FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6008, 2813 aa 1>>>pF1KB6008 2813 - 2813 aa - 2813 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0897+/-0.00137; mu= 24.8863+/- 0.083 mean_var=177.8228+/-33.795, 0's: 0 Z-trim(107.4): 129 B-trim: 22 in 1/50 Lambda= 0.096179 statistics sampled from 9404 (9533) to 9404 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.618), E-opt: 0.2 (0.293), width: 16 Scan time: 8.450 The best scores are: opt bits E(32554) CCDS8539.1 VWF gene_id:7450|Hs108|chr12 (2813) 20127 2808.1 0 CCDS44513.1 MUC6 gene_id:4588|Hs108|chr11 (2439) 1968 288.3 3.5e-76 CCDS59225.2 OTOG gene_id:340990|Hs108|chr11 (2913) 1808 266.2 1.9e-69 CCDS76390.1 OTOG gene_id:340990|Hs108|chr11 (2925) 1808 266.3 1.9e-69 CCDS76369.1 MUC5AC gene_id:4586|Hs108|chr11 (5654) 1573 234.0 1.8e-59 CCDS44515.2 MUC5B gene_id:727897|Hs108|chr11 (5762) 1516 226.1 4.4e-57 CCDS47663.2 ZAN gene_id:7455|Hs108|chr7 (2721) 642 104.4 9.2e-21 CCDS47664.2 ZAN gene_id:7455|Hs108|chr7 (2812) 642 104.4 9.4e-21 CCDS5442.1 BMPER gene_id:168667|Hs108|chr7 ( 685) 587 96.0 8.1e-19 CCDS33410.2 COL6A3 gene_id:1293|Hs108|chr2 (2570) 509 85.9 3.2e-15 CCDS8434.1 TECTA gene_id:7007|Hs108|chr11 (2155) 506 85.4 3.8e-15 CCDS54439.1 COL6A3 gene_id:1293|Hs108|chr2 (1036) 465 79.3 1.3e-13 CCDS33411.2 COL6A3 gene_id:1293|Hs108|chr2 (1237) 465 79.4 1.4e-13 CCDS33409.1 COL6A3 gene_id:1293|Hs108|chr2 (2971) 465 79.9 2.4e-13 CCDS33412.1 COL6A3 gene_id:1293|Hs108|chr2 (3177) 465 80.0 2.5e-13 CCDS7589.2 VWA2 gene_id:340706|Hs108|chr10 ( 755) 394 69.2 9.9e-11 >>CCDS8539.1 VWF gene_id:7450|Hs108|chr12 (2813 aa) initn: 20127 init1: 20127 opt: 20127 Z-score: 15098.0 bits: 2808.1 E(32554): 0 Smith-Waterman score: 20127; 99.9% identity (100.0% similar) in 2813 aa overlap (1-2813:1-2813) 10 20 30 40 50 60 pF1KB6 MIPARFAGVLLALALILPGTLCAEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 MIPARFAGVLLALALILPGTLCAEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 LAGGCQKRSFSIIGDFQNGKRVSLSVYLGEFFDIHLFVNGTVTQGDQRVSMPYASKGLYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 LAGGCQKRSFSIIGDFQNGKRVSLSVYLGEFFDIHLFVNGTVTQGDQRVSMPYASKGLYL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 ETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMTQEGTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 ETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMTQEGTL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 TSDPYDFANSWALSSGEQWCERASPPSSSCNISSGEMQKGLWEQCQLLKSTSVFARCHPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 TSDPYDFANSWALSSGEQWCERASPPSSSCNISSGEMQKGLWEQCQLLKSTSVFARCHPL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 VDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGWTDHSACSPVCPAGME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 VDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGWTDHSACSPVCPAGME 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 YRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCVESTECPCVHSGKRYPPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 YRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCVESTECPCVHSGKRYPPG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 TSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARDCQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 TSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARDCQD 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 HSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 HSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 RIQRTVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSG :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 RIQHTVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 LAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEACAVLTSPTFEACHRAVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 LAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEACAVLTSPTFEACHRAVS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB6 PLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 PLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQ 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB6 CGTPCNLTCRSLSYPDEECNEACLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 CGTPCNLTCRSLSYPDEECNEACLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPED 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB6 IFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 IFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADN 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB6 LRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 LRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGE 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB6 TVKIGCNTCVCRDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGS :::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 TVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGS 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB6 NPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 NPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGR 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB6 YIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 YIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVD 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB6 FGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 FGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPY 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB6 LDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 LDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGY 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB6 ECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 ECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCE 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB6 VAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 VAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVE 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB6 DISEPPLHDFYCSRLLDLVFLLDGSSRLSEAEFEVLKAFVVDMMERLRISQKWVRVAVVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 DISEPPLHDFYCSRLLDLVFLLDGSSRLSEAEFEVLKAFVVDMMERLRISQKWVRVAVVE 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KB6 YHDGSHAYIGLKDRKRPSELRRIASQVKYAGSQVASTSEVLKYTLFQIFSKIDRPEASRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 YHDGSHAYIGLKDRKRPSELRRIASQVKYAGSQVASTSEVLKYTLFQIFSKIDRPEASRI 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KB6 ALLLMASQEPQRMSRNFVRYVQGLKKKKVIVIPVGIGPHANLKQIRLIEKQAPENKAFVL .::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 TLLLMASQEPQRMSRNFVRYVQGLKKKKVIVIPVGIGPHANLKQIRLIEKQAPENKAFVL 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KB6 SSVDELEQQRDEIVSYLCDLAPEAPPPTLPPHMAQVTVGPGLLGVSTLGPKRNSMVLDVA ::::::::::::::::::::::::::::::: :::::::::::::::::::::::::::: CCDS85 SSVDELEQQRDEIVSYLCDLAPEAPPPTLPPDMAQVTVGPGLLGVSTLGPKRNSMVLDVA 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KB6 FVLEGSDKIGEADFNRSKEFMEEVIQRMDVGQDSIHVTVLQYSYMVTVEYPFSEAQSKGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 FVLEGSDKIGEADFNRSKEFMEEVIQRMDVGQDSIHVTVLQYSYMVTVEYPFSEAQSKGD 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KB6 ILQRVREIRYQGGNRTNTGLALRYLSDHSFLVSQGDREQAPNLVYMVTGNPASDEIKRLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 ILQRVREIRYQGGNRTNTGLALRYLSDHSFLVSQGDREQAPNLVYMVTGNPASDEIKRLP 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KB6 GDIQVVPIGVGPNANVQELERIGWPNAPILIQDFETLPREAPDLVLQRCCSGEGLQIPTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 GDIQVVPIGVGPNANVQELERIGWPNAPILIQDFETLPREAPDLVLQRCCSGEGLQIPTL 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KB6 SPAPDCSQPLDVILLLDGSSSFPASYFDEMKSFAKAFISKANIGPRLTQVSVLQYGSITT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 SPAPDCSQPLDVILLLDGSSSFPASYFDEMKSFAKAFISKANIGPRLTQVSVLQYGSITT 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KB6 IDVPWNVVPEKAHLLSLVDVMQREGGPSQIGDALGFAVRYLTSEMHGARPGASKAVVILV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 IDVPWNVVPEKAHLLSLVDVMQREGGPSQIGDALGFAVRYLTSEMHGARPGASKAVVILV 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KB6 TDVSVDSVDAAADAARSNRVTVFPIGIGDRYDAAQLRILAGPAGDSNVVKLQRIEDLPTM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 TDVSVDSVDAAADAARSNRVTVFPIGIGDRYDAAQLRILAGPAGDSNVVKLQRIEDLPTM 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KB6 VTLGNSFLHKLCSGFVRICMDEDGNEKRPGDVWTLPDQCHTVTCQPDGQTLLKSHRVNCD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 VTLGNSFLHKLCSGFVRICMDEDGNEKRPGDVWTLPDQCHTVTCQPDGQTLLKSHRVNCD 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KB6 RGLRPSCPNSQSPVKVEETCGCRWTCPCVCTGSSTRHIVTFDGQNFKLTGSCSYVLFQNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 RGLRPSCPNSQSPVKVEETCGCRWTCPCVCTGSSTRHIVTFDGQNFKLTGSCSYVLFQNK 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KB6 EQDLEVILHNGACSPGARQGCMKSIEVKHSALSVELHSDMEVTVNGRLVSVPYVGGNMEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 EQDLEVILHNGACSPGARQGCMKSIEVKHSALSVELHSDMEVTVNGRLVSVPYVGGNMEV 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KB6 NVYGAIMHEVRFNHLGHIFTFTPQNNEFQLQLSPKTFASKTYGLCGICDENGANDFMLRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 NVYGAIMHEVRFNHLGHIFTFTPQNNEFQLQLSPKTFASKTYGLCGICDENGANDFMLRD 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KB6 GTVTTDWKTLVQEWTVQRPGQTCQPILEEQCLVPDSSHCQVLLLPLFAECHKVLAPATFY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 GTVTTDWKTLVQEWTVQRPGQTCQPILEEQCLVPDSSHCQVLLLPLFAECHKVLAPATFY 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KB6 AICQQDSCHQEQVCEVIASYAHLCRTNGVCVDWRTPDFCAMSCPPSLVYNHCEHGCPRHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 AICQQDSCHQEQVCEVIASYAHLCRTNGVCVDWRTPDFCAMSCPPSLVYNHCEHGCPRHC 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KB6 DGNVSSCGDHPSEGCFCPPDKVMLEGSCVPEEACTQCIGEDGVQHQFLEAWVPDHQPCQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 DGNVSSCGDHPSEGCFCPPDKVMLEGSCVPEEACTQCIGEDGVQHQFLEAWVPDHQPCQI 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KB6 CTCLSGRKVNCTTQPCPTAKAPTCGLCEVARLRQNADQCCPEYECVCDPVSCDLPPVPHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 CTCLSGRKVNCTTQPCPTAKAPTCGLCEVARLRQNADQCCPEYECVCDPVSCDLPPVPHC 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 2400 pF1KB6 ERGLQPTLTNPGECRPNFTCACRKEECKRVSPPSCPPHRLPTLRKTQCCDEYECACNCVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 ERGLQPTLTNPGECRPNFTCACRKEECKRVSPPSCPPHRLPTLRKTQCCDEYECACNCVN 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 2450 2460 pF1KB6 STVSCPLGYLASTATNDCGCTTTTCLPDKVCVHRSTIYPVGQFWEEGCDVCTCTDMEDAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 STVSCPLGYLASTATNDCGCTTTTCLPDKVCVHRSTIYPVGQFWEEGCDVCTCTDMEDAV 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500 2510 2520 pF1KB6 MGLRVAQCSQKPCEDSCRSGFTYVLHEGECCGRCLPSACEVVTGSPRGDSQSSWKSVGSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 MGLRVAQCSQKPCEDSCRSGFTYVLHEGECCGRCLPSACEVVTGSPRGDSQSSWKSVGSQ 2470 2480 2490 2500 2510 2520 2530 2540 2550 2560 2570 2580 pF1KB6 WASPENPCLINECVRVKEEVFIQQRNVSCPQLEVPVCPSGFQLSCKTSACCPSCRCERME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 WASPENPCLINECVRVKEEVFIQQRNVSCPQLEVPVCPSGFQLSCKTSACCPSCRCERME 2530 2540 2550 2560 2570 2580 2590 2600 2610 2620 2630 2640 pF1KB6 ACMLNGTVIGPGKTVMIDVCTTCRCMVQVGVISGFKLECRKTTCNPCPLGYKEENNTGEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 ACMLNGTVIGPGKTVMIDVCTTCRCMVQVGVISGFKLECRKTTCNPCPLGYKEENNTGEC 2590 2600 2610 2620 2630 2640 2650 2660 2670 2680 2690 2700 pF1KB6 CGRCLPTACTIQLRGGQIMTLKRDETLQDGCDTHFCKVNERGEYFWEKRVTGCPPFDEHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 CGRCLPTACTIQLRGGQIMTLKRDETLQDGCDTHFCKVNERGEYFWEKRVTGCPPFDEHK 2650 2660 2670 2680 2690 2700 2710 2720 2730 2740 2750 2760 pF1KB6 CLAEGGKIMKIPGTCCDTCEEPECNDITARLQYVKVGSCKSEVEVDIHYCQGKCASKAMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 CLAEGGKIMKIPGTCCDTCEEPECNDITARLQYVKVGSCKSEVEVDIHYCQGKCASKAMY 2710 2720 2730 2740 2750 2760 2770 2780 2790 2800 2810 pF1KB6 SIDINDVQDQCSCCSPTRTEPMQVALHCTNGSVVYHEVLNAMECKCSPRKCSK ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS85 SIDINDVQDQCSCCSPTRTEPMQVALHCTNGSVVYHEVLNAMECKCSPRKCSK 2770 2780 2790 2800 2810 >>CCDS44513.1 MUC6 gene_id:4588|Hs108|chr11 (2439 aa) initn: 829 init1: 342 opt: 1968 Z-score: 1481.1 bits: 288.3 E(32554): 3.5e-76 Smith-Waterman score: 2167; 29.2% identity (57.5% similar) in 1286 aa overlap (34-1266:44-1272) 10 20 30 40 50 60 pF1KB6 ARFAGVLLALALILPGTLCAEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAG .:: .:. .::: .:.:.: :.:..:. CCDS44 LLSAGLANTSYTSPGLQRLKDSPQTAPDKGQCSTWGAGHFSTFDHHVYDFSGTCNYIFAA 20 30 40 50 60 70 70 80 90 100 110 pF1KB6 GCQKR--SFSIIGDFQNGKRVSLSVYLGEF-FDIHLFVNGTVTQGDQRV-SMPYASKGLY :. .::. ... : :.: . :. .. .. .. : : :.::.:.:: CCDS44 TCKDAFPTFSV--QLRRGPDGSISRIIVELGASVVTVSEAIISVKDIGVISLPYTSNGLQ 80 90 100 110 120 130 120 130 140 150 160 170 pF1KB6 LETEAGYYKLSGEAYGFVARI--DGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMTQE . . .: .. . .. .....::. .:... :::::::. . ..:...: CCDS44 ITPFGQSVRLVAKQLELELEVVWGPDSHLMVLVERKYMGQMCGLCGNFDGKVTNEFVSEE 140 150 160 170 180 190 180 190 200 210 220 230 pF1KB6 GTLTSDPYDFANSWALSSGEQWCERASPPSSSCNISSGEMQKGLWEQC-QLLKSTSVFAR : . .:. :: :.. . : . ::. .. ... . : ::: : : . CCDS44 GKFL-EPHKFAALQKLDDPGEICTFQDIPST--HVRQAQHAR----ICTQLL--TLVAPE 200 210 220 230 240 240 250 260 270 280 290 pF1KB6 CHPLVDPEPFVALCEKTLCECA--GGLECACPALLEYARTCAQEGMVLYGWTDHSACS-P : :. :::: :. . : . .: .: ::.: :.. :. . : . . :: CCDS44 CS--VSKEPFVLSCQADVAAAPQPGPQNSSCATLSEYSRQCSMVGQPVRRWRSPGLCSVG 250 260 270 280 290 300 300 310 320 330 340 pF1KB6 VCPAGMEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDE----GLCVESTECP :::.. :..: : :..::.. . . :. :. :: :::: .:.. :: :.:: CCDS44 QCPANQVYQECGSACVKTCSNPQ--HSCSSSCTFGCFCPEGTVLNDLSNNHTCVPVTQCP 310 320 330 340 350 350 360 370 380 390 400 pF1KB6 CVHSGKRYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGI :: : : :: :.:: : ..:.:... :::.: . : : .:: : . : : CCDS44 CVLHGAMYAPGEVTIAACQTCRCTLGRWVCTERPCPGHCSLEGGSFVTTFDARPYRFHGT 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB6 CQYLLARDCQ---DHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAM : :.: .. : : .. : . . .. .. :.: . ....: ... :. CCDS44 CTYILLQSPQLPEDGALMAVYDKSGVSHSETSL----VAVVYLSRQDKIV-ISQDEVVTN 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB6 DGQDVQLPLLKGDLRIQRTVTASVRL--SYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLC .:. :: .. . : ... ... :.: .: .. . : ..: . :.: ::: CCDS44 NGEAKWLPYKTRNITVFRQTSTHLQMATSFGLELVVQLRPIFQAYVTVGPQFRGQTRGLC 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB6 GNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEAC ::.::. ::: : :.:: . : ..:. :.: ....:::... .: : CCDS44 GNFNGDTTDDFTTSMGIAEGTASLFVDSWRA-GNCPAALERETDPCSMSQLNKVCAETHC 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB6 AVL--TSPTFEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRV-A ..: :. .:: :: .:.: :. . : :..:. . .:.::..:. ::. ::: . . CCDS44 SMLLRTGTVFERCHATVNPAPFYKRCVYQACNYEETFPHICAALGDYVHACSLRGVLLWG 600 610 620 630 640 650 650 660 670 680 690 pF1KB6 WREP-GRCELNCPKGQVYLQCGTPCNLTCRSLSYPDEECNEACL--EGCFCPPGLYMDER :: : . : . .. . :. :: ::: ::... . .:: :: : :.... CCDS44 WRSSVDNCTIPCTGNTTFSYNSQACERTCLSLSDRATECHHSAVPVDGCNCPDGTYLNQK 660 670 680 690 700 710 700 710 720 730 740 750 pF1KB6 GDCVPKAQCPCYYDGEIFQPEDIFSDHHTM-----CYCEDGFMHCTMSGVPGSLLPDAVL :.:: :::::: .: : :.... :. :.: .: . : . :. : CCDS44 GECVRKAQCPCILEGYKF----ILAEQSTVINGITCHCINGRLSCPQR-------PQMFL 720 730 740 750 760 760 770 780 790 800 810 pF1KB6 SSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKTCQNY--DLECMSMGCVSGCLCP .: :. : . : .. : :. ::: . :. : ::.: CCDS44 AS-----------CQAPKTFKSCSQSSENKFGAACAPTCQMLATGVACVPTKCEPGCVCA 770 780 790 800 810 820 830 840 850 860 pF1KB6 PGMVRH-ENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCRDRKWNCTDHV-CDATCST :. .. ...:: :.::: .: : : .. : :: : .: : . . : .::. CCDS44 EGLYENADGQCVPPEECPCEFSGVSYPGGAELHTDCRTCSCSRGRWACQQGTHCPSTCTL 820 830 840 850 860 870 870 880 890 900 910 920 pF1KB6 IGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPG--TFRILVGNKGCSHPSVKCKKRVTI : .: .:::: ...: :.:.:.:. : :: : . ::.::. : :.. .: :.. . : CCDS44 YGEGHVITFDGQRFVFDGNCEYILATDVCGVNDSQPTFKILTENVICGNSGVTCSRAIKI 880 890 900 910 920 930 930 940 950 960 970 980 pF1KB6 LVEGGEIELFDGEVNVKRPMKDETHFEV-VESGRYIIL----LLGK-ALSVVWDRHLSIS .. : . : : . .: .: : .. : : .. . :. :...:.::..: CCDS44 FLGGLSVVLADRNYTVT---GEEPHVQLGVTPGALSLVVDISIPGRYNLTLIWNRHMTIL 940 950 960 970 980 990 1000 1010 1020 1030 1040 pF1KB6 VVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDS . . .. :. .:::::::.: ...:. . . : . ... :::: : :.: : . . CCDS44 IRIARASQDPLCGLCGNFNGNMKDDFETRSRYVASSELELVNSWKESPLCGD---VSFVT 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 1090 1100 pF1KB6 SPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFC .: : : .... .. .: ...:..: :.. : :: ..:. :.:.:.: ::: :.: CCDS44 DP--CSLNAFRRSWAERKCSVINSQTFATCHSKVYHLPYYEACVRDACGCDSGGDCECLC 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 1150 pF1KB6 DTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYN---SCAPACQVTCQ :..::::..: ..: : ::: ..:: : : . . . :..:. .:. : : CCDS44 DAVAAYAQACLDKGVCVDWRTPAFCPIYCGFYNTHTQDGHGEYQYTQEANCTWHYQ-PCL 1110 1120 1130 1140 1150 1160 1160 1170 1180 1190 1200 1210 pF1KB6 HP-EPLACPVQCVEGCHAHCPPGKILDELLQTCVD--PEDCPVCEVAGRRFASGKKVT-L : .: . : . .:::. .: . .:. .:: : : .. . ..:.. : . CCDS44 CPSQPQSVPGSNIEGCY-NCSQDEYFDHEEGVCVPCMPPTTPQPPTTPQLPTTGSRPTQV 1170 1180 1190 1200 1210 1220 1220 1230 1240 1250 1260 1270 pF1KB6 NPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLY----VEDISEPPLHDF : : . .. . . . :.. ::..:. :.:: . . .::: CCDS44 WPMTGTSTTIGLLSSTGPSPSSNHTPAS----PTQTPLLPATLTSSKPTASSGEPPRPTT 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 1330 pF1KB6 YCSRLLDLVFLLDGSSRLSEAEFEVLKAFVVDMMERLRISQKWVRVAVVEYHDGSHAYIG CCDS44 AVTPQATSGLPPTATLRSTATKPTVTQATTRATASTASPATTSTAQSTTRTTMTLPTPAT 1280 1290 1300 1310 1320 1330 >>CCDS59225.2 OTOG gene_id:340990|Hs108|chr11 (2913 aa) initn: 1567 init1: 482 opt: 1808 Z-score: 1360.3 bits: 266.2 E(32554): 1.9e-69 Smith-Waterman score: 3324; 27.4% identity (50.4% similar) in 2980 aa overlap (35-2806:140-2910) 10 20 30 40 50 60 pF1KB6 RFAGVLLALALILPGTLCAEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAGG : .:. :.:::: .: ..: :: :.: CCDS59 HPAFCDCRRFNATGPRCQMVYNAGPERDSICRAWGQHHVETFDGLYYYLSGKGSYTLVGR 110 120 130 140 150 160 70 80 90 100 110 pF1KB6 CQK--RSFSII--GDFQNGKR-VSLSVYLGEFF----DIHLFVNGTVTQGDQRVSMPYAS . .:::: .: : :. . : .. :: .::: ::.: .::..:.. CCDS59 HEPEGQSFSIQVHNDPQCGSSPYTCSRAVSLFFVGEQEIHL--AKEVTHGGMRVQLPHVM 170 180 190 200 210 220 120 130 140 150 160 170 pF1KB6 KGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMT . :. ::: . .. .:. ::.. . .: . .. : ::::: : .::..: CCDS59 GSARLQQLAGYVIVRHQS-AFTLAWDGASAVYIKMSPELLGWTHGLCGNNNADPKDDLVT 230 240 250 260 270 280 180 190 200 210 220 230 pF1KB6 QEGTLTSDPYDFANSWALSSGEQ--WCERASPPSSSC-NISSGEMQKGLWEQCQLLKSTS . : ::.: .:..:: .. .: .: : : . . : :: :..:::. : CCDS59 SSGKLTDDVVEFVHSWQEQAPNQPPGPTTSSLPRPPCLQQNPGTMQ-GVYEQCEALLRPP 290 300 310 320 330 340 240 250 260 270 280 290 pF1KB6 VFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGW-TDHSAC : :: :.: ::.: : . ::. : . : :: ::::.::: : : :: :. : CCDS59 -FDACHAYVSPLPFTASCTSDLCQSMGDVATWCRALAEYARACAQAGRPLQGWRTQLRQC 350 360 370 380 390 400 300 310 320 330 340 pF1KB6 SPVCPA-GMEYRQCVSPCARTCQSLHINEMCQER---CVDGCSCPEGQLLDEGLCVESTE . : .. : .:.. : .: : : . ::::: ::.: ....: :: .: CCDS59 TVHCKEKAFTYNECIACCPASC---HPRASCVDSEIACVDGCYCPNGLIFEDGGCVAPAE 410 420 430 440 450 460 350 360 370 380 390 400 pF1KB6 CPCVHSGKRYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFS ::: : ::::. ...::::: : ...: ::. ::.:: :::. :: .::.: .:: CCDS59 CPCEFHGTLYPPGSVVKEDCNTCTCTSGKWECSTAVCPAECSVTGDIHFTTFDGRRYTFP 470 480 490 500 510 520 410 420 430 440 450 460 pF1KB6 GICQYLLARDCQDHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMD . :::.::.. .. .:....... :. ..:..:..::.: : : : ... : . CCDS59 ATCQYILAKSRSSGTFTVTLQNAPCGLNQDGACVQSVSVILHQDPRRQVTLTQAGDVLLF 530 540 550 560 570 580 470 480 490 500 510 520 pF1KB6 GQDVQLPLLKGD-LRIQR--TVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLC : .: : ..:.: .: :: . : . .: .: :: .... .. : ::: CCDS59 DQYKIIPPYTDDAFEIRRLSSVFLRVRTNVGVRVLYDREGL-RLYLQVDQRWVEDTVGLC 590 600 610 620 630 640 530 540 550 560 570 580 pF1KB6 GNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHS-DPCALNPRMTRFSEEA :..::: ::::.: :. : . :::.:: . :. : . ::: .. . . .: .: CCDS59 GTFNGNTQDDFLSPVGVPESTPQLFGNSWKTLSACSPLVSGSPLDPCDVHLQAASYSVQA 650 660 670 680 690 700 590 600 610 620 630 640 pF1KB6 CAVLTSPTFEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWR :.:::. : : .::.::...:: :.: : :. :::..:: :: : .:. : .: CCDS59 CSVLTGEMFAPCSAFLSPVPYFEQCRRDACRC--GQPCLCATLAHYAHLCRRHGLPVDFR 710 720 730 740 750 650 660 670 680 690 pF1KB6 E--PGRCELNCPKGQVYLQCGTPCNLTCRSLSYP--------DEECNEACLEGCFCPPGL :. : :.: .. : : .::. ::..:. : :. . :.::: ::: CCDS59 ARLPA-CALSCEASKEYSPCVAPCGRTCQDLASPEACGVDGGDDLSRDECVEGCACPPDT 760 770 780 790 800 810 700 710 720 730 740 750 pF1KB6 YMDERGD-CVPKAQCPCYYDGEIFQPEDIFSDHHTM--CYCEDGFMHCTMSGVPGSLLPD :.: ..: :::. :: :...: . : : :: .. :.:.:: : : : : CCDS59 YLDTQADLCVPRNQCSCHFQGVDYPPGD--SDIPSLGHCHCKDGVMSCD------SRAPA 820 830 840 850 860 760 770 780 790 800 pF1KB6 AVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKTC--QNYDLECMSMG-CVSG : .: .: . : . : : .:: : .: . : :.:: CCDS59 A--------------ACPAGQVFVNCSDLHTDLE-LSRERTCEQQLLNLSVSARGPCLSG 870 880 890 900 910 810 820 830 840 850 860 pF1KB6 CLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCRDRKWNCTDHVCDATC : :: :..:: . : :.::: .:::: ::. : :.::::. ...:: : : .:: CCDS59 CACPQGLLRHGDACFLPEECPCTWKGKEYFPGDQVMSPCHTCVCQRGSFQCTLHPCASTC 920 930 940 950 960 970 870 880 890 900 910 920 pF1KB6 STIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTI .. : :: ::::: . : : :. ::.. .. .: ..: : .: .. :.: ..: CCDS59 TAYGDRHYRTFDGLPFDFVGACKVHLVKS---TSDVSFSVIVENVNCYSSGMICRKFISI 980 990 1000 1010 1020 1030 930 940 950 960 970 980 pF1KB6 LVEGGEIELFDGEVNVKRP---MKDETHFEVVESGRYIILLLGKA-LSVVWDRHLSISVV : :. . .:: . . : . :. . .. . : . .. . . ....::.. .. : CCDS59 NV-GNSLIVFDDDSGNPSPESFLDDKQEVHTWRVGFFTLVHFPQEHITLLWDQRTTVHVQ 1040 1050 1060 1070 1080 1090 990 1000 1010 1020 1030 1040 pF1KB6 LKQTYQEKVCGLCGNFDGIQNNDL-TSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSS .: .. ::::::: :.. : ::.. .: .::.:: .. .: :: : : CCDS59 AGPQWQGQLAGLCGNFDLKTINEMRTPENLELT-NPQEFGSSW-AAVECPDTLD-PRD-- 1100 1110 1120 1130 1140 1050 1060 1070 1080 1090 1100 pF1KB6 PATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCD : : ... .. . : :: :.::. :. .:: . . :. :::.: . ::: ::: CCDS59 --MCVLNPLREPFAKKECSILLSEVFEICHPVVDVTWFYSNCLTDTCGCSQGGDCECFCA 1150 1160 1170 1180 1190 1200 1110 1120 1130 1140 pF1KB6 TIAAYAHVCAQHGKVVTWRTATLCPQSCEERN--LRENGYECE----------------- ...:::: : ::: .: ::: ::: .:. : : .. :. CCDS59 SVSAYAHQCCQHGVAVDWRTPRLCPYDCDFFNKVLGKGPYQLSSLAAGGALVGMKAVGDD 1210 1220 1230 1240 1250 1260 1150 1160 1170 1180 pF1KB6 ---WRYNSCAPACQVT-----------CQHPEPLACPVQCVEGCHAHCPPGKILDELLQT : .. ::: :. . :. .. . . : . :. CCDS59 IVLVRTEDVAPADIVSFLLTAALYKAKAHDPDVVSLEAADRPNFFLHVTANGSLELAKWQ 1270 1280 1290 1300 1310 1320 1190 1200 1210 1220 1230 pF1KB6 CVDPEDCPVCEVAGRRFASGKKVTLN----PSD-------------PEHCQICHCDVVNL : . . . : .. :.:. ::. :: .. . .. CCDS59 GRDTFQQHASFLLHRGTRQAGLVALESLAKPSSFLYVSGAVLALRLYEHTEVFRRGTLFR 1330 1340 1350 1360 1370 1380 1240 1250 1260 1270 1280 pF1KB6 TCEACQEPGGLVVPPT----DAPVSPTTLYVEDISEPPLHDFYCSRLLDLVFLLDGSSRL .: .:.: . : :: .:: .: .: :. : . . : CCDS59 LLDA--KPSGAAYPICEWRYDACASPCFQTCRDPRAASCRDV--PRVEGCVPVCPTPQVL 1390 1400 1410 1420 1430 1290 1300 1310 1320 1330 1340 pF1KB6 SEAEFEVLKAFVVDMMERLRISQKWVRVAVVEYHDGSHAYIGLKDRKRPSELRRIASQV- .:. . . .. : .: :: . .. :... . ::. . :: CCDS59 DEVTQRCV--YLEDCVE----PAVWVPTEAL----GNETLPPSQGLPTPSDEEPQLSQES 1440 1450 1460 1470 1480 1350 1360 1370 1380 1390 pF1KB6 ------KYAGSQVASTSEVLKYTLFQIFSKIDRPEASRIALL----LMASQEPQRMSRNF . : . .: . .:. . . : .. .: : ::: : ... CCDS59 PRTPTHRPALTPAAPLTTALNPPVTATEEPVVSPGPTQTTLQQPLELTASQLPAGPTESP 1490 1500 1510 1520 1530 1540 1400 1410 1420 1430 1440 1450 pF1KB6 VRYVQGLKKKKVIVIPVGIGPHANLKQIRLIEKQAPENKAFVLSSVDELEQQRDEIV--- . .:. . . . ::. .. . :.: ..:.. .: : .. CCDS59 AS--KGVTASLLAI------PHTPESSSLPVALQTPTPG--MVSGA--METTRVTVIFAG 1550 1560 1570 1580 1590 1460 1470 1480 1490 1500 1510 pF1KB6 SYLCDLAPEAPP-PTLPPHMAQVTV-GPGLLGVSTLGPKRNSMVLDVAFVLEGSDKIGEA : .. ..:: : .: ::: : : : : : :. . . . . . :... CCDS59 SPNITVSSRSPPAPRFPLMTKAVTVRGHGSLPVRTTPPQPSLTASPSSRPVASPGAISRS 1600 1610 1620 1630 1640 1650 1520 1530 1540 1550 1560 pF1KB6 DFNRSKE------FMEEVIQRMDVGQDSIHVTVLQYSYMVTVEYPFSEAQSKGDILQRVR . ... . .::.: : : . .. . : .:: .: . . : CCDS59 PTSSGSHKAVLTPAVTKVISRTGVPQPTQAQSASSPSTPLTVAGTAAEQVPVSPLATRSL 1660 1670 1680 1690 1700 1710 1570 1580 1590 1600 1610 1620 pF1KB6 EIRYQGGNRTNTGLALRYLSDHSFLVSQGDREQAPNLVYMVTGNPA--SDEIKRLPGDIQ :: . :. : : :: ... : :. . . :: . : :. CCDS59 EIVLS----TEKGEA-----GHSQPMGSPASPQ-PHPLPSAPPRPAQHTTMATRSPA--- 1720 1730 1740 1750 1760 1630 1640 1650 1660 1670 pF1KB6 VVPIGVGPNANVQELERIGWPNAPILIQDFETLPRE-----APDLVLQRCCSGEGLQIPT .: . : : : .:.. . : : . :: : . : . :. CCDS59 -LPPET-PAAASLSTATDGLAATPFMSLE-STRPSQLLSGLPPDTSLP--LAKVGTSAPV 1770 1780 1790 1800 1810 1680 1690 1700 1710 1720 pF1KB6 LSPAPDCSQPLDVILLLDGSSSFPASYFDEMKSFAKAFISKAN----------------- .:.: : . . : ....::. .. . :. : ...:. CCDS59 ATPGPKAS--VITTPLQPQATTLPAQTLSPVLPFTPAAMTQAHPPTHIAPPAAGTAPGLL 1820 1830 1840 1850 1860 1870 1730 1740 1750 1760 1770 pF1KB6 IGPRLTQVSVLQY--GSITTIDV-PWNVVPEKAHLLS----LVDVM--QREGGPSQIGDA .: : .:: :. . ..: : . . :. .:: : : . ::::... : CCDS59 LGATLPTSGVLPVAEGTASMVSVVPRKSTTGKVAILSKQVSLPTSMYGSAEGGPTELTPA 1880 1890 1900 1910 1920 1930 1780 1790 1800 1810 1820 1830 pF1KB6 LGFAVRYLTSEMHGARPGASKAVVILVTDVSVDSVDAAADAARSNRVTVFPIGIGDRYDA . . :..: .::. :.. : :. ... : .: : ... ....: . . CCDS59 TSHPLTPLVAEPEGAQAGTALPVP---TSYALSRV-SARTAPQDSMLVLLPQLAEAHGTS 1940 1950 1960 1970 1980 1990 1840 1850 1860 1870 1880 1890 pF1KB6 AQLRILAGPAGDSNVVKLQRIEDLPTMVTLGNSFLHKLCSGFVRICMDEDGNEKRPGDVW : .. : :. .... : . :.. :... : ... . .. : CCDS59 AGPHLAAEPVDEATTEPSGR--SAPAL-----SIVEGLAEALATTTEANTSTTCVP---- 2000 2010 2020 2030 2040 1900 1910 1920 1930 1940 1950 pF1KB6 TLPDQ-CHTVTCQPDGQTLLKSHRVNCDRGLRPS-CPNSQSPVKVE-ETCGCRWTCPCVC . .: : : .:: . .. .: .: : : :.: . : : : : : CCDS59 -IAEQDCVRHICL-EGQLIRVNQSQHCPQGAAPPRCGILGLAVRVGGDRCCPLWECACRC 2050 2060 2070 2080 2090 2100 1960 1970 1980 1990 2000 pF1KB6 TGSSTRHIVTFDGQNFKLTGSCSYVLFQNKEQDLEVILHNGACSPGARQG-------CMK . .:::::.. : :.: :. .. : : : :. .: : :. CCDS59 SIFPDLSFVTFDGSHVALFKEAIYILSQSPDEMLTV--HVLDCK-SANLGHLNWPPFCLV 2110 2120 2130 2140 2150 2010 2020 2030 2040 2050 2060 pF1KB6 SIEVKHSALSVELHS-DMEVTVNGRLVSVPYVGGNMEVNVYGAIMHEVRFNHLGHIFT-F ... : : .: . . .:::. . : : :. :: :.. ::.. . CCDS59 MLNMTHLAHQVTIDRFNRKVTVDLQPVWPP-------VSRYG-----FRIEDTGHMYMIL 2160 2170 2180 2190 2200 2070 2080 2090 2100 2110 pF1KB6 TPQNNEFQLQLSPKTF---ASKT-----YGLCGICDENGANDFMLRDGTVT---TDWKTL ::.. ..: : . :::: .::::::: ..:::. :.::.:. : . CCDS59 TPSDIQIQWLHSSGLMIVEASKTSKAQGHGLCGICDGDAANDLTLKDGSVVGGAEDPAPF 2210 2220 2230 2240 2250 2260 2120 2130 2140 2150 2160 pF1KB6 VQEWTVQRP----GQT-CQPILEEQCLVPDSSHCQVLLLP-LFAECHKVLAPATFYAICQ .. : : ::: .: ..: . : : : .. :. ::. . : .: . CCDS59 LDSWQVPSSLTSVGQTRFRP---DSCATTDCSPCLRMVSNRTFSACHRFVPPESFCELWI 2270 2280 2290 2300 2310 2320 2170 2180 2190 2200 2210 2220 pF1KB6 QDSCHQEQVCEVIASYAHLCRTNGVCVDWRTPDFCAMSCPPSLVYNHCEHGC--PRHC-D .:. . .: : ... :. .:. ::..:: :.: . : . .:. : .: :. : : CCDS59 RDTKYVQQPCVALTVYVAMCHKFHVCIEWRRSDYCPFLCSSDSTYQACVTACEPPKTCQD 2330 2340 2350 2360 2370 2380 2230 2240 2250 2260 2270 pF1KB6 GNVSSCG-DHPS---EGCFCPPDKVMLE---GSCVPEEACTQCIGEDGVQHQFLEAWVPD : .. .: . ::: : .. . . :.:: :. : :: . . :.: . CCDS59 GILGPLDPEHCQVLGEGCVCSEGTILHRRHSALCIPEAKCA-CTDSMGVPRALGETWNSS 2390 2400 2410 2420 2430 2440 2280 2290 2300 2310 2320 2330 pF1KB6 HQPCQICTCLSGRKVNCTTQPCPTAKAPTC-GLCEVARLRQNADQCCPEYECVCDPVSCD . : : . . . ::. . .: . ::: : . : :: :::. . :. CCDS59 LSGCCQHQCQAPDTIVPVDLGCPSPRPESCLRFGEVALLLPTKDPCCLGTVCVCNQTLCE 2450 2460 2470 2480 2490 2500 2340 2350 2360 2370 2380 pF1KB6 LPPVPHCERGLQPTLTNPGE--CRPNFTCACRKEECKRVSPPSCPPHR-LPTLR-KTQCC .: :. : . ::. : : :...: : . :. ::: . : : : .:: CCDS59 -GLAPTCRPG-HRLLTHFQEDSCCPSYSCECDPDLCEAELVPSCRQDQILITGRLGDSCC 2510 2520 2530 2540 2550 2390 2400 2410 2420 2430 2440 pF1KB6 DEYECAC-NCVNSTVSCPLGYLASTATNDCGCTTTTCLPDKVCVHRSTIYPVGQFWEEGC : ::: .: .: : : .. : :: : : :. : CCDS59 TSYFCACGDCPDSIPECQEGEALTVHRN----TTELC-----C-------PLYQ------ 2560 2570 2580 2590 2450 2460 2470 2480 2490 2500 pF1KB6 DVCTCTDMEDAVMGLRVAQCSQKPCEDSCRSGFTYVLHEGECCGRCLP-SACEVVTGSPR :.: .. .: : : :. .: : :: : ..:: CCDS59 --CVCENF----------RCPQVQC------GLGTALVEVWSPDRCCPYKSCEC------ 2600 2610 2620 2630 2510 2520 2530 2540 2550 2560 pF1KB6 GDSQSSWKSVGSQWASPENPCLINECVRVKEEVFIQQRNVSCPQLEVPVCPSGFQLSCKT : .. : : . : .. :: . . .:: : .: CCDS59 -DCDTI----------PVPRCHLWEKSQLDEEFMHSVENV---------C------GCAK 2640 2650 2660 2570 2580 2590 2600 2610 2620 pF1KB6 SACCPSCRCERMEACMLNGTVIGPGKTVM---ID-VCTTCRCMVQVGVISGF-KLECRKT : . : : : :. ::.::. : :: : :: . . ...: ... .. CCDS59 YECVKAPVCLSREL----G-VMQPGQTVVELSADGVCHTSRCTTVLDPLTNFYQINTTSV 2670 2680 2690 2700 2710 2720 2630 2640 2650 2660 2670 pF1KB6 TCN-PCPLG--YKEENNTGECCGRCLPTACTIQLRGGQIMTLKRDETLQDGCDTHFCKVN :. : . :.. . . ::: : ..: . . .: . . : : :. . CCDS59 LCDIHCEANQEYEHPRDLAACCGSCRNVSCLFTFPNGTTSLFLPGASWIADCARHHCSST 2730 2740 2750 2760 2770 2780 2680 2690 2700 2710 2720 2730 pF1KB6 ERGEYFWEKRVTGCPPFDEHKCLAEGGKIMKIPGTCCDTCEEP--ECNDITARLQYVKVG : . .. .. :::..: .: ::... :: ::.: :. .: :. .. . CCDS59 PLGAVLVRSPIS-CPPLNETECAKVGGSVVPSLEGCCRTCKEDGRSCKKVTIRMT-IRKN 2790 2800 2810 2820 2830 2840 2740 2750 2760 2770 2780 2790 pF1KB6 SCKSEVEVDIHYCQGKCASKAMYSIDINDVQDQCSCCSPTRTEPMQVALHC-TNGSVVYH :.: . :.. :.:.: : ..:. .:: :.:: . . .: : : ::.. : . CCDS59 ECRSSTPVNLVSCDGRCPSASIYNYNINTYARFCKCCREVGLQRRSVQLFCATNATWVPY 2850 2860 2870 2880 2890 2900 2800 2810 pF1KB6 EVLNAMECKCSPRKCSK : . .: : CCDS59 TVQEPTDCACQWS 2910 >>CCDS76390.1 OTOG gene_id:340990|Hs108|chr11 (2925 aa) initn: 1567 init1: 482 opt: 1808 Z-score: 1360.3 bits: 266.3 E(32554): 1.9e-69 Smith-Waterman score: 3324; 27.4% identity (50.4% similar) in 2980 aa overlap (35-2806:152-2922) 10 20 30 40 50 60 pF1KB6 RFAGVLLALALILPGTLCAEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAGG : .:. :.:::: .: ..: :: :.: CCDS76 HPAFCDCRRFNATGPRCQMVYNAGPERDSICRAWGQHHVETFDGLYYYLSGKGSYTLVGR 130 140 150 160 170 180 70 80 90 100 110 pF1KB6 CQK--RSFSII--GDFQNGKR-VSLSVYLGEFF----DIHLFVNGTVTQGDQRVSMPYAS . .:::: .: : :. . : .. :: .::: ::.: .::..:.. CCDS76 HEPEGQSFSIQVHNDPQCGSSPYTCSRAVSLFFVGEQEIHL--AKEVTHGGMRVQLPHVM 190 200 210 220 230 120 130 140 150 160 170 pF1KB6 KGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMT . :. ::: . .. .:. ::.. . .: . .. : ::::: : .::..: CCDS76 GSARLQQLAGYVIVRHQS-AFTLAWDGASAVYIKMSPELLGWTHGLCGNNNADPKDDLVT 240 250 260 270 280 290 180 190 200 210 220 230 pF1KB6 QEGTLTSDPYDFANSWALSSGEQ--WCERASPPSSSC-NISSGEMQKGLWEQCQLLKSTS . : ::.: .:..:: .. .: .: : : . . : :: :..:::. : CCDS76 SSGKLTDDVVEFVHSWQEQAPNQPPGPTTSSLPRPPCLQQNPGTMQ-GVYEQCEALLRPP 300 310 320 330 340 350 240 250 260 270 280 290 pF1KB6 VFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGW-TDHSAC : :: :.: ::.: : . ::. : . : :: ::::.::: : : :: :. : CCDS76 -FDACHAYVSPLPFTASCTSDLCQSMGDVATWCRALAEYARACAQAGRPLQGWRTQLRQC 360 370 380 390 400 410 300 310 320 330 340 pF1KB6 SPVCPA-GMEYRQCVSPCARTCQSLHINEMCQER---CVDGCSCPEGQLLDEGLCVESTE . : .. : .:.. : .: : : . ::::: ::.: ....: :: .: CCDS76 TVHCKEKAFTYNECIACCPASC---HPRASCVDSEIACVDGCYCPNGLIFEDGGCVAPAE 420 430 440 450 460 470 350 360 370 380 390 400 pF1KB6 CPCVHSGKRYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFS ::: : ::::. ...::::: : ...: ::. ::.:: :::. :: .::.: .:: CCDS76 CPCEFHGTLYPPGSVVKEDCNTCTCTSGKWECSTAVCPAECSVTGDIHFTTFDGRRYTFP 480 490 500 510 520 530 410 420 430 440 450 460 pF1KB6 GICQYLLARDCQDHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMD . :::.::.. .. .:....... :. ..:..:..::.: : : : ... : . CCDS76 ATCQYILAKSRSSGTFTVTLQNAPCGLNQDGACVQSVSVILHQDPRRQVTLTQAGDVLLF 540 550 560 570 580 590 470 480 490 500 510 520 pF1KB6 GQDVQLPLLKGD-LRIQR--TVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLC : .: : ..:.: .: :: . : . .: .: :: .... .. : ::: CCDS76 DQYKIIPPYTDDAFEIRRLSSVFLRVRTNVGVRVLYDREGL-RLYLQVDQRWVEDTVGLC 600 610 620 630 640 650 530 540 550 560 570 580 pF1KB6 GNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHS-DPCALNPRMTRFSEEA :..::: ::::.: :. : . :::.:: . :. : . ::: .. . . .: .: CCDS76 GTFNGNTQDDFLSPVGVPESTPQLFGNSWKTLSACSPLVSGSPLDPCDVHLQAASYSVQA 660 670 680 690 700 710 590 600 610 620 630 640 pF1KB6 CAVLTSPTFEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWR :.:::. : : .::.::...:: :.: : :. :::..:: :: : .:. : .: CCDS76 CSVLTGEMFAPCSAFLSPVPYFEQCRRDACRC--GQPCLCATLAHYAHLCRRHGLPVDFR 720 730 740 750 760 770 650 660 670 680 690 pF1KB6 E--PGRCELNCPKGQVYLQCGTPCNLTCRSLSYP--------DEECNEACLEGCFCPPGL :. : :.: .. : : .::. ::..:. : :. . :.::: ::: CCDS76 ARLPA-CALSCEASKEYSPCVAPCGRTCQDLASPEACGVDGGDDLSRDECVEGCACPPDT 780 790 800 810 820 700 710 720 730 740 750 pF1KB6 YMDERGD-CVPKAQCPCYYDGEIFQPEDIFSDHHTM--CYCEDGFMHCTMSGVPGSLLPD :.: ..: :::. :: :...: . : : :: .. :.:.:: : : : : CCDS76 YLDTQADLCVPRNQCSCHFQGVDYPPGD--SDIPSLGHCHCKDGVMSCD------SRAPA 830 840 850 860 870 880 760 770 780 790 800 pF1KB6 AVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKTC--QNYDLECMSMG-CVSG : .: .: . : . : : .:: : .: . : :.:: CCDS76 A--------------ACPAGQVFVNCSDLHTDLE-LSRERTCEQQLLNLSVSARGPCLSG 890 900 910 920 810 820 830 840 850 860 pF1KB6 CLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCRDRKWNCTDHVCDATC : :: :..:: . : :.::: .:::: ::. : :.::::. ...:: : : .:: CCDS76 CACPQGLLRHGDACFLPEECPCTWKGKEYFPGDQVMSPCHTCVCQRGSFQCTLHPCASTC 930 940 950 960 970 980 870 880 890 900 910 920 pF1KB6 STIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTI .. : :: ::::: . : : :. ::.. .. .: ..: : .: .. :.: ..: CCDS76 TAYGDRHYRTFDGLPFDFVGACKVHLVKS---TSDVSFSVIVENVNCYSSGMICRKFISI 990 1000 1010 1020 1030 1040 930 940 950 960 970 980 pF1KB6 LVEGGEIELFDGEVNVKRP---MKDETHFEVVESGRYIILLLGKA-LSVVWDRHLSISVV : :. . .:: . . : . :. . .. . : . .. . . ....::.. .. : CCDS76 NV-GNSLIVFDDDSGNPSPESFLDDKQEVHTWRVGFFTLVHFPQEHITLLWDQRTTVHVQ 1050 1060 1070 1080 1090 1100 990 1000 1010 1020 1030 1040 pF1KB6 LKQTYQEKVCGLCGNFDGIQNNDL-TSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSS .: .. ::::::: :.. : ::.. .: .::.:: .. .: :: : : CCDS76 AGPQWQGQLAGLCGNFDLKTINEMRTPENLELT-NPQEFGSSW-AAVECPDTLD-PRD-- 1110 1120 1130 1140 1150 1050 1060 1070 1080 1090 1100 pF1KB6 PATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCD : : ... .. . : :: :.::. :. .:: . . :. :::.: . ::: ::: CCDS76 --MCVLNPLREPFAKKECSILLSEVFEICHPVVDVTWFYSNCLTDTCGCSQGGDCECFCA 1160 1170 1180 1190 1200 1210 1110 1120 1130 1140 pF1KB6 TIAAYAHVCAQHGKVVTWRTATLCPQSCEERN--LRENGYECE----------------- ...:::: : ::: .: ::: ::: .:. : : .. :. CCDS76 SVSAYAHQCCQHGVAVDWRTPRLCPYDCDFFNKVLGKGPYQLSSLAAGGALVGMKAVGDD 1220 1230 1240 1250 1260 1270 1150 1160 1170 1180 pF1KB6 ---WRYNSCAPACQVT-----------CQHPEPLACPVQCVEGCHAHCPPGKILDELLQT : .. ::: :. . :. .. . . : . :. CCDS76 IVLVRTEDVAPADIVSFLLTAALYKAKAHDPDVVSLEAADRPNFFLHVTANGSLELAKWQ 1280 1290 1300 1310 1320 1330 1190 1200 1210 1220 1230 pF1KB6 CVDPEDCPVCEVAGRRFASGKKVTLN----PSD-------------PEHCQICHCDVVNL : . . . : .. :.:. ::. :: .. . .. CCDS76 GRDTFQQHASFLLHRGTRQAGLVALESLAKPSSFLYVSGAVLALRLYEHTEVFRRGTLFR 1340 1350 1360 1370 1380 1390 1240 1250 1260 1270 1280 pF1KB6 TCEACQEPGGLVVPPT----DAPVSPTTLYVEDISEPPLHDFYCSRLLDLVFLLDGSSRL .: .:.: . : :: .:: .: .: :. : . . : CCDS76 LLDA--KPSGAAYPICEWRYDACASPCFQTCRDPRAASCRDV--PRVEGCVPVCPTPQVL 1400 1410 1420 1430 1440 1450 1290 1300 1310 1320 1330 1340 pF1KB6 SEAEFEVLKAFVVDMMERLRISQKWVRVAVVEYHDGSHAYIGLKDRKRPSELRRIASQV- .:. . . .. : .: :: . .. :... . ::. . :: CCDS76 DEVTQRCV--YLEDCVE----PAVWVPTEAL----GNETLPPSQGLPTPSDEEPQLSQES 1460 1470 1480 1490 1500 1350 1360 1370 1380 1390 pF1KB6 ------KYAGSQVASTSEVLKYTLFQIFSKIDRPEASRIALL----LMASQEPQRMSRNF . : . .: . .:. . . : .. .: : ::: : ... CCDS76 PRTPTHRPALTPAAPLTTALNPPVTATEEPVVSPGPTQTTLQQPLELTASQLPAGPTESP 1510 1520 1530 1540 1550 1560 1400 1410 1420 1430 1440 1450 pF1KB6 VRYVQGLKKKKVIVIPVGIGPHANLKQIRLIEKQAPENKAFVLSSVDELEQQRDEIV--- . .:. . . . ::. .. . :.: ..:.. .: : .. CCDS76 AS--KGVTASLLAI------PHTPESSSLPVALQTPTPG--MVSGA--METTRVTVIFAG 1570 1580 1590 1600 1460 1470 1480 1490 1500 1510 pF1KB6 SYLCDLAPEAPP-PTLPPHMAQVTV-GPGLLGVSTLGPKRNSMVLDVAFVLEGSDKIGEA : .. ..:: : .: ::: : : : : : :. . . . . . :... CCDS76 SPNITVSSRSPPAPRFPLMTKAVTVRGHGSLPVRTTPPQPSLTASPSSRPVASPGAISRS 1610 1620 1630 1640 1650 1660 1520 1530 1540 1550 1560 pF1KB6 DFNRSKE------FMEEVIQRMDVGQDSIHVTVLQYSYMVTVEYPFSEAQSKGDILQRVR . ... . .::.: : : . .. . : .:: .: . . : CCDS76 PTSSGSHKAVLTPAVTKVISRTGVPQPTQAQSASSPSTPLTVAGTAAEQVPVSPLATRSL 1670 1680 1690 1700 1710 1720 1570 1580 1590 1600 1610 1620 pF1KB6 EIRYQGGNRTNTGLALRYLSDHSFLVSQGDREQAPNLVYMVTGNPA--SDEIKRLPGDIQ :: . :. : : :: ... : :. . . :: . : :. CCDS76 EIVLS----TEKGEA-----GHSQPMGSPASPQ-PHPLPSAPPRPAQHTTMATRSPA--- 1730 1740 1750 1760 1770 1630 1640 1650 1660 1670 pF1KB6 VVPIGVGPNANVQELERIGWPNAPILIQDFETLPRE-----APDLVLQRCCSGEGLQIPT .: . : : : .:.. . : : . :: : . : . :. CCDS76 -LPPET-PAAASLSTATDGLAATPFMSLE-STRPSQLLSGLPPDTSLP--LAKVGTSAPV 1780 1790 1800 1810 1820 1830 1680 1690 1700 1710 1720 pF1KB6 LSPAPDCSQPLDVILLLDGSSSFPASYFDEMKSFAKAFISKAN----------------- .:.: : . . : ....::. .. . :. : ...:. CCDS76 ATPGPKAS--VITTPLQPQATTLPAQTLSPVLPFTPAAMTQAHPPTHIAPPAAGTAPGLL 1840 1850 1860 1870 1880 1730 1740 1750 1760 1770 pF1KB6 IGPRLTQVSVLQY--GSITTIDV-PWNVVPEKAHLLS----LVDVM--QREGGPSQIGDA .: : .:: :. . ..: : . . :. .:: : : . ::::... : CCDS76 LGATLPTSGVLPVAEGTASMVSVVPRKSTTGKVAILSKQVSLPTSMYGSAEGGPTELTPA 1890 1900 1910 1920 1930 1940 1780 1790 1800 1810 1820 1830 pF1KB6 LGFAVRYLTSEMHGARPGASKAVVILVTDVSVDSVDAAADAARSNRVTVFPIGIGDRYDA . . :..: .::. :.. : :. ... : .: : ... ....: . . CCDS76 TSHPLTPLVAEPEGAQAGTALPVP---TSYALSRV-SARTAPQDSMLVLLPQLAEAHGTS 1950 1960 1970 1980 1990 2000 1840 1850 1860 1870 1880 1890 pF1KB6 AQLRILAGPAGDSNVVKLQRIEDLPTMVTLGNSFLHKLCSGFVRICMDEDGNEKRPGDVW : .. : :. .... : . :.. :... : ... . .. : CCDS76 AGPHLAAEPVDEATTEPSGR--SAPAL-----SIVEGLAEALATTTEANTSTTCVP---- 2010 2020 2030 2040 2050 1900 1910 1920 1930 1940 1950 pF1KB6 TLPDQ-CHTVTCQPDGQTLLKSHRVNCDRGLRPS-CPNSQSPVKVE-ETCGCRWTCPCVC . .: : : .:: . .. .: .: : : :.: . : : : : : CCDS76 -IAEQDCVRHICL-EGQLIRVNQSQHCPQGAAPPRCGILGLAVRVGGDRCCPLWECACRC 2060 2070 2080 2090 2100 2110 1960 1970 1980 1990 2000 pF1KB6 TGSSTRHIVTFDGQNFKLTGSCSYVLFQNKEQDLEVILHNGACSPGARQG-------CMK . .:::::.. : :.: :. .. : : : :. .: : :. CCDS76 SIFPDLSFVTFDGSHVALFKEAIYILSQSPDEMLTV--HVLDCK-SANLGHLNWPPFCLV 2120 2130 2140 2150 2160 2010 2020 2030 2040 2050 2060 pF1KB6 SIEVKHSALSVELHS-DMEVTVNGRLVSVPYVGGNMEVNVYGAIMHEVRFNHLGHIFT-F ... : : .: . . .:::. . : : :. :: :.. ::.. . CCDS76 MLNMTHLAHQVTIDRFNRKVTVDLQPVWPP-------VSRYG-----FRIEDTGHMYMIL 2170 2180 2190 2200 2210 2070 2080 2090 2100 2110 pF1KB6 TPQNNEFQLQLSPKTF---ASKT-----YGLCGICDENGANDFMLRDGTVT---TDWKTL ::.. ..: : . :::: .::::::: ..:::. :.::.:. : . CCDS76 TPSDIQIQWLHSSGLMIVEASKTSKAQGHGLCGICDGDAANDLTLKDGSVVGGAEDPAPF 2220 2230 2240 2250 2260 2270 2120 2130 2140 2150 2160 pF1KB6 VQEWTVQRP----GQT-CQPILEEQCLVPDSSHCQVLLLP-LFAECHKVLAPATFYAICQ .. : : ::: .: ..: . : : : .. :. ::. . : .: . CCDS76 LDSWQVPSSLTSVGQTRFRP---DSCATTDCSPCLRMVSNRTFSACHRFVPPESFCELWI 2280 2290 2300 2310 2320 2330 2170 2180 2190 2200 2210 2220 pF1KB6 QDSCHQEQVCEVIASYAHLCRTNGVCVDWRTPDFCAMSCPPSLVYNHCEHGC--PRHC-D .:. . .: : ... :. .:. ::..:: :.: . : . .:. : .: :. : : CCDS76 RDTKYVQQPCVALTVYVAMCHKFHVCIEWRRSDYCPFLCSSDSTYQACVTACEPPKTCQD 2340 2350 2360 2370 2380 2390 2230 2240 2250 2260 2270 pF1KB6 GNVSSCG-DHPS---EGCFCPPDKVMLE---GSCVPEEACTQCIGEDGVQHQFLEAWVPD : .. .: . ::: : .. . . :.:: :. : :: . . :.: . CCDS76 GILGPLDPEHCQVLGEGCVCSEGTILHRRHSALCIPEAKCA-CTDSMGVPRALGETWNSS 2400 2410 2420 2430 2440 2450 2280 2290 2300 2310 2320 2330 pF1KB6 HQPCQICTCLSGRKVNCTTQPCPTAKAPTC-GLCEVARLRQNADQCCPEYECVCDPVSCD . : : . . . ::. . .: . ::: : . : :: :::. . :. CCDS76 LSGCCQHQCQAPDTIVPVDLGCPSPRPESCLRFGEVALLLPTKDPCCLGTVCVCNQTLCE 2460 2470 2480 2490 2500 2510 2340 2350 2360 2370 2380 pF1KB6 LPPVPHCERGLQPTLTNPGE--CRPNFTCACRKEECKRVSPPSCPPHR-LPTLR-KTQCC .: :. : . ::. : : :...: : . :. ::: . : : : .:: CCDS76 -GLAPTCRPG-HRLLTHFQEDSCCPSYSCECDPDLCEAELVPSCRQDQILITGRLGDSCC 2520 2530 2540 2550 2560 2570 2390 2400 2410 2420 2430 2440 pF1KB6 DEYECAC-NCVNSTVSCPLGYLASTATNDCGCTTTTCLPDKVCVHRSTIYPVGQFWEEGC : ::: .: .: : : .. : :: : : :. : CCDS76 TSYFCACGDCPDSIPECQEGEALTVHRN----TTELC-----C-------PLYQ------ 2580 2590 2600 2450 2460 2470 2480 2490 2500 pF1KB6 DVCTCTDMEDAVMGLRVAQCSQKPCEDSCRSGFTYVLHEGECCGRCLP-SACEVVTGSPR :.: .. .: : : :. .: : :: : ..:: CCDS76 --CVCENF----------RCPQVQC------GLGTALVEVWSPDRCCPYKSCEC------ 2610 2620 2630 2640 2510 2520 2530 2540 2550 2560 pF1KB6 GDSQSSWKSVGSQWASPENPCLINECVRVKEEVFIQQRNVSCPQLEVPVCPSGFQLSCKT : .. : : . : .. :: . . .:: : .: CCDS76 -DCDTI----------PVPRCHLWEKSQLDEEFMHSVENV---------C------GCAK 2650 2660 2670 2570 2580 2590 2600 2610 2620 pF1KB6 SACCPSCRCERMEACMLNGTVIGPGKTVM---ID-VCTTCRCMVQVGVISGF-KLECRKT : . : : : :. ::.::. : :: : :: . . ...: ... .. CCDS76 YECVKAPVCLSREL----G-VMQPGQTVVELSADGVCHTSRCTTVLDPLTNFYQINTTSV 2680 2690 2700 2710 2720 2730 2630 2640 2650 2660 2670 pF1KB6 TCN-PCPLG--YKEENNTGECCGRCLPTACTIQLRGGQIMTLKRDETLQDGCDTHFCKVN :. : . :.. . . ::: : ..: . . .: . . : : :. . CCDS76 LCDIHCEANQEYEHPRDLAACCGSCRNVSCLFTFPNGTTSLFLPGASWIADCARHHCSST 2740 2750 2760 2770 2780 2790 2680 2690 2700 2710 2720 2730 pF1KB6 ERGEYFWEKRVTGCPPFDEHKCLAEGGKIMKIPGTCCDTCEEP--ECNDITARLQYVKVG : . .. .. :::..: .: ::... :: ::.: :. .: :. .. . CCDS76 PLGAVLVRSPIS-CPPLNETECAKVGGSVVPSLEGCCRTCKEDGRSCKKVTIRMT-IRKN 2800 2810 2820 2830 2840 2850 2740 2750 2760 2770 2780 2790 pF1KB6 SCKSEVEVDIHYCQGKCASKAMYSIDINDVQDQCSCCSPTRTEPMQVALHC-TNGSVVYH :.: . :.. :.:.: : ..:. .:: :.:: . . .: : : ::.. : . CCDS76 ECRSSTPVNLVSCDGRCPSASIYNYNINTYARFCKCCREVGLQRRSVQLFCATNATWVPY 2860 2870 2880 2890 2900 2910 2800 2810 pF1KB6 EVLNAMECKCSPRKCSK : . .: : CCDS76 TVQEPTDCACQWS 2920 >>CCDS76369.1 MUC5AC gene_id:4586|Hs108|chr11 (5654 aa) initn: 1843 init1: 367 opt: 1573 Z-score: 1181.1 bits: 234.0 E(32554): 1.8e-59 Smith-Waterman score: 2854; 34.3% identity (62.2% similar) in 1292 aa overlap (7-1249:50-1295) 10 20 30 pF1KB6 MIPARFAGVLLALALILPGTLCAEGTRGRSSTAR-- .:: : : ..:. .:. :. :. CCDS76 CTRHTGHAQDGSSESSYKHHPALSPIARGPSGVPLRGATVFPSLRTIPVVRA-SNPAHNG 20 30 40 50 60 70 40 50 60 70 80 pF1KB6 --CSLFGSDFVNTFDGSMYSFAGYCSYLLAGGCQK--RSFSI-IGDFQNGKRVSLSVYLG :: .:: .::::... : : :.:... : ..:.: . :.. .:: : CCDS76 RVCSTWGSFHYKTFDGDVFRFPGLCNYVFSEHCGAAYEDFNIQLRRSQESAAPTLSRVLM 80 90 100 110 120 130 90 100 110 120 130 140 pF1KB6 EFFDIHL-FVNGTVTQGDQRVSMPYASKGLYLETEAGYYKLSGEAYGFVARIDGSGNFQV . . . ...:.: . . : .:....:. .. ..: :. .. :.: . . .. . CCDS76 KVDGVVIQLTKGSVLVNGHPVLLPFSQSGVLIQQSSSYTKVEAR-LGLVLMWNHDDSLLL 140 150 160 170 180 190 150 160 170 180 190 200 pF1KB6 LLSDRYFNKTCGLCGNFN-IFAEDDFMTQEGTLTSDPYDFANSWALSSGEQWCERASP-P :. .: ::::::::.:: . . ....... :: :..:.: ... . :. : : CCDS76 ELDTKYANKTCGLCGDFNGMPVVSELLSHNTKLT--PMEFGNLQKMDDPTDQCQDPVPEP 200 210 220 230 240 250 210 220 230 240 250 260 pF1KB6 SSSCNISSGEMQKGLWEQCQLLKSTSVFARCHPLVDPEPFVALCEKTLCECAGG--LECA .:. . : :. : ..:. : ::: .. :.. :: : : :. CCDS76 PRNCSTGFG--------ICEELLHGQLFSGCVALVDVGSYLEACRQDLCFCEDTDLLSCV 260 270 280 290 300 270 280 290 300 310 320 pF1KB6 CPALLEYARTCAQEGMVLYGWTDHSACSPVCPAGMEYRQCVSPCARTCQSLHINEMCQER : .: ::.: :.. : . : . : :: .:.:..: :::: ::.. . .. :... CCDS76 CHTLAEYSRQCTHAGGLPQDWRGPDFCPQKCPNNMQYHECRSPCADTCSNQEHSRACEDH 310 320 330 340 350 360 330 340 350 360 370 380 pF1KB6 CVDGCSCPEGQLLDE-GL--CVESTECPCVHSGKRYPPGTSLSRDCNTCICRNSQWICSN :: :: :::: .::. : :: ..: ::..: : ::.. : ::..: : ...: :.. CCDS76 CVAGCFCPEGTVLDDIGQTGCVPVSKCACVYNGAAYAPGATYSTDCTNCTCSGGRWSCQE 370 380 390 400 410 420 390 400 410 420 430 440 pF1KB6 EECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARDCQDHSFSIVIETVQCADDRDAVCT ::: : : : .::..::.. .: : :.:.:.. :.. .:... : .:. . .: CCDS76 VPCPGTCSVLGGAHFSTFDGKQYTVHGDCSYVLTKPCDSSAFTVLAELRRCGLTDSETCL 430 440 450 460 470 480 450 460 470 480 490 pF1KB6 RSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDLRIQRTVTASV--RLSYGEDLQ .:::. : : . ..: .: .. : .. .:::. ... : : : . . : : .:. CCDS76 KSVTLSLDGAQ-TVVVIKASGEVFLNQIYTQLPISAANVTIFRPSTFFIIAQTSLGLQLN 490 500 510 520 530 540 500 510 520 530 540 550 pF1KB6 MDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDC .. .:...:.: :.:::::::.:. :.::: : ::..: . : :..: .. : CCDS76 LQLVPTMQLFMQLAPKLRGQTCGLCGNFNSIQADDFRTLSGVVEATAAAFFNTFKTQAAC 550 560 570 580 590 600 560 570 580 590 600 610 pF1KB6 QDLQKQHSDPCALNPRMTRFSEEACAVLTSPT--FEACHRAVSPLPYLRNCRYDVCSCSD ..... :::.:. . ..... :. ::. : :: ::.: : :: .:.:.: CCDS76 PNIRNSFEDPCSLSVENEKYAQHWCSQLTDADGPFGRCHAAVKPGTYYSNCMFDTCNCER 610 620 630 640 650 660 620 630 640 650 660 670 pF1KB6 GRECLCGALASYAAACAGRGVRVA-WREPGRCE---LNCPKGQVYLQCGTPCNLTCRSLS ...:::.::.::. :::..::... ::. : : .:::...: . :. :::::: CCDS76 SEDCLCAALSSYVHACAAKGVQLGGWRD-GVCTKPMTTCPKSMTYHYHVSTCQPTCRSLS 670 680 690 700 710 720 680 690 700 710 720 730 pF1KB6 YPDEECNEACL--EGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPEDIFSDHHTMCYC : :. . . .::.:: : ..:. : :: ..::::. : .. . : ..: : CCDS76 EGDITCSVGFIPVDGCICPKGTFLDDTGKCVQASNCPCYHRGSMIPNGESVHDSGAICTC 730 740 750 760 770 780 740 750 760 770 780 790 pF1KB6 EDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKT : . : :. : : ..:. ..:: . :.:. : : :. CCDS76 THGKLSCI-----GGQAPAPVCAAPMVF-----FDCRN-----ATPGDT----GAGCQKS 790 800 810 820 800 810 820 830 840 850 pF1KB6 CQNYDLECMSMGCVSGCLCPPGMVRH-ENRCVALERCPCFHQGKEYAPGETVKIGCNTCV :.. :. :.: :: ::.:: :.: :. :.. : ::: :. : :.:...:::::. CCDS76 CHTLDMTCYSPQCVPGCVCPDGLVADGEGGCITAEDCPCVHNEASYRAGQTIRVGCNTCT 830 840 850 860 870 880 860 870 880 890 900 pF1KB6 CRDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCG---SNPGTFRI : .: : ::: : :::.. : .::::::: .: : :.:.:.:::..:: :. .::. CCDS76 CDSRMWRCTDDPCLATCAVYGDGHYLTFDGQSYSFNGDCEYTLVQNHCGGKDSTQDSFRV 890 900 910 920 930 940 910 920 930 940 950 960 pF1KB6 LVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNV-KRPMKDETHFEVVESGRYIILLL .. : :. .. :.: . :.. : :..: :.:.: ..:. . . . : :... CCDS76 VTENVPCGTTGTTCSKAIKIFLGGFELKLSHGKVEVIGTDESQEVPYTIRQMGIYLVVDT 950 960 970 980 990 1000 970 980 990 1000 1010 1020 pF1KB6 GKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWK .: ..::.. :: . :. .. .::::::::: : ::... . .: : ..:::::: CCDS76 DIGLVLLWDKKTSIFINLSPEFKGRVCGLCGNFDDIAVNDFATRSRSVVGDVLEFGNSWK 1010 1020 1030 1040 1050 1060 1030 1040 1050 1060 1070 1080 pF1KB6 VSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIY .: .: :. .: : : : : .... ....: :: . .: :. :.: : ..:. CCDS76 LSPSCPDAL-APKD--P--CTANPFRKSWAQKQCSILHGPTFAACHAHVEPARYYEACVN 1070 1080 1090 1100 1110 1120 1090 1100 1110 1120 1130 1140 pF1KB6 DTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRY :.:.:.: ::: ::: ..::::..: . : :.::: ..:: :. : .: .:::.: CCDS76 DACACDSGGDCECFCTAVAAYAQACHEVGLCVSWRTPSICPLFCDYYN--PEG-QCEWHY 1130 1140 1150 1160 1170 1150 1160 1170 1180 1190 pF1KB6 NSCAPACQVTCQHPEPLAC--PVQCVEGCHAHCPP-GKILDE----LLQTCVDPEDCPVC . :. : ::..:. : :. .:::. .::: . :.:: . :: : : : CCDS76 QPCGVPCLRTCRNPRG-DCLRDVRGLEGCYPKCPPEAPIFDEDKMQCVATCPTPPLPPRC 1180 1190 1200 1210 1220 1230 1200 1210 1220 1230 1240 pF1KB6 EVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTC----EAC------QE--PGGLVVPP .: :. . : : ::: ..:: : : .. : ::: :. :: .. CCDS76 HVHGKSYRPGAVV---PSD-KNCQSCLCTERGVECTYKAEACVCTYNGQRFHPGDVIYHT 1240 1250 1260 1270 1280 1290 1250 1260 1270 1280 1290 1300 pF1KB6 TDAPVSPTTLYVEDISEPPLHDFYCSRLLDLVFLLDGSSRLSEAEFEVLKAFVVDMMERL :: CCDS76 TDGTGGCISARCGANGTIERRVYPCSPTTPVPPTTFSFSTPPLVVSSTHTPSNGPSSAHT 1300 1310 1320 1330 1340 1350 >-- initn: 660 init1: 170 opt: 558 Z-score: 419.9 bits: 93.2 E(32554): 4.6e-17 Smith-Waterman score: 900; 25.1% identity (42.9% similar) in 998 aa overlap (1887-2811:4859-5619) 1860 1870 1880 1890 1900 1910 pF1KB6 LPTMVTLGNSFLHKLCSGFVRICMDEDGNEKRPGDVWTLPDQCHTVTCQPDGQTLLKSHR .. :..:. :. : .::. :..... . CCDS76 TTLPPAPATSPSISTSEPVTELGCPNAVPPRKKGETWATPN-CSEATCE--GNNVISLRP 4830 4840 4850 4860 4870 4880 1920 1930 1940 1950 1960 1970 pF1KB6 VNCDRGLRPSCPNSQSPVKVEETCGC--RWTCPCVCTGSSTRHIVTFDGQNFKLTGSCSY .: : .:.: :. ::: . :: .. : :::.: . : .:::: . . .:.: CCDS76 RTCPRVEKPTCANGYPAVKVADQDGCCHHYQCQCVCSGWGDPHYITFDGTYYTFLDNCTY 4890 4900 4910 4920 4930 4940 1980 1990 2000 2010 2020 pF1KB6 VLFQNKEQ---DLEVILHNGACSPGARQG--CMKSIEVKHSALSVEL-----HSDM--EV :: :. ..:.. : : ::..: : .:: ... : : :. : :. CCDS76 VLVQQIVPVYGHFRVLVDNYFC--GAEDGLSCPRSIILEYHQDRVVLTRKPVHGVMTNEI 4950 4960 4970 4980 4990 5000 2030 2040 2050 2060 2070 2080 pF1KB6 TVNGRLVSVPYVGGNMEVNVYGAIMHEVRFNHLGHIFTFTPQNNEFQLQLSPKTFASKTY :...:: . ... :. :. :. . . .:: :. :.... . ::..: CCDS76 IFNNKVVSPGFRKNGIVVSRIGVKMYAT-IPELGVQVMFSGLI--FSVEVPFSKFANNTE 5010 5020 5030 5040 5050 5060 2090 2100 2110 2120 pF1KB6 GLCGICDENGANDFMLRDGTVTTDWKTLVQEWTVQRPGQ-TCQ----------------- : :: : .. .. :::... . . :.:. : : .:. CCDS76 GQCGTCTNDRKDECRTPRGTVVASCSEMSGLWNVSIPDQPACHRPHPTPTTVGPTTVGST 5070 5080 5090 5100 5110 5120 2130 2140 2150 2160 2170 pF1KB6 -------------PILEEQCLVPDSSHCQVLLLPLFAECHKVLAPATFYAICQQDSCHQE : .: : ::..: .: :: :. : :: : : ::. CCDS76 TVGPTTVGSTTVGPTTPPAPCLP-SPICQLILSKVFEPCHTVIPPLLFYEGCVFDRCHMT 5130 5140 5150 5160 5170 2180 2190 2200 2210 2220 pF1KB6 Q---VCEVIASYAHLCRTNGVCVDWR--TPDFCAMSCPPSLVYNHCEHGCPRHCDGNVS- . :: . :: :: .. .:.::: : .: ..:: . ::. : . : .: :: : CCDS76 DLDVVCSSLELYAALCASHDICIDWRGRTGHMCPFTCPADKVYQPCGPSNPSYCYGNDSA 5180 5190 5200 5210 5220 5230 2230 2240 2250 2260 2270 pF1KB6 SCGDHP-----SEGCFCPPDKVMLEGS---CVPEEACTQCIGEDGVQHQFLEAWVPDHQP : : : .:::::: ... : ::: .: .:.: : .: CCDS76 SLGALPEAGPITEGCFCPEGMTLFSTSAQVCVPT-GCPRCLG-------------PHGEP 5240 5250 5260 5270 5280 2280 2290 2300 2310 2320 2330 pF1KB6 CQICTCLSGRKVNCTTQPCPTAKAPTCGLCEVARLRQNADQCCPEYECVCDPVSCDLPPV .. :. :. : : ::.: . .: : : :::. CCDS76 VKV-----GHTVGMDCQECT---------CEAAT-----------WTLTCRPKLCPLPPA 5290 5300 5310 5320 2340 2350 2360 2370 2380 2390 pF1KB6 PHCERGLQPTLTNPGECRPNFTCACRKEECKRVSPPSCPPHRLPTLRKTQCCDEYECACN : : :.: : :. : . ::: .: :::: CCDS76 --C-----PL--------PGF-----------VPVPAAP-------QAGQCCPQYSCACN 5330 5340 2400 2410 2420 2430 2440 2450 pF1KB6 CVNSTVSCPLGYLASTATNDCGCTTTTCLPDKVCVHRSTIYPVGQFWEEGCDVCTCTDME : :: ::: CCDS76 ----TSRCPA-------------------------------PVG---------------- 5350 2460 2470 2480 2490 2500 2510 pF1KB6 DAVMGLRVAQCSQKPCEDSCRSGFTYVLHEGECCGRCLPSACEVVTGSPRGDSQSSWKSV : .. :. :: .:: CCDS76 ---------------CPEGARAIPTY--QEG----------------------------- 5360 5370 2520 2530 2540 2550 2560 2570 pF1KB6 GSQWASPENPCLINECVRVKEEVFIQQRNVSCPQLEVPVCPSGFQLSCKTSACCPSCRCE :::: : CCDS76 ---------------------------------------------------ACCPVQNCS 2580 2590 2600 2610 2620 2630 pF1KB6 RMEACMLNGTVIGPGKTVMIDVCTTCRCMVQVGVIS-GFKLECRKTTCNP-CPLGYKEEN .: .:::. :: .: ..: :::: . : : .: . :. :: ::.:.. .. CCDS76 -WTVCSINGTLYQPGAVVSSSLCETCRCELPGGPPSDAFVVSCETQICNTHCPVGFEYQE 5380 5390 5400 5410 5420 5430 2640 2650 2660 2670 2680 2690 pF1KB6 NTGECCGRCLPTACTIQLRGGQIMTLKRDETLQDG---CDTHFCKVNERGEYFWEKRVTG ..:.::: :. .::. . . . :: .:. : :: :. .. : . . CCDS76 QSGQCCGTCVQVACVTNTSKSPAHLFYPGETWSDAGNHCVTHQCEKHQDGLVVVTTK-KA 5440 5450 5460 5470 5480 5490 2700 2710 2720 2730 2740 pF1KB6 CPPFDEHKCLAEGGKIMKIPGTCCDTCEEPE--------CNDITARLQYVKVGSCKSEVE :::.. : . ... : :: : : : . : .. .:.: CCDS76 CPPLS---CSLDEARMSK--DGCCRFCPPPPPPYQNQSTCA-VYHRSLIIQQQGCSSSEP 5500 5510 5520 5530 5540 5550 2750 2760 2770 2780 2790 2800 pF1KB6 VDIHYCQGKCA-SKAMYSIDINDVQDQCSCCSPTRTEPMQVALHCTNGSVVYHEVLNAME : . ::.:.:. :..:::.. : :. .:.::. :: .:.::::.:: .. : CCDS76 VRLAYCRGNCGDSSSMYSLEGNTVEHRCQCCQELRTSLRNVTLHCTDGSSRAFSYTEVEE 5560 5570 5580 5590 5600 5610 2810 pF1KB6 CKCSPRKCSK : : :.: CCDS76 CGCMGRRCPAPGDTQHSEEAEPEPSQEAESGSWERGVPVSPMH 5620 5630 5640 5650 >>CCDS44515.2 MUC5B gene_id:727897|Hs108|chr11 (5762 aa) initn: 1554 init1: 383 opt: 1516 Z-score: 1138.2 bits: 226.1 E(32554): 4.4e-57 Smith-Waterman score: 2925; 34.5% identity (62.1% similar) in 1233 aa overlap (35-1237:77-1259) 10 20 30 40 50 60 pF1KB6 RFAGVLLALALILPGTLCAEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAGG :: .:. .::::... : : :.:... CCDS44 SSPTRRVSFVPPVTVFPSLSPLNPAHNGRVCSTWGDFHYKTFDGDVFRFPGLCNYVFSEH 50 60 70 80 90 100 70 80 90 100 110 120 pF1KB6 CQKRSFSIIGDFQNGKRVSLSVYLGEFFDIHLFV----NGTVTQGDQRVSMPYASKGLYL :. .. ... : : : . . .: ::.: . :: .::. :: . CCDS44 CRAAYEDFNVQLRRGLVGSRPVVTRVVIKAQGLVLEASNGSVLINGQREELPYSRTGLLV 110 120 130 140 150 160 130 140 150 160 170 pF1KB6 ETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFN-IFAEDDFMTQEGT : . : :.: . .. .: . . :. .: :.::::::.:: . : ..:..... CCDS44 EQSGDYIKVSIRLV-LTFLWNGEDSALLELDPKYANQTCGLCGDFNGLPAFNEFYAHNAR 170 180 190 200 210 220 180 190 200 210 220 230 pF1KB6 LTSDPYDFANSWALSSGEQWCERASP-PSSSCNISSGEMQKGLWEQCQLLKSTSVFARCH :: : .:.: :.. . : : :...:. ..:. :. .::.:: CCDS44 LT--PLQFGNLQKLDGPTEQCPDPLPLPAGNCT-----DEEGI---CHRTLLGPAFAECH 230 240 250 260 270 240 250 260 270 280 290 pF1KB6 PLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGWTDHSACSPVCPAG ::: ..: : . ::.: : : ...::.: ::. : .: : .:: . CCDS44 ALVDSTAYLAACAQDLCRCP---TCPCATFVEYSRQCAHAGGQPRNWRCPELCPRTCPLN 280 290 300 310 320 330 300 310 320 330 340 350 pF1KB6 MEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDE---GLCVESTECPCVHSGK :....: :::. ::.. . ..:...::::: :: : .::. . :. .:::.:.:. CCDS44 MQHQECGSPCTDTCSNPQRAQLCEDHCVDGCFCPPGTVLDDITHSGCLPLGQCPCTHGGR 340 350 360 370 380 390 360 370 380 390 400 410 pF1KB6 RYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLA : ::::.. :..: : .. : :.. ::: : : : .:....:.. . . : :.:.:. CCDS44 TYSPGTSFNTTCSSCTCSGGLWQCQDLPCPGTCSVQGGAHISTYDEKLYDLHGDCSYVLS 400 410 420 430 440 450 420 430 440 450 460 470 pF1KB6 RDCQDHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPL . : : ::... : .:. . : ..::. : : .. .... .:: ... .:::: CCDS44 KKCADSSFTVLAELRKCGLTDNENCLKAVTLSLDG-GDTAIRVQADGGVFLNSIYTQLPL 460 470 480 490 500 510 480 490 500 510 520 530 pF1KB6 LKGDLRIQRTVTASVRLSYGEDLQM--DWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGD ... . . . .. : ::. . ...:.:.:.. :. ::::::.: ::.: CCDS44 SAANITLFTPSSFFIVVQTGLGLQLLVQLVPLMQVFVRLDPAHQGQMCGLCGNFNQNQAD 520 530 540 550 560 570 540 550 560 570 580 590 pF1KB6 DFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEACAVLTSPT-- :: . ::..: :.:.:: .. : . ... :::.:. . .... :. ::.:. CCDS44 DFTALSGVVEATGAAFANTWKAQAACANARNSFEDPCSLSVENENYARHWCSRLTDPNSA 580 590 600 610 620 630 600 610 620 630 640 pF1KB6 FEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVA-WREPGRCE- : :: ..: :. :: .:.:.: ...:::.::.::. :::..::... ::. : : CCDS44 FSRCHSIINPKPFHSNCMFDTCNCERSEDCLCAALSSYVHACAAKGVQLSDWRD-GVCTK 640 650 660 670 680 690 650 660 670 680 690 700 pF1KB6 --LNCPKGQVYLQCGTPCNLTCRSLSYPDEECNEACL--EGCFCPPGLYMDERGDCVPKA ::::.: : :. :::.:: : :. . . .:: :: : .... : ::: CCDS44 YMQNCPKSQRYAYVVDACQPTCRGLSEADVTCSVSFVPVDGCTCPAGTFLNDAGACVPAQ 700 710 720 730 740 750 710 720 730 740 750 760 pF1KB6 QCPCYYDGEIFQPEDIFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSL .:::: : .. : .. :. ..: : : . : :. : ..: CCDS44 ECPCYAHGTVLAPGEVVHDEGAVCSCTGGKLSCL-----GASL-------------QKST 760 770 780 790 770 780 790 800 810 820 pF1KB6 SCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRH-ENRCVAL .: ::: : : .. . : :: ..:.. :. :.: :::::.::::.: . :.: CCDS44 GCAAPMVYLDCSNSSAGTPGAECLRSCHTLDVGCFSTHCVSGCVCPPGLVSDGSGGCIAE 800 810 820 830 840 850 830 840 850 860 870 880 pF1KB6 ERCPCFHQGKEYAPGETVKIGCNTCVCRDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYL : ::: :. : ::::... ::::.::.:.:.:. ..: .:: . : .:..:::: .: CCDS44 EDCPCVHNEATYKPGETIRVDCNTCTCRNRRWECSHRLCLGTCVAYGDGHFITFDGDRYS 860 870 880 890 900 910 890 900 910 920 930 940 pF1KB6 FPGECQYVLVQDYCGSNP--GTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVN : : :.:.:.:::::.: :::::.. : :. .. :.: . ..::. :. : .: . CCDS44 FEGSCEYILAQDYCGDNTTHGTFRIVTENIPCGTTGTTCSKAIKLFVESYELILQEGTFK 920 930 940 950 960 970 950 960 970 980 990 1000 pF1KB6 -VKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDG : : . ... : .... ....: :::. :. . :.: :. .::::::::: CCDS44 AVARGPGGDPPYKIRYMGIFLVIET-HGMAVSWDRKTSVFIRLHQDYKGRVCGLCGNFDD 980 990 1000 1010 1020 1030 1010 1020 1030 1040 1050 1060 pF1KB6 IQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCR ::... . .: : ..::::::.: .: :. .: : : : : .... ....: CCDS44 NAINDFATRSRSVVGDALEFGNSWKLSPSCPDAL-APKD--P--CTANPFRKSWAQKQCS 1040 1050 1060 1070 1080 1070 1080 1090 1100 1110 1120 pF1KB6 ILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWR :: . .: : . :: : ..:. :.:.:.: ::: ::: ..::::..: . : :.:: CCDS44 ILHGPTFAACRSQVDSTKYYEACVNDACACDSGGDCECFCTAVAAYAQACHDAGLCVSWR 1090 1100 1110 1120 1130 1140 1130 1140 1150 1160 1170 pF1KB6 TATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQC--VEGCHAHCPP : :: :. : .: :::.:. :. : ::..: : :. .:::. .::: CCDS44 TPDTCPLFCDFYN--PHGG-CEWHYQPCGAPCLKTCRNPSG-HCLVDLPGLEGCYPKCPP 1150 1160 1170 1180 1190 1200 1180 1190 1200 1210 1220 1230 pF1KB6 GK-ILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTC---- .. ...: . :: .: . : . : .: :. :.:: :.: .. : CCDS44 SQPFFNEDQMKCV--AQCGCYDKDGNYYDVGARV---PT-AENCQSCNCTPSGIQCAHSL 1210 1220 1230 1240 1250 1240 1250 1260 1270 1280 1290 pF1KB6 EACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHDFYCSRLLDLVFLLDGSSRLSEAEFE ::: CCDS44 EACTCTYEDRTYSYQDVIYNTTDGLGACLIAICGSNGTIIRKAVACPGTPATTPFTFTTA 1260 1270 1280 1290 1300 1310 >-- initn: 722 init1: 220 opt: 608 Z-score: 457.3 bits: 100.1 E(32554): 3.8e-19 Smith-Waterman score: 980; 28.0% identity (52.5% similar) in 764 aa overlap (1887-2574:5014-5741) 1860 1870 1880 1890 1900 1910 pF1KB6 LPTMVTLGNSFLHKLCSGFVRICMDEDGNEKRPGDVWTLPDQCHTVTCQPDGQTLLKSHR .. ...::: ..: .. : :....: . . CCDS44 GACPTSPPPVSSAPLSSPSPAPGCDNAIPLRQVNETWTL-ENCTVARCVGDNRVVLLDPK 4990 5000 5010 5020 5030 5040 1920 1930 1940 1950 1960 1970 pF1KB6 VNCDRGLRPSCPNSQSPVKVEET---CGCRWTCPCVCTGSSTRHIVTFDGQNFKLTGSCS . .: :.. :.:: . : .. : :.:. . : :::: .. . :.:. CCDS44 PVANV----TCVNKHLPIKVSDPSQPCDFHYECECICSMWGGSHYSTFDGTSYTFRGNCT 5050 5060 5070 5080 5090 1980 1990 2000 2010 2020 pF1KB6 YVLFQN---KEQDLEVILHNGACSPGARQG---CMKSIEVKHSALSVELHSDMEVTVNGR :::... . .: . : : :. .: . : ... ........ : : :.:. CCDS44 YVLMREIHARFGNLSLYLDNHYCTASATAAAARCPRALSIHYKSMDIVLTVTM---VHGK 5100 5110 5120 5130 5140 5150 2030 2040 2050 2060 2070 pF1KB6 ---LV---SVPYVGG----NMEVNVYGAIMHEVRFNHLGHIFTFTPQNNEFQLQLSPKTF :. ..: .: .. :.: :. .: . :: ::. : :: .: . : CCDS44 EEGLILFDQIPVSSGFSKNGVLVSVLGTTTMRVDIPALGVSVTFNGQV--FQARLPYSLF 5160 5170 5180 5190 5200 5210 2080 2090 2100 2110 2120 pF1KB6 ASKTYGLCGICDENGANDFMLRDGTVTTDWKTLVQEWTV---QRPG--------QTCQPI ..: : :: : .: .: . ::::.... : ... : : .. : : .: CCDS44 HNNTEGQCGTCTNNQRDDCLQRDGTTAASCKDMAKTWLVPDSRKDGCWAPTGTPPTASPA 5220 5230 5240 5250 5260 5270 2130 2140 2150 2160 2170 pF1KB6 LEEQCL-----VPDSSHCQVLLLPLFAECHKVLAPATFYAICQQDSCHQ--EQVCEVIAS . : . :...: .:::::... :. :. : .: :. : :. . . CCDS44 APVSSTPTPTPCPPQPLCDLMLSQVFAECHNLVPPGPFFNACISDHCRGRLEVPCQSLEA 5280 5290 5300 5310 5320 5330 2180 2190 2200 2210 2220 2230 pF1KB6 YAHLCRTNGVCVDWR--TPDFCAMSCPPSLVYNHCEHGCPRHCDG-NVSSCGDHPSEGCF ::.:::. ::: ::: : .: ..:::. ::. : : :.. : : . .:::: CCDS44 YAELCRARGVCSDWRGATGGLCDLTCPPTKVYKPCGPIQPATCNSRNQSPQLEGMAEGCF 5340 5350 5360 5370 5380 5390 2240 2250 2260 2270 2280 2290 pF1KB6 CPPDKVMLE---GSCVPEEACTQCIGEDGVQHQFLEAWVPDHQPCQICTCLSGR-KVNCT :: :..... : :: .:: :.: :: . : :: . :: :.: : .:.: CCDS44 CPEDQILFNAHMGICV--QACP-CVGPDGFPKFPGERWVSN---CQSCVCDEGSVSVQCK 5400 5410 5420 5430 5440 2300 2310 2320 2330 2340 pF1KB6 TQPCPT-AKAPTC---GLCEVARLRQNADQCCPEYECVCDPVSCDLPPVPHCERGLQPTL :: . .. : : :. :.: : . . :::: :::. ..: .: : : . CCDS44 PLPCDAQGQPPPCNRPGFVTVTRPRAE-NPCCPETVCVCNTTTCP-QSLPVCPPGQESIC 5450 5460 5470 5480 5490 5500 2350 2360 2370 2380 2390 pF1KB6 TNP-GECRPNFTCACRKEECKRVS---------PPSCPPHRLPTLRKTQCCDEYECACNC :. :.: :.: :: . :. . : . : : : .: . CCDS44 TQEEGDCCPTFR--CRPQLCSYNGTFYGVGATFPGALPCHMCTCLSGDTQDPTVQCQEDA 5510 5520 5530 5540 5550 5560 2400 2410 2420 2430 2440 2450 pF1KB6 VNSTVSCPLGY-LASTATNDCG-CTTTTCL-PDKVCVHRSTIYPVGQFWEEGCDVCTCTD :.: .:: :. .: . :: :. :.:: :: :. . . .. ..: : : . CCDS44 CNNT-TCPQGFEYKRVAGQCCGECVQTACLTPDGQPVQLNETWVNSHV--DNCTVYLC-E 5570 5580 5590 5600 5610 2460 2470 2480 2490 2500 2510 pF1KB6 MEDAVMGLRVAQCSQKPCEDSCRSGFTYVLHEGECCGRCLPSACEVVTGSPRGDSQSSWK : .: : . : .. : .:::.. :.. :: : ..:.: : .. :. CCDS44 AEGGVH-LLTPQPASCPDVSSCRGS----LRKTGCCYSCEEDSCQV-----RINTTILWH 5620 5630 5640 5650 5660 2520 2530 2540 2550 2560 pF1KB6 SVGSQWASPENPCLINEC---VRVKEEVFIQQRNVSCPQLE------VPV-CPSGFQL-- . : . . : . : . . :. .:.. .: : . ::. ::.: . CCDS44 Q-GCETEVNITFCE-GSCPGASKYSAEAQAMQHQCTCCQERRVHEETVPLHCPNGSAILH 5670 5680 5690 5700 5710 5720 2570 2580 2590 2600 2610 2620 pF1KB6 ---SCKTSACCPSCRCERMEACMLNGTVIGPGKTVMIDVCTTCRCMVQVGVISGFKLECR .: : : CCDS44 TYTHVDECGCTPFCVPAPMAPPHTRGFPAQEATAV 5730 5740 5750 5760 >>CCDS47663.2 ZAN gene_id:7455|Hs108|chr7 (2721 aa) initn: 651 init1: 238 opt: 642 Z-score: 486.2 bits: 104.4 E(32554): 9.2e-21 Smith-Waterman score: 1418; 25.8% identity (50.5% similar) in 1286 aa overlap (25-1242:1146-2309) 10 20 30 40 50 pF1KB6 MIPARFAGVLLALALILPGTLCAEGTRGRSSTARCSLFGSDFVNTFDGSMYSFA : . ..:: : ..:. :::: ..: CCDS47 HCRCWPGSRVECQISQCGTHTVCQLKNGQYGCHPYAGTATCLVYGDPHYVTFDGRHFGFM 1120 1130 1140 1150 1160 1170 60 70 80 90 100 pF1KB6 GYCSYLLAGGCQKRS---FSIIG--DFQNGKRVS-LS-VYLGEFFDIHLFVNGTVTQ-GD : :.:.:: : . . : . . . :. . :: :: ::. . ...: : : CCDS47 GKCTYILAQPCGNSTDPFFRVTAKNEEQGQEGVSCLSKVYVTLPESTVTLLKGRRTLVGG 1180 1190 1200 1210 1220 1230 110 120 130 140 150 160 pF1KB6 QRVSMP-YASKGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNF :.:..: :::..: . . . .:. : .:. .: ::. .. : .:. : .: ::::::. CCDS47 QQVTLPAIPSKGVFLGASGRFVELQTE-FGLRVRWDGDQQLYVTVSSTYSGKLCGLCGNY 1240 1250 1260 1270 1280 1290 170 180 190 200 210 220 pF1KB6 NIFAEDDFMTQEGTLTSDPYDFANSWALSSGE-QWCERASPPSS-SCNISSGEMQKGLWE . ...: . .:. ..: ...::: .. : : :.. . .: ::. : ..: CCDS47 DGNSDNDHLKLDGSPAGDKEELGNSWQTDQDEDQECQKYQVVNSPSCDSSLQSSMSGPGF 1300 1310 1320 1330 1340 1350 230 240 250 260 270 280 pF1KB6 QCQLLKSTSVFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLY .:. . . : : : : : .: : . : . .. :: . : .. CCDS47 CGRLVDTHGPFETCLLHVKAASFFDSCMLDMCGFQGLQHLLCTHMSTMTTTCQDAGHAVK 1360 1370 1380 1390 1400 1410 290 300 310 320 330 340 pF1KB6 GWTDHSACSPVCPAGMEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCV : . : .:: . .: :..:: ::.: . .:..:::..: : : .:. :. CCDS47 PWREPHFCPMACPPNSKYSLCAKPCPDTCHSGFSGMFCSDRCVEACECNPGFVLSGLECI 1420 1430 1440 1450 1460 1470 350 360 370 380 pF1KB6 ESTECPCVH-SGKRYPPGTSLSRD-CNT-CIC------RNSQWICSNEECPGE------- ..: :.: .:. . : . :. :.: : . : : .: :. CCDS47 PRSQCGCLHPAGSYFKVGERWYKPGCKELCVCESNNRIRCQPWRCRAQEFCGQQDGIYGC 1480 1490 1500 1510 1520 1530 390 400 410 420 430 440 pF1KB6 -------CLVTGQSHFKSFDNRYFTFSGICQYLLARDCQDHSFSIVIETVQCADDRDAVC : ..:. :. .::. : : : :.:.: : ..: . . . ..: .. CCDS47 HAQGAATCTASGDPHYLTFDGALHHFMGTCTYVLTRPCWSRSQDSYFVVSATNENRGGIL 1540 1550 1560 1570 1580 1590 450 460 470 480 490 pF1KB6 T----RSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDLRIQRTVTASVRLSYGE ..: : . : ::.. : : ..:. : ::. .. :. ..... : : . CCDS47 EVSYIKAVHVTVFDLSISLLR---GCKVMLNGHRVALPVWLAQGRVTIRLSSNLVLLYTN 1600 1610 1620 1630 1640 1650 500 510 520 530 540 550 pF1KB6 -DLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSGLAEPRVEDFGNAWKL ::. .:: . : . :.:. ::::::::.:. :: : :. ..: :::: CCDS47 FGLQVRYDGSHLVEVTVPSSYGGQLCGLCGNYNNNSLDDNLRPDRKLAGDSMQLGAAWKL 1660 1670 1680 1690 1700 1710 560 570 580 590 600 610 pF1KB6 HGDCQD---LQKQHSDPCALNPRMTRFSEEACAVLTSPT--FEACHRAVSPLPYLRNCRY . . : . . : : :. .. ::.: .: : ::..: : . .: . CCDS47 PESSEPGCFLVGGKPSSCQENS-MADAWNKNCAILINPQGPFSQCHQVVPPQSSFASCVH 1720 1730 1740 1750 1760 1770 620 630 640 650 660 670 pF1KB6 DVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQCGTPCNLTCR :. . :: .: .::. :: : :::. : . :: :. : :..:: :: CCDS47 GQCGTKGDTTALCRSLQAYASLCAQAGQAPAWRNRTFCPMRCPPGSSYSPCSSPCPDTCS 1780 1790 1800 1810 1820 1830 680 690 700 710 720 pF1KB6 SLSYPDEECNEA--CLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPEDIFSDHHTM :.. : ..: .: : :.: : : .. . ::: .:: : : ...: CCDS47 SINNP-RDCPKALPCAESCECQKGHILSGTS-CVPLGQCGC---------TDPAGSYH-- 1840 1850 1860 1870 730 740 750 760 770 780 pF1KB6 CYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLEC :...: .: ..: : CCDS47 ---------------------------PVGERWYTENTC----TRL-------------C 1880 1890 790 800 810 820 830 840 pF1KB6 TKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNT : . .: .. :.. : :... : ::. .: CCDS47 TCSVHN-NITCFQ------STCKPNQI-----CWALD--GLLH----------------- 1900 1910 1920 850 860 870 880 890 900 pF1KB6 CVCRDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGT--FR :: .. : ..:. : .::..::: .. .: : :::. : . :. CCDS47 --CR------ASGV--GVCQLPGESHYVSFDGSNHSIPDACTLVLVK-VCHPAMALPFFK 1930 1940 1950 1960 1970 910 920 930 940 950 pF1KB6 ILVGNKGCSHPSVKCK-KRVTILVEGGEIELFDGE---VNVKR---PMKDETHFEVVESG : . .. . . ..: : . ... : :. .: :. : .. :.:. CCDS47 ISAKHEKEEGGTEAFRLHEVYIDIYDAQVTLQKGHRVLINSKQVTLPAISQIPGVSVKSS 1980 1990 2000 2010 2020 2030 960 970 980 990 1000 1010 pF1KB6 R-YIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDP : :. . ...: .: . . . . :: ::::.::::. ....: . .: .. CCDS47 SIYSIVNIKIGVQVKFDGNHLLEIEIPTTYYGKVCGMCGNFNDEEEDELMMPSDEVANSD 2040 2050 2060 2070 2080 2090 1020 1030 1040 1050 1060 pF1KB6 VDFGNSWK---VSSQC----ADTRKVPLDS--SPA-TCHNNIMKQTMVDSSCRI-LTSDV .: :::: .. .: .: ...: .. .:. .:. .... .:. : . : CCDS47 SEFVNSWKDKDIDPSCQSLLVDEQQIPAEQQENPSGNCRAADLRRAR--EKCEAALRAPV 2100 2110 2120 2130 2140 1070 1080 1090 1100 1110 1120 pF1KB6 FQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHG-KVVTWRTATLC . .: . .: :.: : : : : .:... :.. .: ..: : ::....: CCDS47 WAQCASRIDLTPFLVDCANTLC--EFGGLYQALCQALQAFGATCQSQGLKPPLWRNSSFC 2150 2160 2170 2180 2190 2200 1130 1140 1150 1160 1170 1180 pF1KB6 PQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDEL : : . : : ::.:.: . : : :.::: : :: .:.: CCDS47 PLECPAYSSYTN---C---LPSCSPSCWDLDGRCEGAKVPSACAEGCI--CQPGYVLSE- 2210 2220 2230 2240 2250 1190 1200 1210 1220 1230 1240 pF1KB6 LQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVP . :: .: .. : . ::. .. . :.: .: ... : . :.: CCDS47 -DKCVPRSQCGCKDAHGGSIPLGKSW-VSSGCTEKC-VCTGGAIQ--CGDFRCPSGSHCQ 2260 2270 2280 2290 2300 2310 1250 1260 1270 1280 1290 1300 pF1KB6 PTDAPVSPTTLYVEDISEPPLHDFYCSRLLDLVFLLDGSSRLSEAEFEVLKAFVVDMMER CCDS47 LTSDNSNSNCVSDKSEQCSVYGDPRYLTFDGFSYRLQGRMTYVLIKTVDVLPEGVEPLLV 2320 2330 2340 2350 2360 2370 >>CCDS47664.2 ZAN gene_id:7455|Hs108|chr7 (2812 aa) initn: 651 init1: 238 opt: 642 Z-score: 486.1 bits: 104.4 E(32554): 9.4e-21 Smith-Waterman score: 1418; 25.8% identity (50.5% similar) in 1286 aa overlap (25-1242:1146-2309) 10 20 30 40 50 pF1KB6 MIPARFAGVLLALALILPGTLCAEGTRGRSSTARCSLFGSDFVNTFDGSMYSFA : . ..:: : ..:. :::: ..: CCDS47 HCRCWPGSRVECQISQCGTHTVCQLKNGQYGCHPYAGTATCLVYGDPHYVTFDGRHFGFM 1120 1130 1140 1150 1160 1170 60 70 80 90 100 pF1KB6 GYCSYLLAGGCQKRS---FSIIG--DFQNGKRVS-LS-VYLGEFFDIHLFVNGTVTQ-GD : :.:.:: : . . : . . . :. . :: :: ::. . ...: : : CCDS47 GKCTYILAQPCGNSTDPFFRVTAKNEEQGQEGVSCLSKVYVTLPESTVTLLKGRRTLVGG 1180 1190 1200 1210 1220 1230 110 120 130 140 150 160 pF1KB6 QRVSMP-YASKGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNF :.:..: :::..: . . . .:. : .:. .: ::. .. : .:. : .: ::::::. CCDS47 QQVTLPAIPSKGVFLGASGRFVELQTE-FGLRVRWDGDQQLYVTVSSTYSGKLCGLCGNY 1240 1250 1260 1270 1280 1290 170 180 190 200 210 220 pF1KB6 NIFAEDDFMTQEGTLTSDPYDFANSWALSSGE-QWCERASPPSS-SCNISSGEMQKGLWE . ...: . .:. ..: ...::: .. : : :.. . .: ::. : ..: CCDS47 DGNSDNDHLKLDGSPAGDKEELGNSWQTDQDEDQECQKYQVVNSPSCDSSLQSSMSGPGF 1300 1310 1320 1330 1340 1350 230 240 250 260 270 280 pF1KB6 QCQLLKSTSVFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLY .:. . . : : : : : .: : . : . .. :: . : .. CCDS47 CGRLVDTHGPFETCLLHVKAASFFDSCMLDMCGFQGLQHLLCTHMSTMTTTCQDAGHAVK 1360 1370 1380 1390 1400 1410 290 300 310 320 330 340 pF1KB6 GWTDHSACSPVCPAGMEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCV : . : .:: . .: :..:: ::.: . .:..:::..: : : .:. :. CCDS47 PWREPHFCPMACPPNSKYSLCAKPCPDTCHSGFSGMFCSDRCVEACECNPGFVLSGLECI 1420 1430 1440 1450 1460 1470 350 360 370 380 pF1KB6 ESTECPCVH-SGKRYPPGTSLSRD-CNT-CIC------RNSQWICSNEECPGE------- ..: :.: .:. . : . :. :.: : . : : .: :. CCDS47 PRSQCGCLHPAGSYFKVGERWYKPGCKELCVCESNNRIRCQPWRCRAQEFCGQQDGIYGC 1480 1490 1500 1510 1520 1530 390 400 410 420 430 440 pF1KB6 -------CLVTGQSHFKSFDNRYFTFSGICQYLLARDCQDHSFSIVIETVQCADDRDAVC : ..:. :. .::. : : : :.:.: : ..: . . . ..: .. CCDS47 HAQGAATCTASGDPHYLTFDGALHHFMGTCTYVLTRPCWSRSQDSYFVVSATNENRGGIL 1540 1550 1560 1570 1580 1590 450 460 470 480 490 pF1KB6 T----RSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDLRIQRTVTASVRLSYGE ..: : . : ::.. : : ..:. : ::. .. :. ..... : : . CCDS47 EVSYIKAVHVTVFDLSISLLR---GCKVMLNGHRVALPVWLAQGRVTIRLSSNLVLLYTN 1600 1610 1620 1630 1640 1650 500 510 520 530 540 550 pF1KB6 -DLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSGLAEPRVEDFGNAWKL ::. .:: . : . :.:. ::::::::.:. :: : :. ..: :::: CCDS47 FGLQVRYDGSHLVEVTVPSSYGGQLCGLCGNYNNNSLDDNLRPDRKLAGDSMQLGAAWKL 1660 1670 1680 1690 1700 1710 560 570 580 590 600 610 pF1KB6 HGDCQD---LQKQHSDPCALNPRMTRFSEEACAVLTSPT--FEACHRAVSPLPYLRNCRY . . : . . : : :. .. ::.: .: : ::..: : . .: . CCDS47 PESSEPGCFLVGGKPSSCQENS-MADAWNKNCAILINPQGPFSQCHQVVPPQSSFASCVH 1720 1730 1740 1750 1760 1770 620 630 640 650 660 670 pF1KB6 DVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQCGTPCNLTCR :. . :: .: .::. :: : :::. : . :: :. : :..:: :: CCDS47 GQCGTKGDTTALCRSLQAYASLCAQAGQAPAWRNRTFCPMRCPPGSSYSPCSSPCPDTCS 1780 1790 1800 1810 1820 1830 680 690 700 710 720 pF1KB6 SLSYPDEECNEA--CLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPEDIFSDHHTM :.. : ..: .: : :.: : : .. . ::: .:: : : ...: CCDS47 SINNP-RDCPKALPCAESCECQKGHILSGTS-CVPLGQCGC---------TDPAGSYH-- 1840 1850 1860 1870 730 740 750 760 770 780 pF1KB6 CYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLEC :...: .: ..: : CCDS47 ---------------------------PVGERWYTENTC----TRL-------------C 1880 1890 790 800 810 820 830 840 pF1KB6 TKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNT : . .: .. :.. : :... : ::. .: CCDS47 TCSVHN-NITCFQ------STCKPNQI-----CWALD--GLLH----------------- 1900 1910 1920 850 860 870 880 890 900 pF1KB6 CVCRDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGT--FR :: .. : ..:. : .::..::: .. .: : :::. : . :. CCDS47 --CR------ASGV--GVCQLPGESHYVSFDGSNHSIPDACTLVLVK-VCHPAMALPFFK 1930 1940 1950 1960 1970 910 920 930 940 950 pF1KB6 ILVGNKGCSHPSVKCK-KRVTILVEGGEIELFDGE---VNVKR---PMKDETHFEVVESG : . .. . . ..: : . ... : :. .: :. : .. :.:. CCDS47 ISAKHEKEEGGTEAFRLHEVYIDIYDAQVTLQKGHRVLINSKQVTLPAISQIPGVSVKSS 1980 1990 2000 2010 2020 2030 960 970 980 990 1000 1010 pF1KB6 R-YIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDP : :. . ...: .: . . . . :: ::::.::::. ....: . .: .. CCDS47 SIYSIVNIKIGVQVKFDGNHLLEIEIPTTYYGKVCGMCGNFNDEEEDELMMPSDEVANSD 2040 2050 2060 2070 2080 2090 1020 1030 1040 1050 1060 pF1KB6 VDFGNSWK---VSSQC----ADTRKVPLDS--SPA-TCHNNIMKQTMVDSSCRI-LTSDV .: :::: .. .: .: ...: .. .:. .:. .... .:. : . : CCDS47 SEFVNSWKDKDIDPSCQSLLVDEQQIPAEQQENPSGNCRAADLRRAR--EKCEAALRAPV 2100 2110 2120 2130 2140 1070 1080 1090 1100 1110 1120 pF1KB6 FQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHG-KVVTWRTATLC . .: . .: :.: : : : : .:... :.. .: ..: : ::....: CCDS47 WAQCASRIDLTPFLVDCANTLC--EFGGLYQALCQALQAFGATCQSQGLKPPLWRNSSFC 2150 2160 2170 2180 2190 2200 1130 1140 1150 1160 1170 1180 pF1KB6 PQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDEL : : . : : ::.:.: . : : :.::: : :: .:.: CCDS47 PLECPAYSSYTN---C---LPSCSPSCWDLDGRCEGAKVPSACAEGCI--CQPGYVLSE- 2210 2220 2230 2240 2250 1190 1200 1210 1220 1230 1240 pF1KB6 LQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVP . :: .: .. : . ::. .. . :.: .: ... : . :.: CCDS47 -DKCVPRSQCGCKDAHGGSIPLGKSW-VSSGCTEKC-VCTGGAIQ--CGDFRCPSGSHCQ 2260 2270 2280 2290 2300 2310 1250 1260 1270 1280 1290 1300 pF1KB6 PTDAPVSPTTLYVEDISEPPLHDFYCSRLLDLVFLLDGSSRLSEAEFEVLKAFVVDMMER CCDS47 LTSDNSNSNCVSDKSEQCSVYGDPRYLTFDGFSYRLQGRMTYVLIKTVDVLPEGVEPLLV 2320 2330 2340 2350 2360 2370 >>CCDS5442.1 BMPER gene_id:168667|Hs108|chr7 (685 aa) initn: 447 init1: 293 opt: 587 Z-score: 451.3 bits: 96.0 E(32554): 8.1e-19 Smith-Waterman score: 677; 29.7% identity (57.1% similar) in 387 aa overlap (329-708:322-683) 300 310 320 330 340 350 pF1KB6 MEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQL-LDEGLCVESTECPCVHSGKRY :.: .:. . :. . :: CCDS54 RVPPEDIKVCKFGNKIFQDGEMWSSINCTICACVKGRTECRNKQCIPISSCP-------- 300 310 320 330 340 360 370 380 390 400 410 pF1KB6 PPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARD : :.: . : : ::. : :: : : :. :...::.: :.:.: :::.:..: CCDS54 -QGKILNR--KGC-CP----ICT--EKPGVCTVFGDPHYNTFDGRTFNFQGTCQYVLTKD 350 360 370 380 390 420 430 440 450 460 470 pF1KB6 CQDHS--FSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPL :.. . :...... . :. :.:: . : .: :.:.. : .:. . :: CCDS54 CSSPASPFQVLVKN-DARRTRSFSWTKSVELVLG---ESRVSLQQHLTVRWNGSRIALPC 400 410 420 430 440 480 490 500 510 520 530 pF1KB6 LKGDLRIQRTVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDF ..:. .... :...::: . . : .: :: :::::::::.. ::. CCDS54 RAPHFHIDLD-GYLLKVTTKAGLEISWDGDSFVEVMAAPHLKGKLCGLCGNYNGHKRDDL 450 460 470 480 490 500 540 550 560 570 580 590 pF1KB6 LTPSGLAEPRVEDFGNAWKLHGD--CQDLQKQH-SDPCALNPRMTRFSEEACAVLTSPTF . .: . :.::...:..... :. :.. . : . .. ... : : : : CCDS54 IGGDGNFKFDVDDFAESWRVESNEFCNRPQRKPVPELCQGTVKVKLRAHRECQKLKSWEF 510 520 530 540 550 560 600 610 620 630 640 650 pF1KB6 EACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCE-LN ..:: .:. . :.: :.: : ..: : .. .:. :: .:..: :. : . CCDS54 QTCHSTVDYATFYRSCVTDMCECPVHKNCYCESFLAYTRACQREGIKVHWEPQQNCAATQ 570 580 590 600 610 620 660 670 680 690 700 710 pF1KB6 CPKGQVYLQCGTPCNLTCRSLSYPDEECNEACLEGCFCPPGLYMDERGDCVPKAQCPCYY : .: :: :: : :: . . ::. :. :: :: .: . ..: :. . :: CCDS54 CKHGAVYDTCGPGCIKTCDNWNEIGP-CNKPCVAGCHCPANLVL-HKGRCIKPVLCPQR 630 640 650 660 670 680 720 730 740 750 760 770 pF1KB6 DGEIFQPEDIFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPM >>CCDS33410.2 COL6A3 gene_id:1293|Hs108|chr2 (2570 aa) initn: 236 init1: 236 opt: 509 Z-score: 386.8 bits: 85.9 E(32554): 3.2e-15 Smith-Waterman score: 571; 26.2% identity (59.4% similar) in 611 aa overlap (1277-1867:422-1006) 1250 1260 1270 1280 1290 1300 pF1KB6 PTDAPVSPTTLYVEDISEPPLHDFYCSRLLDLVFLLDGSSRLSEAEFEVLKAFVVDMMER :.::::::: . .. : .:: :: ..: CCDS33 LPKIGDLHPQIVNLLKSVHNGAPAPVSGEKDVVFLLDGSEGV-RSGFPLLKEFVQRVVES 400 410 420 430 440 450 1310 1320 1330 1340 1350 1360 pF1KB6 LRISQKWVRVAVVEYHDGSHAYIGLKDRKRPSELRRIASQVKYAGSQVASTSEVLKYTLF : ..: ::::::.: : .. . :.. ... . :. :. . .:. .:...: CCDS33 LDVGQDRVRVAVVQYSDRTRPEFYLNSYMNKQDVVNAVRQLTLLGGPTPNTGAALEFVLR 460 470 480 490 500 510 1370 1380 1390 1400 1410 1420 pF1KB6 QIF--SKIDRPEASRIALLLMASQEPQRMSRNFVRYVQGLKKKKVIVIPVGIG-PHANLK .:. : .: . ::.. . . : . :: .. :. ..:.::: .:.. CCDS33 NILVSSAGSRITEGVPQLLIVLTAD---RSGDDVRN-PSVVVKRGGAVPIGIGIGNADIT 520 530 540 550 560 1430 1440 1450 1460 1470 1480 pF1KB6 QIRLIEKQAPENKAFVLSSVDELEQQRDEIVSYLCDLAPEAPPPTLPPHMAQVTVGPGLL ... : . :. : .. . .: .. : . .:. : : . : .:: CCDS33 EMQTI-SFIPDF-AVAIPTFRQLGTVQQVISERVTQLTREELSRLQP--VLQPLPSPG-- 570 580 590 600 610 620 1490 1500 1510 1520 1530 1540 pF1KB6 GVSTLGPKRNSMVLDVAFVLEGSDKIGEADFNRSKEFMEEVIQRMDVGQDSIHVTVLQYS .: :: ::.:...::.. : .:. . ..:.... .::: :. .:.:.:.: CCDS33 ----VGGKR-----DVVFLIDGSQSAGP-EFQYVRTLIERLVDYLDVGFDTTRVAVIQFS 630 640 650 660 670 1550 1560 1570 1580 1590 1600 pF1KB6 YMVTVEYPFSEAQSKGDILQRVREIRYQGGNRTNTGLALRYLSDHSFLVSQGDR--EQAP ::. .. .:: .. . :...: .:: . :.: ::.:.: . : :.: : .: CCDS33 DDPKVEFLLNAHSSKDEVQNAVQRLRPKGGRQINVGNALEYVSRNIFKRPLGSRIEEGVP 680 690 700 710 720 730 1610 1620 1630 1640 1650 pF1KB6 NLVYMVTGNPASDEIKRLPGDIQ---VVPIGVGPNANVQELERIGW-PNAPILIQDFETL ... ..... ..::. ... :.:. .. ::. .:: .:. :. . .. :. : CCDS33 QFLVLISSGKSDDEVDDPAVELKQFGVAPFTIARNADQEELVKISLSPEYVFSVSTFREL 740 750 760 770 780 790 1660 1670 1680 1690 1700 1710 pF1KB6 PREAPDLVLQ-RCCSGEGLQ---IPTLSPAPDC-SQPLDVILLLDGSSSFPASYFDEMKS : :. ..: .: : : : :. :...:.:.: . . : .... CCDS33 PSLEQKLLTPITTLTSEQIQKLLASTRYPPPAVESDAADIVFLIDSSEGVRPDGFAHIRD 800 810 820 830 840 850 1720 1730 1740 1750 1760 1770 pF1KB6 FAKAFISKANIGPRLTQVSVLQYGSITTIDVPWNVVPEKAHLLSLVDVMQREGG-PSQIG :.. .. . :::: ..:.:.:... . . .. .: .:. . .. .:: : . : CCDS33 FVSRIVRRLNIGPSKVRVGVVQFSNDVFPEFYLKTYRSQAPVLDAIRRLRLRGGSPLNTG 860 870 880 890 900 910 1780 1790 1800 1810 1820 pF1KB6 DALGFAVRYLTSEMHGAR--PGASKAVVILVTDVSVDSVDAAADAARSNRVTVFPIGIGD :: :..: : . :.: :. . .:... : :.:. :.. ::. . .:.:: CCDS33 KALEFVARNLFVKSAGSRIEDGVPQHLVLVLGGKSQDDVSRFAQVIRSS--GIVSLGVGD 920 930 940 950 960 1830 1840 1850 1860 1870 1880 pF1KB6 R-YDAAQLRILAGPAGDSNVV-KLQRIEDLPTMVT-LGNSFLHKLCSGFVRICMDEDGNE : : ..:. .. .: .: ......::.. . ::: CCDS33 RNIDRTELQTIT---NDPRLVFTVREFRELPNIEERIMNSFGPSAATPAPPGVDTPPPSR 970 980 990 1000 1010 1020 1890 1900 1910 1920 1930 1940 pF1KB6 KRPGDVWTLPDQCHTVTCQPDGQTLLKSHRVNCDRGLRPSCPNSQSPVKVEETCGCRWTC CCDS33 PEKKKADIVFLLDGSINFRRDSFQEVLRFVSEIVDTVYEDGDSIQVGLVQYNSDPTDEFF 1030 1040 1050 1060 1070 1080 >-- initn: 259 init1: 236 opt: 508 Z-score: 386.0 bits: 85.8 E(32554): 3.5e-15 Smith-Waterman score: 508; 30.7% identity (62.7% similar) in 381 aa overlap (1498-1866:38-408) 1470 1480 1490 1500 1510 1520 pF1KB6 TLPPHMAQVTVGPGLLGVSTLGPKRNSMVLDVAFVLEGSDKIGEADFNRSKEFMEEVIQR :..:...::. .: :.:: ..:. .:::: CCDS33 PLVAVFCLFLSGFPTTHAQQQQAVIEVNKRDIVFLVDGSSALGLANFNAIRDFIAKVIQR 10 20 30 40 50 60 1530 1540 1550 1560 1570 1580 pF1KB6 MDVGQDSIHVTVLQYSYMVTVEYPFSEAQSKGDILQRVREIRYQGGNRTNTGLALRYLSD ...::: :.:.: ::. : :. :. .: ... ::... :. :: :: .. . CCDS33 LEIGQDLIQVAVAQYADTVRPEFYFNTHPTKREVITAVRKMKPLDGSALYTGSALDFVRN 70 80 90 100 110 120 1590 1600 1610 1620 1630 1640 pF1KB6 HSFLVSQGDR--EQAPNLVYMVTGNPASDEIKRLPGDIQ---VVPIGVG-PNANVQELER . : : : : : :.:. ..::. . :::.. ... .. ...: .:. :::. CCDS33 NLFTSSAGYRAAEGIPKLLVLITGGKSLDEISQPAQELKRSSIMAFAIGNKGADQAELEE 130 140 150 160 170 180 1650 1660 1670 1680 1690 1700 pF1KB6 IGWPNAPILIQ-DFETLPREAPDLVLQRCCSGEGLQIPTLSPAPDCSQPLDVILLLDGSS :.. .. ..: .: : :: :: : . ::: .:. :. :...:.:::. CCDS33 IAFDSSLVFIPAEF----RAAP---LQGMLPGLLAPLRTLSGTPEESKR-DILFLFDGSA 190 200 210 220 230 1710 1720 1730 1740 1750 1760 pF1KB6 SFPASYFDEMKSFAKAFISKANIGPRLTQVSVLQYGSITTIDVPWNVVPEKAHLLSLVDV .. .. : ...: .:.. :. :. :...: ::.. . .. .. : ..:.:: CCDS33 NL-VGQFPVVRDFLYKIIDELNVKPEGTRIAVAQYSDDVKVESRFDEHQSKPEILNLVKR 240 250 260 270 280 290 1770 1780 1790 1800 1810 pF1KB6 MQ-REGGPSQIGDALGFAVRYLTSEMHGAR--PGASKAVVILVTDVSVDSVDAAADAARS :. . : ..: :: .: ::. . :.: :. . .:.::. : : ::. :. .. CCDS33 MKIKTGKALNLGYALDYAQRYIFVKSAGSRIEDGVLQFLVLLVAGRSSDRVDGPASNLKQ 300 310 320 330 340 350 1820 1830 1840 1850 1860 1870 pF1KB6 NRVTVFPIGIGDRYDAAQL-RILAGPAGDSNVVKLQRIEDL-PTMVTLGNSFLHKLCSGF . :. : : . : :.: .:. .:: . .: .: :: : .:.: .: CCDS33 SGVVPF-IFQAKNADPAELEQIVLSPAFILAAESLPKIGDLHPQIVNLLKSVHNGAPAPV 360 370 380 390 400 410 1880 1890 1900 1910 1920 1930 pF1KB6 VRICMDEDGNEKRPGDVWTLPDQCHTVTCQPDGQTLLKSHRVNCDRGLRPSCPNSQSPVK CCDS33 SGEKDVVFLLDGSEGVRSGFPLLKEFVQRVVESLDVGQDRVRVAVVQYSDRTRPEFYLNS 420 430 440 450 460 470 2813 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 23:08:02 2016 done: Wed Nov 2 23:08:04 2016 Total Scan time: 8.450 Total Display time: 2.650 Function used was FASTA [36.3.4 Apr, 2011]