FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2518, 1456 aa 1>>>pF1KE2518 1456 - 1456 aa - 1456 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3489+/-0.00108; mu= 24.0988+/- 0.066 mean_var=90.3946+/-18.423, 0's: 0 Z-trim(105.6): 143 B-trim: 219 in 1/49 Lambda= 0.134897 statistics sampled from 8373 (8532) to 8373 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.602), E-opt: 0.2 (0.262), width: 16 Scan time: 4.200 The best scores are: opt bits E(32554) CCDS7123.2 MRC1 gene_id:4360|Hs108|chr10 (1456) 10319 2019.7 0 CCDS33309.1 PLA2R1 gene_id:22925|Hs108|chr2 (1463) 2327 464.4 1.1e-129 CCDS42767.1 PLA2R1 gene_id:22925|Hs108|chr2 (1324) 2256 450.5 1.5e-125 CCDS11634.1 MRC2 gene_id:9902|Hs108|chr17 (1479) 2251 449.6 3.2e-125 CCDS2211.1 LY75 gene_id:4065|Hs108|chr2 (1722) 1480 299.6 5.3e-80 CCDS56140.1 CD302 gene_id:100526664|Hs108|chr2 (1817) 1480 299.6 5.5e-80 CCDS56141.1 CD302 gene_id:100526664|Hs108|chr2 (1873) 1480 299.6 5.6e-80 CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321) 357 80.9 2.7e-14 CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 ( 911) 337 76.9 3.1e-13 CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530) 332 76.3 1.3e-12 CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 ( 655) 320 73.5 2.4e-12 CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642) 320 73.8 4.6e-12 CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409) 320 74.0 6.1e-12 CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396) 320 74.1 7.8e-12 CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431) 317 73.4 9.2e-12 >>CCDS7123.2 MRC1 gene_id:4360|Hs108|chr10 (1456 aa) initn: 10319 init1: 10319 opt: 10319 Z-score: 10847.5 bits: 2019.7 E(32554): 0 Smith-Waterman score: 10319; 99.7% identity (99.9% similar) in 1456 aa overlap (1-1456:1-1456) 10 20 30 40 50 60 pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAESQKFRW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAESQKFRW 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGEDLFFNYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 VSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGEDLFFNYG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 NRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGAICAFPFKFENKWYA :::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::: CCDS71 NRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGATCAFPFKFENKWYA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 DCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFEGSESLWNKDPLTSVSYQINSKSALTW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 DCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFEGSESLWNKDPLTSVSYQINSKSALTW 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 HQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWSDRSPFRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 HQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWSDRSPFRY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 LNWLPGSPSAEPGKSCVSLNPGKNAKWENLECVQKLGYICKKGNTTLNSFVIPSESDVPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 LNWLPGSPSAEPGKSCVSLNPGKNAKWENLECVQKLGYICKKGNTTLNSFVIPSESDVPT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 HCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGSDLASIHTIEEFDFIISQLGYEPND :::::::::::::::::::::::::::::::::::.::.:::::::.::::::::::::: CCDS71 HCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGGDLTSIHTIEELDFIISQLGYEPND 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 ELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGKDGYWADRGCEW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 ELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGKDGYWADRGCEW 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 PLGYICKMKSRSQGPEIVEVEKGCRKGWKKHHFYCYMIGHTLSTFAEANQTCNNENAYLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 PLGYICKMKSRSQGPEIVEVEKGCRKGWKKHHFYCYMIGHTLSTFAEANQTCNNENAYLT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 TIEDRYEQAFLTSFVGLRPEKYFWTGLSDIQTKGTFQWTIEEEVRFTHWNSDMPGRKPGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 TIEDRYEQAFLTSFVGLRPEKYFWTGLSDIQTKGTFQWTIEEEVRFTHWNSDMPGRKPGC 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 VAMRTGIAGGLWDVLKCDEKAKFVCKHWAEGVTHPPKPTTTPEPKCPEDWGASSRTSLCF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 VAMRTGIAGGLWDVLKCDEKAKFVCKHWAEGVTHPPKPTTTPEPKCPEDWGASSRTSLCF 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 KLYAKGKHEKKTWFESRDFCRALGGDLASINNKEEQQTIWRLITASGSYHKLFWLGLTYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 KLYAKGKHEKKTWFESRDFCRALGGDLASINNKEEQQTIWRLITASGSYHKLFWLGLTYG 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 SPSEGFTWSDGSPVSYENWAYGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 SPSEGFTWSDGSPVSYENWAYGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQ 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 KGQTPKPEPTPAPQDNPPVTEDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 KGQTPKPEPTPAPQDNPPVTEDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 ESEKKFLWKYVNRNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 ESEKKFLWKYVNRNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCV 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 TMYSNSGFWNDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCFKIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 TMYSNSGFWNDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCFKIF 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 GFMEEERKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 GFMEEERKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTF 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE2 LWTDGRGVHYTNWGKGYPGGRRSSLSYEDADCVVIIGGASNEAGKWMDDTCDSKRGYICQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 LWTDGRGVHYTNWGKGYPGGRRSSLSYEDADCVVIIGGASNEAGKWMDDTCDSKRGYICQ 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE2 TRSDPSLTNPPATIQTDGFVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 TRSDPSLTNPPATIQTDGFVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNA 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE2 FAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 FAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWK 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE2 TAHCNESFYFLCKRSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYIESSYTRNWGQAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 TAHCNESFYFLCKRSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYIESSYTRNWGQAS 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE2 LECLRMGSSLVSIESAAESSFLSYRVEPLKSKTNFWIGLFRNVEGTWLWINNSPVSFVNW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 LECLRMGSSLVSIESAAESSFLSYRVEPLKSKTNFWIGLFRNVEGTWLWINNSPVSFVNW 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE2 NTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKPTHELLTTKADTRKMD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 NTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKPTHELLTTKADTRKMD 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE2 PSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPGTSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 PSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPGTSD 1390 1400 1410 1420 1430 1440 1450 pF1KE2 MKDLVGNIEQNEHSVI :::::::::::::::: CCDS71 MKDLVGNIEQNEHSVI 1450 >>CCDS33309.1 PLA2R1 gene_id:22925|Hs108|chr2 (1463 aa) initn: 952 init1: 304 opt: 2327 Z-score: 2441.6 bits: 464.4 E(32554): 1.1e-129 Smith-Waterman score: 2430; 29.2% identity (58.8% similar) in 1494 aa overlap (8-1453:23-1463) 10 20 30 40 pF1KE2 MRLPLLLVFASVIPGAVL-LLDTRQFLIYNEDHKRCVDAVSPSAV : :.. : .: : :.: .:. :.:..: . :.. CCDS33 MLLSPSLLLLLLLGAPRGCAEGVAAALTPERLLEWQDKGIFVIQSESLKKCIQA-GKSVL 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 QTAACNQDAESQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKN :.: . . ..:::. ..... . :::. .. ..:: ::: .:.:. CCDS33 TLENCKQANKHMLWKWVSNHGLFNIGGSGCLGLNFSAPEQPLSLYECDSTLVSLRWRCNR 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 DTLLGIKGEDLFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTD-NLCSRGYEAMYTLLGNA . : ..:. . .. . . .: ::. ..: .. ..:. ::. CCDS33 KMITGP------LQYSVQVAHDNTVVASRKYIHKWISYGSGGGDICEYLHKDLHTIKGNT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 NGAICAFPFKFENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE---GSESLW .: : :::.....:. .:: :: : :::.::. :. :. .:.:: : ...: CCDS33 HGMPCMFPFQYNHQWHHECTREGREDDLLWCATTSRYERDEKWGFCPDPTSAEVGCDTIW 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 NKDPLTSVSYQINSKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIG .:: . . ::.: :.:.: .:..:::.:.. :::::. :.... :: : .:.: CCDS33 EKDLNSHICYQFNLLSSLSWSEAHSSCQMQGGTLLSITDETEENFIREHMSSKTVEVWMG 240 250 260 270 280 290 290 300 310 320 330 pF1KE2 LNSLSFNSGWQWSDRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGY ::.:. ..:::::: .:. :::: : . :: : ... . :.. .: . : : CCDS33 LNQLDEHAGWQWSDGTPLNYLNWSP-EVNFEPFVEDHCGTFSSFMPSAWRSRDCESTLPY 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE2 ICKKGNTTLNSFVIPSES--DVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGS :::: . .. .. ... ::: : :: .:::....:: ..:: .:. ..: CCDS33 ICKKYLNHIDHEIVEKDAWKYYATHCEPGWNPYNRNCYKLQKEEKT-WHEALRSCQADNS 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE2 DLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHE : .: .. : .:... :: : .: ::::.. :: . ::::. . : ::.: :: CCDS33 ALIDITSLAEVEFLVTLLGDENASETWIGLSSNKIPVSFEWSNDSSVIFTNWHTLEPHIF 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE2 NNRQEDCVVMKGKDGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGCRKGWKKHHFYCY ::.. :: . ..:.: ..:: : :::: . : . ..:.::..::..: .:: CCDS33 PNRSQLCVSAEQSEGHWKVKNCEERLFYICK----KAGHVLSDAESGCQEGWERHGGFCY 480 490 500 510 520 520 530 540 550 560 570 pF1KE2 MIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGL---RPEKYFWTGLSDIQTK : .: .: .:.. : :.:: .:.::::.::... ..::: .:.: . CCDS33 KIDTVLRSFDQASSGYYCPPA-LVTITNRFEQAFITSLISSVVKMKDSYFWIALQDQNDT 530 540 550 560 570 580 580 590 600 610 620 pF1KE2 GTFQWTI----EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHW : . : : :..::::. .: . :::::: : :.: .: . :: .::. CCDS33 GEYTWKPVGQKPEPVQYTHWNTHQPRYSGGCVAMRGRHPLGRWEVKHCRHFKAMSLCKQP 590 600 610 620 630 640 630 640 650 660 670 680 pF1KE2 AEGVTHPPKPTTTPEPKCPEDWGASSRTSLCFKLYAKGK-HEKKTWFESRDFCRALGGDL .:. . : : :: . . :::.. . : :.:: :.. ::. .:. : CCDS33 VENQEKAEYEERWPFHPCYLDWESEPGLASCFKVFHSEKVLMKRTWREAEAFCEEFGAHL 650 660 670 680 690 700 690 700 710 720 730 740 pF1KE2 ASINNKEEQQTIWRLITASGSY--HKLFWLGLTYGSP-SEG-FTWSDGSPV--SY-ENWA ::. . ::.. . .:. .. .. .. ::.:.. .: . : . ::: .:: :. .: CCDS33 ASFAHIEEENFVNELLHSKFNWTEERQFWIGFNKRNPLNAGSWEWSDRTPVVSSFLDNTY 710 720 730 740 750 760 750 760 770 780 790 800 pF1KE2 YGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQKGQTPKPEPTPAPQDNPPVT .:: ... :. :.. :. ..: .:::.: . :: : : : CCDS33 FGE-----DARNCAVYKANKTLL--PLHCGSKREWICKIPRDVKPKI-PFWYQYDVP--- 770 780 790 800 810 810 820 830 840 850 pF1KE2 EDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQSESEKKFLWKYVNRNDAQSA- :..:.: .: : : . :. .::..:.: :..:. . .. . .: CCDS33 ---WLFYQDAEYLFHTFASEWLNFEFVCSWLHSDLLTIHSAHEQEFIHSKIKALSKYGAS 820 830 840 850 860 870 860 870 880 890 900 910 pF1KE2 YFIGLLIS-LDKKFAWMDGSKVDYVSWATG-EPNFANEDENCVTMYSNSGFWNDINCGYP ..::: . .: : ::. : : .: :: : . :... : . : .:.:.. .:. CCDS33 WWIGLQEERANDEFRWRDGTPVIYQNWDTGRERTVNNQSQRCGFISSITGLWGSEECSVS 880 890 900 910 920 930 920 930 940 950 960 970 pF1KE2 NAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCFKIFGFMEEER--KNWQEARK ::.:.. . :. . : .:: ... ::. .... .. ::: .:.. CCDS33 MPSICKRKK--VWLIEKKKDTPKQHGTCPKGWLYFNYKCL-LLNIPKDPSSWKNWTHAQH 940 950 960 970 980 980 990 1000 1010 1020 1030 pF1KE2 ACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGRGVHYTNWGK : ::.::.:..: ::::.:... .: :.: ::.. . : : .:. : :.::. CCDS33 FCAEEGGTLVAIESEVEQAFITMNLFGQTTSVWIGLQNDDYE---TWLNGKPVVYSNWSP 990 1000 1010 1020 1030 1040 1040 1050 1060 1070 1080 pF1KE2 ----GYPGGRRSSLSYEDADCVVIIGGAS-NEAGKWMDDTCDSK-RGYICQTRSDPSL-- . :. . .. . :... .. . . .:::. . : .. :..:. .: : CCDS33 FDIINIPSHNTTEVQKHIPLCALLSSNPNFHFTGKWYFEDCGKEGYGFVCEKMQDTSGHG 1050 1060 1070 1080 1090 1100 1090 1100 1110 1120 1130 1140 pF1KE2 TNPPATIQTDGFVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNAFAWLQME .: . ..::. .:... .. :. : : .:.. ..:: : : ..: . .. CCDS33 VNTSDMYPMPNTLEYGNRTYKIINANMTWYAAIKTCLMHKAQLVSITDQYHQSFLTVVLN 1110 1120 1130 1140 1150 1160 1150 1160 1170 1180 1190 1200 pF1KE2 TSNERVWIALNSNLTDN--QYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWKTAHCN . ::.: . ::: .. :.: . .: : .: .: . ::. : .: :... : CCDS33 RLGYAHWIGLFT--TDNGLNFDWSDGTKSSFTFWKDEESSLLGDCVFADSNGRWHSTAC- 1170 1180 1190 1200 1210 1220 1210 1220 1230 1240 1250 1260 pF1KE2 ESFY--FLCKRSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYIESSYTRNWGQASLE- ::: .:. : .: :.: : :.. :: :...:: . . .:. : CCDS33 ESFLQGAICHVPPETRQSEHPEL---CSETS-IPWIKFKSNCYSFSTVLDSMSFEAAHEF 1230 1240 1250 1260 1270 1270 1280 1290 1300 1310 1320 pF1KE2 CLRMGSSLVSIESAAESSFLSYRVEPLKSKTNF-WIGL-FRNVEGTWLWINNSPVSFVNW : . ::.:..:.. ::..:: .. . :.... :.. : . . : :....:.. :: CCDS33 CKKEGSNLLTIKDEAENAFLLEELFAFGSSVQMVWLNAQFDGNNETIKWFDGTPTDQSNW 1280 1290 1300 1310 1320 1330 1330 1340 1350 1360 1370 pF1KE2 NTGDPSGER---NDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKPTHELLTTKADTR . :. . . ::::. :.:. :. ::.::: : : : : :. CCDS33 GIRKPDTDYFKPHHCVALRIPEGLWQLSPCQEKKGFICKMEADIH---TAEALPEKG--- 1340 1350 1360 1370 1380 1390 1380 1390 1400 1410 1420 1430 pF1KE2 KMDPSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPG :: .. ..... :..... .. .::. . . ..:.: : .. : CCDS33 ------PSHSIIPLAVVLTLIVIVAICTLSFCIYKHNGGFFRRLAGFRNPYYPATNFSTV 1400 1410 1420 1430 1440 1440 1450 pF1KE2 TSDMKDLVGNIEQNEHSVI . . :....:.... CCDS33 YLEENILISDLEKSDQ 1450 1460 >>CCDS42767.1 PLA2R1 gene_id:22925|Hs108|chr2 (1324 aa) initn: 952 init1: 304 opt: 2256 Z-score: 2367.5 bits: 450.5 E(32554): 1.5e-125 Smith-Waterman score: 2286; 30.1% identity (59.4% similar) in 1334 aa overlap (8-1297:23-1315) 10 20 30 40 pF1KE2 MRLPLLLVFASVIPGAVL-LLDTRQFLIYNEDHKRCVDAVSPSAV : :.. : .: : :.: .:. :.:..: . :.. CCDS42 MLLSPSLLLLLLLGAPRGCAEGVAAALTPERLLEWQDKGIFVIQSESLKKCIQA-GKSVL 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 QTAACNQDAESQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKN :.: . . ..:::. ..... . :::. .. ..:: ::: .:.:. CCDS42 TLENCKQANKHMLWKWVSNHGLFNIGGSGCLGLNFSAPEQPLSLYECDSTLVSLRWRCNR 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 DTLLGIKGEDLFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTD-NLCSRGYEAMYTLLGNA . : ..:. . .. . . .: ::. ..: .. ..:. ::. CCDS42 KMITGP------LQYSVQVAHDNTVVASRKYIHKWISYGSGGGDICEYLHKDLHTIKGNT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 NGAICAFPFKFENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE---GSESLW .: : :::.....:. .:: :: : :::.::. :. :. .:.:: : ...: CCDS42 HGMPCMFPFQYNHQWHHECTREGREDDLLWCATTSRYERDEKWGFCPDPTSAEVGCDTIW 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 NKDPLTSVSYQINSKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIG .:: . . ::.: :.:.: .:..:::.:.. :::::. :.... :: : .:.: CCDS42 EKDLNSHICYQFNLLSSLSWSEAHSSCQMQGGTLLSITDETEENFIREHMSSKTVEVWMG 240 250 260 270 280 290 290 300 310 320 330 pF1KE2 LNSLSFNSGWQWSDRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGY ::.:. ..:::::: .:. :::: : . :: : ... . :.. .: . : : CCDS42 LNQLDEHAGWQWSDGTPLNYLNWSP-EVNFEPFVEDHCGTFSSFMPSAWRSRDCESTLPY 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE2 ICKKGNTTLNSFVIPSES--DVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGS :::: . .. .. ... ::: : :: .:::....:: ..:: .:. ..: CCDS42 ICKKYLNHIDHEIVEKDAWKYYATHCEPGWNPYNRNCYKLQKEEKT-WHEALRSCQADNS 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE2 DLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHE : .: .. : .:... :: : .: ::::.. :: . ::::. . : ::.: :: CCDS42 ALIDITSLAEVEFLVTLLGDENASETWIGLSSNKIPVSFEWSNDSSVIFTNWHTLEPHIF 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE2 NNRQEDCVVMKGKDGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGCRKGWKKHHFYCY ::.. :: . ..:.: ..:: : :::: . : . ..:.::..::..: .:: CCDS42 PNRSQLCVSAEQSEGHWKVKNCEERLFYICK----KAGHVLSDAESGCQEGWERHGGFCY 480 490 500 510 520 520 530 540 550 560 570 pF1KE2 MIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGL---RPEKYFWTGLSDIQTK : .: .: .:.. : :.:: .:.::::.::... ..::: .:.: . CCDS42 KIDTVLRSFDQASSGYYCPPA-LVTITNRFEQAFITSLISSVVKMKDSYFWIALQDQNDT 530 540 550 560 570 580 580 590 600 610 620 pF1KE2 GTFQWTI----EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHW : . : : :..::::. .: . :::::: : :.: .: . :: .::. CCDS42 GEYTWKPVGQKPEPVQYTHWNTHQPRYSGGCVAMRGRHPLGRWEVKHCRHFKAMSLCKQP 590 600 610 620 630 640 630 640 650 660 670 680 pF1KE2 AEGVTHPPKPTTTPEPKCPEDWGASSRTSLCFKLYAKGK-HEKKTWFESRDFCRALGGDL .:. . : : :: . . :::.. . : :.:: :.. ::. .:. : CCDS42 VENQEKAEYEERWPFHPCYLDWESEPGLASCFKVFHSEKVLMKRTWREAEAFCEEFGAHL 650 660 670 680 690 700 690 700 710 720 730 740 pF1KE2 ASINNKEEQQTIWRLITASGSY--HKLFWLGLTYGSP-SEG-FTWSDGSPV--SY-ENWA ::. . ::.. . .:. .. .. .. ::.:.. .: . : . ::: .:: :. .: CCDS42 ASFAHIEEENFVNELLHSKFNWTEERQFWIGFNKRNPLNAGSWEWSDRTPVVSSFLDNTY 710 720 730 740 750 760 750 760 770 780 790 800 pF1KE2 YGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQKGQTPKPEPTPAPQDNPPVT .:: ... :. :.. :. ..: .:::.: . :: : : : CCDS42 FGE-----DARNCAVYKANKTLL--PLHCGSKREWICKIPRDVKPKI-PFWYQYDVP--- 770 780 790 800 810 810 820 830 840 850 pF1KE2 EDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQSESEKKFLWKYVNRNDAQSA- :..:.: .: : : . :. .::..:.: :..:. . .. . .: CCDS42 ---WLFYQDAEYLFHTFASEWLNFEFVCSWLHSDLLTIHSAHEQEFIHSKIKALSKYGAS 820 830 840 850 860 870 860 870 880 890 900 910 pF1KE2 YFIGLLIS-LDKKFAWMDGSKVDYVSWATG-EPNFANEDENCVTMYSNSGFWNDINCGYP ..::: . .: : ::. : : .: :: : . :... : . : .:.:.. .:. CCDS42 WWIGLQEERANDEFRWRDGTPVIYQNWDTGRERTVNNQSQRCGFISSITGLWGSEECSVS 880 890 900 910 920 930 920 930 940 950 960 970 pF1KE2 NAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCFKIFGFMEEER--KNWQEARK ::.:.. . :. . : .:: ... ::. .... .. ::: .:.. CCDS42 MPSICKRKK--VWLIEKKKDTPKQHGTCPKGWLYFNYKCL-LLNIPKDPSSWKNWTHAQH 940 950 960 970 980 980 990 1000 1010 1020 1030 pF1KE2 ACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGRGVHYTNWGK : ::.::.:..: ::::.:... .: :.: ::.. . : : .:. : :.::. CCDS42 FCAEEGGTLVAIESEVEQAFITMNLFGQTTSVWIGLQNDDYE---TWLNGKPVVYSNWSP 990 1000 1010 1020 1030 1040 1040 1050 1060 1070 1080 pF1KE2 ----GYPGGRRSSLSYEDADCVVIIGGAS-NEAGKWMDDTCDSK-RGYICQTRSDPSL-- . :. . .. . :... .. . . .:::. . : .. :..:. .: : CCDS42 FDIINIPSHNTTEVQKHIPLCALLSSNPNFHFTGKWYFEDCGKEGYGFVCEKMQDTSGHG 1050 1060 1070 1080 1090 1100 1090 1100 1110 1120 1130 1140 pF1KE2 TNPPATIQTDGFVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNAFAWLQME .: . ..::. .:... .. :. : : .:.. ..:: : : ..: . .. CCDS42 VNTSDMYPMPNTLEYGNRTYKIINANMTWYAAIKTCLMHKAQLVSITDQYHQSFLTVVLN 1110 1120 1130 1140 1150 1160 1150 1160 1170 1180 1190 1200 pF1KE2 TSNERVWIALNSNLTDN--QYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWKTAHCN . ::.: . ::: .. :.: . .: : .: .: . ::. : .: :... : CCDS42 RLGYAHWIGLFT--TDNGLNFDWSDGTKSSFTFWKDEESSLLGDCVFADSNGRWHSTAC- 1170 1180 1190 1200 1210 1220 1210 1220 1230 1240 1250 1260 pF1KE2 ESFY--FLCKRSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYIESSYTRNWGQASLE- ::: .:. : .: :.: : :.. :: :...:: . . .:. : CCDS42 ESFLQGAICHVPPETRQSEHPEL---CSETS-IPWIKFKSNCYSFSTVLDSMSFEAAHEF 1230 1240 1250 1260 1270 1270 1280 1290 1300 1310 1320 pF1KE2 CLRMGSSLVSIESAAESSFLSYRVEPLKSKTNF-WIGLFRNVEGTWLWINNSPVSFVNWN : . ::.:..:.. ::..:: .. . :.... :. CCDS42 CKKEGSNLLTIKDEAENAFLLEELFAFGSSVQMVWLNAQFDGNSK 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE2 TGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKPTHELLTTKADTRKMDP >>CCDS11634.1 MRC2 gene_id:9902|Hs108|chr17 (1479 aa) initn: 1870 init1: 917 opt: 2251 Z-score: 2361.6 bits: 449.6 E(32554): 3.2e-125 Smith-Waterman score: 3190; 33.5% identity (64.2% similar) in 1482 aa overlap (14-1453:33-1477) 10 20 30 40 pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSA :: . : . :::... . :..: . .. CCDS11 PGRPAPAPWPRHLLRCVLLLGCLHLGRPGAPGDAALPEPNVFLIFSHGLQGCLEAQGGQV 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 VQTAACNQDAESQKFRWVSESQIMSVAFKLCLGV--PSKTDWVAITLYACDSKSEFQKWE : ::: . .:...:::........ :::. :. . ... .: :: .. .:. CCDS11 RVTPACNTSLPAQRWKWVSRNRLFNLGTMQCLGTGWPGTNTTASLGMYECDREALNLRWH 70 80 90 100 110 120 110 120 130 140 150 pF1KE2 CKNDTLLGIKGEDLFFNYGNRQE---KNIMLYKGSGLWS-RWKIYGTTDNLCSRGYEAMY :. :: :..: . : : : : .:. : .:.:::. ..::. :. .: CCDS11 CR--TL----GDQLSLLLGARTSNISKPGTLERGDQTRSGQWRIYGSEEDLCALPYHEVY 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 TLLGNANGAICAFPFKFENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFEGSE :. ::..: :..:::..:.:. :::.:: :: :::.:: :: :. .:.::.: . : CCDS11 TIQGNSHGKPCTIPFKYDNQWFHGCTSTGREDGHLWCATTQDYGKDERWGFCPIKSNDCE 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 SLWNKDPLTSVSYQINSKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGL ..:.:: ::. ::.: .:.:.:..: ::.::.:.::::::::::::..:: .. .: : CCDS11 TFWDKDQLTDSCYQFNFQSTLSWREAWASCEQQGADLLSITEIHEQTYINGLLTGYSSTL 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 WIGLNSLSFNSGWQWSDRSPFRYLNWLPGSPSAEPGKSCVSLNPGKNAKWENLECVQKLG :::::.:. ..:::::: ::..:::: .:. ..: . ... :.: .: : CCDS11 WIGLNDLDTSGGWQWSDNSPLKYLNWESDQPDNPSEENCGVIRTESSGGWQNRDCSIALP 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE2 YICKKGNTTLNSFVIPSE-SDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGS :.::: .. . :.. ..: ..: .: :. ::::... ::. ... .: . :. CCDS11 YVCKKKPNATAEPTPPDRWANVKVECEPSWQPFQGHCYRLQA-EKRSWQESKKACLRGGG 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE2 DLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHE ::.:::.. :..:: .:. : .::::::::.:.:: ::::::. :.::.: ::.. CCDS11 DLVSIHSMAELEFITKQIKQEV-EELWIGLNDLKLQMNFEWSDGSLVSFTHWHPFEPNNF 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE2 NNRQEDCVVMKGKDGYWADRGCEWPLGYICKMKSR-SQGPEIVEVEKGCRKGWKKHHFYC . ::::.. : .: : : :. : ::: .. ::: .: ..:::::: : : CCDS11 RDSLEDCVTIWGPEGRWNDSPCNQSLPSICKKAGQLSQG--AAEEDHGCRKGWTWHSPSC 480 490 500 510 520 530 520 530 540 550 560 570 pF1KE2 YMIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPEKYFWTGLSDIQTKGT : .:. :..:: . :..... :.:: .:.::::..:.. .::::.:.:... :. CCDS11 YWLGEDQVTYSEARRLCTDHGSQLVTITNRFEQAFVSSLIYNWEGEYFWTALQDLNSTGS 540 550 560 570 580 590 580 590 600 610 620 630 pF1KE2 FQWTIEEEVRFTHWNSDMPGR-KPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHWAEGVT : : .:: .:::: :.:: . ::::. :: : :::.: .: .:...:.. . CCDS11 FFWLSGDEVMYTHWNRDQPGYSRGGCVALATGSAMGLWEVKNCTSFRARYICRQSLGTPV 600 610 620 630 640 650 640 650 660 670 680 pF1KE2 HPPKPTTTPEPK----CPEDWGASSRTSLCFKLYAKGK-HEKKTWFESRDFCRALGGDLA : : : :. ::. :..... :.:.... . ..::.: ... :. ::..: CCDS11 TPELPGPDPTPSLTGSCPQGWASDTKLRYCYKVFSSERLQDKKSWVQAQGACQELGAQLL 660 670 680 690 700 710 690 700 710 720 730 pF1KE2 SINNKEEQQTIWRLIT-----ASGSYHKL--FWLGLTYGSPSEG--FTWSDGSPVSYENW :. . ::.. . ... . :. ::.::. .: : . :::: ::.:. CCDS11 SLASYEEEHFVANMLNKIFGESEPEIHEQHWFWIGLNRRDPRGGQSWRWSDGVGFSYHNF 720 730 740 750 760 770 740 750 760 770 780 790 pF1KE2 AYGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQKGQTPKPEPTPAPQDNPPV .. .. .... :. : ...: ..:. .:::.: .: : :: .:: CCDS11 DRSRHDD-DDIRGCAVLDL-ASLQWVAMQCDTQLDWICKIPRG-TDVREPDDSPQG---- 780 790 800 810 820 800 810 820 830 840 850 pF1KE2 TEDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQSESEKKFLWKYVNR-NDAQS . :. ... .: : ... : .:. .: ..:.:..:..: :: . ... . :: CCDS11 -RREWLRFQEAEYKFFEHHSTWAQAQRICTWFQAELTSVHSQAELDFLSHNLQKFSRAQE 830 840 850 860 870 880 860 870 880 890 900 910 pF1KE2 AYF-IGLLISL-DKKFAWMDGSKVDYVSWATGEPNFANEDENCVTMYSNSGFWNDINCGY .. ::: : : .: : ::: ....::: :.: ...:..:: : .. :.: : CCDS11 QHWWIGLHTSESDGRFRWTDGSIINFISWAPGKPRPVGKDKKCVYMTASREDWGDQRCLT 890 900 910 920 930 940 920 930 940 950 960 970 pF1KE2 PNAFICQRHNSSINATTVMPTMPSVP-SGCKEGWNFYSNKCFKIFGFMEEERKNWQEARK .::.: : .. : : .:.. .:: : . ::::.. : . : .:.::. CCDS11 ALPYICKRSN--VTKETQPPDLPTTALGGCPSDWIQFLNKCFQVQGQEPQSRVKWSEAQF 950 960 970 980 990 1000 980 990 1000 1010 1020 1030 pF1KE2 ACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGRGVHYTNWGK .: ..::.: : ::::.: . . ::. : ::. :.. : :.. . . :.::. CCDS11 SCEQQEAQLVTITNPLEQAFITASLPNVTFDLWIGLH--ASQRDFQWVEQEPLMYANWAP 1010 1020 1030 1040 1050 1060 1040 1050 1060 1070 1080 1090 pF1KE2 GYPGGRRSSLS-YEDADCVVIIGGASNE-AGKWMDDTC-DSKRGYICQTRSDPSLTNPPA : :.: . : . ..:.:.. . : . .:.: : .: . .:.::: .::::. :: CCDS11 GEPSGPSPAPSGNKPTSCAVVLHSPSAHFTGRWDDRSCTEETHGFICQKGTDPSLSPSPA 1070 1080 1090 1100 1110 1120 1100 1110 1120 1130 1140 1150 pF1KE2 TIQ-TDGF-VKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNAFAWLQMETSN .. . : ..: .... :... ..::.: :. .:. .: . :::..:: . CCDS11 ALPPAPGTELSYLNGTFRLLQKPLRWHDALLLCESRNASLAYVPDPYTQAFLTQAARGLR 1130 1140 1150 1160 1170 1180 1160 1170 1180 1190 1200 pF1KE2 ERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWKTAHCNESFY- .::.: .. . .:.:... . :..: ::. ..:.:.:.:: :.:. :. .. CCDS11 TPLWIGLAGEEGSRRYSWVSEEPLNYVGWQDGEPQQPGGCTYVDVDGAWRTTSCDTKLQG 1190 1200 1210 1220 1230 1240 1210 1220 1230 1240 1250 1260 pF1KE2 FLCKRSDEIPATEPPQLPGRCPES-DHTAWIPFHGHCYYIESSYTRNWGQASLECLRMGS .: :. : . . : ::.. .:::::. ::: .. . .: .: : :. CCDS11 AVCGVSSGPPPPRRISYHGSCPQGLADSAWIPFREHCYSFHMELLLGHKEARQRCQRAGG 1250 1260 1270 1280 1290 1300 1270 1280 1290 1300 1310 1320 pF1KE2 SLVSIESAAESSFLSYRVEPLKSKT-NFWIGL-FRNVEGTWLWINNSPVSFVNWNT---G ...:: . :. :. ... .... . :.:. : :: .: .:. :.. ::. : CCDS11 AVLSILDEMENVFVWEHLQSYEGQSRGAWLGMNFNPKGGTLVWQDNTAVNYSNWGPPGLG 1310 1320 1330 1340 1350 1360 1330 1340 1350 1360 1370 1380 pF1KE2 DPSGERNDCVALHASSGFWSNIHCSSYK-GYICKRPKIIDAKPTHELLTTKADTRKMDPS .:.: ....::.: :.. : .:: :. :. ...:: CCDS11 PSMLSHNSCYWIQSNSGLWRPGACTNITMGVVCKLPR--------------AEQSSFSPS 1370 1380 1390 1400 1390 1400 1410 1420 1430 1440 pF1KE2 KPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPGTSDMK : :..:.... ..: : :.: .. .:: . ..::::.. : :.::: . : CCDS11 ALPENPAALVVVLMAVLLLLALLTAALILYRRRQSI-ERGAFEGARYSRSSSSPTEATEK 1410 1420 1430 1440 1450 1460 1450 pF1KE2 D-LVGNIEQNEHSVI . ::...:.::. CCDS11 NILVSDMEMNEQQE 1470 >>CCDS2211.1 LY75 gene_id:4065|Hs108|chr2 (1722 aa) initn: 1268 init1: 376 opt: 1480 Z-score: 1549.8 bits: 299.6 E(32554): 5.3e-80 Smith-Waterman score: 2116; 29.8% identity (58.0% similar) in 1387 aa overlap (25-1342:36-1358) 10 20 30 40 50 pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAE : : . . .:. : : :.. .: CCDS22 ATPRRPAGLLMLLFWFFDLAEPSGRAANDPFTIVHGNTGKCIKPVYGWIVADD-CDE-TE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 SQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGED .. ..:::. ... . . :::. . . ...::: : . :.:.. .: : CCDS22 DKLWKWVSQHRLFHLHSQKCLGLDITKSVNELRMFSCDS-SAMLWWKCEHHSLYGAARYR 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 LFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGAICAFPFKF : .. :. . . ..: .:.. :. ..::.. :. .:: ::. : : ::: . CCDS22 LALKDGH----GTAISNASDVWKK---GGSEESLCDQPYHEIYTRDGNSYGRPCEFPFLI 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 ENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE-GSESLWNKDPLTSVSYQIN .. :. :: .: ::.:: .:. :. .: : :: : : :. :.:. . ::.: CCDS22 DGTWHHDCILDEDHSGP-WCATTLNYEYDRKWGIC-LKPENGCEDNWEKNEQFGSCYQFN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 SKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWS ...::.:..: :::.:.:.::::. : ::: .... .:::::.: ::.:: CCDS22 TQTALSWKEAYVSCQNQGADLLSINSAAELTYLKE-KEGIAKIFWIGLNQLYSARGWEWS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 DRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGYICKKG-NTTLNSF :..:. .::: : ::: :.::. .. .... :... : .: :.:.: :.:.. CCDS22 DHKPLNFLNWDPDRPSAPTIGGSSCARMD-AESGLWQSFSCEAQLPYVCRKPLNNTVELT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 VIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGSDLASIHTIEEFDFI . . :: :.: . : : : :: . .:.. : . :. .::: :::.. . . . CCDS22 DVWTYSD--TRCDAGWLPNNGFCY-LLVNESNSWDKAHAKCKAFSSDLISIHSLADVEVV 360 370 380 390 400 420 430 440 450 460 pF1KE2 ISQLGYEP-NDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGK ...: : ..:.::::..:.: :.::::: ::.: : ..::. :. .:: . :. CCDS22 VTKLHNEDIKEEVWIGLKNINIPTLFQWSDGTEVTLTYWDENEPNVPYNKTPNCVSYLGE 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE2 DGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGC--RKGWKKHHFYCYMIGHTLSTFAE : : ..:: : :.:: :... . . .: : .:::.: :: : . :. CCDS22 LGQWKVQSCEEKLKYVCKRKGEKLND--ASSDKMCPPDEGWKRHGETCYKIYEDEVPFGT 470 480 490 500 510 520 530 540 550 560 570 580 pF1KE2 ANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPE---KYFWTGLSDIQTKGTFQWTI---- .:: :: .:.:: .:.... . ::::::: :... : ..:. CCDS22 ---NCN------LTITSRFEQEYLNDLMKKYDKSLRKYFWTGLRDVDSCGEYNWATVGGR 530 540 550 560 570 590 600 610 620 630 pF1KE2 EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHWAEGVTHPPKPT .. : :..:: :. ::::: :: . : :.: : :: .::. . : : . . CCDS22 RRAVTFSNWNFLEPASPGGCVAMSTGKSVGKWEVKDCRSFKALSICKKMS-GPLGPEEAS 580 590 600 610 620 630 640 650 660 670 680 690 pF1KE2 TTPEPKCPEDWGASSRTSLCFKLY-AKGKHEKKTWFESRDFCRALGGDLASINNKEEQQT :. ::: : . . :.:.. :. .:..: :.. ::.:::. :.:... .: . CCDS22 PKPDDPCPEGWQSFPASLSCYKVFHAERIVRKRNWEEAERFCQALGAHLSSFSHVDEIKE 640 650 660 670 680 690 700 710 720 730 740 750 pF1KE2 IWRLITASGSYHKLFWLGLTYGSPS-EG-FTWSDGSPVSYENWAYGEPNNYQ---NVEYC . ...: . : .. .:.::. ::. .: . ::: .::: . ::..: ... : CCDS22 FLHFLTDQFSGQHWLWIGLNKRSPDLQGSWQWSDRTPVS----TIIMPNEFQQDYDIRDC 700 710 720 730 740 750 760 770 780 790 pF1KE2 GELK--GDP-TMSWN-----------DINCEHLNNWICQIQKGQTPK-PE---PTPAPQD . .: : .:. . :. .:.::: ::.::: :. : : CCDS22 AAVKVFHRPWRRGWHFYDDREFIYLRPFACDTKLEWVCQIPKGRTPKTPDWYNPDRAGIH 760 770 780 790 800 810 800 810 820 830 840 850 pF1KE2 NPPVTEDGWVIYKDYQYYFSKEKE-TMDNARAFCKRNFGDLVSIQSE-SEKKFLWKYVN- .::. .: .:.: . . ....: .: : . :..: : . : . : .: CCDS22 GPPLIIEG------SEYWFVADLHLNYEEAVLYCASNHSFLATITSFVGLKAIKNKIANI 820 830 840 850 860 860 870 880 890 900 pF1KE2 RNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCVTMYSNSGFW--- .:.:. .. .: .:.. . : .:..: : .: .. : CCDS22 SGDGQKWWIRISEWPIDDHFTY------SRYPWHRFPVTFGEE---C--LYMSAKTWLID 870 880 890 900 910 910 920 930 940 950 960 pF1KE2 --NDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCF-KIFGFMEEE . .:. :::...: : . : .. :.: : ..:::: :: . CCDS22 LGKPTDCSTKLPFICEKYNVS-SLEKYSPD-SAAKVQCSEQWIPFQNKCFLKI----KPV 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 RKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGR ....: .: ..::.: :. .. :: :.: . : . : :: . :. :::.: CCDS22 SLTFSQASDTCHSYGGTLPSVLSQIEQDFITSLLPDMEATLWIGLRWTAYEKINKWTDNR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 pF1KE2 GVHYTNWGKGYPGGR-RSSLSYEDAD----CVVIIG-GASNEAGKWMDDTCDSKRGYI-- . :.:. .:: : .. . . :..:.. : .: : .: :.: .. CCDS22 ELTYSNFHPLLVSGRLRIPENFFEEESRYHCALILNLQKSPFTGTWNFTSC-SERHFVSL 1030 1040 1050 1060 1070 1080 1080 1090 1100 1110 1120 1130 pF1KE2 CQTRSDPSLTNPPATIQTDG-FVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPY :: :. .. :.:. . ::: .. :... . . :: :. : : ..:: ::: CCDS22 CQKYSE---VKSRQTLQNASETVKYLNNLYKIIPKTLTWHSAKRECLKSNMQLVSITDPY 1090 1100 1110 1120 1130 1140 1140 1150 1160 1170 1180 1190 pF1KE2 SNAFAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDG ..:: .: : .::.: :. . .. :.: :.... :: . .:.. :: :: :: CCDS22 QQAFLSVQALLHNSSLWIGLFSQDDELNFGWSDGKRLHFSRWAETNGQLED-CVVLDTDG 1150 1160 1170 1180 1190 1200 1200 1210 1220 1230 1240 1250 pF1KE2 YWKTAHCNESFY-FLCKRS-DEIPATEPPQLPGRCPESD-HTAWIPFHGHCYYIESSYTR .:::. ::.. .: : .: : .:: .: ::::.. :: . . .: CCDS22 FWKTVDCNDNQPGAICYYSGNETEKEVKPVDSVKCPSPVLNTPWIPFQNCCYNFIITKNR 1210 1220 1230 1240 1250 1260 1260 1270 1280 1290 1300 pF1KE2 NWGQASLE----CLRMG--SSLVSIESAAESSFLSYRVEPLKSKTNFWIGL---FRNVEG . . .. : : ... : ..::.. :..:. .. .. .. :. : .:: CCDS22 HMATTQDEVHTKCQKLNPKSHILSIRDEKENNFVLEQLLYFNYMAS-WVMLGITYRN--K 1270 1280 1290 1300 1310 1320 1310 1320 1330 1340 1350 1360 pF1KE2 TWLWINNSPVSFVNWNTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKP . .:....:.:...: .: :. . . .: ...::: CCDS22 SLMWFDKTPLSYTHWRAGRPTIKNEKFLAGLSTDGFWDIQTFKVIEEAVYFHQHSILACK 1330 1340 1350 1360 1370 1380 1370 1380 1390 1400 1410 1420 pF1KE2 THELLTTKADTRKMDPSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFE CCDS22 IEMVDYKEEYNTTLPQFMPYEDGIYSVIQKKVTWYEALNMCSQSGGHLASVHNQNGQLFL 1390 1400 1410 1420 1430 1440 >>CCDS56140.1 CD302 gene_id:100526664|Hs108|chr2 (1817 aa) initn: 1268 init1: 376 opt: 1480 Z-score: 1549.5 bits: 299.6 E(32554): 5.5e-80 Smith-Waterman score: 2116; 29.8% identity (58.0% similar) in 1387 aa overlap (25-1342:36-1358) 10 20 30 40 50 pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAE : : . . .:. : : :.. .: CCDS56 ATPRRPAGLLMLLFWFFDLAEPSGRAANDPFTIVHGNTGKCIKPVYGWIVADD-CDE-TE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 SQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGED .. ..:::. ... . . :::. . . ...::: : . :.:.. .: : CCDS56 DKLWKWVSQHRLFHLHSQKCLGLDITKSVNELRMFSCDS-SAMLWWKCEHHSLYGAARYR 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 LFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGAICAFPFKF : .. :. . . ..: .:.. :. ..::.. :. .:: ::. : : ::: . CCDS56 LALKDGH----GTAISNASDVWKK---GGSEESLCDQPYHEIYTRDGNSYGRPCEFPFLI 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 ENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE-GSESLWNKDPLTSVSYQIN .. :. :: .: ::.:: .:. :. .: : :: : : :. :.:. . ::.: CCDS56 DGTWHHDCILDEDHSGP-WCATTLNYEYDRKWGIC-LKPENGCEDNWEKNEQFGSCYQFN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 SKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWS ...::.:..: :::.:.:.::::. : ::: .... .:::::.: ::.:: CCDS56 TQTALSWKEAYVSCQNQGADLLSINSAAELTYLKE-KEGIAKIFWIGLNQLYSARGWEWS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 DRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGYICKKG-NTTLNSF :..:. .::: : ::: :.::. .. .... :... : .: :.:.: :.:.. CCDS56 DHKPLNFLNWDPDRPSAPTIGGSSCARMD-AESGLWQSFSCEAQLPYVCRKPLNNTVELT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 VIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGSDLASIHTIEEFDFI . . :: :.: . : : : :: . .:.. : . :. .::: :::.. . . . CCDS56 DVWTYSD--TRCDAGWLPNNGFCY-LLVNESNSWDKAHAKCKAFSSDLISIHSLADVEVV 360 370 380 390 400 420 430 440 450 460 pF1KE2 ISQLGYEP-NDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGK ...: : ..:.::::..:.: :.::::: ::.: : ..::. :. .:: . :. CCDS56 VTKLHNEDIKEEVWIGLKNINIPTLFQWSDGTEVTLTYWDENEPNVPYNKTPNCVSYLGE 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE2 DGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGC--RKGWKKHHFYCYMIGHTLSTFAE : : ..:: : :.:: :... . . .: : .:::.: :: : . :. CCDS56 LGQWKVQSCEEKLKYVCKRKGEKLND--ASSDKMCPPDEGWKRHGETCYKIYEDEVPFGT 470 480 490 500 510 520 530 540 550 560 570 580 pF1KE2 ANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPE---KYFWTGLSDIQTKGTFQWTI---- .:: :: .:.:: .:.... . ::::::: :... : ..:. CCDS56 ---NCN------LTITSRFEQEYLNDLMKKYDKSLRKYFWTGLRDVDSCGEYNWATVGGR 530 540 550 560 570 590 600 610 620 630 pF1KE2 EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHWAEGVTHPPKPT .. : :..:: :. ::::: :: . : :.: : :: .::. . : : . . CCDS56 RRAVTFSNWNFLEPASPGGCVAMSTGKSVGKWEVKDCRSFKALSICKKMS-GPLGPEEAS 580 590 600 610 620 630 640 650 660 670 680 690 pF1KE2 TTPEPKCPEDWGASSRTSLCFKLY-AKGKHEKKTWFESRDFCRALGGDLASINNKEEQQT :. ::: : . . :.:.. :. .:..: :.. ::.:::. :.:... .: . CCDS56 PKPDDPCPEGWQSFPASLSCYKVFHAERIVRKRNWEEAERFCQALGAHLSSFSHVDEIKE 640 650 660 670 680 690 700 710 720 730 740 750 pF1KE2 IWRLITASGSYHKLFWLGLTYGSPS-EG-FTWSDGSPVSYENWAYGEPNNYQ---NVEYC . ...: . : .. .:.::. ::. .: . ::: .::: . ::..: ... : CCDS56 FLHFLTDQFSGQHWLWIGLNKRSPDLQGSWQWSDRTPVS----TIIMPNEFQQDYDIRDC 700 710 720 730 740 750 760 770 780 790 pF1KE2 GELK--GDP-TMSWN-----------DINCEHLNNWICQIQKGQTPK-PE---PTPAPQD . .: : .:. . :. .:.::: ::.::: :. : : CCDS56 AAVKVFHRPWRRGWHFYDDREFIYLRPFACDTKLEWVCQIPKGRTPKTPDWYNPDRAGIH 760 770 780 790 800 810 800 810 820 830 840 850 pF1KE2 NPPVTEDGWVIYKDYQYYFSKEKE-TMDNARAFCKRNFGDLVSIQSE-SEKKFLWKYVN- .::. .: .:.: . . ....: .: : . :..: : . : . : .: CCDS56 GPPLIIEG------SEYWFVADLHLNYEEAVLYCASNHSFLATITSFVGLKAIKNKIANI 820 830 840 850 860 860 870 880 890 900 pF1KE2 RNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCVTMYSNSGFW--- .:.:. .. .: .:.. . : .:..: : .: .. : CCDS56 SGDGQKWWIRISEWPIDDHFTY------SRYPWHRFPVTFGEE---C--LYMSAKTWLID 870 880 890 900 910 910 920 930 940 950 960 pF1KE2 --NDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCF-KIFGFMEEE . .:. :::...: : . : .. :.: : ..:::: :: . CCDS56 LGKPTDCSTKLPFICEKYNVS-SLEKYSPD-SAAKVQCSEQWIPFQNKCFLKI----KPV 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 RKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGR ....: .: ..::.: :. .. :: :.: . : . : :: . :. :::.: CCDS56 SLTFSQASDTCHSYGGTLPSVLSQIEQDFITSLLPDMEATLWIGLRWTAYEKINKWTDNR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 pF1KE2 GVHYTNWGKGYPGGR-RSSLSYEDAD----CVVIIG-GASNEAGKWMDDTCDSKRGYI-- . :.:. .:: : .. . . :..:.. : .: : .: :.: .. CCDS56 ELTYSNFHPLLVSGRLRIPENFFEEESRYHCALILNLQKSPFTGTWNFTSC-SERHFVSL 1030 1040 1050 1060 1070 1080 1080 1090 1100 1110 1120 1130 pF1KE2 CQTRSDPSLTNPPATIQTDG-FVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPY :: :. .. :.:. . ::: .. :... . . :: :. : : ..:: ::: CCDS56 CQKYSE---VKSRQTLQNASETVKYLNNLYKIIPKTLTWHSAKRECLKSNMQLVSITDPY 1090 1100 1110 1120 1130 1140 1140 1150 1160 1170 1180 1190 pF1KE2 SNAFAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDG ..:: .: : .::.: :. . .. :.: :.... :: . .:.. :: :: :: CCDS56 QQAFLSVQALLHNSSLWIGLFSQDDELNFGWSDGKRLHFSRWAETNGQLED-CVVLDTDG 1150 1160 1170 1180 1190 1200 1200 1210 1220 1230 1240 1250 pF1KE2 YWKTAHCNESFY-FLCKRS-DEIPATEPPQLPGRCPESD-HTAWIPFHGHCYYIESSYTR .:::. ::.. .: : .: : .:: .: ::::.. :: . . .: CCDS56 FWKTVDCNDNQPGAICYYSGNETEKEVKPVDSVKCPSPVLNTPWIPFQNCCYNFIITKNR 1210 1220 1230 1240 1250 1260 1260 1270 1280 1290 1300 pF1KE2 NWGQASLE----CLRMG--SSLVSIESAAESSFLSYRVEPLKSKTNFWIGL---FRNVEG . . .. : : ... : ..::.. :..:. .. .. .. :. : .:: CCDS56 HMATTQDEVHTKCQKLNPKSHILSIRDEKENNFVLEQLLYFNYMAS-WVMLGITYRN--K 1270 1280 1290 1300 1310 1320 1310 1320 1330 1340 1350 1360 pF1KE2 TWLWINNSPVSFVNWNTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKP . .:....:.:...: .: :. . . .: ...::: CCDS56 SLMWFDKTPLSYTHWRAGRPTIKNEKFLAGLSTDGFWDIQTFKVIEEAVYFHQHSILACK 1330 1340 1350 1360 1370 1380 1370 1380 1390 1400 1410 1420 pF1KE2 THELLTTKADTRKMDPSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFE CCDS56 IEMVDYKEEYNTTLPQFMPYEDGIYSVIQKKVTWYEALNMCSQSGGHLASVHNQNGQLFL 1390 1400 1410 1420 1430 1440 >>CCDS56141.1 CD302 gene_id:100526664|Hs108|chr2 (1873 aa) initn: 1268 init1: 376 opt: 1480 Z-score: 1549.3 bits: 299.6 E(32554): 5.6e-80 Smith-Waterman score: 2116; 29.8% identity (58.0% similar) in 1387 aa overlap (25-1342:36-1358) 10 20 30 40 50 pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAE : : . . .:. : : :.. .: CCDS56 ATPRRPAGLLMLLFWFFDLAEPSGRAANDPFTIVHGNTGKCIKPVYGWIVADD-CDE-TE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 SQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGED .. ..:::. ... . . :::. . . ...::: : . :.:.. .: : CCDS56 DKLWKWVSQHRLFHLHSQKCLGLDITKSVNELRMFSCDS-SAMLWWKCEHHSLYGAARYR 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 LFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGAICAFPFKF : .. :. . . ..: .:.. :. ..::.. :. .:: ::. : : ::: . CCDS56 LALKDGH----GTAISNASDVWKK---GGSEESLCDQPYHEIYTRDGNSYGRPCEFPFLI 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 ENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE-GSESLWNKDPLTSVSYQIN .. :. :: .: ::.:: .:. :. .: : :: : : :. :.:. . ::.: CCDS56 DGTWHHDCILDEDHSGP-WCATTLNYEYDRKWGIC-LKPENGCEDNWEKNEQFGSCYQFN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 SKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWS ...::.:..: :::.:.:.::::. : ::: .... .:::::.: ::.:: CCDS56 TQTALSWKEAYVSCQNQGADLLSINSAAELTYLKE-KEGIAKIFWIGLNQLYSARGWEWS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 DRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGYICKKG-NTTLNSF :..:. .::: : ::: :.::. .. .... :... : .: :.:.: :.:.. CCDS56 DHKPLNFLNWDPDRPSAPTIGGSSCARMD-AESGLWQSFSCEAQLPYVCRKPLNNTVELT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 VIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGSDLASIHTIEEFDFI . . :: :.: . : : : :: . .:.. : . :. .::: :::.. . . . CCDS56 DVWTYSD--TRCDAGWLPNNGFCY-LLVNESNSWDKAHAKCKAFSSDLISIHSLADVEVV 360 370 380 390 400 420 430 440 450 460 pF1KE2 ISQLGYEP-NDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGK ...: : ..:.::::..:.: :.::::: ::.: : ..::. :. .:: . :. CCDS56 VTKLHNEDIKEEVWIGLKNINIPTLFQWSDGTEVTLTYWDENEPNVPYNKTPNCVSYLGE 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE2 DGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGC--RKGWKKHHFYCYMIGHTLSTFAE : : ..:: : :.:: :... . . .: : .:::.: :: : . :. CCDS56 LGQWKVQSCEEKLKYVCKRKGEKLND--ASSDKMCPPDEGWKRHGETCYKIYEDEVPFGT 470 480 490 500 510 520 530 540 550 560 570 580 pF1KE2 ANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPE---KYFWTGLSDIQTKGTFQWTI---- .:: :: .:.:: .:.... . ::::::: :... : ..:. CCDS56 ---NCN------LTITSRFEQEYLNDLMKKYDKSLRKYFWTGLRDVDSCGEYNWATVGGR 530 540 550 560 570 590 600 610 620 630 pF1KE2 EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHWAEGVTHPPKPT .. : :..:: :. ::::: :: . : :.: : :: .::. . : : . . CCDS56 RRAVTFSNWNFLEPASPGGCVAMSTGKSVGKWEVKDCRSFKALSICKKMS-GPLGPEEAS 580 590 600 610 620 630 640 650 660 670 680 690 pF1KE2 TTPEPKCPEDWGASSRTSLCFKLY-AKGKHEKKTWFESRDFCRALGGDLASINNKEEQQT :. ::: : . . :.:.. :. .:..: :.. ::.:::. :.:... .: . CCDS56 PKPDDPCPEGWQSFPASLSCYKVFHAERIVRKRNWEEAERFCQALGAHLSSFSHVDEIKE 640 650 660 670 680 690 700 710 720 730 740 750 pF1KE2 IWRLITASGSYHKLFWLGLTYGSPS-EG-FTWSDGSPVSYENWAYGEPNNYQ---NVEYC . ...: . : .. .:.::. ::. .: . ::: .::: . ::..: ... : CCDS56 FLHFLTDQFSGQHWLWIGLNKRSPDLQGSWQWSDRTPVS----TIIMPNEFQQDYDIRDC 700 710 720 730 740 750 760 770 780 790 pF1KE2 GELK--GDP-TMSWN-----------DINCEHLNNWICQIQKGQTPK-PE---PTPAPQD . .: : .:. . :. .:.::: ::.::: :. : : CCDS56 AAVKVFHRPWRRGWHFYDDREFIYLRPFACDTKLEWVCQIPKGRTPKTPDWYNPDRAGIH 760 770 780 790 800 810 800 810 820 830 840 850 pF1KE2 NPPVTEDGWVIYKDYQYYFSKEKE-TMDNARAFCKRNFGDLVSIQSE-SEKKFLWKYVN- .::. .: .:.: . . ....: .: : . :..: : . : . : .: CCDS56 GPPLIIEG------SEYWFVADLHLNYEEAVLYCASNHSFLATITSFVGLKAIKNKIANI 820 830 840 850 860 860 870 880 890 900 pF1KE2 RNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCVTMYSNSGFW--- .:.:. .. .: .:.. . : .:..: : .: .. : CCDS56 SGDGQKWWIRISEWPIDDHFTY------SRYPWHRFPVTFGEE---C--LYMSAKTWLID 870 880 890 900 910 910 920 930 940 950 960 pF1KE2 --NDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCF-KIFGFMEEE . .:. :::...: : . : .. :.: : ..:::: :: . CCDS56 LGKPTDCSTKLPFICEKYNVS-SLEKYSPD-SAAKVQCSEQWIPFQNKCFLKI----KPV 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 RKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGR ....: .: ..::.: :. .. :: :.: . : . : :: . :. :::.: CCDS56 SLTFSQASDTCHSYGGTLPSVLSQIEQDFITSLLPDMEATLWIGLRWTAYEKINKWTDNR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 pF1KE2 GVHYTNWGKGYPGGR-RSSLSYEDAD----CVVIIG-GASNEAGKWMDDTCDSKRGYI-- . :.:. .:: : .. . . :..:.. : .: : .: :.: .. CCDS56 ELTYSNFHPLLVSGRLRIPENFFEEESRYHCALILNLQKSPFTGTWNFTSC-SERHFVSL 1030 1040 1050 1060 1070 1080 1080 1090 1100 1110 1120 1130 pF1KE2 CQTRSDPSLTNPPATIQTDG-FVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPY :: :. .. :.:. . ::: .. :... . . :: :. : : ..:: ::: CCDS56 CQKYSE---VKSRQTLQNASETVKYLNNLYKIIPKTLTWHSAKRECLKSNMQLVSITDPY 1090 1100 1110 1120 1130 1140 1140 1150 1160 1170 1180 1190 pF1KE2 SNAFAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDG ..:: .: : .::.: :. . .. :.: :.... :: . .:.. :: :: :: CCDS56 QQAFLSVQALLHNSSLWIGLFSQDDELNFGWSDGKRLHFSRWAETNGQLED-CVVLDTDG 1150 1160 1170 1180 1190 1200 1200 1210 1220 1230 1240 1250 pF1KE2 YWKTAHCNESFY-FLCKRS-DEIPATEPPQLPGRCPESD-HTAWIPFHGHCYYIESSYTR .:::. ::.. .: : .: : .:: .: ::::.. :: . . .: CCDS56 FWKTVDCNDNQPGAICYYSGNETEKEVKPVDSVKCPSPVLNTPWIPFQNCCYNFIITKNR 1210 1220 1230 1240 1250 1260 1260 1270 1280 1290 1300 pF1KE2 NWGQASLE----CLRMG--SSLVSIESAAESSFLSYRVEPLKSKTNFWIGL---FRNVEG . . .. : : ... : ..::.. :..:. .. .. .. :. : .:: CCDS56 HMATTQDEVHTKCQKLNPKSHILSIRDEKENNFVLEQLLYFNYMAS-WVMLGITYRN--K 1270 1280 1290 1300 1310 1320 1310 1320 1330 1340 1350 1360 pF1KE2 TWLWINNSPVSFVNWNTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKP . .:....:.:...: .: :. . . .: ...::: CCDS56 SLMWFDKTPLSYTHWRAGRPTIKNEKFLAGLSTDGFWDIQTFKVIEEAVYFHQHSILACK 1330 1340 1350 1360 1370 1380 1370 1380 1390 1400 1410 1420 pF1KE2 THELLTTKADTRKMDPSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFE CCDS56 IEMVDYKEEYNTTLPQFMPYEDGIYSVIQKKVTWYEALNMCSQSGGHLASVHNQNGQLFL 1390 1400 1410 1420 1430 1440 >-- initn: 214 init1: 120 opt: 376 Z-score: 388.2 bits: 84.8 E(32554): 2.7e-15 Smith-Waterman score: 539; 27.0% identity (54.5% similar) in 519 aa overlap (965-1455:1410-1870) 940 950 960 970 980 990 pF1KE2 MPTMPSVPSGCKEGWNFYSNKCFKIFGFMEEERKNWQEARKACIGFGGNLVSIQNEKEQA ... .: :: . : ::.:.:..:.. : CCDS56 CKIEMVDYKEEYNTTLPQFMPYEDGIYSVIQKKVTWYEALNMCSQSGGHLASVHNQNGQL 1380 1390 1400 1410 1420 1430 1000 1010 1020 1030 1040 1050 pF1KE2 FLTYHMKDSTFSAWTGLNDVN-SEHTFLWTDGRGVHYTNW-GKGYPGGRRSSLSYEDADC :: .: . : :.::.. . :: .: :.:: : : :. :: .: CCDS56 FLEDIVKRDGFPLWVGLSSHDGSESSFEWSDGSTFDYIPWKGQTSPG-----------NC 1440 1450 1460 1470 1480 1060 1070 1080 1090 1100 pF1KE2 VVIIGGASNEAGKWMDDTCDS-KRGYICQ--------TRSDPSLTNPPATIQTDGFVKYG :.. . : : . :.: : : :: .: : : : . . ...: CCDS56 VLL-----DPKGTWKHEKCNSVKDGAICYKPTKSKKLSRLTYSSRCPAAKENGSRWIQYK 1490 1500 1510 1520 1530 1540 1110 1120 1130 1140 1150 pF1KE2 KSSYSLMRQKFQWHEAETYCKLHN--SLIASILDPYSNAFAWLQMETSNE---RVWIALN :. . .. ::. :. :. . :.:: : : :. :. .:. :::..:. CCDS56 GHCYKSDQALHSFSEAKKLCSKHDHSATIVSIKDEDENKFVSRLMRENNNITMRVWLGLS 1550 1560 1570 1580 1590 1600 1160 1170 1180 1190 1200 1210 pF1KE2 SNLTDNQYTWTDKWRVRYTNWAADEPKLKSA---CVYLDLDGY-WKTAHCNESF-YFLCK .. .:....: : .: ...: : : ::. : .: .. :: ..:...: .:: CCDS56 QHSVDQSWSWLDGSEVTFVKW---ENKSKSGVGRCSMLIASNETWKKVECEHGFGRVVCK 1610 1620 1630 1640 1650 1660 1220 1230 1240 1250 1260 1270 pF1KE2 RSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYI--ESSYTRNWGQASLECLRMGSSLV .: :: : .:: :. :: . :. ... .. .: :.... CCDS56 ------------VPLDCPSS---TWIQFQDSCYIFLQEAIKVESIEDVRNQCTDHGADMI 1670 1680 1690 1700 1280 1290 1300 1310 1320 pF1KE2 SIESAAESSF-LSYRVEPLKSKTNFWIGLFRNVE-GTWLWINNSPVSFVNWNTGDPSGER ::.. :..: :. . :. .. .:.: ... ... :..:: ..: .:. : . . CCDS56 SIHNEEENAFILDTLKKQWKGPDDILLGMFYDTDDASFKWFDNSNMTFDKWTDQDDDEDL 1710 1720 1730 1740 1750 1760 1330 1340 1350 1360 1370 1380 pF1KE2 ND-CVALHASSGFWSNIHC--SSYKGYICKRPKIIDAKPTHELLTTKADTRKMDPSKPSS : :. :: ..: :.. .: :: .: .:: : : . ::. . . CCDS56 VDTCAFLHIKTGEWKKGNCEVSSVEGTLCKT-----AIPYK---------RKY--LSDNH 1770 1780 1790 1800 1390 1400 1410 1420 1430 1440 pF1KE2 NVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPGTSDMKDLVG . ....:. .::: : .:.::: : ... : .:.. .. .:: . : .:: CCDS56 ILISALVIASTVILTVLGAIIWFLYKK---H--SDSRF-TTVFSTAPQSPYNEDCVLVVG 1810 1820 1830 1840 1850 1860 1450 pF1KE2 NIEQNEHSVI :.::. : CCDS56 --EENEYPVQFD 1870 >>CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321 aa) initn: 289 init1: 145 opt: 357 Z-score: 370.2 bits: 80.9 E(32554): 2.7e-14 Smith-Waterman score: 357; 32.7% identity (58.9% similar) in 214 aa overlap (313-513:1031-1234) 290 300 310 320 330 340 pF1KE2 SLSFNSGWQWSDRSPFRYLNWLPGSPSAEPGKSCVSLNPGKNAKWENLECVQKLGYICKK : :: . :.: . . .: : :.. CCDS12 NAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDC---LCSPCEN 1010 1020 1030 1040 1050 350 360 370 380 390 pF1KE2 GNTTL---NSFV---IPS------ESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTT :.: . :.:: .:: :.:. : : . ::::. . ... .:: CCDS12 GGTCIDEVNGFVCLCLPSYGGSFCEKDTEG-CDRGWHKFQGHCYR-YFAHRRAWEDAEKD 1060 1070 1080 1090 1100 1110 400 410 420 430 440 450 pF1KE2 CRKEGSDLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLR ::.... :.:.:. :: .:: : .:.: . :::::: .. :.:.:.: . : .: . CCDS12 CRRRSGHLTSVHSPEEHSFINS-FGHE---NTWIGLNDRIVERDFQWTDNTGLQFENWRE 1120 1130 1140 1150 1160 1170 460 470 480 490 500 pF1KE2 GEPSHENNRQEDCVVMKGKD-GYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGCRKGWK ..:.. :::::: ... : : : :.. : :.:: . :: . ::.. : . CCDS12 NQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPA-VENASLIGAR 1180 1190 1200 1210 1220 1230 510 520 530 540 550 560 pF1KE2 KHHFYCYMIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPEKYFWTGLSD : .. CCDS12 KAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRHHHHHQHH 1240 1250 1260 1270 1280 1290 >>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 (911 aa) initn: 374 init1: 150 opt: 337 Z-score: 351.2 bits: 76.9 E(32554): 3.1e-13 Smith-Waterman score: 337; 42.2% identity (60.0% similar) in 135 aa overlap (362-495:688-817) 340 350 360 370 380 390 pF1KE2 CVQKLGYICKKGNTTLNSFVIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTC : : . : ::: : . .. ..: : : CCDS11 GGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYK-HFSTRRSWEEAETQC 660 670 680 690 700 710 400 410 420 430 440 450 pF1KE2 RKEGSDLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRG : :. :::: : :: ::: .. :. . :::::: :. : ::::.:. . .: : CCDS11 RMYGAHLASISTPEEQDFINNR--YR--EYQWIGLNDRTIEGDFLWSDGVPLLYENWNPG 720 730 740 750 760 770 460 470 480 490 500 510 pF1KE2 EPSHENNRQEDCVVMKGKD-GYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGCRKGWKK .:. :.:::: .: : :.: :.. :.: ::: : :: CCDS11 QPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRL 780 790 800 810 820 830 520 530 540 550 560 570 pF1KE2 HHFYCYMIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPEKYFWTGLSDI CCDS11 RYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGR 840 850 860 870 880 890 >>CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530 aa) initn: 285 init1: 161 opt: 332 Z-score: 340.2 bits: 76.3 E(32554): 1.3e-12 Smith-Waterman score: 362; 28.3% identity (50.5% similar) in 321 aa overlap (252-545:2220-2516) 230 240 250 260 270 280 pF1KE2 KDPLTSVSYQINSKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGL .: . :. .:.: .::: :. : CCDS53 TASGDRTEISGDLSGHTSQLGVVISTSIPESEWTQQTQRPAETHLEIESSSL---LYSGE 2190 2200 2210 2220 2230 2240 290 300 310 320 330 pF1KE2 NSLSFNSGWQWSDRSPFRYLNWLPGSPS--AEPGKSCVSLNPGKNAKWENLECVQKLGYI .. . ... . .: : .: : : : :..::. : .. : . :.. CCDS53 ETHTVETATSPTDASIPASPEWKRESESTAAAPARSCAEEPCGAGT------CKETEGHV 2250 2260 2270 2280 2290 2300 340 350 360 370 380 390 pF1KE2 ---CKKGNTTLNSFVIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGS : : : . . ...: : : : ::::. : ... :: ::.. : CCDS53 ICLCPPGYTGEHCNI---DQEV---CEEGWNKYQGHCYR-HFPDRETWVDAERRCREQQS 2310 2320 2330 2340 2350 400 410 420 430 440 450 pF1KE2 DLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHE :.:: : :: .:. . . .: :::::: :. :.:::: :. : .: ..:.. CCDS53 HLSSIVTPEEQEFVNN----NAQDYQWIGLNDRTIEGDFRWSDGHPMQFENWRPNQPDNF 2360 2370 2380 2390 2400 460 470 480 490 pF1KE2 NNRQEDCVVMKGKD-GYWADRGCEWPLGYICKMKSRSQG-PEIVE--------------- :::::: .. : : : :.. : . :: . . : : .:: CCDS53 FAAGEDCVVMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPVVEHARTFGQKKDRYEIN 2410 2420 2430 2440 2450 2460 500 510 520 530 540 550 pF1KE2 --VEKGCRKGWKKHHF---YCYMIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSF :. : .:. ..:. : :: . : . ::.. ..: .. : CCDS53 SLVRYQCTEGFVQRHMPTIRCQPSGH----WEEPQITCTDPTTYKRRLQKRSSRHPRRSR 2470 2480 2490 2500 2510 2520 560 570 580 590 600 610 pF1KE2 VGLRPEKYFWTGLSDIQTKGTFQWTIEEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDV CCDS53 PSTAH 2530 1456 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 03:12:52 2016 done: Tue Nov 8 03:12:53 2016 Total Scan time: 4.200 Total Display time: 0.440 Function used was FASTA [36.3.4 Apr, 2011]