FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2421, 2351 aa 1>>>pF1KE2421 2351 - 2351 aa - 2351 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.1126+/-0.00139; mu= 15.4456+/- 0.083 mean_var=83.5685+/-16.611, 0's: 0 Z-trim(100.4): 55 B-trim: 64 in 1/50 Lambda= 0.140298 statistics sampled from 6069 (6117) to 6069 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.525), E-opt: 0.2 (0.188), width: 16 Scan time: 3.890 The best scores are: opt bits E(32554) CCDS35457.1 F8 gene_id:2157|Hs108|chrX (2351) 15768 3202.9 0 CCDS1281.1 F5 gene_id:2153|Hs108|chr1 (2224) 1809 377.5 3.9e-103 CCDS44026.1 F8 gene_id:2157|Hs108|chrX ( 216) 1414 297.5 4.5e-80 CCDS64195.1 EDIL3 gene_id:10085|Hs108|chr5 ( 470) 884 190.3 1.9e-47 CCDS4062.1 EDIL3 gene_id:10085|Hs108|chr5 ( 480) 884 190.3 1.9e-47 CCDS3141.1 CP gene_id:1356|Hs108|chr3 (1065) 819 177.1 3.9e-43 CCDS44710.1 HEPHL1 gene_id:341208|Hs108|chr11 (1159) 813 175.9 9.9e-43 CCDS14385.1 HEPH gene_id:9843|Hs108|chrX ( 891) 637 140.3 4.1e-32 CCDS65277.1 HEPH gene_id:9843|Hs108|chrX ( 969) 555 123.7 4.4e-27 CCDS48133.1 HEPH gene_id:9843|Hs108|chrX (1160) 555 123.7 5.2e-27 CCDS14384.3 HEPH gene_id:9843|Hs108|chrX (1212) 555 123.7 5.5e-27 CCDS45345.1 MFGE8 gene_id:4240|Hs108|chr15 ( 335) 535 119.6 2.5e-26 CCDS46499.1 NRP2 gene_id:8828|Hs108|chr2 ( 555) 438 100.0 3.4e-20 CCDS46498.1 NRP2 gene_id:8828|Hs108|chr2 ( 901) 438 100.0 5.5e-20 CCDS2365.1 NRP2 gene_id:8828|Hs108|chr2 ( 906) 438 100.0 5.5e-20 CCDS46497.1 NRP2 gene_id:8828|Hs108|chr2 ( 909) 438 100.0 5.5e-20 CCDS46496.1 NRP2 gene_id:8828|Hs108|chr2 ( 926) 438 100.0 5.6e-20 CCDS2364.1 NRP2 gene_id:8828|Hs108|chr2 ( 931) 438 100.0 5.6e-20 CCDS31179.1 NRP1 gene_id:8829|Hs108|chr10 ( 609) 356 83.4 3.7e-15 CCDS31180.1 NRP1 gene_id:8829|Hs108|chr10 ( 644) 356 83.4 3.9e-15 CCDS81448.1 NRP1 gene_id:8829|Hs108|chr10 ( 906) 356 83.4 5.5e-15 CCDS7177.1 NRP1 gene_id:8829|Hs108|chr10 ( 923) 356 83.4 5.6e-15 CCDS14187.1 RS1 gene_id:6247|Hs108|chrX ( 224) 338 79.7 1.7e-14 CCDS5476.1 AEBP1 gene_id:165|Hs108|chr7 (1158) 346 81.4 2.8e-14 CCDS7637.1 CPXM2 gene_id:119587|Hs108|chr10 ( 756) 340 80.2 4.3e-14 CCDS46878.1 DCBLD2 gene_id:131566|Hs108|chr3 ( 775) 338 79.8 5.8e-14 CCDS81918.1 MFGE8 gene_id:4240|Hs108|chr15 ( 343) 323 76.7 2.1e-13 CCDS10347.1 MFGE8 gene_id:4240|Hs108|chr15 ( 387) 323 76.7 2.4e-13 CCDS34522.1 DCBLD1 gene_id:285761|Hs108|chr6 ( 539) 301 72.3 7.3e-12 CCDS5889.1 CNTNAP2 gene_id:26047|Hs108|chr7 (1331) 290 70.0 8.4e-11 >>CCDS35457.1 F8 gene_id:2157|Hs108|chrX (2351 aa) initn: 15768 init1: 15768 opt: 15768 Z-score: 17234.4 bits: 3202.9 E(32554): 0 Smith-Waterman score: 15768; 100.0% identity (100.0% similar) in 2351 aa overlap (1-2351:1-2351) 10 20 30 40 50 60 pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 TSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 GVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 VDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 AASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 RQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 RQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 EAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 PDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 LIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 TKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 NRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 NRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILS 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 IGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 IGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRG 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 MTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 PENDIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PENDIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 PGAIDSNNSLSEMTHFRPQLHHSGDMVFTPESGLQLRLNEKLGTTAATELKKLDFKVSST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PGAIDSNNSLSEMTHFRPQLHHSGDMVFTPESGLQLRLNEKLGTTAATELKKLDFKVSST 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 SNNLISTIPSDNLAAGTDNTSSLGPPSMPVHYDSQLDTTLFGKKSSPLTESGGPLSLSEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SNNLISTIPSDNLAAGTDNTSSLGPPSMPVHYDSQLDTTLFGKKSSPLTESGGPLSLSEE 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 NNDSKLLESGLMNSQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 NNDSKLLESGLMNSQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTN 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE2 KTSNNSATNRKTHIDGPSLLIENSPSVWQNILESDTEFKKVTPLIHDRMLMDKNATALRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KTSNNSATNRKTHIDGPSLLIENSPSVWQNILESDTEFKKVTPLIHDRMLMDKNATALRL 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE2 NHMSNKTTSSKNMEMVQQKKEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 NHMSNKTTSSKNMEMVQQKKEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSG 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE2 QGPSPKQLVSLGPEKSVEGQNFLSEKNKVVVGKGEFTKDVGLKEMVFPSSRNLFLTNLDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 QGPSPKQLVSLGPEKSVEGQNFLSEKNKVVVGKGEFTKDVGLKEMVFPSSRNLFLTNLDN 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE2 LHENNTHNQEKKIQEEIEKKETLIQENVVLPQIHTVTGTKNFMKNLFLLSTRQNVEGSYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LHENNTHNQEKKIQEEIEKKETLIQENVVLPQIHTVTGTKNFMKNLFLLSTRQNVEGSYD 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE2 GAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNT 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE2 SQQNFVTQRSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPSTLTQIDYNEKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SQQNFVTQRSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPSTLTQIDYNEKE 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE2 KGAITQSPLSDCLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KGAITQSPLSDCLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASY 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE2 RKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKVENTVLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 RKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKVENTVLP 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE2 KPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQGTEGAIKWNEANRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQGTEGAIKWNEANRP 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE2 GKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSL 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE2 NACESNHAIAAINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQSDQEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 NACESNHAIAAINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQSDQEE 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE2 IDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 IDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNR 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE2 AQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASR 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE2 PYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDV 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE2 DLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRA 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE2 PCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGH 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE2 VFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKC 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE2 QTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 QTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMII 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE2 HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFN 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE2 PPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFA 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KE2 TWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFL 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KE2 ISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRM 2290 2300 2310 2320 2330 2340 2350 pF1KE2 EVLGCEAQDLY ::::::::::: CCDS35 EVLGCEAQDLY 2350 >>CCDS1281.1 F5 gene_id:2153|Hs108|chr1 (2224 aa) initn: 2214 init1: 458 opt: 1809 Z-score: 1965.0 bits: 377.5 E(32554): 3.9e-103 Smith-Waterman score: 3486; 31.8% identity (59.1% similar) in 2408 aa overlap (22-2346:32-2222) 10 20 30 40 50 pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPP :..:..: .::.: : CCDS12 FPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYR--------------P 10 20 30 40 60 70 80 90 100 110 pF1KE2 RVPKSFPFNTSVV-YKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNM . : . .: ::. .:: .. :. . :. ::. ::::::. ::: : . . .:: CCDS12 E-PTNSSLNLSVTSFKKIVYREYEPY-FKKEKPQSTISGLLGPTLYAEVGDIIKVHFKNK 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE2 ASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDP :..:.:.: :. : : :::: : :.: :: :: : :: .:: :.. ...:: .:: CCDS12 ADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSGPTHDDP 110 120 130 140 150 160 180 190 200 210 220 pF1KE2 LCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQ-TLHK-FILLFAVFDEGKSWH :::. : :: .:..:.:::::: ::.:..:.:.. :: :. : ..::::::::.::: CCDS12 PCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLFAVFDESKSW- 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE2 SETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSI :.. .::: .::::::: ..: . : . . ::..::.. ::. :: CCDS12 SQS-SSLM--------------YTVNGYVNGTMPDITVCAHDHISWHLLGMSSGPELFSI 230 240 250 260 290 300 310 320 330 340 pF1KE2 FLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSC ..:... .:. ... . : ::. . :.... .: . ::.::. . .: CCDS12 HFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWIISSLTPKHLQAGMQAYIDIKNC 270 280 290 300 310 320 350 360 370 380 390 400 pF1KE2 PEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAE :. . .: . .: ..: : : ..:::: CCDS12 PK----KTRN----------------------------LKKITREQRRHMKRWEYFIAAE 330 340 350 410 420 430 440 450 460 pF1KE2 EEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQ---HES : :::::.. : :..:.::.:.: ..::..:::: . : ::.: :..... .:. CCDS12 EVIWDYAPVIPANMDKKYRSQHLDNFSNQIGKHYKKVMYTQYEDESF-TKHTVNPNMKED 360 370 380 390 400 410 470 480 490 500 510 520 pF1KE2 GILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGIT--DVRPLYSRRLPKGVKHLKDFPIL :::::.. ..: ::: :.:::.:::::.:::::.: . . . .: .. . CCDS12 GILGPIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQ 420 430 440 450 460 470 530 540 550 560 570 580 pF1KE2 PGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGN ::: . :::.. : ::..: .:::: : : :.. ::.:::::: :::: ..:.:.:: CCDS12 PGETYTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGI 480 490 500 510 520 530 590 600 610 620 630 640 pF1KE2 QIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDS : .: .. .:.:::::.:::: .::..: :: :. .::.: :::: .::::: .: CCDS12 QRAADIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPES 540 550 560 570 580 590 650 660 670 680 690 700 pF1KE2 LQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSME . :. :. ... :.. :.:.:...:.. :.:..: . .::::::::. ::.: ..:. CCDS12 ITTLGFCFDDTVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMD 600 610 620 630 640 650 710 720 730 740 750 pF1KE2 NPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDI----SAYLLSK--NNAI : : :.: ::. :.. . .. .: : ::::: . :. . .. .. . CCDS12 NVGTWMLTSMNSSPRSKKLRLKFRDVKC---IPDDDEDSYEIFEPPESTVMATRKMHDRL 660 670 680 690 700 710 760 770 780 790 800 pF1KE2 EPRSFS-------QNSRHPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQNVSSSDL ::.. :: . ..: ... ... : . .: .. . :::. CCDS12 EPEDEESDADYDYQNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGT---EFVSSNTD 720 730 740 750 760 770 810 820 830 840 850 pF1KE2 LMLLRQSPTPHGLS------LSDLQEA---KYETFSDDPSPGAIDSNNSLSEMT--HFRP ... . .: ..: :.. :.: . : . .: : .:. :. : : : CCDS12 IIVGSNYSSPSNISKFTVNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSP 780 790 800 810 820 830 860 870 880 890 900 910 pF1KE2 QLHHSGDMVFTPE-SGLQLRLNEKLGTTAATE-LKKLDFKV--SSTSNNLISTIPSDNLA . . . :. .:..: :. : . : :. :: ...... .: . CCDS12 YSEDPIEDPLQPDVTGIRL-LSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHK 840 850 860 870 880 920 930 940 950 960 970 pF1KE2 AGTDNTSSLGPPS-MPVHYDSQLDTTLFGKKSSPLTESGGPLSLSEENNDSKLLESGLMN .: ... : :: : : . : .. : . . : : ...:.::.: . CCDS12 VGRHLSQDTGSPSGMRPWEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHL 890 900 910 920 930 940 980 990 1000 1010 1020 1030 pF1KE2 SQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTNKTSNNSATNRKTH ..:.. . ...:. : . :.. .:: . : .:: ...:. . . CCDS12 ASEKGSYEIIQDTDEDT------AVNNWLISPQNASRAWGESTPLANKPGKQSGHPKFPR 950 960 970 980 990 1000 1040 1050 1060 1070 1080 1090 pF1KE2 IDGPSLLIENSPS---VWQNILESDTEFKKVTPLIHDRMLMDKNATALRLNHMSNKTTSS . :: .... . . .. . :. :: : : .. :: . ... . CCDS12 VRHKSLQVRQDGGKSRLKKSQFLIKTRKKKKEKHTHHAPLSPRTFHPLRSEAYNTFSERR 1010 1020 1030 1040 1050 1060 1100 1110 1120 1130 1140 pF1KE2 KNMEMVQQKK-EGPIPPDAQN--PDMSFFKMLFLPESARWIQRTHGKNSLN-SGQGPSPK . .: .:. : .: : .. :.:.: . ::. :..:: : .::. : CCDS12 LKHSLVLHKSNETSLPTDLNQTLPSMDFGWIASLPD--------HNQNSSNDTGQASCPP 1070 1080 1090 1100 1110 1150 1160 1170 1180 1190 1200 pF1KE2 QLV-SLGPEKSVEGQNF-LSEKNKV--VVGKGEFTKDVGLKEMV-FPSSRNLFLTNLDNL : .. ::. :.: ... ... . .. ... :.::. . :.. : :..... CCDS12 GLYQTVPPEEHY--QTFPIQDPDQMHSTSDPSHRSSSPELSEMLEYDRSHKSFPTDISQM 1120 1130 1140 1150 1160 1170 1210 1220 1230 1240 1250 pF1KE2 HENNTHNQEKKI----QEEIEKKETLIQENVVLPQIHTVTGTKNFMKNLFLLSTRQNVEG .. :. . . .. . : : :. ::. . . ...:: CCDS12 SPSSEHEVWQTVISPDLSQVTLSPELSQTNLSPDLSHTTLSPELIQRNL----------- 1180 1190 1200 1210 1220 1260 1270 1280 1290 1300 1310 pF1KE2 SYDGAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRIS : . :. :. . : . . ::. :. . .: : .: CCDS12 SPALGQMPISPDLSHTTLSPDLS--HTT-------------LSLDLSQ--------TNLS 1230 1240 1250 1320 1330 1340 1350 1360 1370 pF1KE2 PNTSQQNFVTQRSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPST-LTQIDY :. :: :. :: : .:: . . .: ..:. : ...:.: : :.: . CCDS12 PELSQTNLSP-----ALGQ--MPLSPDLSHTTLSLDFSQTNLSPELSHMTLSPELSQTNL 1260 1270 1280 1290 1300 1310 1380 1390 1400 1410 1420 1430 pF1KE2 NEKEKGAITQSPLSDCLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLP . :. : :.: : ::. . : ..... : . :. .: : : : CCDS12 SP----ALGQMPISPDL--SHTTLS-----LDFSQTNLSPELSQTNLSPALGQMPLSPDP 1320 1330 1340 1350 1360 1440 1450 1460 1470 1480 1490 pF1KE2 AASYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKVEN . . . : ...::: . ... : :. .. . .: ... CCDS12 SHTTLSLD------------LSQTNLSPELSQTNLSPDLSEMPLFADLSQIPLT-PDLDQ 1370 1380 1390 1400 1500 1510 1520 1530 1540 1550 pF1KE2 TVLPKPDLPKTSGKVELLPKVHIYQKDLFPTETS-NGSPGHLDLVEGSLLQGTEGAIKWN .: .::: :...: : .. : .: : .. . :: :. . .:: . CCDS12 MTL-SPDL----GETDLSP--NFGQMSLSPDLSQVTLSP---DISDTTLLPDL------S 1410 1420 1430 1440 1450 1560 1570 1580 1590 1600 1610 pF1KE2 EANRPGKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKD . . : . . .::: : ::. ... ..: . .: :: . .. .: CCDS12 QISPPPDLDQIFYPSESS---QSLLLQ------EFNESFPYPDL-GQMPSPSSPTL--ND 1460 1470 1480 1490 1500 1620 1630 1640 1650 1660 1670 pF1KE2 TILSLNACESNHAIAAINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQ :.:: : : : . : .:.: :. . . : ..:. . . CCDS12 TFLS---KEFN------------PLVIVGLSKDG-TDYI--EIIP-----KEEVQSS--E 1510 1520 1530 1680 1690 1700 1710 1720 1730 pF1KE2 SDQEEIDY---DDTISVEMKKEDFDIYDEDENQSP--RSFQKKTRHYFIAAVERLWDYGM .: :::: :: ..... . . : :. . :: . . :.:.::: : ::: CCDS12 DDYAEIDYVPYDDPYKTDVRTNINSSRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDY-- 1540 1550 1560 1570 1580 1590 1740 1750 1760 1770 1780 pF1KE2 SSSPHVLRNR--AQSGSVPQ---FKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAE : : :. .: ..:. .:::::... :..::. ::: .::::.::: :::: CCDS12 --SEFVQRETDIEDSDDIPEDTTYKKVVFRKYLDSTFTKRDPRGEYEEHLGILGPIIRAE 1600 1610 1620 1630 1640 1650 1790 1800 1810 1820 1830 pF1KE2 VEDNIMVTFRNQASRPYSFYSSLISYE--------EDQRQGAEPRKNFVKPNETKTYFWK :.: :.: :.: ::::::... .::: ::. . : :.:: . :: :. CCDS12 VDDVIQVRFKNLASRPYSLHAHGLSYEKSSEGKTYEDDSPEWFKEDNAVQPNSSYTYVWH 1660 1670 1680 1690 1700 1710 1840 1850 1860 1870 1880 1890 pF1KE2 VQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFAL . .. .: . :.::::.: :. :::.:::::::::.:. . :. . . ..::.: CCDS12 ATERSGPESPGSACRAWAYYSAVNPEKDIHSGLIGPLLICQKGILHKDSNMPMDMREFVL 1720 1730 1740 1750 1760 1770 1900 1910 1920 1930 1940 1950 pF1KE2 FFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQ .: ::: ::::. :.. :. . .. . .:....::::::.:. .:::: : ... CCDS12 LFMTFDEKKSWYY----EKKSRS--SWRLTSSEMKKSHEFHAINGMIY-SLPGLKMYEQE 1780 1790 1800 1810 1820 1960 1970 1980 1990 2000 2010 pF1KE2 RIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRV .: .::..:....:: .:: :... ......... : :: :.:.:: :: : : . CCDS12 WVRLHLLNIGGSQDIHVVHFHGQTLLENGNKQHQLGVWPLLPGSFKTLEMKASKPGWWLL 1830 1840 1850 1860 1870 1880 2020 2030 2040 2050 2060 2070 pF1KE2 ECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGS . .::. .:::.: ::... :. :.:...: : : :: :: : : :.::::. .:: CCDS12 NTEVGENQRAGMQTPFLIMDRDCRMPMGLSTGIISDSQIKASEFLGYWEPRLARLNNGGS 1890 1900 1910 1920 1930 1940 2080 2090 2100 2110 2120 2130 pF1KE2 INAWSTKE---PFS---WIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKW ::::... :. ::.::. .:: ::.::::.. ..: : ..: . :: . .: CCDS12 YNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQTQGAKHYLKSCYTTEFYVAYSSNQINW 1950 1960 1970 1980 1990 2000 2140 2150 2160 2170 2180 2190 pF1KE2 QTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLN : ..:::: ..: : :: :.: ::.: :.:::.:::::. ::. : :::.::.::..: CCDS12 QIFKGNSTRNVMYFNGNSDASTIKENQFDPPIVARYIRISPTRAYNRPTLRLELQGCEVN 2010 2020 2030 2040 2050 2060 2200 2210 2220 2230 2240 2250 pF1KE2 SCSMPLGMESKAISDAQITASSYFTNMFAT-WSPSKARLHLQGRSNAWRPQVNNPKEWLQ .:: :::::. : . ::::::. . .. : : .:::. ::: :::. ..:: :.::. CCDS12 GCSTPLGMENGKIENKQITASSFKKSWWGDYWEPFRARLNAQGRVNAWQAKANNNKQWLE 2070 2080 2090 2100 2110 2120 2260 2270 2280 2290 2300 pF1KE2 VDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF-FQNGKV-KVFQGNQDS .:. : :.:.. ::: ::: . :::: . : :..: .: . .... : :.:.:: .. CCDS12 IDLLKIKKITAIITQGCKSLSSEMYVKSYTIHYSEQGVEWKPYRLKSSMVDKIFEGNTNT 2130 2140 2150 2160 2170 2180 2310 2320 2330 2340 2350 pF1KE2 FTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY : : ..::...:..:. :..: ..::::.:..::. CCDS12 KGHVKNFFNPPIISRFIRVIPKTWNQSIALRLELFGCDIY 2190 2200 2210 2220 >>CCDS44026.1 F8 gene_id:2157|Hs108|chrX (216 aa) initn: 1414 init1: 1414 opt: 1414 Z-score: 1551.1 bits: 297.5 E(32554): 4.5e-80 Smith-Waterman score: 1414; 100.0% identity (100.0% similar) in 208 aa overlap (2144-2351:9-216) 2120 2130 2140 2150 2160 2170 pF1KE2 SLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPT :::::::::::::::::::::::::::::: CCDS44 MRIQDPGKVFFGNVDSSGIKHNIFNPPIIARYIRLHPT 10 20 30 2180 2190 2200 2210 2220 2230 pF1KE2 HYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQG 40 50 60 70 80 90 2240 2250 2260 2270 2280 2290 pF1KE2 RSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF 100 110 120 130 140 150 2300 2310 2320 2330 2340 2350 pF1KE2 FQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY 160 170 180 190 200 210 >>CCDS64195.1 EDIL3 gene_id:10085|Hs108|chr5 (470 aa) initn: 769 init1: 399 opt: 884 Z-score: 965.3 bits: 190.3 E(32554): 1.9e-47 Smith-Waterman score: 884; 44.9% identity (67.4% similar) in 325 aa overlap (2039-2349:147-470) 2010 2020 2030 2040 2050 2060 pF1KE2 PSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQ----YG- ::. :::. .: : . :::::. .: CCDS64 PCKNGGICTDLVANYSCECPGEFMGRNCQYKCSGPLGIEGGIISNQQITASSTHRALFGL 120 130 140 150 160 170 2070 2080 2090 2100 2110 2120 pF1KE2 -QWAPKLARLHYSGSINAWSTKEP--FSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQF .: : :::. .: ::::.. : . ::...: : . :. ::::.. : ::... CCDS64 QKWYPYYARLNKKGLINAWTAAENDRWPWIQINLQRKMRVTGVITQGAKRIGSPEYIKSY 180 190 200 210 220 230 2130 2140 2150 2160 2170 2180 pF1KE2 IIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRST : :: ::: : :. ..:. ::: ::.:.. : :.::: :.:.::.: . : CCDS64 KIAYSNDGKTWAMYKVKGTNEDMVFRGNIDNNTPYANSFTPPIKAQYVRLYPQVCRRHCT 240 250 260 270 280 290 2190 2200 2210 2220 2230 pF1KE2 LRMELMGCDLNSCSMPLGMESKAISDAQITASSYFT----NMFATWSPSKARLHLQGRSN :::::.::.:..:: ::::.: :.: :::::: : .:: :: : :::: ::. : CCDS64 LRMELLGCELSGCSEPLGMKSGHIQDYQITASSIFRTLNMDMF-TWEPRKARLDKQGKVN 300 310 320 330 340 350 2240 2250 2260 2270 2280 2290 pF1KE2 AWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF--F :: :. ..:::::. ::::. :::.:.. ..: . .. :.::..::.. CCDS64 AWTSGHNDQSQWLQVDLLVPTKVTGIITQGAKDFGHVQFVGSYKLAYSNDGEHWTVYQDE 360 370 380 390 400 410 2300 2310 2320 2330 2340 2350 pF1KE2 QNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY .. : :::::: :. : : .:::. .:..:: : :: .:.:: :.::: .. CCDS64 KQRKDKVFQGNFDNDTHRKNVIDPPIYARHIRILPWSWYGRITLRSELLGCTEEE 420 430 440 450 460 470 >>CCDS4062.1 EDIL3 gene_id:10085|Hs108|chr5 (480 aa) initn: 769 init1: 399 opt: 884 Z-score: 965.1 bits: 190.3 E(32554): 1.9e-47 Smith-Waterman score: 884; 44.9% identity (67.4% similar) in 325 aa overlap (2039-2349:157-480) 2010 2020 2030 2040 2050 2060 pF1KE2 PSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQ----YG- ::. :::. .: : . :::::. .: CCDS40 PCKNGGICTDLVANYSCECPGEFMGRNCQYKCSGPLGIEGGIISNQQITASSTHRALFGL 130 140 150 160 170 180 2070 2080 2090 2100 2110 2120 pF1KE2 -QWAPKLARLHYSGSINAWSTKEP--FSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQF .: : :::. .: ::::.. : . ::...: : . :. ::::.. : ::... CCDS40 QKWYPYYARLNKKGLINAWTAAENDRWPWIQINLQRKMRVTGVITQGAKRIGSPEYIKSY 190 200 210 220 230 240 2130 2140 2150 2160 2170 2180 pF1KE2 IIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRST : :: ::: : :. ..:. ::: ::.:.. : :.::: :.:.::.: . : CCDS40 KIAYSNDGKTWAMYKVKGTNEDMVFRGNIDNNTPYANSFTPPIKAQYVRLYPQVCRRHCT 250 260 270 280 290 300 2190 2200 2210 2220 2230 pF1KE2 LRMELMGCDLNSCSMPLGMESKAISDAQITASSYFT----NMFATWSPSKARLHLQGRSN :::::.::.:..:: ::::.: :.: :::::: : .:: :: : :::: ::. : CCDS40 LRMELLGCELSGCSEPLGMKSGHIQDYQITASSIFRTLNMDMF-TWEPRKARLDKQGKVN 310 320 330 340 350 360 2240 2250 2260 2270 2280 2290 pF1KE2 AWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF--F :: :. ..:::::. ::::. :::.:.. ..: . .. :.::..::.. CCDS40 AWTSGHNDQSQWLQVDLLVPTKVTGIITQGAKDFGHVQFVGSYKLAYSNDGEHWTVYQDE 370 380 390 400 410 420 2300 2310 2320 2330 2340 2350 pF1KE2 QNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY .. : :::::: :. : : .:::. .:..:: : :: .:.:: :.::: .. CCDS40 KQRKDKVFQGNFDNDTHRKNVIDPPIYARHIRILPWSWYGRITLRSELLGCTEEE 430 440 450 460 470 480 >>CCDS3141.1 CP gene_id:1356|Hs108|chr3 (1065 aa) initn: 1433 init1: 469 opt: 819 Z-score: 887.8 bits: 177.1 E(32554): 3.9e-43 Smith-Waterman score: 1471; 34.1% identity (60.8% similar) in 766 aa overlap (5-736:6-724) 10 20 30 40 50 pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGE---LPVDARFPPRVPKS :. .::: .. ..::.: .: .::: :: :: . ::.. .. CCDS31 MKILILGIFLFLCSTP-AWAKEKHYYIGIIETTWDYA-SDHGEKKLISVDTEHSNIYLQN 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 FPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVS : . .:::.:....::. : . .: :.:.::: :.::. : : . :::.::.: . CCDS31 GPDRIGRLYKKALYLQYTDETFRTTIEKPVWLGFLGPIIKAETGDKVYVHLKNLASRPYT 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 LHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYS .:. :..:.: ::: : :.:.. .. ::::.:: ..::. . .:..: .: :.: CCDS31 FHSHGITYYKEHEGAIYPDNTTDFQRADDKVYPGEQYTYMLLATEEQSPGEGDGNCVTRI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 YLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHK-FILLFAVFDEGKSWHSETKNSL : ::.: ::. ::::: :..:.. :: ::: . . . :...:.: ::. ::. : . . CCDS31 YHSHIDAPKDIASGLIGPLIICKKDSLDKEKEKHIDREFVVMFSVVDENFSWYLEDNIKT 180 190 200 210 220 230 240 250 260 270 280 pF1KE2 MQ------DRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIF . :.: . . .:..::::. ::::: : . : :...:::. .::. : CCDS31 YCSEPEKVDKDNEDFQESNRMYSVNGYTFGSLPGLSMCAEDRVKWYLFGMGNEVDVHAAF 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 LEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCP ..:... .:.: .... : :.. : . .. :...: :. .: . :..:. .:. : CCDS31 FHGQALTNKNYRIDTINLFPATLFDAYMVAQNPGEWMLSCQNLNHLKAGLQAFFQVQEC- 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 EEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEE :. ..: .::. .: .:::::: CCDS31 --------NKSSSKD------------------------NIRGKHVRH-----YYIAAEE 360 370 380 410 420 430 440 450 460 pF1KE2 EDWDYAPL---------VLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREA :.::: . :: . : . ....: ::: .:::. . ::: .: .:. CCDS31 IIWNYAPSGIDIFTKENLTAPGSDS--AVFFEQGTTRIGGSYKKLVYREYTDASFTNRKE 390 400 410 420 430 470 480 490 500 pF1KE2 IQHES---GILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGI--------TDVRPLY--- : :::::....:::::. . :.:... : .: : :. : : : CCDS31 RGPEEEHLGILGPVIWAEVGDTIRVTFHNKGAYPLSIEPIGVRFNKNNEGTYYSPNYNPQ 440 450 460 470 480 490 510 520 530 540 550 560 pF1KE2 SRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGL :: .: ...: . : : : :.::: : :::..:: ::...: : :. .:. .:: CCDS31 SRSVPPSASH-----VAPTETFTYEWTVPKEVGPTNADPVCLAKMYYSAVEPTKDIFTGL 500 510 520 530 540 550 570 580 590 600 610 620 pF1KE2 IGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPE :::. :: : :. : : ::. .. .:::::.: : .::. : : :. :: . CCDS31 IGPMKICKKGSLHANGRQKDVDKEFYLFPTVFDENESLLLEDNIRMFTTAPDQVDKEDED 560 570 580 590 600 610 630 640 650 660 670 680 pF1KE2 FQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYED :: :: :::.::... . :..: . . ::..: : ..: ...::: :. . .: CCDS31 FQESNKMHSMNGFMYGNQPGLTMCKGDSVVWYLFSAGNEADVHGIYFSGNTYLWRGERRD 620 630 640 650 660 670 690 700 710 720 730 740 pF1KE2 TLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDI : .::: .. :. : .. : . . : ..: . :: :..: ... : CCDS31 TANLFPQTSLTLHMWPDTEGTFNVECLTTDHYTGGMKQKYTVNQCRRQSEDSTFYLGERT 680 690 700 710 720 730 750 760 770 780 790 800 pF1KE2 SAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQNVS CCDS31 YYIAAVEVEWDYSPQREWEKELHHLQEQNVSNAFLDKGEFYIGSKYKKVVYRQYTDSTFR 740 750 760 770 780 790 >-- initn: 917 init1: 447 opt: 820 Z-score: 888.9 bits: 177.3 E(32554): 3.4e-43 Smith-Waterman score: 820; 36.0% identity (66.3% similar) in 344 aa overlap (1709-2039:726-1060) 1680 1690 1700 1710 1720 1730 pF1KE2 EEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYG----MSSSP .: : :.::::: :::. . CCDS31 NVECLTTDHYTGGMKQKYTVNQCRRQSEDSTFYLGERTYYIAAVEVEWDYSPQREWEKEL 700 710 720 730 740 750 1740 1750 1760 1770 1780 pF1KE2 HVLRNRAQSGSV---------PQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAE : :... :.. ..::::....::..: :. : .::::.::: ..:. CCDS31 HHLQEQNVSNAFLDKGEFYIGSKYKKVVYRQYTDSTFRVPVERKAEEEHLGILGPQLHAD 760 770 780 790 800 810 1790 1800 1810 1820 1830 1840 pF1KE2 VEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPT : :.. . :.:.:.::::... .. : . . : . :.:: :: ::. .. . CCDS31 VGDKVKIIFKNMATRPYSIHAHGVQTESST---VTP----TLPGETLTYVWKIPERSGAG 820 830 840 850 860 1850 1860 1870 1880 1890 1900 pF1KE2 KDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDET .. : :::.: :: ::..:::::::.::. :. . :. ::::.: .:::. CCDS31 TEDSACIPWAYYSTVDQVKDLYSGLIGPLIVCRRPYLKVFNPRRKL--EFALLFLVFDEN 870 880 890 900 910 920 1910 1920 1930 1940 1950 1960 pF1KE2 KSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLS .:::. .:.. : ... .: : :. ..::::: .. .: ::.: ... :::.. CCDS31 ESWYLDDNIKTYSDHPEKVNKDDEEFIESNKMHAINGRMFGNLQGLTMHVGDEVNWYLMG 930 940 950 960 970 980 1970 1980 1990 2000 2010 2020 pF1KE2 MGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHL ::.. ..:..:: :: : ... :. .....::...:.::.: ::: ..: . .:. CCDS31 MGNEIDLHTVHFHGHSFQYKHRGVYSSDVFDIFPGTYQTLEMFPRTPGIWLLHCHVTDHI 990 1000 1010 1020 1030 1040 2030 2040 2050 2060 2070 2080 pF1KE2 HAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKE :::: : . : .:. CCDS31 HAGMETTYTVLQNEDTKSG 1050 1060 >>CCDS44710.1 HEPHL1 gene_id:341208|Hs108|chr11 (1159 aa) initn: 1750 init1: 600 opt: 813 Z-score: 880.6 bits: 175.9 E(32554): 9.9e-43 Smith-Waterman score: 1611; 34.6% identity (62.5% similar) in 847 aa overlap (10-824:15-810) 10 20 30 40 50 pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPK :: : . ..:: ::.: :: :.:. . . . . .. CCDS44 MPRKQPAGCIFLLTFLGLSGLVGTVTRTYYIGIVEEYWNYVPQGKNVITGKSFTEDKLAT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 SF----PFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMA : : . .:::... .::: ..: :.:::.:.::: ..::: :..:: :::.: CCDS44 LFLERGPNRIGSIYKKAVYRRFTDGTYSIEIPKPPWLGFLGPILRAEVGDVIVIHLKNFA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 SHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPL :.: ::: :: : : :::: : : :: :.:.:: : :: ..:::: : .: .: .: CCDS44 SRPYSLHPHGVFYNKDSEGALYPDGTSGRNKNDDMVPPGKNYTYVWPVREEYAPTPADAN 130 140 150 160 170 180 180 190 200 210 220 pF1KE2 CLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAK---EKTQTLHKFILLFAVFDEGKSW- :::. : ::.: ::. ::::: ::::.:: : . .... ..:...:.. ::..:: CCDS44 CLTWVYHSHIDAPKDICSGLIGPLLVCKEGILNRYSGTRNDVDREFVIMFTLVDENQSWY 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE2 ------HSETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGT : :. . .. .::. :. :::..:::. ..: : .:: ::..:::. CCDS44 LNENIKHFCTNPDSVDKKDAVFQRS-NKMHALNGYLFGNFPEPDMCVGESVSWHLFGMGN 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 TPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEA ..:::.. :.::. :.:: ... : ::::.. . . :.... :..:.: . :: . CCDS44 EIDIHSIYFYGNTFISRGHRTDVVNLFPATFLTTEMIAENPGKWMITCQVSDHLQAGMLG 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 YVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTW .::.: . :. . .... ... CCDS44 QYNVDNC------------------------KSDIF---------YPKMKGQQRRY---- 360 370 380 410 420 430 440 450 pF1KE2 VHYIAAEEEDWDYAP-----LVLAPDDRSYKSQ--YLNNGPQRIGRKYKKVRFMAYTDET .::::. ::::: . : . : ... :...: .::: :: :::. ..: : CCDS44 --FIAAEKILWDYAPQGYNKFSGLPLNASGSDSDLYFTQGDNRIGGKYWKVRYTEFVDAT 390 400 410 420 430 440 460 470 480 490 500 pF1KE2 FKTREAIQHES---GILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGI-----TDVRPLY : :. .. : :::::.. .:::::::. : :.:.. :.: :::. .:. : CCDS44 FTKRKRLSAEEAHLGILGPVIKAEVGDTLLVTFANKADKVYSILPHGVIYDKASDAAPNL 450 460 470 480 490 500 510 520 530 540 550 560 pF1KE2 SRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGL . . :. :.: ::: : ::::: .:: .:: ::: : : :. .: .::: CCDS44 DGFVKPGA-HVK-----PGETFTYKWTVPESVSPTAGDPPCLTYLYFSAVDPIKDTSSGL 510 520 530 540 550 570 580 590 600 610 620 pF1KE2 IGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPE .::::.: : .. :.: ::. .::.::::: : :. ::::.:. .: ... :: : CCDS44 VGPLLVCKKGVLNADGTQKGIDKEFYLLFTVFDENLSRYFDENIQKFIWHPFSIDKEDKE 560 570 580 590 600 610 630 640 650 660 670 680 pF1KE2 FQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYED : :: ::..:::.. . :..: .. . :.....:..::. .. :.: :.. . ...: CCDS44 FVKSNRMHAVNGYMYGNQPGLNMCKRDRVSWHLIGLGTDTDMHGIVFQGNTIHLRGTHRD 620 630 640 650 660 670 690 700 710 720 730 740 pF1KE2 TLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDI .:.::: . :.::. .. :.. . : . .::: . .:::::. : :. : : CCDS44 SLALFPHMATTAFMQPDHAGIFRVFCATMPHLSRGMGQIYEVSSCDNR--DPSEQRYGMI 680 690 700 710 720 730 750 760 770 780 790 800 pF1KE2 SAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDI--EKTDPWFAHRTPMPKIQN .. .. .. .: ... : .. .... .: ..:: ..:. :.. . .. CCDS44 RTFYIAAEE-VE-WDYAPN-KNWEFEKQHVDARGERHGDIFMNRTENWIGSQYKKVVYRE 740 750 760 770 780 810 820 830 840 850 860 pF1KE2 VSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPSPGAIDSNNSLSEMTHFRPQLHHS ...... . . : . : : CCDS44 YTDGEFVEIKARPPREEHLELLGPMIHAEVGNTVLIIFKNKASRPYSISAQGVEEMDSGK 790 800 810 820 830 840 >-- initn: 769 init1: 600 opt: 710 Z-score: 767.9 bits: 155.0 E(32554): 1.9e-36 Smith-Waterman score: 710; 38.4% identity (74.1% similar) in 263 aa overlap (1778-2038:811-1068) 1750 1760 1770 1780 1790 1800 pF1KE2 QFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSS :::.:.::: ..... :.:.::::::. .. CCDS44 QYKKVVYREYTDGEFVEIKARPPREEHLELLGPMIHAEVGNTVLIIFKNKASRPYSISAQ 790 800 810 820 830 840 1810 1820 1830 1840 1850 1860 pF1KE2 LISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVH . :.. .: . . ..::.:.::: :.. .. .: .. .: :.:.: :.. ::.. CCDS44 GV---EEMDSGKQFQVPMTKPGEVKTYRWNIPKRSGPGPSDPNCIPWVYYSTVNFVKDTY 850 860 870 880 890 1870 1880 1890 1900 1910 1920 pF1KE2 SGLIGPLLVCHTNTLNPAHGRQVTVQ-EFALFFTIFDETKSWYFTENMERNC-RAPCNIQ :::.:::..:. ..:: .::. :. ::::.: .:.:..:::. .:... . : ... CCDS44 SGLMGPLITCRKGVLNE-KGRRSDVDYEFALLFLVFNENESWYLDDNIKKYLNKDPRDFK 900 910 920 930 940 950 1930 1940 1950 1960 1970 1980 pF1KE2 MEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVR : :.:. :.::::: :. .: ::.: .: ::::..::. .::.::. .. : . CCDS44 RTDD-FEESNRMHAINGKIFGNLHGLIMNEDTMTNWYLLGIGSEVDIHTIHYHAESFLFK 960 970 980 990 1000 1010 1990 2000 2010 2020 2030 2040 pF1KE2 KKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLG . :. .:.:.::.:.:.:.. .. : : ..: ...:.:::: : . : : CCDS44 IDKSYREDVYDLFPGTFQTIELFADHPGTWLLHCHVSDHIHAGMETTYTVLRNIDNRIPY 1020 1030 1040 1050 1060 1070 2050 2060 2070 2080 2090 2100 pF1KE2 MASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKT CCDS44 STTSPGVASHPATVPSNERPGKEQLYFFGKNLGPTGAKAALVILFIIGLLLLITTVILSL 1080 1090 1100 1110 1120 1130 >>CCDS14385.1 HEPH gene_id:9843|Hs108|chrX (891 aa) initn: 1409 init1: 390 opt: 637 Z-score: 690.1 bits: 140.3 E(32554): 4.1e-32 Smith-Waterman score: 1339; 34.0% identity (59.1% similar) in 745 aa overlap (22-729:113-797) 10 20 30 40 pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDY--MQSDLGELPVDARF :.:.. : :..::: : : : . : CCDS14 NSHFRDGMQALYKVKSCSMAPPVDLLTGKVRQYFIEAHEIQWDYGPMGHD-GSTGKNLRE 90 100 110 120 130 140 50 60 70 80 90 100 pF1KE2 PPRVP-KSFPFNTSVV---YKKTLFVEFTDHLFN--IAKPRPPWMGLLGPTIQAEVYDTV : . : : ..: . : :. . : :. :. . . .:.:::.:.::: ::. CCDS14 PGSISDKFFQKSSSRIGGTYWKVRYEAFQDETFQEKMHLEEDRHLGILGPVIRAEVGDTI 150 160 170 180 190 200 110 120 130 140 150 160 pF1KE2 VITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQR---EKEDDKVFPGGSHTYVWQVL ... : ::.: :.. :: : : ::. :.: .: : .:: :: : : CCDS14 QVVFYNRASQPFSMQPHGVFYEKDYEGTVYNDGSSYPGLVAKPFEKV------TYRWTVP 210 220 230 240 250 170 180 190 200 210 pF1KE2 KENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQ--TLHKFILLF . :: :.:: :::. :.: .: ..: ::::.: ::::: :.:. . : . ..:.::: CCDS14 PHAGPTAQDPACLTWMYFSAADPIRDTNSGLVGPLLVCRAGALGADGKQKGVDKEFFLLF 260 270 280 290 300 310 220 230 240 250 260 270 pF1KE2 AVFDEGKSWHSET-KNSLMQD-----RDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSV .:.::.:::.:.. . . : : .: . . .::..::.. .:: : :. .: CCDS14 TVLDENKSWYSNANQAAAMLDFRLLSEDIEGFQDSNRMHAINGFLFSNLPRLDMCKGDTV 320 330 340 350 360 370 280 290 300 310 320 330 pF1KE2 YWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHIS ::..:.:: .::.....:.: ... :... . : ::. : .:: : ..:. . CCDS14 AWHLLGLGTETDVHGVMFQGNTVQLQGMRKGAAMLFPHTFVMAIMQPDNLGTFEIYCQAG 380 390 400 410 420 430 340 350 360 370 380 390 pF1KE2 SHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRS ::.. ::.: .:..:: ...: .: CCDS14 SHREAGMRAIYNVSQCP---------GHQA---------------------TPR------ 440 450 400 410 420 430 440 pF1KE2 VAKKHPKTWVHYIAAEEEDWDYAPLVL-------APDDRSYKSQYLNNGPQRIGRKYKKV ... . ..:: ::: .::: : . :: .:.: .: .:::. CCDS14 --QRYQAARIYYIMAEEVEWDYCPDRSWEREWHNQSEKDSYGYIFLSNKDGLLGSRYKKA 460 470 480 490 500 510 450 460 470 480 490 pF1KE2 RFMAYTDETFKT---REAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGI--- : ::: ::. : . ... ::::::. ::::: : ..:::.:::::... ::. CCDS14 VFREYTDGTFRIPRPRTGPEEHLGILGPLIKGEVGDILTVVFKNNASRPYSVHAHGVLES 520 530 540 550 560 570 500 510 520 530 540 550 pF1KE2 TDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNME : : :: .. :::. :.:.. ..:: .: :.. : : :. CCDS14 TTVWPLAAE---------------PGEVVTYQWNIPERSGPGPNDSACVSWIYYSAVDPI 580 590 600 610 620 560 570 580 590 600 610 pF1KE2 RDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRF-LPNPA .:. :::.::: :: : .. .:.. :.. ..:: .::::.:::: ::. .:. CCDS14 KDMYSGLVGPLAICQKGILEPHGGRSDMDREFALLFLIFDENKSWYLEENVATHGSQDPG 630 640 650 660 670 680 620 630 640 650 660 670 pF1KE2 GVQLEDPEFQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTF ...:.: : :: ::.::: .. .:. :.. : . ::.:..: ..:. .. : . .: CCDS14 SINLQDETFLESNKMHAINGKLYANLRGLTMYQGERVAWYMLAMGQDVDLHTIHFHAESF 690 700 710 720 730 740 680 690 700 710 720 730 pF1KE2 KHKM---VYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNT .. :.. ::: . :.: : ::: :.. :: .: . :: .:. : : CCDS14 LYRNGENYRADVVDLFPGTFEVVEMVASNPGTWLMHCHVTDHVHAGMETLFTVFSRTEHL 750 760 770 780 790 800 740 750 760 770 780 790 pF1KE2 GDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDIEKTDPWFAH CCDS14 SPLTVITKETEKAVPPRDIEEGNVKMLGMQIPIKNVEMLASVLVAISVTLLLVVLALGGV 810 820 830 840 850 860 >>CCDS65277.1 HEPH gene_id:9843|Hs108|chrX (969 aa) initn: 1628 init1: 455 opt: 555 Z-score: 599.8 bits: 123.7 E(32554): 4.4e-27 Smith-Waterman score: 1353; 31.2% identity (54.4% similar) in 861 aa overlap (20-729:27-875) 10 20 30 40 pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSD---LGELPVDARF- ::: :::: ...:.: . . . :.:. . CCDS65 MWAMESGHLLWALLFMQSLWPQLTDGATRVYYLGIRDVQWNYAPKGRNVITNQPLDSDIV 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 PPRVPKSFPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKN :: . .::::.. :. : .. .: :.:.:::..:::: :...: ::: CCDS65 ASSFLKSDKNRIGGTYKKTIYKEYKDDSYTDEVAQPAWLGFLGPVLQAEVGDVILIHLKN 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 MASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASD .:..: ..: :: : : :::. : : .: : ::.: ::::: : : . . ..: .: CCDS65 FATRPYTIHPHGVFYEKDSEGSLYPDGSSGPLKADDSVPPGGSHIYNWTIPEGHAPTDAD 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE2 PLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSL----AKEKTQTLHKFILLFAVFDEGK : :::. : :::: .:. .:::: :..:..:.: .. .. : :.:::.: ::. CCDS65 PACLTWIYHSHVDAPRDIATGLIGPLITCKRGALDGNSPPQRQDVDHDFFLLFSVVDENL 190 200 210 220 230 240 230 240 250 260 270 pF1KE2 SWH------SETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGM ::: . .. :.. . . .::..::.: .:: : : .: : ::..:: CCDS65 SWHLNENIATYCSDPASVDKEDETFQESNRMHAINGFVFGNLPELNMCAQKRVAWHLFGM 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE2 GTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGM :. .::. :..:. . .:.:. .: : ::.::. . . : .:. :...:: .::: CCDS65 GNEIDVHTAFFHGQMLTTRGHHTDVANIFPATFVTAEMVPWEPGTWLISCQVNSHFRDGM 310 320 330 340 350 360 340 350 360 pF1KE2 EAYVKVDSCPEEPQLRM-----------------------------KNNEEA-------- .: :: :: : . . :: .: CCDS65 QALYKVKSCSMAPPVDLLTGKVRQYFIEAHEIQWDYGPMGHDGSTGKNLREPGSISDKFF 370 380 390 400 410 420 370 380 pF1KE2 ----------------EDYDDDLTDSEM-----------------------DVVRFDDDN : ..:. . .: .:: .. . CCDS65 QKSSSRIGGTYWKVRYEAFQDETFQEKMHLEEDRHLGILGPVIRAEVGDTIQVVFYNRAS 430 440 450 460 470 480 390 pF1KE2 SPSFIQIRSV---------------------AKKH--------------------PK--- .: .: ..: : .: :. CCDS65 QPFSMQPHGVFYEKDYEGTVYNDGTFEIYCQAGSHREAGMRAIYNVSQCPGHQATPRQRY 490 500 510 520 530 540 400 410 420 430 440 450 pF1KE2 --TWVHYIAAEEEDWDYAPLVL-------APDDRSYKSQYLNNGPQRIGRKYKKVRFMAY . ..:: ::: .::: : . :: .:.: .: .:::. : : CCDS65 QAARIYYIMAEEVEWDYCPDRSWEREWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREY 550 560 570 580 590 600 460 470 480 490 500 pF1KE2 TDETFKT---REAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYS :: ::. : . ... ::::::. ::::: : ..:::.:::::... ::. . .. CCDS65 TDGTFRIPRPRTGPEEHLGILGPLIKGEVGDILTVVFKNNASRPYSVHAHGVLESTTVW- 610 620 630 640 650 510 520 530 540 550 560 pF1KE2 RRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLI : ... :::. :.:.. ..:: .: :.. : : :. .:. :::. CCDS65 ---PLAAE--------PGEVVTYQWNIPERSGPGPNDSACVSWIYYSAVDPIKDMYSGLV 660 670 680 690 700 570 580 590 600 610 620 pF1KE2 GPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRF-LPNPAGVQLEDPE ::: :: : .. .:.. :.. ..:: .::::.:::: ::. .:....:.: CCDS65 GPLAICQKGILEPHGGRSDMDREFALLFLIFDENKSWYLEENVATHGSQDPGSINLQDET 710 720 730 740 750 760 630 640 650 660 670 680 pF1KE2 FQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKM---V : :: ::.::: .. .:. :.. : . ::.:..: ..:. .. : . .: .. CCDS65 FLESNKMHAINGKLYANLRGLTMYQGERVAWYMLAMGQDVDLHTIHFHAESFLYRNGENY 770 780 790 800 810 820 690 700 710 720 730 740 pF1KE2 YEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSY :.. ::: . :.: : ::: :.. :: .: . :: .:. : : CCDS65 RADVVDLFPGTFEVVEMVASNPGTWLMHCHVTDHVHAGMETLFTVFSRTEHLSPLTVITK 830 840 850 860 870 880 750 760 770 780 790 800 pF1KE2 EDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQ CCDS65 ETEKAVPPRDIEEGNVKMLGMQIPIKNVEMLASVLVAISVTLLLVVLALGGVVWYQHRQR 890 900 910 920 930 940 >>CCDS48133.1 HEPH gene_id:9843|Hs108|chrX (1160 aa) initn: 1758 init1: 455 opt: 555 Z-score: 598.4 bits: 123.7 E(32554): 5.2e-27 Smith-Waterman score: 868; 39.2% identity (66.5% similar) in 355 aa overlap (1706-2044:727-1075) 1680 1690 1700 1710 1720 1730 pF1KE2 SDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSP- .::. . .: :.: : : ::: . : CCDS48 TFEIYCQAGSHREAGMRAIYNVSQCPGHQATPRQRYQAARIYYIMAEEVEWDYCPDRSWE 700 710 720 730 740 750 1740 1750 1760 1770 1780 pF1KE2 ---HVLRNRAQSGSV----------PQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPY : .. . : . ..::.::.:.:::.: : : .::::.::: CCDS48 REWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGTFRIPRPRTGPEEHLGILGPL 760 770 780 790 800 810 1790 1800 1810 1820 1830 1840 pF1KE2 IRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHH :..:: : . :.:.:.:::::: .. . . . : ..:.:. :: :.. .. CCDS48 IKGEVGDILTVVFKNNASRPYSVHAHGVL----ESTTVWPLA--AEPGEVVTYQWNIPER 820 830 840 850 860 870 1850 1860 1870 1880 1890 1900 pF1KE2 MAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTI .: .. : .: :.: :: ::..:::.::: .:. . :.: ::. .::::.: : CCDS48 SGPGPNDSACVSWIYYSAVDPIKDMYSGLVGPLAICQKGILEPHGGRSDMDREFALLFLI 880 890 900 910 920 930 1910 1920 1930 1940 1950 1960 pF1KE2 FDETKSWYFTENMERN-CRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIR :::.::::. ::. . . : .:...: :: :. ..::::: .. .: ::.: : .:. CCDS48 FDENKSWYLEENVATHGSQDPGSINLQDETFLESNKMHAINGKLYANLRGLTMYQGERVA 940 950 960 970 980 990 1970 1980 1990 2000 2010 2020 pF1KE2 WYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECL ::.:.::.. ..:.::: .. : :. :.:. . .:.::.::.:::. :. : : ..: CCDS48 WYMLAMGQDVDLHTIHFHAESFLYRNGENYRADVVDLFPGTFEVVEMVASNPGTWLMHCH 1000 1010 1020 1030 1040 1050 2030 2040 2050 2060 2070 pF1KE2 IGEHLHAGMSTLFLVYSNKCQ-TPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSIN . .:.:::: ::: :.: . .:: CCDS48 VTDHVHAGMETLFTVFSRTEHLSPLTVITKETEKVPPRDIEEGNVKMLGMQIPIKNVEML 1060 1070 1080 1090 1100 1110 >-- initn: 1758 init1: 455 opt: 827 Z-score: 895.9 bits: 178.7 E(32554): 1.4e-43 Smith-Waterman score: 1444; 34.8% identity (61.4% similar) in 739 aa overlap (20-730:27-721) 10 20 30 40 pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSD---LGELPVDARF- ::: :::: ...:.: . . . :.:. . CCDS48 MWAMESGHLLWALLFMQSLWPQLTDGATRVYYLGIRDVQWNYAPKGRNVITNQPLDSDIV 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 PPRVPKSFPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKN :: . .::::.. :. : .. .: :.:.:::..:::: :...: ::: CCDS48 ASSFLKSDKNRIGGTYKKTIYKEYKDDSYTDEVAQPAWLGFLGPVLQAEVGDVILIHLKN 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 MASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASD .:..: ..: :: : : :::. : : .: : ::.: ::::: : : . . ..: .: CCDS48 FATRPYTIHPHGVFYEKDSEGSLYPDGSSGPLKADDSVPPGGSHIYNWTIPEGHAPTDAD 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE2 PLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSL----AKEKTQTLHKFILLFAVFDEGK : :::. : :::: .:. .:::: :..:..:.: .. .. : :.:::.: ::. CCDS48 PACLTWIYHSHVDAPRDIATGLIGPLITCKRGALDGNSPPQRQDVDHDFFLLFSVVDENL 190 200 210 220 230 240 230 240 250 260 270 pF1KE2 SWH------SETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGM ::: . .. :.. . . .::..::.: .:: : : .: : ::..:: CCDS48 SWHLNENIATYCSDPASVDKEDETFQESNRMHAINGFVFGNLPELNMCAQKRVAWHLFGM 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE2 GTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGM :. .::. :..:. . .:.:. .: : ::.::. . . : .:. :...:: .::: CCDS48 GNEIDVHTAFFHGQMLTTRGHHTDVANIFPATFVTAEMVPWEPGTWLISCQVNSHFRDGM 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE2 EAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPK .: :: :: : . : :: ..:. CCDS48 QALYKVKSCSMAPPV------------DLLTG-----------------KVRQ------- 370 380 400 410 420 430 440 450 pF1KE2 TWVHYIAAEEEDWDYAPL----VLAPDDR---SYKSQYLNNGPQRIGRKYKKVRFMAYTD ..: :.: .:::.:. . . : : ........ .::: : :::. :. : CCDS48 ---YFIEAHEIQWDYGPMGHDGSTGKNLREPGSISDKFFQKSSSRIGGTYWKVRYEAFQD 390 400 410 420 430 440 460 470 480 490 500 510 pF1KE2 ETFKTREAIQHES--GILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRL :::. . .... :::::.. .:::::. ..: :.::.:... :::. . . CCDS48 ETFQEKMHLEEDRHLGILGPVIRAEVGDTIQVVFYNRASQPFSMQPHGVFYEKDYEGTVY 450 460 470 480 490 500 520 530 540 550 560 pF1KE2 PKGVKHLKDFPIL---PGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLI : ...: : : : :.::: . ::: .:: ::: .: : .. :: :::. CCDS48 NDG----SSYPGLVAKPFEKVTYRWTVPPHAGPTAQDPACLTWMYFSAADPIRDTNSGLV 510 520 530 540 550 570 580 590 600 610 620 pF1KE2 GPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPE- ::::.: .. :.: ::. .::.:.:::.::: . : . . .. :: : CCDS48 GPLLVCRAGALGADGKQKGVDKEFFLLFTVLDENKSWYSNANQAAAMLDFRLLS-EDIEG 560 570 580 590 600 610 630 640 650 660 670 680 pF1KE2 FQASNIMHSINGYVFDSL-QLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYED :: :: ::.:::..:..: .:..: ... :..:..:..:: .:.:.: : . . . . CCDS48 FQDSNRMHAINGFLFSNLPRLDMCKGDTVAWHLLGLGTETDVHGVMFQGNTVQLQGMRKG 620 630 640 650 660 670 690 700 710 720 730 740 pF1KE2 TLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDI . ::: . ..:. .: : . . :. .. :. :: :. .::.: CCDS48 AAMLFPHTFVMAIMQPDNLGTFEIYCQAGSHREAGMRAIYNVSQCPGHQATPRQRYQAAR 680 690 700 710 720 730 750 760 770 780 790 800 pF1KE2 SAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQNVS CCDS48 IYYIMAEEVEWDYCPDRSWEREWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGT 740 750 760 770 780 790 2351 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:41:38 2016 done: Mon Nov 7 19:41:39 2016 Total Scan time: 3.890 Total Display time: 0.570 Function used was FASTA [36.3.4 Apr, 2011]