FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4969, 2224 aa 1>>>pF1KB4969 2224 - 2224 aa - 2224 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.1169+/-0.0014; mu= 11.6155+/- 0.083 mean_var=155.5783+/-30.761, 0's: 0 Z-trim(103.6): 100 B-trim: 0 in 0/51 Lambda= 0.102825 statistics sampled from 7415 (7504) to 7415 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.565), E-opt: 0.2 (0.231), width: 16 Scan time: 6.540 The best scores are: opt bits E(32554) CCDS1281.1 F5 gene_id:2153|Hs108|chr1 (2224) 15037 2244.9 0 CCDS35457.1 F8 gene_id:2157|Hs108|chrX (2351) 1809 282.6 1.5e-74 CCDS44710.1 HEPHL1 gene_id:341208|Hs108|chr11 (1159) 996 161.8 1.7e-38 CCDS64195.1 EDIL3 gene_id:10085|Hs108|chr5 ( 470) 924 150.9 1.3e-35 CCDS4062.1 EDIL3 gene_id:10085|Hs108|chr5 ( 480) 924 150.9 1.3e-35 CCDS3141.1 CP gene_id:1356|Hs108|chr3 (1065) 922 150.8 3.1e-35 CCDS48133.1 HEPH gene_id:9843|Hs108|chrX (1160) 900 147.5 3.2e-34 CCDS14384.3 HEPH gene_id:9843|Hs108|chrX (1212) 900 147.6 3.4e-34 CCDS81918.1 MFGE8 gene_id:4240|Hs108|chr15 ( 343) 882 144.6 7.5e-34 CCDS14385.1 HEPH gene_id:9843|Hs108|chrX ( 891) 889 145.8 8e-34 CCDS10347.1 MFGE8 gene_id:4240|Hs108|chr15 ( 387) 869 142.7 3.1e-33 CCDS44026.1 F8 gene_id:2157|Hs108|chrX ( 216) 671 113.2 1.3e-24 CCDS45345.1 MFGE8 gene_id:4240|Hs108|chr15 ( 335) 576 99.2 3.4e-20 CCDS65277.1 HEPH gene_id:9843|Hs108|chrX ( 969) 505 88.9 1.2e-16 CCDS46878.1 DCBLD2 gene_id:131566|Hs108|chr3 ( 775) 462 82.5 8.4e-15 CCDS34522.1 DCBLD1 gene_id:285761|Hs108|chr6 ( 539) 415 75.4 7.8e-13 CCDS46499.1 NRP2 gene_id:8828|Hs108|chr2 ( 555) 404 73.8 2.5e-12 CCDS46498.1 NRP2 gene_id:8828|Hs108|chr2 ( 901) 404 73.9 3.7e-12 CCDS2365.1 NRP2 gene_id:8828|Hs108|chr2 ( 906) 404 73.9 3.7e-12 CCDS46497.1 NRP2 gene_id:8828|Hs108|chr2 ( 909) 404 73.9 3.7e-12 CCDS46496.1 NRP2 gene_id:8828|Hs108|chr2 ( 926) 404 73.9 3.8e-12 CCDS2364.1 NRP2 gene_id:8828|Hs108|chr2 ( 931) 404 73.9 3.8e-12 CCDS14187.1 RS1 gene_id:6247|Hs108|chrX ( 224) 387 71.0 6.7e-12 CCDS44873.1 KMT2D gene_id:8085|Hs108|chr12 (5537) 397 73.3 3.5e-11 >>CCDS1281.1 F5 gene_id:2153|Hs108|chr1 (2224 aa) initn: 15037 init1: 15037 opt: 15037 Z-score: 12057.5 bits: 2244.9 E(32554): 0 Smith-Waterman score: 15037; 100.0% identity (100.0% similar) in 2224 aa overlap (1-2224:1-2224) 10 20 30 40 50 60 pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEPTNSSLNLSVTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEPTNSSLNLSVTS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 FKKIVYREYEPYFKKEKPQSTISGLLGPTLYAEVGDIIKVHFKNKADKPLSIHPQGIRYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FKKIVYREYEPYFKKEKPQSTISGLLGPTLYAEVGDIIKVHFKNKADKPLSIHPQGIRYS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 KLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSGPTHDDPPCLTHIYYSHENLIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSGPTHDDPPCLTHIYYSHENLIE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 DFNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLFAVFDESKSWSQSSSLMYTVNGYVNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DFNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLFAVFDESKSWSQSSSLMYTVNGYVNG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 TMPDITVCAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TMPDITVCAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 GPEGKWIISSLTPKHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GPEGKWIISSLTPKHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 WDYAPVIPANMDKKYRSQHLDNFSNQIGKHYKKVMYTQYEDESFTKHTVNPNMKEDGILG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 WDYAPVIPANMDKKYRSQHLDNFSNQIGKHYKKVMYTQYEDESFTKHTVNPNMKEDGILG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 PIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGET 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 YTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 YTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 DIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB4 GFCFDDTVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMDNVGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GFCFDDTVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMDNVGT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB4 WMLTSMNSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDEES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 WMLTSMNSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDEES 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB4 DADYDYQNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVSSNTDIIVGSNYSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DADYDYQNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVSSNTDIIVGSNYSSP 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB4 SNISKFTVNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SNISKFTVNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB4 QPDVTGIRLLSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHKVGRHLSQDTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QPDVTGIRLLSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHKVGRHLSQDTGS 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB4 PSGMRPWEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PSGMRPWEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQ 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB4 DTDEDTAVNNWLISPQNASRAWGESTPLANKPGKQSGHPKFPRVRHKSLQVRQDGGKSRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DTDEDTAVNNWLISPQNASRAWGESTPLANKPGKQSGHPKFPRVRHKSLQVRQDGGKSRL 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB4 KKSQFLIKTRKKKKEKHTHHAPLSPRTFHPLRSEAYNTFSERRLKHSLVLHKSNETSLPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KKSQFLIKTRKKKKEKHTHHAPLSPRTFHPLRSEAYNTFSERRLKHSLVLHKSNETSLPT 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB4 DLNQTLPSMDFGWIASLPDHNQNSSNDTGQASCPPGLYQTVPPEEHYQTFPIQDPDQMHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DLNQTLPSMDFGWIASLPDHNQNSSNDTGQASCPPGLYQTVPPEEHYQTFPIQDPDQMHS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB4 TSDPSHRSSSPELSEMLEYDRSHKSFPTDISQMSPSSEHEVWQTVISPDLSQVTLSPELS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TSDPSHRSSSPELSEMLEYDRSHKSFPTDISQMSPSSEHEVWQTVISPDLSQVTLSPELS 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB4 QTNLSPDLSHTTLSPELIQRNLSPALGQMPISPDLSHTTLSPDLSHTTLSLDLSQTNLSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QTNLSPDLSHTTLSPELIQRNLSPALGQMPISPDLSHTTLSPDLSHTTLSLDLSQTNLSP 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB4 ELSQTNLSPALGQMPLSPDLSHTTLSLDFSQTNLSPELSHMTLSPELSQTNLSPALGQMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ELSQTNLSPALGQMPLSPDLSHTTLSLDFSQTNLSPELSHMTLSPELSQTNLSPALGQMP 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KB4 ISPDLSHTTLSLDFSQTNLSPELSQTNLSPALGQMPLSPDPSHTTLSLDLSQTNLSPELS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ISPDLSHTTLSLDFSQTNLSPELSQTNLSPALGQMPLSPDPSHTTLSLDLSQTNLSPELS 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KB4 QTNLSPDLSEMPLFADLSQIPLTPDLDQMTLSPDLGETDLSPNFGQMSLSPDLSQVTLSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QTNLSPDLSEMPLFADLSQIPLTPDLDQMTLSPDLGETDLSPNFGQMSLSPDLSQVTLSP 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KB4 DISDTTLLPDLSQISPPPDLDQIFYPSESSQSLLLQEFNESFPYPDLGQMPSPSSPTLND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DISDTTLLPDLSQISPPPDLDQIFYPSESSQSLLLQEFNESFPYPDLGQMPSPSSPTLND 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KB4 TFLSKEFNPLVIVGLSKDGTDYIEIIPKEEVQSSEDDYAEIDYVPYDDPYKTDVRTNINS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TFLSKEFNPLVIVGLSKDGTDYIEIIPKEEVQSSEDDYAEIDYVPYDDPYKTDVRTNINS 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KB4 SRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDYSEFVQRETDIEDSDDIPEDTTYKKVVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDYSEFVQRETDIEDSDDIPEDTTYKKVVF 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KB4 RKYLDSTFTKRDPRGEYEEHLGILGPIIRAEVDDVIQVRFKNLASRPYSLHAHGLSYEKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RKYLDSTFTKRDPRGEYEEHLGILGPIIRAEVDDVIQVRFKNLASRPYSLHAHGLSYEKS 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KB4 SEGKTYEDDSPEWFKEDNAVQPNSSYTYVWHATERSGPESPGSACRAWAYYSAVNPEKDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SEGKTYEDDSPEWFKEDNAVQPNSSYTYVWHATERSGPESPGSACRAWAYYSAVNPEKDI 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KB4 HSGLIGPLLICQKGILHKDSNMPMDMREFVLLFMTFDEKKSWYYEKKSRSSWRLTSSEMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 HSGLIGPLLICQKGILHKDSNMPMDMREFVLLFMTFDEKKSWYYEKKSRSSWRLTSSEMK 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KB4 KSHEFHAINGMIYSLPGLKMYEQEWVRLHLLNIGGSQDIHVVHFHGQTLLENGNKQHQLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KSHEFHAINGMIYSLPGLKMYEQEWVRLHLLNIGGSQDIHVVHFHGQTLLENGNKQHQLG 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KB4 VWPLLPGSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRMPMGLSTGIISD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VWPLLPGSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRMPMGLSTGIISD 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KB4 SQIKASEFLGYWEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQTQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SQIKASEFLGYWEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQTQG 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KB4 AKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPIVARY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPIVARY 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KB4 IRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDYWEPFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 IRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDYWEPFR 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KB4 ARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYTIHYSEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYTIHYSEQ 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KB4 GVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIALRLELFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIALRLELFG 2170 2180 2190 2200 2210 2220 pF1KB4 CDIY :::: CCDS12 CDIY >>CCDS35457.1 F8 gene_id:2157|Hs108|chrX (2351 aa) initn: 2085 init1: 458 opt: 1809 Z-score: 1451.9 bits: 282.6 E(32554): 1.5e-74 Smith-Waterman score: 3396; 31.8% identity (59.1% similar) in 2333 aa overlap (92-2222:97-2346) 70 80 90 100 110 120 pF1KB4 KKIVYREYEPYFKKEKPQSTISGLLGPTLYAEVGDIIKVHFKNKADKPLSIHPQGIRYSK ::: : . . .:: :..:.:.: :. : : CCDS35 KTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAVGVSYWK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 LSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSGPTHDDPPCLTHIYYSHENLIED :::: : :.: :: :: : :: .:: :.. ...:: .:: :::. : :: .:..: CCDS35 ASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKD 130 140 150 160 170 180 190 200 210 220 230 pF1KB4 FNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLFAVFDESKSWSQSS--SLM-------- .:::::: ::.:..:.:.. :: :. : ..::::::::.::: . . ::: CCDS35 LNSGLIGALLVCREGSLAKEKTQ-TLHK-FILLFAVFDEGKSWHSETKNSLMQDRDAASA 190 200 210 220 230 240 240 250 260 270 280 pF1KB4 ------YTVNGYVNGTMPDITVCAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSA .::::::: ..: . : . . ::..::.. ::. :: ..:... .:. .. CCDS35 RAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQAS 250 260 270 280 290 300 290 300 310 320 330 pF1KB4 ITLVSATSTTANMTVGPEGKWIISSLTPKHLQAGMQAYIDIKNCPK----KTRN------ . . : ::. . :.... .: . ::.::. . .::. . .: CCDS35 LEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAED 310 320 330 340 350 360 340 350 360 370 pF1KB4 ----------------------LKKITREQRRHMKRWEYFIAAEEVIWDYAPVIPANMDK . .: ..: : : ..::::: :::::.. : :. CCDS35 YDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDR 370 380 390 400 410 420 380 390 400 410 420 430 pF1KB4 KYRSQHLDNFSNQIGKHYKKVMYTQYEDESFTKHTVNPNMKEDGILGPIIRAQVRDTLKI .:.::.:.: ..::..:::: . : ::.: .: . ..:.:::::.. ..: ::: : CCDS35 SYKSQYLNNGPQRIGRKYKKVRFMAYTDETF--KTREAIQHESGILGPLLYGEVGDTLLI 430 440 450 460 470 480 440 450 460 470 480 490 pF1KB4 VFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGETYTYKWNILEFDEP .:::.:::::.:::::.: . . . .: .. . ::: . :::.. : : CCDS35 IFKNQASRPYNIYPHGIT--DVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGP 490 500 510 520 530 540 500 510 520 530 540 550 pF1KB4 TENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAADIEQQAVFAVFDE :..: .:::: : : :.. ::.:::::: :::: ..:.:.:: : .: .. .:.:::: CCDS35 TKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDE 550 560 570 580 590 600 560 570 580 590 600 610 pF1KB4 NKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTLGFCFDDTVQWHFC :.:::: .::..: :: :. .::.: :::: .::::: .:. :. :. ... :.. CCDS35 NRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYIL 610 620 630 640 650 620 630 640 650 660 670 pF1KB4 SVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMDNVGTWMLTSMNSSPRSK :.:.:...:.. :.:..: . .::::::::. ::.: ..:.: : :.: ::. :.. CCDS35 SIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNR 660 670 680 690 700 710 680 690 700 710 720 730 pF1KB4 KLRLKFRDVKC---IPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDEESDADYDYQNRL . .. .: : ::::: . :. . .. .. .::.. :: CCDS35 GMTALLKVSSCDKNTGDYYEDSYEDI----SAYLLSK--NNAIEPRSFS-------QNSR 720 730 740 750 760 740 750 760 770 780 pF1KB4 AAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVS--SNTDIIVGSNYS-SPSNISKFT . ..: ... ... : . .: .. .. :..:... : .: ..: CCDS35 HPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLS--- 770 780 790 800 810 820 790 800 810 820 830 840 pF1KB4 VNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPLQPDVTGI :.. :.: . : . .: : .:. :. : : : . . . :. .:. CCDS35 ---LSDLQEA---KYETFSDDPSPGAIDSNNSLSEMT--HFRPQLHHSGDMVFTPE-SGL 830 840 850 860 870 850 860 870 880 890 900 pF1KB4 RL-LSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHKVGRHLSQDTGSPSGMRP .: :. : . : :. :: ...... .: . .: ... : :: : CCDS35 QLRLNEKLGTTAATE-LKKLDFKV--SSTSNNLISTIPSDNLAAGTDNTSSLGPPS-MPV 880 890 900 910 920 930 910 920 930 940 950 960 pF1KB4 WEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQDTDEDT : . : .. : . . : : ...:.::.: . ..:.. . ...:. CCDS35 HYDSQLDTTLFGKKSSPLTESGGPLSLSEENNDSKLLESGLMNSQESSWGKNVSSTESGR 940 950 960 970 980 990 970 980 990 1000 1010 1020 pF1KB4 ------AVNNWLISPQNASRAWGESTPLANKPGKQSGHPKFPRVRHKSLQVRQDGGKSRL : . :.. .:: . : .:: ...:. . .. :: .... . CCDS35 LFKGKRAHGPALLTKDNALFKVSISLLKTNKTSNNSATNRKTHIDGPSLLIENS---PSV 1000 1010 1020 1030 1040 1030 1040 1050 1060 1070 pF1KB4 KKSQFLIKTRKKKKEKHTHHAPLSPRTFHPLRSEAYNTFSERRL--KHSLVLHKSNETSL .. . :. :: : : .. :: : .:.. :. ......: . CCDS35 WQNILESDTEFKKVTPLIHDRMLMDKNATALR---LNHMSNKTTSSKNMEMVQQKKEGPI 1050 1060 1070 1080 1090 1100 1080 1090 1100 1110 1120 pF1KB4 PTDLNQTLPSMDFGWIASLPD--------HNQNSSNDTGQASCPPGLYQTVPPEEHY--Q : : .. :.:.: . ::. :..:: : .::. : : .. ::. : CCDS35 PPDAQN--PDMSFFKMLFLPESARWIQRTHGKNSLN-SGQGPSPKQLV-SLGPEKSVEGQ 1110 1120 1130 1140 1150 1160 1130 1140 1150 1160 1170 1180 pF1KB4 TFPIQDPDQMHSTSDPSHRSSSPELSEMLEYDRSHKSFPTDISQMSPSSEHEVWQTVISP .: ... ... . .. ... :.::. . :.. : :..... .. :. . . CCDS35 NF-LSEKNKV--VVGKGEFTKDVGLKEMV-FPSSRNLFLTNLDNLHENNTHNQEKKI--- 1170 1180 1190 1200 1210 1190 1200 1210 1220 1230 pF1KB4 DLSQVTLSPELSQTNLSPDLSHTTLSPELIQRNL-----------SPALGQMPISPDLSH .. . : : :. ::. . . ...:: : . :. :. CCDS35 -QEEIEKKETLIQENVVLPQIHTVTGTKNFMKNLFLLSTRQNVEGSYDGAYAPVLQDFRS 1220 1230 1240 1250 1260 1270 1240 1250 1260 pF1KB4 TTLSPDLS--HTT-------------LSLDLSQ--------TNLSPELSQTNLSP----- . : . . ::. :. . .: : .::. :: :. CCDS35 LNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNTSQQNFVTQRSKR 1280 1290 1300 1310 1320 1330 1270 1280 1290 1300 1310 1320 pF1KB4 ALGQ--MPLSPDLSHTTLSLDFSQTNLSPELSHMTLSPELSQTNLSP----ALGQMPISP :: : .:: . . .: ..:. : ...:.: : :.: . . :. : :.: CCDS35 ALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPST-LTQIDYNEKEKGAITQSPLSD 1340 1350 1360 1370 1380 1390 1330 1340 1350 1360 1370 pF1KB4 DL--SHTTLS-----LDFSQTNLSPELSQTNLSPALGQMPLSPDPSHTTLSLDLSQTNLS : ::. . : ..... : . :. .: : : :. . . : . . : CCDS35 CLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASYRKKDSGVQESS 1400 1410 1420 1430 1440 1450 1380 1390 1400 1410 pF1KB4 PELS---QTNLSPDLSEMPLFADLSQIPL--TPDLDQMTLS---------PDL----GET :. ..::: . . . .: .. : ...: . ::: :.. CCDS35 HFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKVENTVLPKPDLPKTSGKV 1460 1470 1480 1490 1500 1510 1420 1430 1440 1450 1460 pF1KB4 DLSP--NFGQMSLSPDLSQVTLSP---DISDTTLLPDL------SQISPPPDLDQIFYPS .: : .. : .: : .. . :: :. . .:: .. . : . . . CCDS35 ELLPKVHIYQKDLFPTETS-NGSPGHLDLVEGSLLQGTEGAIKWNEANRPGKVPFLRVAT 1520 1530 1540 1550 1560 1570 1470 1480 1490 1500 pF1KB4 ESSQ---SLLLQ------EFNESFPYPDL-GQMPSPSSPTLN--DTFLSK---EFN---- ::: : ::. ... ..: . .: :: . ... ::.:: : : CCDS35 ESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSLNACESNHAIA 1580 1590 1600 1610 1620 1630 1510 1520 1530 1540 1550 pF1KB4 --------PLVIVGLSKDG-TDYI--EIIP-----KEEVQSS--EDDYAEIDYVPYDDPY : . : .:.: :. . . : ..:. . ..: :::: :: CCDS35 AINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQSDQEEIDY---DDTI 1640 1650 1660 1670 1680 1560 1570 1580 1590 1600 pF1KB4 KTDVRTNINSSRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDY----SEFVQRETDIEDS ..... . . : :. . :: . . :.:.::: : ::: : : :. .: CCDS35 SVEMKKEDFDIYDEDENQS--PRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNR--AQS 1690 1700 1710 1720 1730 1740 1610 1620 1630 1640 1650 1660 pF1KB4 DDIPEDTTYKKVVFRKYLDSTFTKRDPRGEYEEHLGILGPIIRAEVDDVIQVRFKNLASR ..:. .:::::... :..::. ::: .::::.::: :::::.: :.: :.: ::: CCDS35 GSVPQ---FKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASR 1750 1760 1770 1780 1790 1800 1670 1680 1690 1700 1710 1720 pF1KB4 PYSLHAHGLSYEKSSEGKTYEDDSPEWFKEDNAVQPNSSYTYVWHATERSGPESPGSACR :::... .::: ::. . : :.:: . :: :.. .. .: . :. CCDS35 PYSFYSSLISYE--------EDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCK 1810 1820 1830 1840 1850 1730 1740 1750 1760 1770 1780 pF1KB4 AWAYYSAVNPEKDIHSGLIGPLLICQKGILHKDSNMPMDMREFVLLFMTFDEKKSWYY-- ::::.: :. :::.:::::::::.:. . :. . . ..::.:.: ::: ::::. CCDS35 AWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTE 1860 1870 1880 1890 1900 1910 1790 1800 1810 1820 1830 pF1KB4 --EKKSRS--SWRLTSSEMKKSHEFHAINGMIY-SLPGLKMYEQEWVRLHLLNIGGSQDI :.. :. . .. . .:....::::::.:. .:::: : ... .: .::..:....: CCDS35 NMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENI 1920 1930 1940 1950 1960 1970 1840 1850 1860 1870 1880 1890 pF1KB4 HVVHFHGQTLLENGNKQHQLGVWPLLPGSFKTLEMKASKPGWWLLNTEVGENQRAGMQTP : .:: :... ......... : :: :.:.:: :: : : .. .::. .:::.: CCDS35 HSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTL 1980 1990 2000 2010 2020 2030 1900 1910 1920 1930 1940 1950 pF1KB4 FLIMDRDCRMPMGLSTGIISDSQIKASEFLGYWEPRLARLNNGGSYNAWSVEKLAAEFAS ::... :. :.:...: : : :: :: : : :.::::. .:: ::::... :. CCDS35 FLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKE---PFS- 2040 2050 2060 2070 2080 1960 1970 1980 1990 2000 2010 pF1KB4 KPWIQVDMQKEVIITGIQTQGAKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFN ::.::. .:: ::.::::.. ..: : ..: . :: . .:: ..:::: ..: : CCDS35 --WIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFF 2090 2100 2110 2120 2130 2140 2020 2030 2040 2050 2060 2070 pF1KB4 GNSDASTIKENQFDPPIVARYIRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIEN :: :.: ::.: :.:::.:::::. ::. : :::.::.::..:.:: :::::. : . CCDS35 GNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISD 2150 2160 2170 2180 2190 2200 2080 2090 2100 2110 2120 2130 pF1KB4 KQITASSFKKSWWGDYWEPFRARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQ ::::::. . .. : : .:::. ::: :::. ..:: :.::..:. : :.:.. :: CCDS35 AQITASSYFTNMFAT-WSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQ 2210 2220 2230 2240 2250 2260 2140 2150 2160 2170 2180 2190 pF1KB4 GCKSLSSEMYVKSYTIHYSEQGVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISR : ::: . :::: . : :..: .: . .... : :.:.:: .. : : ..::...: CCDS35 GVKSLLTSMYVKEFLISSSQDGHQWTLF-FQNGKV-KVFQGNQDSFTPVVNSLDPPLLTR 2270 2280 2290 2300 2310 2320 2200 2210 2220 pF1KB4 FIRVIPKTWNQSIALRLELFGCDIY ..:. :..: ..::::.:..::. CCDS35 YLRIHPQSWVHQIALRMEVLGCEAQDLY 2330 2340 2350 >>CCDS44710.1 HEPHL1 gene_id:341208|Hs108|chr11 (1159 aa) initn: 1444 init1: 488 opt: 996 Z-score: 804.7 bits: 161.8 E(32554): 1.7e-38 Smith-Waterman score: 1495; 33.3% identity (58.9% similar) in 879 aa overlap (4-832:8-836) 10 20 30 40 50 pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEPTNSSLNL :: ...:. :: : : :: . : .:.. :.: :. : . CCDS44 MPRKQPAGC--IFLLTFLGLS----GLVGTVT---RTYYIGIVEEYWNYVPQGKNVITGK 10 20 30 40 50 60 70 80 90 pF1KB4 SVTS------------------FKKIVYREY-EPYFKKEKPQSTISGLLGPTLYAEVGDI : : .:: :::.. . .. : :. :.::: : :::::. CCDS44 SFTEDKLATLFLERGPNRIGSIYKKAVYRRFTDGTYSIEIPKPPWLGFLGPILRAEVGDV 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB4 IKVHFKNKADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISED : .:.:: :..: :.::.:. :.: :::: : : : .: :: : ::..::: : . :. CCDS44 IVIHLKNFASRPYSLHPHGVFYNKDSEGALYPDGTSGRNKNDDMVPPGKNYTYVWPVREE 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB4 SGPTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTE-GGTQKTFDKQIVLLFA .:: : ::: .:.:: . .:. ::::::::.::.: :.. .::.. :...:..:. CCDS44 YAPTPADANCLTWVYHSHIDAPKDICSGLIGPLLVCKEGILNRYSGTRNDVDREFVIMFT 180 190 200 210 220 230 220 230 240 250 pF1KB4 VFDESKSWS----------------------QSSSLMYTVNGYVNGTMPDITVCAHDHIS . ::..:: : :. :...:::. :..:. .:. . .: CCDS44 LVDENQSWYLNENIKHFCTNPDSVDKKDAVFQRSNKMHALNGYLFGNFPEPDMCVGESVS 240 250 260 270 280 290 260 270 280 290 300 310 pF1KB4 WHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWIISSLTPK :::.::.. .. ::.: :... . :......: :: :..: . :::.:. . CCDS44 WHLFGMGNEIDIHSIYFYGNTFISRGHRTDVVNLFPATFLTTEMIAENPGKWMITCQVSD 300 310 320 330 340 350 320 330 340 350 360 pF1KB4 HLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVIWDYAPV-------I :::::: . .. :: :. :. .::: ::::::...::::: . CCDS44 HLQAGMLGQYNVDNC-KSDIFYPKMKGQQRR------YFIAAEKILWDYAPQGYNKFSGL 360 370 380 390 400 370 380 390 400 410 420 pF1KB4 PANMDKKYRSQHLDNFSNQIGKHYKKVMYTQYEDESFTKHT-VNPNMKEDGILGPIIRAQ : : . . . .. . .:.:: .: :: ::.. : .:::. .. . . :::::.:.:. CCDS44 PLNASGSDSDLYFTQGDNRIGGKYWKVRYTEFVDATFTKRKRLSAEEAHLGILGPVIKAE 410 420 430 440 450 460 430 440 450 460 470 480 pF1KB4 VRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGETYTYKWN : ::: ..: : :.. ::: :::: .. : . . .: . . :.::::.::::. CCDS44 VGDTLLVTFANKADKVYSILPHGVIYDKASDAAPN--LDGFVKPGAH-VKPGETFTYKWT 470 480 490 500 510 520 490 500 510 520 530 540 pF1KB4 ILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAADIEQQA . : :: .: ::: :.: :: ..: .:::.: ::.::. :. : :.. : : CCDS44 VPESVSPTAGDPPCLTYLYFSAVDPIKDTSSGLVGPLLVCKKGVLNADGTQKGIDKEFYL 530 540 550 560 570 580 550 560 570 580 590 600 pF1KB4 VFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTLGFCFDD .:.::::: : :...::.:: .: . ..: .: .:: : ..:::. . :..: : CCDS44 LFTVFDENLSRYFDENIQKFIWHPFSIDKEDKEFVKSNRMHAVNGYMYGNQPGLNMCKRD 590 600 610 620 630 640 610 620 630 640 650 660 pF1KB4 TVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMDNVGTWMLTSM :.::. ..::.... : : :... :.:.:.::: . .. . :..: . . CCDS44 RVSWHLIGLGTDTDMHGIVFQGNTIHLRGTHRDSLALFPHMATTAFMQPDHAGIFRVFCA 650 660 670 680 690 700 670 680 690 700 710 720 pF1KB4 NSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDEESDADYDY . :. . .. .: :..: : :. : .. :: . :: CCDS44 TMPHLSRGMGQIYEVSSC---DNRD------PSEQRYGMIRTFY----IAAEEVEWDYA- 710 720 730 740 730 740 750 760 770 780 pF1KB4 QNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVSSNTDIIVGSNYSSPSNISKF :. : : :. .. : . ..: :.. :. .::.:.. .. CCDS44 PNK---------------NWEFEKQHVDARGERHGDIFMNR-TENWIGSQYKK-VVYREY 750 760 770 780 790 790 800 810 820 830 840 pF1KB4 TVNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPLQPDVTG : ....: . : ... .:. : :.:: . : ::: CCDS44 TDGEFVEIKARPPREEHLELLGPMIHAEVGNTVLIIFKNKASRPYSISAQGVEEMDSGKQ 800 810 820 830 840 850 850 860 870 880 890 900 pF1KB4 IRLLSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHKVGRHLSQDTGSPSGMRP CCDS44 FQVPMTKPGEVKTYRWNIPKRSGPGPSDPNCIPWVYYSTVNFVKDTYSGLMGPLITCRKG 860 870 880 890 900 910 >-- initn: 998 init1: 377 opt: 459 Z-score: 374.2 bits: 82.1 E(32554): 1.6e-14 Smith-Waterman score: 552; 36.8% identity (68.4% similar) in 250 aa overlap (1680-1919:838-1084) 1650 1660 1670 1680 1690 1700 pF1KB4 AEVDDVIQVRFKNLASRPYSLHAHGLSYEKSSEGKTYEDDSPEWFKEDNAVQPNSSYTYV :..: . : :: . :. ..:. :: CCDS44 LELLGPMIHAEVGNTVLIIFKNKASRPYSISAQG-VEEMDSGKQFQVP-MTKPGEVKTYR 810 820 830 840 850 860 1710 1720 1730 1740 1750 1760 pF1KB4 WHATERSGPESPGSACRAWAYYSAVNPEKDIHSGLIGPLLICQKGILH-KDSNMPMDMRE :. .:::: : :.:::.:: :: .:::.:::. :.::.:. : .:. : CCDS44 WNIPKRSGPGPSDPNCIPWVYYSTVNFVKDTYSGLMGPLITCRKGVLNEKGRRSDVDY-E 870 880 890 900 910 920 1770 1780 1790 1800 1810 1820 pF1KB4 FVLLFMTFDEKKSWYYEKKSRSSWRLTSSEMKKSHEF------HAINGMIY-SLPGLKMY :.:::..:.:..::: . . .. ..:.. .: ::::: :. .: :: : CCDS44 FALLFLVFNENESWYLDDNIKKYLNKDPRDFKRTDDFEESNRMHAINGKIFGNLHGLIMN 930 940 950 960 970 980 1830 1840 1850 1860 1870 1880 pF1KB4 EQEWVRLHLLNIGGSQDIHVVHFHGQTLLENGNKQHQLGVWPLLPGSFKTLEMKASKPGW :. . .::.::. :::..:.:....: . .:... :. :.::.:.:.:. :..:: CCDS44 EDTMTNWYLLGIGSEVDIHTIHYHAESFLFKIDKSYREDVYDLFPGTFQTIELFADHPGT 990 1000 1010 1020 1030 1040 1890 1900 1910 1920 1930 pF1KB4 WLLNTEVGENQRAGMQTPFLIM-DRDCRMPMGLST-GIISDSQIKASEFLGYWEPRLARL :::. .:... .:::.: . .. . : :.:.. .. :. : CCDS44 WLLHCHVSDHIHAGMETTYTVLRNIDNRIPYSTTSPGVASHPATVPSNERPGKEQLYFFG 1050 1060 1070 1080 1090 1100 1940 1950 1960 1970 1980 1990 pF1KB4 NNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQTQGAKHYLKSCYTTEFYVAYSS CCDS44 KNLGPTGAKAALVILFIIGLLLLITTVILSLRLCSAMKQTDYQQVQSCALPTDAL 1110 1120 1130 1140 1150 >>CCDS64195.1 EDIL3 gene_id:10085|Hs108|chr5 (470 aa) initn: 963 init1: 420 opt: 924 Z-score: 752.9 bits: 150.9 E(32554): 1.3e-35 Smith-Waterman score: 924; 42.7% identity (68.5% similar) in 337 aa overlap (1897-2221:134-466) 1870 1880 1890 1900 1910 1920 pF1KB4 GSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRM----PMGLSTGIISDSQ . : .: :.:.. :.:. ::::..: CCDS64 IHCQHNINECEVEPCKNGGICTDLVANYSCECPGEFMGRNCQYKCSGPLGIEGGIISNQQ 110 120 130 140 150 160 1930 1940 1950 1960 1970 pF1KB4 IKASE----FLGY--WEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGI : :: ..: : : ::::. : :::. ::: ::::...:... .::. CCDS64 ITASSTHRALFGLQKWYPYYARLNKKGLINAWT----AAENDRWPWIQINLQRKMRVTGV 170 180 190 200 210 1980 1990 2000 2010 2020 2030 pF1KB4 QTQGAKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPI :::::. . : . .:::.. .: ..: ..: . : : :: : .: :.: ::: CCDS64 ITQGAKRIGSPEYIKSYKIAYSNDGKTWAMYKVKGTNEDMVFRGNIDNNTPYANSFTPPI 220 230 240 250 260 270 2040 2050 2060 2070 2080 2090 pF1KB4 VARYIRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDY- :.:.:. : . :::.:: :::..::: ::::..:.:.. ::::::. .. :. CCDS64 KAQYVRLYPQVCRRHCTLRMELLGCELSGCSEPLGMKSGHIQDYQITASSIFRTLNMDMF 280 290 300 310 320 330 2100 2110 2120 2130 2140 2150 pF1KB4 -WEPFRARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYT ::: .:::. ::.:::: . :...:::..::: :.:.::::: :... ..: :: CCDS64 TWEPRKARLDKQGKVNAWTSGHNDQSQWLQVDLLVPTKVTGIITQGAKDFGHVQFVGSYK 340 350 360 370 380 390 2160 2170 2180 2190 2200 2210 pF1KB4 IHYSEQGVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIAL . ::..: .: :. ... ::.:.:: .. : :: ..::: .: ::..: .: :.: CCDS64 LAYSNDGEHWTVYQDEKQRKDKVFQGNFDNDTHRKNVIDPPIYARHIRILPWSWYGRITL 400 410 420 430 440 450 2220 pF1KB4 RLELFGCDIY : ::.:: CCDS64 RSELLGCTEEE 460 470 >>CCDS4062.1 EDIL3 gene_id:10085|Hs108|chr5 (480 aa) initn: 963 init1: 420 opt: 924 Z-score: 752.7 bits: 150.9 E(32554): 1.3e-35 Smith-Waterman score: 924; 42.7% identity (68.5% similar) in 337 aa overlap (1897-2221:144-476) 1870 1880 1890 1900 1910 1920 pF1KB4 GSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRM----PMGLSTGIISDSQ . : .: :.:.. :.:. ::::..: CCDS40 IHCQHNINECEVEPCKNGGICTDLVANYSCECPGEFMGRNCQYKCSGPLGIEGGIISNQQ 120 130 140 150 160 170 1930 1940 1950 1960 1970 pF1KB4 IKASE----FLGY--WEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGI : :: ..: : : ::::. : :::. ::: ::::...:... .::. CCDS40 ITASSTHRALFGLQKWYPYYARLNKKGLINAWT----AAENDRWPWIQINLQRKMRVTGV 180 190 200 210 220 1980 1990 2000 2010 2020 2030 pF1KB4 QTQGAKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPI :::::. . : . .:::.. .: ..: ..: . : : :: : .: :.: ::: CCDS40 ITQGAKRIGSPEYIKSYKIAYSNDGKTWAMYKVKGTNEDMVFRGNIDNNTPYANSFTPPI 230 240 250 260 270 280 2040 2050 2060 2070 2080 2090 pF1KB4 VARYIRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDY- :.:.:. : . :::.:: :::..::: ::::..:.:.. ::::::. .. :. CCDS40 KAQYVRLYPQVCRRHCTLRMELLGCELSGCSEPLGMKSGHIQDYQITASSIFRTLNMDMF 290 300 310 320 330 340 2100 2110 2120 2130 2140 2150 pF1KB4 -WEPFRARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYT ::: .:::. ::.:::: . :...:::..::: :.:.::::: :... ..: :: CCDS40 TWEPRKARLDKQGKVNAWTSGHNDQSQWLQVDLLVPTKVTGIITQGAKDFGHVQFVGSYK 350 360 370 380 390 400 2160 2170 2180 2190 2200 2210 pF1KB4 IHYSEQGVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIAL . ::..: .: :. ... ::.:.:: .. : :: ..::: .: ::..: .: :.: CCDS40 LAYSNDGEHWTVYQDEKQRKDKVFQGNFDNDTHRKNVIDPPIYARHIRILPWSWYGRITL 410 420 430 440 450 460 2220 pF1KB4 RLELFGCDIY : ::.:: CCDS40 RSELLGCTEEE 470 480 >>CCDS3141.1 CP gene_id:1356|Hs108|chr3 (1065 aa) initn: 923 init1: 479 opt: 922 Z-score: 746.0 bits: 150.8 E(32554): 3.1e-35 Smith-Waterman score: 1371; 34.7% identity (64.4% similar) in 675 aa overlap (61-697:67-731) 40 50 60 70 80 pF1KB4 LRQFYVAAQGISWSYRPEPTNSSLNLSVTSFKKIVYREY-EPYFKKEKPQSTISGLLGPT .:: .: .: . :. . . :.::: CCDS31 SDHGEKKLISVDTEHSNIYLQNGPDRIGRLYKKALYLQYTDETFRTTIEKPVWLGFLGPI 40 50 60 70 80 90 90 100 110 120 130 140 pF1KB4 LYAEVGDIIKVHFKNKADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKMDDAVAPGREYT . ::.:: . ::.:: :..: ..: .:: : : ::: : :.: .. :: : ::..:: CCDS31 IKAETGDKVYVHLKNLASRPYTFHSHGITYYKEHEGAIYPDNTTDFQRADDKVYPGEQYT 100 110 120 130 140 150 150 160 170 180 190 200 pF1KB4 YEWSISEDSGPTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTEGGTQKTFDK : .:...: . : :.:.::.:: . .:. :::::::.:::: .: . .: .:. CCDS31 YMLLATEEQSPGEGDGNCVTRIYHSHIDAPKDIASGLIGPLIICKKDSL-DKEKEKHIDR 160 170 180 190 200 210 210 220 230 240 pF1KB4 QIVLLFAVFDESKSWS----------------------QSSSLMYTVNGYVNGTMPDITV ..:..:.: ::. :: : :. ::.::::. :..: ... CCDS31 EFVVMFSVVDENFSWYLEDNIKTYCSEPEKVDKDNEDFQESNRMYSVNGYTFGSLPGLSM 220 230 240 250 260 270 250 260 270 280 290 300 pF1KB4 CAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWI ::.:...:.:.::.. .. . :.::.: ........:.: :: : :.. :.:. CCDS31 CAEDRVKWYLFGMGNEVDVHAAFFHGQALTNKNYRIDTINLFPATLFDAYMVAQNPGEWM 280 290 300 310 320 330 310 320 330 340 350 360 pF1KB4 ISSLTPKHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVIWDYAPV- .: . .::.::.::......: .:. . .: .. :: :.:::::.::.::: CCDS31 LSCQNLNHLKAGLQAFFQVQEC-NKSSSKDNIRGKHVRH-----YYIAAEEIIWNYAPSG 340 350 360 370 380 370 380 390 400 410 pF1KB4 IPANMDKKYRSQHLDN--FSNQ----IGKHYKKVMYTQYEDESFT-KHTVNPNMKEDGIL : .. . :. : .: :: :::..: .: : ::: .. .:. .. ::: CCDS31 IDIFTKENLTAPGSDSAVFFEQGTTRIGGSYKKLVYREYTDASFTNRKERGPEEEHLGIL 390 400 410 420 430 440 420 430 440 450 460 470 pF1KB4 GPIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPG- ::.: :.: ::....:.: .. : :: : :: :. .. ... : : . :.: :. CCDS31 GPVIWAEVGDTIRVTFHNKGAYPLSIEPIGVRFNKNNE---GTYYSPNYNPQSRSVPPSA 450 460 470 480 490 500 480 490 500 510 520 530 pF1KB4 ------ETYTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLD ::.::.:.. . ::. : ::.. ::: :. .:: .:::: . :::. :: CCDS31 SHVAPTETFTYEWTVPKEVGPTNADPVCLAKMYYSAVEPTKDIFTGLIGPMKICKKGSLH 510 520 530 540 550 560 540 550 560 570 580 590 pF1KB4 RRGIQRAADIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGY : :. .: : .:::::.: ::::: : ::.: ..: : ::: : ..::. CCDS31 ANGRQKDVDKEFYLFPTVFDENESLLLEDNIRMFTTAPDQVDKEDEDFQESNKMHSMNGF 570 580 590 600 610 620 600 610 620 630 640 650 pF1KB4 VPESITTLGFCFDDTVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVT . . : .: :.: :.. :.:.. .. :.:.:..... ...:: .:::. . .. CCDS31 MYGNQPGLTMCKGDSVVWYLFSAGNEADVHGIYFSGNTYLWRGERRDTANLFPQTSLTLH 630 640 650 660 670 680 660 670 680 690 700 710 pF1KB4 VTMDNVGTWMLTSMNSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDR . :. ::. . .... . .. :. .: ....... . : CCDS31 MWPDTEGTFNVECLTTDHYTGGMKQKYTVNQCRRQSEDSTFYLGERTYYIAAVEVEWDYS 690 700 710 720 730 740 720 730 740 750 760 770 pF1KB4 LEPEDEESDADYDYQNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVSSNTDII CCDS31 PQREWEKELHHLQEQNVSNAFLDKGEFYIGSKYKKVVYRQYTDSTFRVPVERKAEEEHLG 750 760 770 780 790 800 >-- initn: 878 init1: 274 opt: 546 Z-score: 444.5 bits: 95.0 E(32554): 1.9e-18 Smith-Waterman score: 778; 39.7% identity (64.7% similar) in 348 aa overlap (1580-1906:732-1060) 1550 1560 1570 1580 1590 1600 pF1KB4 YKTDVRTNINSSRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDYSEFVQRETDIE----- :.::::: :. :::: ::: . : CCDS31 TDHYTGGMKQKYTVNQCRRQSEDSTFYLGERTYYIAAVEVEWDYSP--QREWEKELHHLQ 710 720 730 740 750 1610 1620 1630 1640 1650 pF1KB4 ---------DSDDIPEDTTYKKVVFRKYLDSTFTKRDPRGEYEEHLGILGPIIRAEVDDV :. .. . :::::.:.: :::: : ::::::::: ..:.: : CCDS31 EQNVSNAFLDKGEFYIGSKYKKVVYRQYTDSTFRVPVERKAEEEHLGILGPQLHADVGDK 760 770 780 790 800 810 1660 1670 1680 1690 1700 1710 pF1KB4 IQVRFKNLASRPYSLHAHGLSYEKSSEGKTYEDDSPEWFKEDNAVQPNSSYTYVWHATER ... :::.:.::::.::::.. :.:. : :. . ::::. :: CCDS31 VKIIFKNMATRPYSIHAHGVQTESSTVTPTL---------------PGETLTYVWKIPER 820 830 840 850 860 1720 1730 1740 1750 1760 1770 pF1KB4 SGPESPGSACRAWAYYSAVNPEKDIHSGLIGPLLICQKGILHKDSNMPMDMREFVLLFMT :: . ::: :::::.:. ::..:::::::..:.. : : : : ::.:::.. CCDS31 SGAGTEDSACIPWAYYSTVDQVKDLYSGLIGPLIVCRRPYL-KVFN-PRRKLEFALLFLV 870 880 890 900 910 920 1780 1790 1800 1810 1820 pF1KB4 FDEKKSWYYEK--KSRSSW--RLTSS--EMKKSHEFHAINGMIY-SLPGLKMYEQEWVRL :::..::: . :. :. ..... :. .:...::::: .. .: :: :. . : CCDS31 FDENESWYLDDNIKTYSDHPEKVNKDDEEFIESNKMHAINGRMFGNLQGLTMHVGDEVNW 930 940 950 960 970 980 1830 1840 1850 1860 1870 1880 pF1KB4 HLLNIGGSQDIHVVHFHGQTLLENGNKQHQLGVWPLLPGSFKTLEMKASKPGWWLLNTEV .:...:. :.:.:::::... . .. :. ..::...:::: :: :::. .: CCDS31 YLMGMGNEIDLHTVHFHGHSFQYKHRGVYSSDVFDIFPGTYQTLEMFPRTPGIWLLHCHV 990 1000 1010 1020 1030 1040 1890 1900 1910 1920 1930 1940 pF1KB4 GENQRAGMQTPFLIMDRDCRMPMGLSTGIISDSQIKASEFLGYWEPRLARLNNGGSYNAW .. .:::.: . ... . CCDS31 TDHIHAGMETTYTVLQNEDTKSG 1050 1060 >>CCDS48133.1 HEPH gene_id:9843|Hs108|chrX (1160 aa) initn: 1356 init1: 411 opt: 900 Z-score: 727.8 bits: 147.5 E(32554): 3.2e-34 Smith-Waterman score: 1378; 31.0% identity (55.6% similar) in 984 aa overlap (8-900:10-953) 10 20 30 40 50 pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEP----TNSSL ::.:. . . : : :..: : .:.. . ..:.: :. ::. : CCDS48 MWAMESGHLLWALLFMQSLW----PQLTDGAT-RVYYLGIRDVQWNYAPKGRNVITNQPL 10 20 30 40 50 60 70 80 90 pF1KB4 NLSVT--------------SFKKIVYREY-EPYFKKEKPQSTISGLLGPTLYAEVGDIIK . ... ..:: .:.:: . . : : . :.:::.: :::::.: CCDS48 DSDIVASSFLKSDKNRIGGTYKKTIYKEYKDDSYTDEVAQPAWLGFLGPVLQAEVGDVIL 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB4 VHFKNKADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSG .:.:: : .: .:::.:. : : :::. : : . : ::.: :: . :.:.: : . CCDS48 IHLKNFATRPYTIHPHGVFYEKDSEGSLYPDGSSGPLKADDSVPPGGSHIYNWTIPEGHA 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB4 PTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTEGGT---QKTFDKQIVLLFA :: :: ::: ::.:: . .:. .::::::. ::.:.: .:.. .. :... :::. CCDS48 PTDADPACLTWIYHSHVDAPRDIATGLIGPLITCKRGAL-DGNSPPQRQDVDHDFFLLFS 180 190 200 210 220 230 220 230 240 250 pF1KB4 VFDESKSWS----------------------QSSSLMYTVNGYVNGTMPDITVCAHDHIS : ::. :: : :. :...::.: :..:....::. ... CCDS48 VVDENLSWHLNENIATYCSDPASVDKEDETFQESNRMHAINGFVFGNLPELNMCAQKRVA 240 250 260 270 280 290 260 270 280 290 300 310 pF1KB4 WHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWIISSLTPK :::.::.. .. . :.::.: :.... .. :: .::.:. : :.:: . . CCDS48 WHLFGMGNEIDVHTAFFHGQMLTTRGHHTDVANIFPATFVTAEMVPWEPGTWLISCQVNS 300 310 320 330 340 350 320 330 340 350 360 370 pF1KB4 HLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVIWDYAPVI-PANMDK :.. :::: .:.: . . . .: . : .::: :.:. :::.:. .. : CCDS48 HFRDGMQALYKVKSC-SMAPPVDLLTGKVR------QYFIEAHEIQWDYGPMGHDGSTGK 360 370 380 390 400 380 390 400 410 420 pF1KB4 KYRSQHL--DNF----SNQIGKHYKKVMYTQYEDESFTKHTVNPNMKED---GILGPIIR . : :.: :..:: : :: : ..::.: .. ...:: :::::.:: CCDS48 NLREPGSISDKFFQKSSSRIGGTYWKVRYEAFQDETFQEKM---HLEEDRHLGILGPVIR 410 420 430 440 450 460 430 440 450 460 470 480 pF1KB4 AQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGETYTYK :.: ::...:: : ::.:.:. :::: . .: .. ...: . . : .: : ::. CCDS48 AEVGDTIQVVFYNRASQPFSMQPHGVFYE--KDYEGTVYNDGSSYPGLVA-KPFEKVTYR 470 480 490 500 510 520 490 500 510 520 530 540 pF1KB4 WNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAADIEQ :.. :: .: ::: :.: .: .:: :::.: ::.:.. .: : :...: : CCDS48 WTVPPHAGPTAQDPACLTWMYFSAADPIRDTNSGLVGPLLVCRAGALGADGKQKGVDKEF 530 540 550 560 570 580 550 560 570 580 590 600 pF1KB4 QAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTLGFCF .:.:.::::::: . : . ...: : .:: : .:::.. .. : .: CCDS48 FLLFTVLDENKSWYSNANQAAAMLDFRLLSEDIEGFQDSNRMHAINGFLFSNLPRLDMCK 590 600 610 620 630 640 610 620 630 640 650 660 pF1KB4 DDTVQWHFCSVGTQNEILTIHFTGHSF-IYGKRHEDTLTLFPMRGESVTVTMDNVGTWML ::: ::. ..::.... . : :.. . : :. .. ::: . . ::.::. . CCDS48 GDTVAWHLLGLGTETDVHGVMFQGNTVQLQGMRKGAAM-LFPHTFVMAIMQPDNLGTFEI 650 660 670 680 690 700 670 680 690 700 710 pF1KB4 TSMNSSPRSKKLRLKFRDVKC-----IPDDDEDSYEIF----EPPESTVMATRKMHDRLE . .: : .: . .: : . .. .:. : : :. . . . CCDS48 YCQAGSHREAGMRAIYNVSQCPGHQATPRQRYQAARIYYIMAEEVEWDYCPDRSWEREWH 710 720 730 740 750 760 720 730 740 750 760 pF1KB4 PEDEESDADYDYQNRLAAALGIR------------SFRNSSLNQEEEEFNLTALA-LENG ..:... : . . . :: : .:: :: .: :. : .: CCDS48 NQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGTFRIPRPRTGPEE-HLGILGPLIKG 770 780 790 800 810 770 780 790 800 810 pF1KB4 TEFVSSNTDIIVGSNYSSPSNISKF------TVNNLA-EPQKAPSHQQATTAGSPLRHLI :.. .. .: : : .. :: :: :: .. ..: : : CCDS48 E--VGDILTVVFKNNASRPYSVHAHGVLESTTVWPLAAEPGEVVTYQWNI----PERSGP 820 830 840 850 860 870 820 830 840 850 860 870 pF1KB4 GKNSVLNSSTAEHSSPYSEDPIEDPLQPDVTGIRLLSLGAGEFKSQEHAKHKGPKVERDQ : :. : .:. :::.: . : . . . : : : : . . :. CCDS48 GPNDSACVSWIYYSAV---DPIKDMYSGLVGPLAICQKGILE-------PH-GGRSDMDR 880 890 900 910 920 880 890 900 910 920 pF1KB4 AAKHRF-------SWMKLLAHKVGRHLSQDTGSPSGMRPWEDLPSQDTGSPSRMRPWKDP : ::. : ..:. : ::: :: CCDS48 EFALLFLIFDENKSWY--LEENVATHGSQDPGSINLQDETFLESNKMHAINGKLYANLRG 930 940 950 960 970 980 930 940 950 960 970 980 pF1KB4 PSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQDTDEDTAVNNWLISPQNASRAWGESTP CCDS48 LTMYQGERVAWYMLAMGQDVDLHTIHFHAESFLYRNGENYRADVVDLFPGTFEVVEMVAS 990 1000 1010 1020 1030 1040 >>CCDS14384.3 HEPH gene_id:9843|Hs108|chrX (1212 aa) initn: 1749 init1: 411 opt: 900 Z-score: 727.5 bits: 147.6 E(32554): 3.4e-34 Smith-Waterman score: 1378; 31.0% identity (55.6% similar) in 984 aa overlap (8-900:61-1004) 10 20 30 pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVA ::.:. . . : : :..: : .:.. CCDS14 CAQPAWRKVSAPSQDLLITKVMWAMESGHLLWALLFMQSLW----PQLTDGAT-RVYYLG 40 50 60 70 80 40 50 60 70 pF1KB4 AQGISWSYRPEP----TNSSLNLSVT--------------SFKKIVYREY-EPYFKKEKP . ..:.: :. ::. :. ... ..:: .:.:: . . : CCDS14 IRDVQWNYAPKGRNVITNQPLDSDIVASSFLKSDKNRIGGTYKKTIYKEYKDDSYTDEVA 90 100 110 120 130 140 80 90 100 110 120 130 pF1KB4 QSTISGLLGPTLYAEVGDIIKVHFKNKADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKM : . :.:::.: :::::.: .:.:: : .: .:::.:. : : :::. : : . : CCDS14 QPAWLGFLGPVLQAEVGDVILIHLKNFATRPYTIHPHGVFYEKDSEGSLYPDGSSGPLKA 150 160 170 180 190 200 140 150 160 170 180 190 pF1KB4 DDAVAPGREYTYEWSISEDSGPTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTL ::.: :: . :.:.: : .:: :: ::: ::.:: . .:. .::::::. ::.:.: CCDS14 DDSVPPGGSHIYNWTIPEGHAPTDADPACLTWIYHSHVDAPRDIATGLIGPLITCKRGAL 210 220 230 240 250 260 200 210 220 230 pF1KB4 TEGGT---QKTFDKQIVLLFAVFDESKSWS----------------------QSSSLMYT .:.. .. :... :::.: ::. :: : :. :.. CCDS14 -DGNSPPQRQDVDHDFFLLFSVVDENLSWHLNENIATYCSDPASVDKEDETFQESNRMHA 270 280 290 300 310 320 240 250 260 270 280 290 pF1KB4 VNGYVNGTMPDITVCAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATS .::.: :..:....::. ...:::.::.. .. . :.::.: :.... .. :: CCDS14 INGFVFGNLPELNMCAQKRVAWHLFGMGNEIDVHTAFFHGQMLTTRGHHTDVANIFPATF 330 340 350 360 370 380 300 310 320 330 340 350 pF1KB4 TTANMTVGPEGKWIISSLTPKHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYF .::.:. : :.:: . .:.. :::: .:.: . . . .: . : .:: CCDS14 VTAEMVPWEPGTWLISCQVNSHFRDGMQALYKVKSC-SMAPPVDLLTGKVR------QYF 390 400 410 420 430 360 370 380 390 400 pF1KB4 IAAEEVIWDYAPVI-PANMDKKYRSQHL--DNF----SNQIGKHYKKVMYTQYEDESFTK : :.:. :::.:. .. :. : :.: :..:: : :: : ..::.: . CCDS14 IEAHEIQWDYGPMGHDGSTGKNLREPGSISDKFFQKSSSRIGGTYWKVRYEAFQDETFQE 440 450 460 470 480 490 410 420 430 440 450 460 pF1KB4 HTVNPNMKED---GILGPIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSF . ...:: :::::.:::.: ::...:: : ::.:.:. :::: . .: .. . CCDS14 KM---HLEEDRHLGILGPVIRAEVGDTIQVVFYNRASQPFSMQPHGVFYE--KDYEGTVY 500 510 520 530 540 550 470 480 490 500 510 520 pF1KB4 TSGRNNTMIRAVQPGETYTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLL ..: . . : .: : ::.:.. :: .: ::: :.: .: .:: :::.: : CCDS14 NDGSSYPGLVA-KPFEKVTYRWTVPPHAGPTAQDPACLTWMYFSAADPIRDTNSGLVGPL 560 570 580 590 600 610 530 540 550 560 570 580 pF1KB4 LICKSRSLDRRGIQRAADIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYES :.:.. .: : :...: : .:.:.::::::: . : . ...: : .: CCDS14 LVCRAGALGADGKQKGVDKEFFLLFTVLDENKSWYSNANQAAAMLDFRLLSEDIEGFQDS 620 630 640 650 660 670 590 600 610 620 630 640 pF1KB4 NIMSTINGYVPESITTLGFCFDDTVQWHFCSVGTQNEILTIHFTGHSF-IYGKRHEDTLT : : .:::.. .. : .: ::: ::. ..::.... . : :.. . : :. .. CCDS14 NRMHAINGFLFSNLPRLDMCKGDTVAWHLLGLGTETDVHGVMFQGNTVQLQGMRKGAAM- 680 690 700 710 720 730 650 660 670 680 690 pF1KB4 LFPMRGESVTVTMDNVGTWMLTSMNSSPRSKKLRLKFRDVKC-----IPDDDEDSYEIF- ::: . . ::.::. . . .: : .: . .: : . .. .:. CCDS14 LFPHTFVMAIMQPDNLGTFEIYCQAGSHREAGMRAIYNVSQCPGHQATPRQRYQAARIYY 740 750 760 770 780 790 700 710 720 730 740 pF1KB4 ---EPPESTVMATRKMHDRLEPEDEESDADYDYQNRLAAALGIR------------SFRN : : :. . . . ..:... : . . . :: : .:: CCDS14 IMAEEVEWDYCPDRSWEREWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGTFRI 800 810 820 830 840 850 750 760 770 780 790 pF1KB4 SSLNQEEEEFNLTALA-LENGTEFVSSNTDIIVGSNYSSPSNISKF------TVNNLA-E :: .: :. : .: :.. .. .: : : .. :: :: : CCDS14 PRPRTGPEE-HLGILGPLIKGE--VGDILTVVFKNNASRPYSVHAHGVLESTTVWPLAAE 860 870 880 890 900 800 810 820 830 840 850 pF1KB4 PQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPLQPDVTGIRLLSLG : .. ..: : : : :. : .:. :::.: . : . . . : CCDS14 PGEVVTYQWNI----PERSGPGPNDSACVSWIYYSAV---DPIKDMYSGLVGPLAICQKG 910 920 930 940 950 960 860 870 880 890 900 pF1KB4 AGEFKSQEHAKHKGPKVERDQAAKHRF-------SWMKLLAHKVGRHLSQDTGSPSGMRP : : : . . :. : ::. : ..:. : ::: :: CCDS14 ILE-------PH-GGRSDMDREFALLFLIFDENKSWY--LEENVATHGSQDPGSINLQDE 970 980 990 1000 1010 910 920 930 940 950 960 pF1KB4 WEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQDTDEDT CCDS14 TFLESNKMHAINGKLYANLRGLTMYQGERVAWYMLAMGQDVDLHTIHFHAESFLYRNGEN 1020 1030 1040 1050 1060 1070 >>CCDS81918.1 MFGE8 gene_id:4240|Hs108|chr15 (343 aa) initn: 637 init1: 411 opt: 882 Z-score: 721.3 bits: 144.6 E(32554): 7.5e-34 Smith-Waterman score: 882; 41.5% identity (70.3% similar) in 337 aa overlap (1894-2221:13-343) 1870 1880 1890 1900 1910 1920 pF1KB4 LLPGSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRMPMGLSTGIISDSQI : . .: :.. .: :.:: .: :..::: CCDS81 MPRPRLLAALCGALLCAPSLLVALECVEPLGLENGNIANSQI 10 20 30 40 1930 1940 1950 1960 1970 pF1KB4 KASE----FLG--YWEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQ :: ::: .: :.::::: .: :::. . ..:::::.. ... .::. CCDS81 AASSVRVTFLGLQHWVPELARLNRAGMVNAWT----PSSNDDNPWIQVNLLRRMWVTGVV 50 60 70 80 90 1980 1990 2000 2010 2020 2030 pF1KB4 TQGAKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPIV ::::.. . : : :::: : ... : . ... : :: . .... : :. :. CCDS81 TQGASRLASHEYLKAFKVAYSLNGHEFD-FIHDVNKKHKEFVGNWNKNAVHVNLFETPVE 100 110 120 130 140 150 2040 2050 2060 2070 2080 2090 pF1KB4 ARYIRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDY-- :.:.:. :: .. :::.:: :::.:::..:::..:..: .::::::: :.: : . CCDS81 AQYVRLYPTSCHTACTLRFELLGCELNGCANPLGLKNNSIPDKQITASSSYKTW-GLHLF 160 170 180 190 200 210 2100 2110 2120 2130 2140 2150 pF1KB4 -WEPFRARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYT :.: :::. :: ::: : . .: :::..:: . :..:.::::: ....: ..: :: CCDS81 SWNPSYARLDKQGNFNAWVAGSYGNDQWLQVDLGSSKEVTGIITQGARNFGSVQFVASYK 220 230 240 250 260 270 2160 2170 2180 2190 2200 2210 pF1KB4 IHYSEQGVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIAL . ::.....: :. . .::: :: ....: ::.:. ::..:..:..: .:.. ::: CCDS81 VAYSNDSANWTEYQDPRTGSSKIFPGNWDNHSHKKNLFETPILARYVRILPVAWHNRIAL 280 290 300 310 320 330 2220 pF1KB4 RLELFGCDIY ::::.:: CCDS81 RLELLGC 340 >>CCDS14385.1 HEPH gene_id:9843|Hs108|chrX (891 aa) initn: 1196 init1: 411 opt: 889 Z-score: 720.7 bits: 145.8 E(32554): 8e-34 Smith-Waterman score: 1271; 34.1% identity (60.7% similar) in 695 aa overlap (30-663:111-777) 10 20 30 40 50 pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEPTNSSL--NL- ..::... :. :.:.: : ..: :: CCDS14 QVNSHFRDGMQALYKVKSCSMAPPVDLLTGKVRQYFIEAHEIQWDYGPMGHDGSTGKNLR 90 100 110 120 130 140 60 70 80 90 pF1KB4 ---SVTS--FKKIVYR--------EYEPYFKKEKPQSTIS-------GLLGPTLYAEVGD :... :.: : .:: :. : : . :.:::.. ::::: CCDS14 EPGSISDKFFQKSSSRIGGTYWKVRYEA-FQDETFQEKMHLEEDRHLGILGPVIRAEVGD 150 160 170 180 190 100 110 120 130 140 150 pF1KB4 IIKVHFKNKADKPLSIHPQGIRYSKLSEGASYLD-HTFPAEKMDDAVAPGREYTYEWSIS :.: : :.:..:.:..:.:. : : ::. : : ..:. .. : .. ::.:.. CCDS14 TIQVVFYNRASQPFSMQPHGVFYEKDYEGTVYNDGSSYPGL----VAKPFEKVTYRWTVP 200 210 220 230 240 250 160 170 180 190 200 210 pF1KB4 EDSGPTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLF .::: .:: ::: .:.: . :.: ::::.::::.:. :.: : :: ::.. ::: CCDS14 PHAGPTAQDPACLTWMYFSAADPIRDTNSGLVGPLLVCRAGALGADGKQKGVDKEFFLLF 260 270 280 290 300 310 220 230 240 250 pF1KB4 AVFDESKSWS----------------------QSSSLMYTVNGYVNGTMPDITVCAHDHI .:.::.::: :.:. :...::.. ...: . .: : . CCDS14 TVLDENKSWYSNANQAAAMLDFRLLSEDIEGFQDSNRMHAINGFLFSNLPRLDMCKGDTV 320 330 340 350 360 370 260 270 280 290 300 310 pF1KB4 SWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWIISSLTP .:::::... .. .. :.:.... . . .: : : . : : : . : . CCDS14 AWHLLGLGTETDVHGVMFQGNTVQLQGMRKGAAMLFPHTFVMAIMQPDNLGTFEIYCQAG 380 390 400 410 420 430 320 330 340 350 360 370 pF1KB4 KHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVIWDYAPVIPANMDK .: .:::.: ....:: .. : .:: . : :.: :::: ::: : . .. CCDS14 SHREAGMRAIYNVSQCPG-----HQATPRQRYQAARI-YYIMAEEVEWDYCP--DRSWER 440 450 460 470 480 380 390 400 410 420 pF1KB4 KYRSQH---------LDNFSNQIGKHYKKVMYTQYEDESFT--KHTVNPNMKEDGILGPI ....: :.: .. .:..:::... .: : .: . ..:. .. :::::. CCDS14 EWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGTFRIPRPRTGPE-EHLGILGPL 490 500 510 520 530 540 430 440 450 460 470 480 pF1KB4 IRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGETYT :...: : : .:::: ::::::.. ::: : ... :..:::. : CCDS14 IKGEVGDILTVVFKNNASRPYSVHAHGVLES--------------TTVWPLAAEPGEVVT 550 560 570 580 590 490 500 510 520 530 540 pF1KB4 YKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAADI :.::: : . : ::. :.. ::: :: ..:. :::.: : ::.. :. .: . : CCDS14 YQWNIPERSGPGPNDSACVSWIYYSAVDPIKDMYSGLVGPLAICQKGILEPHGGRSDMDR 600 610 620 630 640 650 550 560 570 580 590 600 pF1KB4 EQQAVFAVFDENKSWYLEDNINKF-CENPDEVKRDDPKFYESNIMSTINGYVPESITTLG : .: .::::::::::.:. ..: .. .: : ::: : .::: . .. : CCDS14 EFALLFLIFDENKSWYLEENVATHGSQDPGSINLQDETFLESNKMHAINGKLYANLRGLT 660 670 680 690 700 710 610 620 630 640 650 pF1KB4 FCFDDTVQWHFCSVGTQNEILTIHFTGHSFIY--GKRHE-DTLTLFPMRGESVTVTMDNV . . : :.. ..: . .. :::: ..::.: :. .. :.. ::: : : .. .: CCDS14 MYQGERVAWYMLAMGQDVDLHTIHFHAESFLYRNGENYRADVVDLFPGTFEVVEMVASNP 720 730 740 750 760 770 660 670 680 690 700 710 pF1KB4 GTWMLTSMNSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDE :::.. CCDS14 GTWLMHCHVTDHVHAGMETLFTVFSRTEHLSPLTVITKETEKAVPPRDIEEGNVKMLGMQ 780 790 800 810 820 830 2224 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 22:10:06 2016 done: Thu Nov 3 22:10:07 2016 Total Scan time: 6.540 Total Display time: 0.790 Function used was FASTA [36.3.4 Apr, 2011]