FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2421, 2351 aa
1>>>pF1KE2421 2351 - 2351 aa - 2351 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.1126+/-0.00139; mu= 15.4456+/- 0.083
mean_var=83.5685+/-16.611, 0's: 0 Z-trim(100.4): 55 B-trim: 64 in 1/50
Lambda= 0.140298
statistics sampled from 6069 (6117) to 6069 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.525), E-opt: 0.2 (0.188), width: 16
Scan time: 3.890
The best scores are: opt bits E(32554)
CCDS35457.1 F8 gene_id:2157|Hs108|chrX (2351) 15768 3202.9 0
CCDS1281.1 F5 gene_id:2153|Hs108|chr1 (2224) 1809 377.5 3.9e-103
CCDS44026.1 F8 gene_id:2157|Hs108|chrX ( 216) 1414 297.5 4.5e-80
CCDS64195.1 EDIL3 gene_id:10085|Hs108|chr5 ( 470) 884 190.3 1.9e-47
CCDS4062.1 EDIL3 gene_id:10085|Hs108|chr5 ( 480) 884 190.3 1.9e-47
CCDS3141.1 CP gene_id:1356|Hs108|chr3 (1065) 819 177.1 3.9e-43
CCDS44710.1 HEPHL1 gene_id:341208|Hs108|chr11 (1159) 813 175.9 9.9e-43
CCDS14385.1 HEPH gene_id:9843|Hs108|chrX ( 891) 637 140.3 4.1e-32
CCDS65277.1 HEPH gene_id:9843|Hs108|chrX ( 969) 555 123.7 4.4e-27
CCDS48133.1 HEPH gene_id:9843|Hs108|chrX (1160) 555 123.7 5.2e-27
CCDS14384.3 HEPH gene_id:9843|Hs108|chrX (1212) 555 123.7 5.5e-27
CCDS45345.1 MFGE8 gene_id:4240|Hs108|chr15 ( 335) 535 119.6 2.5e-26
CCDS46499.1 NRP2 gene_id:8828|Hs108|chr2 ( 555) 438 100.0 3.4e-20
CCDS46498.1 NRP2 gene_id:8828|Hs108|chr2 ( 901) 438 100.0 5.5e-20
CCDS2365.1 NRP2 gene_id:8828|Hs108|chr2 ( 906) 438 100.0 5.5e-20
CCDS46497.1 NRP2 gene_id:8828|Hs108|chr2 ( 909) 438 100.0 5.5e-20
CCDS46496.1 NRP2 gene_id:8828|Hs108|chr2 ( 926) 438 100.0 5.6e-20
CCDS2364.1 NRP2 gene_id:8828|Hs108|chr2 ( 931) 438 100.0 5.6e-20
CCDS31179.1 NRP1 gene_id:8829|Hs108|chr10 ( 609) 356 83.4 3.7e-15
CCDS31180.1 NRP1 gene_id:8829|Hs108|chr10 ( 644) 356 83.4 3.9e-15
CCDS81448.1 NRP1 gene_id:8829|Hs108|chr10 ( 906) 356 83.4 5.5e-15
CCDS7177.1 NRP1 gene_id:8829|Hs108|chr10 ( 923) 356 83.4 5.6e-15
CCDS14187.1 RS1 gene_id:6247|Hs108|chrX ( 224) 338 79.7 1.7e-14
CCDS5476.1 AEBP1 gene_id:165|Hs108|chr7 (1158) 346 81.4 2.8e-14
CCDS7637.1 CPXM2 gene_id:119587|Hs108|chr10 ( 756) 340 80.2 4.3e-14
CCDS46878.1 DCBLD2 gene_id:131566|Hs108|chr3 ( 775) 338 79.8 5.8e-14
CCDS81918.1 MFGE8 gene_id:4240|Hs108|chr15 ( 343) 323 76.7 2.1e-13
CCDS10347.1 MFGE8 gene_id:4240|Hs108|chr15 ( 387) 323 76.7 2.4e-13
CCDS34522.1 DCBLD1 gene_id:285761|Hs108|chr6 ( 539) 301 72.3 7.3e-12
CCDS5889.1 CNTNAP2 gene_id:26047|Hs108|chr7 (1331) 290 70.0 8.4e-11
>>CCDS35457.1 F8 gene_id:2157|Hs108|chrX (2351 aa)
initn: 15768 init1: 15768 opt: 15768 Z-score: 17234.4 bits: 3202.9 E(32554): 0
Smith-Waterman score: 15768; 100.0% identity (100.0% similar) in 2351 aa overlap (1-2351:1-2351)
10 20 30 40 50 60
pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 TSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 TSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 GVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 GVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 VDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 VDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 AASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 AASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 RQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 RQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 EAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 EAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 PDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 LIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 LIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 TKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 TKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 NRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 NRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILS
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 IGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 IGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 MTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTI
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 PENDIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PENDIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 PGAIDSNNSLSEMTHFRPQLHHSGDMVFTPESGLQLRLNEKLGTTAATELKKLDFKVSST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PGAIDSNNSLSEMTHFRPQLHHSGDMVFTPESGLQLRLNEKLGTTAATELKKLDFKVSST
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 SNNLISTIPSDNLAAGTDNTSSLGPPSMPVHYDSQLDTTLFGKKSSPLTESGGPLSLSEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 SNNLISTIPSDNLAAGTDNTSSLGPPSMPVHYDSQLDTTLFGKKSSPLTESGGPLSLSEE
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 NNDSKLLESGLMNSQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 NNDSKLLESGLMNSQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTN
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE2 KTSNNSATNRKTHIDGPSLLIENSPSVWQNILESDTEFKKVTPLIHDRMLMDKNATALRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 KTSNNSATNRKTHIDGPSLLIENSPSVWQNILESDTEFKKVTPLIHDRMLMDKNATALRL
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE2 NHMSNKTTSSKNMEMVQQKKEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 NHMSNKTTSSKNMEMVQQKKEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSG
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE2 QGPSPKQLVSLGPEKSVEGQNFLSEKNKVVVGKGEFTKDVGLKEMVFPSSRNLFLTNLDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 QGPSPKQLVSLGPEKSVEGQNFLSEKNKVVVGKGEFTKDVGLKEMVFPSSRNLFLTNLDN
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE2 LHENNTHNQEKKIQEEIEKKETLIQENVVLPQIHTVTGTKNFMKNLFLLSTRQNVEGSYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 LHENNTHNQEKKIQEEIEKKETLIQENVVLPQIHTVTGTKNFMKNLFLLSTRQNVEGSYD
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE2 GAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 GAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNT
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE2 SQQNFVTQRSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPSTLTQIDYNEKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 SQQNFVTQRSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPSTLTQIDYNEKE
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE2 KGAITQSPLSDCLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 KGAITQSPLSDCLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASY
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE2 RKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKVENTVLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 RKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKVENTVLP
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE2 KPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQGTEGAIKWNEANRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 KPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQGTEGAIKWNEANRP
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE2 GKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 GKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSL
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE2 NACESNHAIAAINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQSDQEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 NACESNHAIAAINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQSDQEE
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE2 IDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 IDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNR
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE2 AQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 AQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASR
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE2 PYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDV
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE2 DLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 DLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRA
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE2 PCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGH
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE2 VFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 VFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKC
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE2 QTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 QTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMII
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE2 HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFN
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE2 PPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFA
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE2 TWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 TWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFL
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE2 ISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRM
2290 2300 2310 2320 2330 2340
2350
pF1KE2 EVLGCEAQDLY
:::::::::::
CCDS35 EVLGCEAQDLY
2350
>>CCDS1281.1 F5 gene_id:2153|Hs108|chr1 (2224 aa)
initn: 2214 init1: 458 opt: 1809 Z-score: 1965.0 bits: 377.5 E(32554): 3.9e-103
Smith-Waterman score: 3486; 31.8% identity (59.1% similar) in 2408 aa overlap (22-2346:32-2222)
10 20 30 40 50
pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPP
:..:..: .::.: :
CCDS12 FPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYR--------------P
10 20 30 40
60 70 80 90 100 110
pF1KE2 RVPKSFPFNTSVV-YKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNM
. : . .: ::. .:: .. :. . :. ::. ::::::. ::: : . . .::
CCDS12 E-PTNSSLNLSVTSFKKIVYREYEPY-FKKEKPQSTISGLLGPTLYAEVGDIIKVHFKNK
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE2 ASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDP
:..:.:.: :. : : :::: : :.: :: :: : :: .:: :.. ...:: .::
CCDS12 ADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSGPTHDDP
110 120 130 140 150 160
180 190 200 210 220
pF1KE2 LCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQ-TLHK-FILLFAVFDEGKSWH
:::. : :: .:..:.:::::: ::.:..:.:.. :: :. : ..::::::::.:::
CCDS12 PCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLFAVFDESKSW-
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE2 SETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSI
:.. .::: .::::::: ..: . : . . ::..::.. ::. ::
CCDS12 SQS-SSLM--------------YTVNGYVNGTMPDITVCAHDHISWHLLGMSSGPELFSI
230 240 250 260
290 300 310 320 330 340
pF1KE2 FLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSC
..:... .:. ... . : ::. . :.... .: . ::.::. . .:
CCDS12 HFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWIISSLTPKHLQAGMQAYIDIKNC
270 280 290 300 310 320
350 360 370 380 390 400
pF1KE2 PEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAE
:. . .: . .: ..: : : ..::::
CCDS12 PK----KTRN----------------------------LKKITREQRRHMKRWEYFIAAE
330 340 350
410 420 430 440 450 460
pF1KE2 EEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQ---HES
: :::::.. : :..:.::.:.: ..::..:::: . : ::.: :..... .:.
CCDS12 EVIWDYAPVIPANMDKKYRSQHLDNFSNQIGKHYKKVMYTQYEDESF-TKHTVNPNMKED
360 370 380 390 400 410
470 480 490 500 510 520
pF1KE2 GILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGIT--DVRPLYSRRLPKGVKHLKDFPIL
:::::.. ..: ::: :.:::.:::::.:::::.: . . . .: .. .
CCDS12 GILGPIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQ
420 430 440 450 460 470
530 540 550 560 570 580
pF1KE2 PGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGN
::: . :::.. : ::..: .:::: : : :.. ::.:::::: :::: ..:.:.::
CCDS12 PGETYTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGI
480 490 500 510 520 530
590 600 610 620 630 640
pF1KE2 QIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDS
: .: .. .:.:::::.:::: .::..: :: :. .::.: :::: .::::: .:
CCDS12 QRAADIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPES
540 550 560 570 580 590
650 660 670 680 690 700
pF1KE2 LQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSME
. :. :. ... :.. :.:.:...:.. :.:..: . .::::::::. ::.: ..:.
CCDS12 ITTLGFCFDDTVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMD
600 610 620 630 640 650
710 720 730 740 750
pF1KE2 NPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDI----SAYLLSK--NNAI
: : :.: ::. :.. . .. .: : ::::: . :. . .. .. .
CCDS12 NVGTWMLTSMNSSPRSKKLRLKFRDVKC---IPDDDEDSYEIFEPPESTVMATRKMHDRL
660 670 680 690 700 710
760 770 780 790 800
pF1KE2 EPRSFS-------QNSRHPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQNVSSSDL
::.. :: . ..: ... ... : . .: .. . :::.
CCDS12 EPEDEESDADYDYQNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGT---EFVSSNTD
720 730 740 750 760 770
810 820 830 840 850
pF1KE2 LMLLRQSPTPHGLS------LSDLQEA---KYETFSDDPSPGAIDSNNSLSEMT--HFRP
... . .: ..: :.. :.: . : . .: : .:. :. : : :
CCDS12 IIVGSNYSSPSNISKFTVNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSP
780 790 800 810 820 830
860 870 880 890 900 910
pF1KE2 QLHHSGDMVFTPE-SGLQLRLNEKLGTTAATE-LKKLDFKV--SSTSNNLISTIPSDNLA
. . . :. .:..: :. : . : :. :: ...... .: .
CCDS12 YSEDPIEDPLQPDVTGIRL-LSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHK
840 850 860 870 880
920 930 940 950 960 970
pF1KE2 AGTDNTSSLGPPS-MPVHYDSQLDTTLFGKKSSPLTESGGPLSLSEENNDSKLLESGLMN
.: ... : :: : : . : .. : . . : : ...:.::.: .
CCDS12 VGRHLSQDTGSPSGMRPWEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHL
890 900 910 920 930 940
980 990 1000 1010 1020 1030
pF1KE2 SQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTNKTSNNSATNRKTH
..:.. . ...:. : . :.. .:: . : .:: ...:. . .
CCDS12 ASEKGSYEIIQDTDEDT------AVNNWLISPQNASRAWGESTPLANKPGKQSGHPKFPR
950 960 970 980 990 1000
1040 1050 1060 1070 1080 1090
pF1KE2 IDGPSLLIENSPS---VWQNILESDTEFKKVTPLIHDRMLMDKNATALRLNHMSNKTTSS
. :: .... . . .. . :. :: : : .. :: . ... .
CCDS12 VRHKSLQVRQDGGKSRLKKSQFLIKTRKKKKEKHTHHAPLSPRTFHPLRSEAYNTFSERR
1010 1020 1030 1040 1050 1060
1100 1110 1120 1130 1140
pF1KE2 KNMEMVQQKK-EGPIPPDAQN--PDMSFFKMLFLPESARWIQRTHGKNSLN-SGQGPSPK
. .: .:. : .: : .. :.:.: . ::. :..:: : .::. :
CCDS12 LKHSLVLHKSNETSLPTDLNQTLPSMDFGWIASLPD--------HNQNSSNDTGQASCPP
1070 1080 1090 1100 1110
1150 1160 1170 1180 1190 1200
pF1KE2 QLV-SLGPEKSVEGQNF-LSEKNKV--VVGKGEFTKDVGLKEMV-FPSSRNLFLTNLDNL
: .. ::. :.: ... ... . .. ... :.::. . :.. : :.....
CCDS12 GLYQTVPPEEHY--QTFPIQDPDQMHSTSDPSHRSSSPELSEMLEYDRSHKSFPTDISQM
1120 1130 1140 1150 1160 1170
1210 1220 1230 1240 1250
pF1KE2 HENNTHNQEKKI----QEEIEKKETLIQENVVLPQIHTVTGTKNFMKNLFLLSTRQNVEG
.. :. . . .. . : : :. ::. . . ...::
CCDS12 SPSSEHEVWQTVISPDLSQVTLSPELSQTNLSPDLSHTTLSPELIQRNL-----------
1180 1190 1200 1210 1220
1260 1270 1280 1290 1300 1310
pF1KE2 SYDGAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRIS
: . :. :. . : . . ::. :. . .: : .:
CCDS12 SPALGQMPISPDLSHTTLSPDLS--HTT-------------LSLDLSQ--------TNLS
1230 1240 1250
1320 1330 1340 1350 1360 1370
pF1KE2 PNTSQQNFVTQRSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPST-LTQIDY
:. :: :. :: : .:: . . .: ..:. : ...:.: : :.: .
CCDS12 PELSQTNLSP-----ALGQ--MPLSPDLSHTTLSLDFSQTNLSPELSHMTLSPELSQTNL
1260 1270 1280 1290 1300 1310
1380 1390 1400 1410 1420 1430
pF1KE2 NEKEKGAITQSPLSDCLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLP
. :. : :.: : ::. . : ..... : . :. .: : : :
CCDS12 SP----ALGQMPISPDL--SHTTLS-----LDFSQTNLSPELSQTNLSPALGQMPLSPDP
1320 1330 1340 1350 1360
1440 1450 1460 1470 1480 1490
pF1KE2 AASYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKVEN
. . . : ...::: . ... : :. .. . .: ...
CCDS12 SHTTLSLD------------LSQTNLSPELSQTNLSPDLSEMPLFADLSQIPLT-PDLDQ
1370 1380 1390 1400
1500 1510 1520 1530 1540 1550
pF1KE2 TVLPKPDLPKTSGKVELLPKVHIYQKDLFPTETS-NGSPGHLDLVEGSLLQGTEGAIKWN
.: .::: :...: : .. : .: : .. . :: :. . .:: .
CCDS12 MTL-SPDL----GETDLSP--NFGQMSLSPDLSQVTLSP---DISDTTLLPDL------S
1410 1420 1430 1440 1450
1560 1570 1580 1590 1600 1610
pF1KE2 EANRPGKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKD
. . : . . .::: : ::. ... ..: . .: :: . .. .:
CCDS12 QISPPPDLDQIFYPSESS---QSLLLQ------EFNESFPYPDL-GQMPSPSSPTL--ND
1460 1470 1480 1490 1500
1620 1630 1640 1650 1660 1670
pF1KE2 TILSLNACESNHAIAAINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQ
:.:: : : : . : .:.: :. . . : ..:. . .
CCDS12 TFLS---KEFN------------PLVIVGLSKDG-TDYI--EIIP-----KEEVQSS--E
1510 1520 1530
1680 1690 1700 1710 1720 1730
pF1KE2 SDQEEIDY---DDTISVEMKKEDFDIYDEDENQSP--RSFQKKTRHYFIAAVERLWDYGM
.: :::: :: ..... . . : :. . :: . . :.:.::: : :::
CCDS12 DDYAEIDYVPYDDPYKTDVRTNINSSRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDY--
1540 1550 1560 1570 1580 1590
1740 1750 1760 1770 1780
pF1KE2 SSSPHVLRNR--AQSGSVPQ---FKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAE
: : :. .: ..:. .:::::... :..::. ::: .::::.::: ::::
CCDS12 --SEFVQRETDIEDSDDIPEDTTYKKVVFRKYLDSTFTKRDPRGEYEEHLGILGPIIRAE
1600 1610 1620 1630 1640 1650
1790 1800 1810 1820 1830
pF1KE2 VEDNIMVTFRNQASRPYSFYSSLISYE--------EDQRQGAEPRKNFVKPNETKTYFWK
:.: :.: :.: ::::::... .::: ::. . : :.:: . :: :.
CCDS12 VDDVIQVRFKNLASRPYSLHAHGLSYEKSSEGKTYEDDSPEWFKEDNAVQPNSSYTYVWH
1660 1670 1680 1690 1700 1710
1840 1850 1860 1870 1880 1890
pF1KE2 VQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFAL
. .. .: . :.::::.: :. :::.:::::::::.:. . :. . . ..::.:
CCDS12 ATERSGPESPGSACRAWAYYSAVNPEKDIHSGLIGPLLICQKGILHKDSNMPMDMREFVL
1720 1730 1740 1750 1760 1770
1900 1910 1920 1930 1940 1950
pF1KE2 FFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQ
.: ::: ::::. :.. :. . .. . .:....::::::.:. .:::: : ...
CCDS12 LFMTFDEKKSWYY----EKKSRS--SWRLTSSEMKKSHEFHAINGMIY-SLPGLKMYEQE
1780 1790 1800 1810 1820
1960 1970 1980 1990 2000 2010
pF1KE2 RIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRV
.: .::..:....:: .:: :... ......... : :: :.:.:: :: : : .
CCDS12 WVRLHLLNIGGSQDIHVVHFHGQTLLENGNKQHQLGVWPLLPGSFKTLEMKASKPGWWLL
1830 1840 1850 1860 1870 1880
2020 2030 2040 2050 2060 2070
pF1KE2 ECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGS
. .::. .:::.: ::... :. :.:...: : : :: :: : : :.::::. .::
CCDS12 NTEVGENQRAGMQTPFLIMDRDCRMPMGLSTGIISDSQIKASEFLGYWEPRLARLNNGGS
1890 1900 1910 1920 1930 1940
2080 2090 2100 2110 2120 2130
pF1KE2 INAWSTKE---PFS---WIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKW
::::... :. ::.::. .:: ::.::::.. ..: : ..: . :: . .:
CCDS12 YNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQTQGAKHYLKSCYTTEFYVAYSSNQINW
1950 1960 1970 1980 1990 2000
2140 2150 2160 2170 2180 2190
pF1KE2 QTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLN
: ..:::: ..: : :: :.: ::.: :.:::.:::::. ::. : :::.::.::..:
CCDS12 QIFKGNSTRNVMYFNGNSDASTIKENQFDPPIVARYIRISPTRAYNRPTLRLELQGCEVN
2010 2020 2030 2040 2050 2060
2200 2210 2220 2230 2240 2250
pF1KE2 SCSMPLGMESKAISDAQITASSYFTNMFAT-WSPSKARLHLQGRSNAWRPQVNNPKEWLQ
.:: :::::. : . ::::::. . .. : : .:::. ::: :::. ..:: :.::.
CCDS12 GCSTPLGMENGKIENKQITASSFKKSWWGDYWEPFRARLNAQGRVNAWQAKANNNKQWLE
2070 2080 2090 2100 2110 2120
2260 2270 2280 2290 2300
pF1KE2 VDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF-FQNGKV-KVFQGNQDS
.:. : :.:.. ::: ::: . :::: . : :..: .: . .... : :.:.:: ..
CCDS12 IDLLKIKKITAIITQGCKSLSSEMYVKSYTIHYSEQGVEWKPYRLKSSMVDKIFEGNTNT
2130 2140 2150 2160 2170 2180
2310 2320 2330 2340 2350
pF1KE2 FTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY
: : ..::...:..:. :..: ..::::.:..::.
CCDS12 KGHVKNFFNPPIISRFIRVIPKTWNQSIALRLELFGCDIY
2190 2200 2210 2220
>>CCDS44026.1 F8 gene_id:2157|Hs108|chrX (216 aa)
initn: 1414 init1: 1414 opt: 1414 Z-score: 1551.1 bits: 297.5 E(32554): 4.5e-80
Smith-Waterman score: 1414; 100.0% identity (100.0% similar) in 208 aa overlap (2144-2351:9-216)
2120 2130 2140 2150 2160 2170
pF1KE2 SLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPT
::::::::::::::::::::::::::::::
CCDS44 MRIQDPGKVFFGNVDSSGIKHNIFNPPIIARYIRLHPT
10 20 30
2180 2190 2200 2210 2220 2230
pF1KE2 HYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQG
40 50 60 70 80 90
2240 2250 2260 2270 2280 2290
pF1KE2 RSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF
100 110 120 130 140 150
2300 2310 2320 2330 2340 2350
pF1KE2 FQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY
160 170 180 190 200 210
>>CCDS64195.1 EDIL3 gene_id:10085|Hs108|chr5 (470 aa)
initn: 769 init1: 399 opt: 884 Z-score: 965.3 bits: 190.3 E(32554): 1.9e-47
Smith-Waterman score: 884; 44.9% identity (67.4% similar) in 325 aa overlap (2039-2349:147-470)
2010 2020 2030 2040 2050 2060
pF1KE2 PSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQ----YG-
::. :::. .: : . :::::. .:
CCDS64 PCKNGGICTDLVANYSCECPGEFMGRNCQYKCSGPLGIEGGIISNQQITASSTHRALFGL
120 130 140 150 160 170
2070 2080 2090 2100 2110 2120
pF1KE2 -QWAPKLARLHYSGSINAWSTKEP--FSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQF
.: : :::. .: ::::.. : . ::...: : . :. ::::.. : ::...
CCDS64 QKWYPYYARLNKKGLINAWTAAENDRWPWIQINLQRKMRVTGVITQGAKRIGSPEYIKSY
180 190 200 210 220 230
2130 2140 2150 2160 2170 2180
pF1KE2 IIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRST
: :: ::: : :. ..:. ::: ::.:.. : :.::: :.:.::.: . :
CCDS64 KIAYSNDGKTWAMYKVKGTNEDMVFRGNIDNNTPYANSFTPPIKAQYVRLYPQVCRRHCT
240 250 260 270 280 290
2190 2200 2210 2220 2230
pF1KE2 LRMELMGCDLNSCSMPLGMESKAISDAQITASSYFT----NMFATWSPSKARLHLQGRSN
:::::.::.:..:: ::::.: :.: :::::: : .:: :: : :::: ::. :
CCDS64 LRMELLGCELSGCSEPLGMKSGHIQDYQITASSIFRTLNMDMF-TWEPRKARLDKQGKVN
300 310 320 330 340 350
2240 2250 2260 2270 2280 2290
pF1KE2 AWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF--F
:: :. ..:::::. ::::. :::.:.. ..: . .. :.::..::..
CCDS64 AWTSGHNDQSQWLQVDLLVPTKVTGIITQGAKDFGHVQFVGSYKLAYSNDGEHWTVYQDE
360 370 380 390 400 410
2300 2310 2320 2330 2340 2350
pF1KE2 QNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY
.. : :::::: :. : : .:::. .:..:: : :: .:.:: :.::: ..
CCDS64 KQRKDKVFQGNFDNDTHRKNVIDPPIYARHIRILPWSWYGRITLRSELLGCTEEE
420 430 440 450 460 470
>>CCDS4062.1 EDIL3 gene_id:10085|Hs108|chr5 (480 aa)
initn: 769 init1: 399 opt: 884 Z-score: 965.1 bits: 190.3 E(32554): 1.9e-47
Smith-Waterman score: 884; 44.9% identity (67.4% similar) in 325 aa overlap (2039-2349:157-480)
2010 2020 2030 2040 2050 2060
pF1KE2 PSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQ----YG-
::. :::. .: : . :::::. .:
CCDS40 PCKNGGICTDLVANYSCECPGEFMGRNCQYKCSGPLGIEGGIISNQQITASSTHRALFGL
130 140 150 160 170 180
2070 2080 2090 2100 2110 2120
pF1KE2 -QWAPKLARLHYSGSINAWSTKEP--FSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQF
.: : :::. .: ::::.. : . ::...: : . :. ::::.. : ::...
CCDS40 QKWYPYYARLNKKGLINAWTAAENDRWPWIQINLQRKMRVTGVITQGAKRIGSPEYIKSY
190 200 210 220 230 240
2130 2140 2150 2160 2170 2180
pF1KE2 IIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRST
: :: ::: : :. ..:. ::: ::.:.. : :.::: :.:.::.: . :
CCDS40 KIAYSNDGKTWAMYKVKGTNEDMVFRGNIDNNTPYANSFTPPIKAQYVRLYPQVCRRHCT
250 260 270 280 290 300
2190 2200 2210 2220 2230
pF1KE2 LRMELMGCDLNSCSMPLGMESKAISDAQITASSYFT----NMFATWSPSKARLHLQGRSN
:::::.::.:..:: ::::.: :.: :::::: : .:: :: : :::: ::. :
CCDS40 LRMELLGCELSGCSEPLGMKSGHIQDYQITASSIFRTLNMDMF-TWEPRKARLDKQGKVN
310 320 330 340 350 360
2240 2250 2260 2270 2280 2290
pF1KE2 AWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLF--F
:: :. ..:::::. ::::. :::.:.. ..: . .. :.::..::..
CCDS40 AWTSGHNDQSQWLQVDLLVPTKVTGIITQGAKDFGHVQFVGSYKLAYSNDGEHWTVYQDE
370 380 390 400 410 420
2300 2310 2320 2330 2340 2350
pF1KE2 QNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY
.. : :::::: :. : : .:::. .:..:: : :: .:.:: :.::: ..
CCDS40 KQRKDKVFQGNFDNDTHRKNVIDPPIYARHIRILPWSWYGRITLRSELLGCTEEE
430 440 450 460 470 480
>>CCDS3141.1 CP gene_id:1356|Hs108|chr3 (1065 aa)
initn: 1433 init1: 469 opt: 819 Z-score: 887.8 bits: 177.1 E(32554): 3.9e-43
Smith-Waterman score: 1471; 34.1% identity (60.8% similar) in 766 aa overlap (5-736:6-724)
10 20 30 40 50
pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGE---LPVDARFPPRVPKS
:. .::: .. ..::.: .: .::: :: :: . ::.. ..
CCDS31 MKILILGIFLFLCSTP-AWAKEKHYYIGIIETTWDYA-SDHGEKKLISVDTEHSNIYLQN
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 FPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVS
: . .:::.:....::. : . .: :.:.::: :.::. : : . :::.::.: .
CCDS31 GPDRIGRLYKKALYLQYTDETFRTTIEKPVWLGFLGPIIKAETGDKVYVHLKNLASRPYT
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 LHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYS
.:. :..:.: ::: : :.:.. .. ::::.:: ..::. . .:..: .: :.:
CCDS31 FHSHGITYYKEHEGAIYPDNTTDFQRADDKVYPGEQYTYMLLATEEQSPGEGDGNCVTRI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 YLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHK-FILLFAVFDEGKSWHSETKNSL
: ::.: ::. ::::: :..:.. :: ::: . . . :...:.: ::. ::. : . .
CCDS31 YHSHIDAPKDIASGLIGPLIICKKDSLDKEKEKHIDREFVVMFSVVDENFSWYLEDNIKT
180 190 200 210 220 230
240 250 260 270 280
pF1KE2 MQ------DRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIF
. :.: . . .:..::::. ::::: : . : :...:::. .::. :
CCDS31 YCSEPEKVDKDNEDFQESNRMYSVNGYTFGSLPGLSMCAEDRVKWYLFGMGNEVDVHAAF
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE2 LEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCP
..:... .:.: .... : :.. : . .. :...: :. .: . :..:. .:. :
CCDS31 FHGQALTNKNYRIDTINLFPATLFDAYMVAQNPGEWMLSCQNLNHLKAGLQAFFQVQEC-
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 EEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEE
:. ..: .::. .: .::::::
CCDS31 --------NKSSSKD------------------------NIRGKHVRH-----YYIAAEE
360 370 380
410 420 430 440 450 460
pF1KE2 EDWDYAPL---------VLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREA
:.::: . :: . : . ....: ::: .:::. . ::: .: .:.
CCDS31 IIWNYAPSGIDIFTKENLTAPGSDS--AVFFEQGTTRIGGSYKKLVYREYTDASFTNRKE
390 400 410 420 430
470 480 490 500
pF1KE2 IQHES---GILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGI--------TDVRPLY---
: :::::....:::::. . :.:... : .: : :. : : :
CCDS31 RGPEEEHLGILGPVIWAEVGDTIRVTFHNKGAYPLSIEPIGVRFNKNNEGTYYSPNYNPQ
440 450 460 470 480 490
510 520 530 540 550 560
pF1KE2 SRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGL
:: .: ...: . : : : :.::: : :::..:: ::...: : :. .:. .::
CCDS31 SRSVPPSASH-----VAPTETFTYEWTVPKEVGPTNADPVCLAKMYYSAVEPTKDIFTGL
500 510 520 530 540 550
570 580 590 600 610 620
pF1KE2 IGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPE
:::. :: : :. : : ::. .. .:::::.: : .::. : : :. :: .
CCDS31 IGPMKICKKGSLHANGRQKDVDKEFYLFPTVFDENESLLLEDNIRMFTTAPDQVDKEDED
560 570 580 590 600 610
630 640 650 660 670 680
pF1KE2 FQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYED
:: :: :::.::... . :..: . . ::..: : ..: ...::: :. . .:
CCDS31 FQESNKMHSMNGFMYGNQPGLTMCKGDSVVWYLFSAGNEADVHGIYFSGNTYLWRGERRD
620 630 640 650 660 670
690 700 710 720 730 740
pF1KE2 TLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDI
: .::: .. :. : .. : . . : ..: . :: :..: ... :
CCDS31 TANLFPQTSLTLHMWPDTEGTFNVECLTTDHYTGGMKQKYTVNQCRRQSEDSTFYLGERT
680 690 700 710 720 730
750 760 770 780 790 800
pF1KE2 SAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQNVS
CCDS31 YYIAAVEVEWDYSPQREWEKELHHLQEQNVSNAFLDKGEFYIGSKYKKVVYRQYTDSTFR
740 750 760 770 780 790
>--
initn: 917 init1: 447 opt: 820 Z-score: 888.9 bits: 177.3 E(32554): 3.4e-43
Smith-Waterman score: 820; 36.0% identity (66.3% similar) in 344 aa overlap (1709-2039:726-1060)
1680 1690 1700 1710 1720 1730
pF1KE2 EEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYG----MSSSP
.: : :.::::: :::. .
CCDS31 NVECLTTDHYTGGMKQKYTVNQCRRQSEDSTFYLGERTYYIAAVEVEWDYSPQREWEKEL
700 710 720 730 740 750
1740 1750 1760 1770 1780
pF1KE2 HVLRNRAQSGSV---------PQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAE
: :... :.. ..::::....::..: :. : .::::.::: ..:.
CCDS31 HHLQEQNVSNAFLDKGEFYIGSKYKKVVYRQYTDSTFRVPVERKAEEEHLGILGPQLHAD
760 770 780 790 800 810
1790 1800 1810 1820 1830 1840
pF1KE2 VEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPT
: :.. . :.:.:.::::... .. : . . : . :.:: :: ::. .. .
CCDS31 VGDKVKIIFKNMATRPYSIHAHGVQTESST---VTP----TLPGETLTYVWKIPERSGAG
820 830 840 850 860
1850 1860 1870 1880 1890 1900
pF1KE2 KDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDET
.. : :::.: :: ::..:::::::.::. :. . :. ::::.: .:::.
CCDS31 TEDSACIPWAYYSTVDQVKDLYSGLIGPLIVCRRPYLKVFNPRRKL--EFALLFLVFDEN
870 880 890 900 910 920
1910 1920 1930 1940 1950 1960
pF1KE2 KSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLS
.:::. .:.. : ... .: : :. ..::::: .. .: ::.: ... :::..
CCDS31 ESWYLDDNIKTYSDHPEKVNKDDEEFIESNKMHAINGRMFGNLQGLTMHVGDEVNWYLMG
930 940 950 960 970 980
1970 1980 1990 2000 2010 2020
pF1KE2 MGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHL
::.. ..:..:: :: : ... :. .....::...:.::.: ::: ..: . .:.
CCDS31 MGNEIDLHTVHFHGHSFQYKHRGVYSSDVFDIFPGTYQTLEMFPRTPGIWLLHCHVTDHI
990 1000 1010 1020 1030 1040
2030 2040 2050 2060 2070 2080
pF1KE2 HAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKE
:::: : . : .:.
CCDS31 HAGMETTYTVLQNEDTKSG
1050 1060
>>CCDS44710.1 HEPHL1 gene_id:341208|Hs108|chr11 (1159 aa)
initn: 1750 init1: 600 opt: 813 Z-score: 880.6 bits: 175.9 E(32554): 9.9e-43
Smith-Waterman score: 1611; 34.6% identity (62.5% similar) in 847 aa overlap (10-824:15-810)
10 20 30 40 50
pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPK
:: : . ..:: ::.: :: :.:. . . . . ..
CCDS44 MPRKQPAGCIFLLTFLGLSGLVGTVTRTYYIGIVEEYWNYVPQGKNVITGKSFTEDKLAT
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 SF----PFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMA
: : . .:::... .::: ..: :.:::.:.::: ..::: :..:: :::.:
CCDS44 LFLERGPNRIGSIYKKAVYRRFTDGTYSIEIPKPPWLGFLGPILRAEVGDVIVIHLKNFA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 SHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPL
:.: ::: :: : : :::: : : :: :.:.:: : :: ..:::: : .: .: .:
CCDS44 SRPYSLHPHGVFYNKDSEGALYPDGTSGRNKNDDMVPPGKNYTYVWPVREEYAPTPADAN
130 140 150 160 170 180
180 190 200 210 220
pF1KE2 CLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAK---EKTQTLHKFILLFAVFDEGKSW-
:::. : ::.: ::. ::::: ::::.:: : . .... ..:...:.. ::..::
CCDS44 CLTWVYHSHIDAPKDICSGLIGPLLVCKEGILNRYSGTRNDVDREFVIMFTLVDENQSWY
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE2 ------HSETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGT
: :. . .. .::. :. :::..:::. ..: : .:: ::..:::.
CCDS44 LNENIKHFCTNPDSVDKKDAVFQRS-NKMHALNGYLFGNFPEPDMCVGESVSWHLFGMGN
250 260 270 280 290
290 300 310 320 330 340
pF1KE2 TPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEA
..:::.. :.::. :.:: ... : ::::.. . . :.... :..:.: . :: .
CCDS44 EIDIHSIYFYGNTFISRGHRTDVVNLFPATFLTTEMIAENPGKWMITCQVSDHLQAGMLG
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 YVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTW
.::.: . :. . .... ...
CCDS44 QYNVDNC------------------------KSDIF---------YPKMKGQQRRY----
360 370 380
410 420 430 440 450
pF1KE2 VHYIAAEEEDWDYAP-----LVLAPDDRSYKSQ--YLNNGPQRIGRKYKKVRFMAYTDET
.::::. ::::: . : . : ... :...: .::: :: :::. ..: :
CCDS44 --FIAAEKILWDYAPQGYNKFSGLPLNASGSDSDLYFTQGDNRIGGKYWKVRYTEFVDAT
390 400 410 420 430 440
460 470 480 490 500
pF1KE2 FKTREAIQHES---GILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGI-----TDVRPLY
: :. .. : :::::.. .:::::::. : :.:.. :.: :::. .:. :
CCDS44 FTKRKRLSAEEAHLGILGPVIKAEVGDTLLVTFANKADKVYSILPHGVIYDKASDAAPNL
450 460 470 480 490 500
510 520 530 540 550 560
pF1KE2 SRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGL
. . :. :.: ::: : ::::: .:: .:: ::: : : :. .: .:::
CCDS44 DGFVKPGA-HVK-----PGETFTYKWTVPESVSPTAGDPPCLTYLYFSAVDPIKDTSSGL
510 520 530 540 550
570 580 590 600 610 620
pF1KE2 IGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPE
.::::.: : .. :.: ::. .::.::::: : :. ::::.:. .: ... :: :
CCDS44 VGPLLVCKKGVLNADGTQKGIDKEFYLLFTVFDENLSRYFDENIQKFIWHPFSIDKEDKE
560 570 580 590 600 610
630 640 650 660 670 680
pF1KE2 FQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYED
: :: ::..:::.. . :..: .. . :.....:..::. .. :.: :.. . ...:
CCDS44 FVKSNRMHAVNGYMYGNQPGLNMCKRDRVSWHLIGLGTDTDMHGIVFQGNTIHLRGTHRD
620 630 640 650 660 670
690 700 710 720 730 740
pF1KE2 TLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDI
.:.::: . :.::. .. :.. . : . .::: . .:::::. : :. : :
CCDS44 SLALFPHMATTAFMQPDHAGIFRVFCATMPHLSRGMGQIYEVSSCDNR--DPSEQRYGMI
680 690 700 710 720 730
750 760 770 780 790 800
pF1KE2 SAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDI--EKTDPWFAHRTPMPKIQN
.. .. .. .: ... : .. .... .: ..:: ..:. :.. . ..
CCDS44 RTFYIAAEE-VE-WDYAPN-KNWEFEKQHVDARGERHGDIFMNRTENWIGSQYKKVVYRE
740 750 760 770 780
810 820 830 840 850 860
pF1KE2 VSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPSPGAIDSNNSLSEMTHFRPQLHHS
...... . . : . : :
CCDS44 YTDGEFVEIKARPPREEHLELLGPMIHAEVGNTVLIIFKNKASRPYSISAQGVEEMDSGK
790 800 810 820 830 840
>--
initn: 769 init1: 600 opt: 710 Z-score: 767.9 bits: 155.0 E(32554): 1.9e-36
Smith-Waterman score: 710; 38.4% identity (74.1% similar) in 263 aa overlap (1778-2038:811-1068)
1750 1760 1770 1780 1790 1800
pF1KE2 QFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSS
:::.:.::: ..... :.:.::::::. ..
CCDS44 QYKKVVYREYTDGEFVEIKARPPREEHLELLGPMIHAEVGNTVLIIFKNKASRPYSISAQ
790 800 810 820 830 840
1810 1820 1830 1840 1850 1860
pF1KE2 LISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVH
. :.. .: . . ..::.:.::: :.. .. .: .. .: :.:.: :.. ::..
CCDS44 GV---EEMDSGKQFQVPMTKPGEVKTYRWNIPKRSGPGPSDPNCIPWVYYSTVNFVKDTY
850 860 870 880 890
1870 1880 1890 1900 1910 1920
pF1KE2 SGLIGPLLVCHTNTLNPAHGRQVTVQ-EFALFFTIFDETKSWYFTENMERNC-RAPCNIQ
:::.:::..:. ..:: .::. :. ::::.: .:.:..:::. .:... . : ...
CCDS44 SGLMGPLITCRKGVLNE-KGRRSDVDYEFALLFLVFNENESWYLDDNIKKYLNKDPRDFK
900 910 920 930 940 950
1930 1940 1950 1960 1970 1980
pF1KE2 MEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVR
: :.:. :.::::: :. .: ::.: .: ::::..::. .::.::. .. : .
CCDS44 RTDD-FEESNRMHAINGKIFGNLHGLIMNEDTMTNWYLLGIGSEVDIHTIHYHAESFLFK
960 970 980 990 1000 1010
1990 2000 2010 2020 2030 2040
pF1KE2 KKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLG
. :. .:.:.::.:.:.:.. .. : : ..: ...:.:::: : . : :
CCDS44 IDKSYREDVYDLFPGTFQTIELFADHPGTWLLHCHVSDHIHAGMETTYTVLRNIDNRIPY
1020 1030 1040 1050 1060 1070
2050 2060 2070 2080 2090 2100
pF1KE2 MASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKT
CCDS44 STTSPGVASHPATVPSNERPGKEQLYFFGKNLGPTGAKAALVILFIIGLLLLITTVILSL
1080 1090 1100 1110 1120 1130
>>CCDS14385.1 HEPH gene_id:9843|Hs108|chrX (891 aa)
initn: 1409 init1: 390 opt: 637 Z-score: 690.1 bits: 140.3 E(32554): 4.1e-32
Smith-Waterman score: 1339; 34.0% identity (59.1% similar) in 745 aa overlap (22-729:113-797)
10 20 30 40
pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDY--MQSDLGELPVDARF
:.:.. : :..::: : : : . :
CCDS14 NSHFRDGMQALYKVKSCSMAPPVDLLTGKVRQYFIEAHEIQWDYGPMGHD-GSTGKNLRE
90 100 110 120 130 140
50 60 70 80 90 100
pF1KE2 PPRVP-KSFPFNTSVV---YKKTLFVEFTDHLFN--IAKPRPPWMGLLGPTIQAEVYDTV
: . : : ..: . : :. . : :. :. . . .:.:::.:.::: ::.
CCDS14 PGSISDKFFQKSSSRIGGTYWKVRYEAFQDETFQEKMHLEEDRHLGILGPVIRAEVGDTI
150 160 170 180 190 200
110 120 130 140 150 160
pF1KE2 VITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQR---EKEDDKVFPGGSHTYVWQVL
... : ::.: :.. :: : : ::. :.: .: : .:: :: : :
CCDS14 QVVFYNRASQPFSMQPHGVFYEKDYEGTVYNDGSSYPGLVAKPFEKV------TYRWTVP
210 220 230 240 250
170 180 190 200 210
pF1KE2 KENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQ--TLHKFILLF
. :: :.:: :::. :.: .: ..: ::::.: ::::: :.:. . : . ..:.:::
CCDS14 PHAGPTAQDPACLTWMYFSAADPIRDTNSGLVGPLLVCRAGALGADGKQKGVDKEFFLLF
260 270 280 290 300 310
220 230 240 250 260 270
pF1KE2 AVFDEGKSWHSET-KNSLMQD-----RDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSV
.:.::.:::.:.. . . : : .: . . .::..::.. .:: : :. .:
CCDS14 TVLDENKSWYSNANQAAAMLDFRLLSEDIEGFQDSNRMHAINGFLFSNLPRLDMCKGDTV
320 330 340 350 360 370
280 290 300 310 320 330
pF1KE2 YWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHIS
::..:.:: .::.....:.: ... :... . : ::. : .:: : ..:. .
CCDS14 AWHLLGLGTETDVHGVMFQGNTVQLQGMRKGAAMLFPHTFVMAIMQPDNLGTFEIYCQAG
380 390 400 410 420 430
340 350 360 370 380 390
pF1KE2 SHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRS
::.. ::.: .:..:: ...: .:
CCDS14 SHREAGMRAIYNVSQCP---------GHQA---------------------TPR------
440 450
400 410 420 430 440
pF1KE2 VAKKHPKTWVHYIAAEEEDWDYAPLVL-------APDDRSYKSQYLNNGPQRIGRKYKKV
... . ..:: ::: .::: : . :: .:.: .: .:::.
CCDS14 --QRYQAARIYYIMAEEVEWDYCPDRSWEREWHNQSEKDSYGYIFLSNKDGLLGSRYKKA
460 470 480 490 500 510
450 460 470 480 490
pF1KE2 RFMAYTDETFKT---REAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGI---
: ::: ::. : . ... ::::::. ::::: : ..:::.:::::... ::.
CCDS14 VFREYTDGTFRIPRPRTGPEEHLGILGPLIKGEVGDILTVVFKNNASRPYSVHAHGVLES
520 530 540 550 560 570
500 510 520 530 540 550
pF1KE2 TDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNME
: : :: .. :::. :.:.. ..:: .: :.. : : :.
CCDS14 TTVWPLAAE---------------PGEVVTYQWNIPERSGPGPNDSACVSWIYYSAVDPI
580 590 600 610 620
560 570 580 590 600 610
pF1KE2 RDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRF-LPNPA
.:. :::.::: :: : .. .:.. :.. ..:: .::::.:::: ::. .:.
CCDS14 KDMYSGLVGPLAICQKGILEPHGGRSDMDREFALLFLIFDENKSWYLEENVATHGSQDPG
630 640 650 660 670 680
620 630 640 650 660 670
pF1KE2 GVQLEDPEFQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTF
...:.: : :: ::.::: .. .:. :.. : . ::.:..: ..:. .. : . .:
CCDS14 SINLQDETFLESNKMHAINGKLYANLRGLTMYQGERVAWYMLAMGQDVDLHTIHFHAESF
690 700 710 720 730 740
680 690 700 710 720 730
pF1KE2 KHKM---VYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNT
.. :.. ::: . :.: : ::: :.. :: .: . :: .:. : :
CCDS14 LYRNGENYRADVVDLFPGTFEVVEMVASNPGTWLMHCHVTDHVHAGMETLFTVFSRTEHL
750 760 770 780 790 800
740 750 760 770 780 790
pF1KE2 GDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDIEKTDPWFAH
CCDS14 SPLTVITKETEKAVPPRDIEEGNVKMLGMQIPIKNVEMLASVLVAISVTLLLVVLALGGV
810 820 830 840 850 860
>>CCDS65277.1 HEPH gene_id:9843|Hs108|chrX (969 aa)
initn: 1628 init1: 455 opt: 555 Z-score: 599.8 bits: 123.7 E(32554): 4.4e-27
Smith-Waterman score: 1353; 31.2% identity (54.4% similar) in 861 aa overlap (20-729:27-875)
10 20 30 40
pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSD---LGELPVDARF-
::: :::: ...:.: . . . :.:. .
CCDS65 MWAMESGHLLWALLFMQSLWPQLTDGATRVYYLGIRDVQWNYAPKGRNVITNQPLDSDIV
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 PPRVPKSFPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKN
:: . .::::.. :. : .. .: :.:.:::..:::: :...: :::
CCDS65 ASSFLKSDKNRIGGTYKKTIYKEYKDDSYTDEVAQPAWLGFLGPVLQAEVGDVILIHLKN
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE2 MASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASD
.:..: ..: :: : : :::. : : .: : ::.: ::::: : : . . ..: .:
CCDS65 FATRPYTIHPHGVFYEKDSEGSLYPDGSSGPLKADDSVPPGGSHIYNWTIPEGHAPTDAD
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE2 PLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSL----AKEKTQTLHKFILLFAVFDEGK
: :::. : :::: .:. .:::: :..:..:.: .. .. : :.:::.: ::.
CCDS65 PACLTWIYHSHVDAPRDIATGLIGPLITCKRGALDGNSPPQRQDVDHDFFLLFSVVDENL
190 200 210 220 230 240
230 240 250 260 270
pF1KE2 SWH------SETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGM
::: . .. :.. . . .::..::.: .:: : : .: : ::..::
CCDS65 SWHLNENIATYCSDPASVDKEDETFQESNRMHAINGFVFGNLPELNMCAQKRVAWHLFGM
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE2 GTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGM
:. .::. :..:. . .:.:. .: : ::.::. . . : .:. :...:: .:::
CCDS65 GNEIDVHTAFFHGQMLTTRGHHTDVANIFPATFVTAEMVPWEPGTWLISCQVNSHFRDGM
310 320 330 340 350 360
340 350 360
pF1KE2 EAYVKVDSCPEEPQLRM-----------------------------KNNEEA--------
.: :: :: : . . :: .:
CCDS65 QALYKVKSCSMAPPVDLLTGKVRQYFIEAHEIQWDYGPMGHDGSTGKNLREPGSISDKFF
370 380 390 400 410 420
370 380
pF1KE2 ----------------EDYDDDLTDSEM-----------------------DVVRFDDDN
: ..:. . .: .:: .. .
CCDS65 QKSSSRIGGTYWKVRYEAFQDETFQEKMHLEEDRHLGILGPVIRAEVGDTIQVVFYNRAS
430 440 450 460 470 480
390
pF1KE2 SPSFIQIRSV---------------------AKKH--------------------PK---
.: .: ..: : .: :.
CCDS65 QPFSMQPHGVFYEKDYEGTVYNDGTFEIYCQAGSHREAGMRAIYNVSQCPGHQATPRQRY
490 500 510 520 530 540
400 410 420 430 440 450
pF1KE2 --TWVHYIAAEEEDWDYAPLVL-------APDDRSYKSQYLNNGPQRIGRKYKKVRFMAY
. ..:: ::: .::: : . :: .:.: .: .:::. : :
CCDS65 QAARIYYIMAEEVEWDYCPDRSWEREWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREY
550 560 570 580 590 600
460 470 480 490 500
pF1KE2 TDETFKT---REAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYS
:: ::. : . ... ::::::. ::::: : ..:::.:::::... ::. . ..
CCDS65 TDGTFRIPRPRTGPEEHLGILGPLIKGEVGDILTVVFKNNASRPYSVHAHGVLESTTVW-
610 620 630 640 650
510 520 530 540 550 560
pF1KE2 RRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLI
: ... :::. :.:.. ..:: .: :.. : : :. .:. :::.
CCDS65 ---PLAAE--------PGEVVTYQWNIPERSGPGPNDSACVSWIYYSAVDPIKDMYSGLV
660 670 680 690 700
570 580 590 600 610 620
pF1KE2 GPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRF-LPNPAGVQLEDPE
::: :: : .. .:.. :.. ..:: .::::.:::: ::. .:....:.:
CCDS65 GPLAICQKGILEPHGGRSDMDREFALLFLIFDENKSWYLEENVATHGSQDPGSINLQDET
710 720 730 740 750 760
630 640 650 660 670 680
pF1KE2 FQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKM---V
: :: ::.::: .. .:. :.. : . ::.:..: ..:. .. : . .: ..
CCDS65 FLESNKMHAINGKLYANLRGLTMYQGERVAWYMLAMGQDVDLHTIHFHAESFLYRNGENY
770 780 790 800 810 820
690 700 710 720 730 740
pF1KE2 YEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSY
:.. ::: . :.: : ::: :.. :: .: . :: .:. : :
CCDS65 RADVVDLFPGTFEVVEMVASNPGTWLMHCHVTDHVHAGMETLFTVFSRTEHLSPLTVITK
830 840 850 860 870 880
750 760 770 780 790 800
pF1KE2 EDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQ
CCDS65 ETEKAVPPRDIEEGNVKMLGMQIPIKNVEMLASVLVAISVTLLLVVLALGGVVWYQHRQR
890 900 910 920 930 940
>>CCDS48133.1 HEPH gene_id:9843|Hs108|chrX (1160 aa)
initn: 1758 init1: 455 opt: 555 Z-score: 598.4 bits: 123.7 E(32554): 5.2e-27
Smith-Waterman score: 868; 39.2% identity (66.5% similar) in 355 aa overlap (1706-2044:727-1075)
1680 1690 1700 1710 1720 1730
pF1KE2 SDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSP-
.::. . .: :.: : : ::: . :
CCDS48 TFEIYCQAGSHREAGMRAIYNVSQCPGHQATPRQRYQAARIYYIMAEEVEWDYCPDRSWE
700 710 720 730 740 750
1740 1750 1760 1770 1780
pF1KE2 ---HVLRNRAQSGSV----------PQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPY
: .. . : . ..::.::.:.:::.: : : .::::.:::
CCDS48 REWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGTFRIPRPRTGPEEHLGILGPL
760 770 780 790 800 810
1790 1800 1810 1820 1830 1840
pF1KE2 IRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHH
:..:: : . :.:.:.:::::: .. . . . : ..:.:. :: :.. ..
CCDS48 IKGEVGDILTVVFKNNASRPYSVHAHGVL----ESTTVWPLA--AEPGEVVTYQWNIPER
820 830 840 850 860 870
1850 1860 1870 1880 1890 1900
pF1KE2 MAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTI
.: .. : .: :.: :: ::..:::.::: .:. . :.: ::. .::::.: :
CCDS48 SGPGPNDSACVSWIYYSAVDPIKDMYSGLVGPLAICQKGILEPHGGRSDMDREFALLFLI
880 890 900 910 920 930
1910 1920 1930 1940 1950 1960
pF1KE2 FDETKSWYFTENMERN-CRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIR
:::.::::. ::. . . : .:...: :: :. ..::::: .. .: ::.: : .:.
CCDS48 FDENKSWYLEENVATHGSQDPGSINLQDETFLESNKMHAINGKLYANLRGLTMYQGERVA
940 950 960 970 980 990
1970 1980 1990 2000 2010 2020
pF1KE2 WYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECL
::.:.::.. ..:.::: .. : :. :.:. . .:.::.::.:::. :. : : ..:
CCDS48 WYMLAMGQDVDLHTIHFHAESFLYRNGENYRADVVDLFPGTFEVVEMVASNPGTWLMHCH
1000 1010 1020 1030 1040 1050
2030 2040 2050 2060 2070
pF1KE2 IGEHLHAGMSTLFLVYSNKCQ-TPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSIN
. .:.:::: ::: :.: . .::
CCDS48 VTDHVHAGMETLFTVFSRTEHLSPLTVITKETEKVPPRDIEEGNVKMLGMQIPIKNVEML
1060 1070 1080 1090 1100 1110
>--
initn: 1758 init1: 455 opt: 827 Z-score: 895.9 bits: 178.7 E(32554): 1.4e-43
Smith-Waterman score: 1444; 34.8% identity (61.4% similar) in 739 aa overlap (20-730:27-721)
10 20 30 40
pF1KE2 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSD---LGELPVDARF-
::: :::: ...:.: . . . :.:. .
CCDS48 MWAMESGHLLWALLFMQSLWPQLTDGATRVYYLGIRDVQWNYAPKGRNVITNQPLDSDIV
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 PPRVPKSFPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKN
:: . .::::.. :. : .. .: :.:.:::..:::: :...: :::
CCDS48 ASSFLKSDKNRIGGTYKKTIYKEYKDDSYTDEVAQPAWLGFLGPVLQAEVGDVILIHLKN
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE2 MASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASD
.:..: ..: :: : : :::. : : .: : ::.: ::::: : : . . ..: .:
CCDS48 FATRPYTIHPHGVFYEKDSEGSLYPDGSSGPLKADDSVPPGGSHIYNWTIPEGHAPTDAD
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE2 PLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSL----AKEKTQTLHKFILLFAVFDEGK
: :::. : :::: .:. .:::: :..:..:.: .. .. : :.:::.: ::.
CCDS48 PACLTWIYHSHVDAPRDIATGLIGPLITCKRGALDGNSPPQRQDVDHDFFLLFSVVDENL
190 200 210 220 230 240
230 240 250 260 270
pF1KE2 SWH------SETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGM
::: . .. :.. . . .::..::.: .:: : : .: : ::..::
CCDS48 SWHLNENIATYCSDPASVDKEDETFQESNRMHAINGFVFGNLPELNMCAQKRVAWHLFGM
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE2 GTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGM
:. .::. :..:. . .:.:. .: : ::.::. . . : .:. :...:: .:::
CCDS48 GNEIDVHTAFFHGQMLTTRGHHTDVANIFPATFVTAEMVPWEPGTWLISCQVNSHFRDGM
310 320 330 340 350 360
340 350 360 370 380 390
pF1KE2 EAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPK
.: :: :: : . : :: ..:.
CCDS48 QALYKVKSCSMAPPV------------DLLTG-----------------KVRQ-------
370 380
400 410 420 430 440 450
pF1KE2 TWVHYIAAEEEDWDYAPL----VLAPDDR---SYKSQYLNNGPQRIGRKYKKVRFMAYTD
..: :.: .:::.:. . . : : ........ .::: : :::. :. :
CCDS48 ---YFIEAHEIQWDYGPMGHDGSTGKNLREPGSISDKFFQKSSSRIGGTYWKVRYEAFQD
390 400 410 420 430 440
460 470 480 490 500 510
pF1KE2 ETFKTREAIQHES--GILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRL
:::. . .... :::::.. .:::::. ..: :.::.:... :::. . .
CCDS48 ETFQEKMHLEEDRHLGILGPVIRAEVGDTIQVVFYNRASQPFSMQPHGVFYEKDYEGTVY
450 460 470 480 490 500
520 530 540 550 560
pF1KE2 PKGVKHLKDFPIL---PGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLI
: ...: : : : :.::: . ::: .:: ::: .: : .. :: :::.
CCDS48 NDG----SSYPGLVAKPFEKVTYRWTVPPHAGPTAQDPACLTWMYFSAADPIRDTNSGLV
510 520 530 540 550
570 580 590 600 610 620
pF1KE2 GPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPE-
::::.: .. :.: ::. .::.:.:::.::: . : . . .. :: :
CCDS48 GPLLVCRAGALGADGKQKGVDKEFFLLFTVLDENKSWYSNANQAAAMLDFRLLS-EDIEG
560 570 580 590 600 610
630 640 650 660 670 680
pF1KE2 FQASNIMHSINGYVFDSL-QLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYED
:: :: ::.:::..:..: .:..: ... :..:..:..:: .:.:.: : . . . .
CCDS48 FQDSNRMHAINGFLFSNLPRLDMCKGDTVAWHLLGLGTETDVHGVMFQGNTVQLQGMRKG
620 630 640 650 660 670
690 700 710 720 730 740
pF1KE2 TLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDI
. ::: . ..:. .: : . . :. .. :. :: :. .::.:
CCDS48 AAMLFPHTFVMAIMQPDNLGTFEIYCQAGSHREAGMRAIYNVSQCPGHQATPRQRYQAAR
680 690 700 710 720 730
750 760 770 780 790 800
pF1KE2 SAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQNVS
CCDS48 IYYIMAEEVEWDYCPDRSWEREWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGT
740 750 760 770 780 790
2351 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 19:41:38 2016 done: Mon Nov 7 19:41:39 2016
Total Scan time: 3.890 Total Display time: 0.570
Function used was FASTA [36.3.4 Apr, 2011]