FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1675, 1276 aa
1>>>pF1KA1675 1276 - 1276 aa - 1276 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.3421+/-0.00117; mu= 2.4857+/- 0.070
mean_var=421.9430+/-86.677, 0's: 0 Z-trim(114.0): 788 B-trim: 817 in 1/52
Lambda= 0.062438
statistics sampled from 13729 (14607) to 13729 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.75), E-opt: 0.2 (0.449), width: 16
Scan time: 4.600
The best scores are: opt bits E(32554)
CCDS41236.2 PRDM16 gene_id:63976|Hs108|chr1 (1276) 8833 811.4 0
CCDS44048.2 PRDM16 gene_id:63976|Hs108|chr1 (1257) 8541 785.1 0
CCDS54670.1 MECOM gene_id:2122|Hs108|chr3 (1116) 1916 188.3 9.9e-47
CCDS54669.1 MECOM gene_id:2122|Hs108|chr3 (1042) 1824 179.9 2.9e-44
CCDS3205.1 MECOM gene_id:2122|Hs108|chr3 (1051) 1686 167.5 1.6e-40
>>CCDS41236.2 PRDM16 gene_id:63976|Hs108|chr1 (1276 aa)
initn: 8833 init1: 8833 opt: 8833 Z-score: 4319.2 bits: 811.4 E(32554): 0
Smith-Waterman score: 8833; 99.9% identity (99.9% similar) in 1276 aa overlap (1-1276:1-1276)
10 20 30 40 50 60
pF1KA1 MRSKARARKLAKSDGDVVNNMYEPNRDLLASHSAEDEAEDSAMSPIPVGPPSPFPTSEDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 MRSKARARKLAKSDGDVVNNMYEPNRDLLASHSAEDEAEDSAMSPIPVGPPSPFPTSEDF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 TPKEGSPYEAPVYIPEDIPIPADFELRESSIPGAGLGVWAKRKMEAGERLGPCVVVPRAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 TPKEGSPYEAPVYIPEDIPIPADFELRESSIPGAGLGVWAKRKMEAGERLGPCVVVPRAA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 AKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVACSCDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 AKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVACSCDD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 QNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 QNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 SKLDLRRHKKYTCGSVGAALYEGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 SKLDLRRHKKYTCGSVGAALYEGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 VIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 VIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 VGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 VGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 TQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 TQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNH
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 ASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTPLLKSPLN
:::::::::::::::::::::::::::::::::::::::::::::::::::: :::::::
CCDS41 ASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTSLLKSPLN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 HTQDAKLPSPLGNPALPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 HTQDAKLPSPLGNPALPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMSD
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 GSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 GSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAPN
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 SVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGPGFMGMQEKKLGSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 SVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGPGFMGMQEKKLGSLP
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 YHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTKPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 YHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTKPK
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA1 DVKPILPMPKGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVYGERKLGAGEGLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 DVKPILPMPKGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVYGERKLGAGEGLP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA1 QVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSPLLFHPQMSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 QVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSPLLFHPQMSA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KA1 IETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCRYCGKIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 IETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCRYCGKIF
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KA1 PRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCNRCFGQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 PRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCNRCFGQQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KA1 TNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNHALLDEKEDSYFSEIRNFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 TNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNHALLDEKEDSYFSEIRNFI
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KA1 ANSEMNQASTRTEKRADMQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDEDSLAGKSQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 ANSEMNQASTRTEKRADMQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDEDSLAGKSQD
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KA1 DTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMPTFGKGLDLRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 DTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMPTFGKGLDLRR
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KA1 AAEEAFEVKDVLNSTLDSEALKHTLCRQAKNQAYAMMLSLSEDTPLHTPSQGSLDAWLKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 AAEEAFEVKDVLNSTLDSEALKHTLCRQAKNQAYAMMLSLSEDTPLHTPSQGSLDAWLKV
1210 1220 1230 1240 1250 1260
1270
pF1KA1 TGATSESGAFHPINHL
::::::::::::::::
CCDS41 TGATSESGAFHPINHL
1270
>>CCDS44048.2 PRDM16 gene_id:63976|Hs108|chr1 (1257 aa)
initn: 8541 init1: 8541 opt: 8541 Z-score: 4177.1 bits: 785.1 E(32554): 0
Smith-Waterman score: 8662; 98.4% identity (98.4% similar) in 1276 aa overlap (1-1276:1-1257)
10 20 30 40 50 60
pF1KA1 MRSKARARKLAKSDGDVVNNMYEPNRDLLASHSAEDEAEDSAMSPIPVGPPSPFPTSEDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MRSKARARKLAKSDGDVVNNMYEPNRDLLASHSAEDEAEDSAMSPIPVGPPSPFPTSEDF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 TPKEGSPYEAPVYIPEDIPIPADFELRESSIPGAGLGVWAKRKMEAGERLGPCVVVPRAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TPKEGSPYEAPVYIPEDIPIPADFELRESSIPGAGLGVWAKRKMEAGERLGPCVVVPRAA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 AKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVACSCDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVACSCDD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 QNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 SKLDLRRHKKYTCGSVGAALYEGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SKLDLRRHKKYTCGSVGAALYEGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 VIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 VGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 TQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNH
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 ASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTPLLKSPLN
:::::::::::::::::::::::::::::::::::::::::::::::::::: :::::::
CCDS44 ASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTSLLKSPLN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 HTQDAKLPSPLGNPALPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HTQDAKLPSPLGNPALPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMSD
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 GSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAPN
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 SVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGPGFMGMQEKKLGSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGPGFMGMQEKKLGSLP
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 YHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTKPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 YHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTKPK
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA1 DVKPILPMPKGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVYGERKLGAGEGLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DVKPILPMPKGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVYGERKLGAGEGLP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA1 QVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSPLLFHPQMSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSPLLFHPQMSA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KA1 IETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCRYCGKIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 IETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCRYCGKIF
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KA1 PRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCNRCFGQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCNRCFGQQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KA1 TNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNHALLDEKEDSYFSEIRNFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNHALLDEKEDSYFSEIRNFI
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KA1 ANSEMNQASTRTEKRADMQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDEDSLAGKSQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ANSEMNQASTRTEKRADMQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDEDSLAGKSQD
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KA1 DTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMPTFGKGLDLRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMPTFGKGLDLRR
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KA1 AAEEAFEVKDVLNSTLDSEALKHTLCRQAKNQAYAMMLSLSEDTPLHTPSQGSLDAWLKV
:::::::::::::::::::::::::::::::: :::::::::
CCDS44 AAEEAFEVKDVLNSTLDSEALKHTLCRQAKNQ-------------------GSLDAWLKV
1210 1220 1230 1240
1270
pF1KA1 TGATSESGAFHPINHL
::::::::::::::::
CCDS44 TGATSESGAFHPINHL
1250
>>CCDS54670.1 MECOM gene_id:2122|Hs108|chr3 (1116 aa)
initn: 2395 init1: 834 opt: 1916 Z-score: 952.5 bits: 188.3 E(32554): 9.9e-47
Smith-Waterman score: 3829; 52.9% identity (74.6% similar) in 1154 aa overlap (147-1276:2-1116)
120 130 140 150 160 170
pF1KA1 PRAAAKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVAC
: ... . :::.::.: .:::::::: :
CCDS54 MILDEFYNVKFCIDASQPDVGSWLKYIRFAG
10 20 30
180 190 200 210 220 230
pF1KA1 SCDDQNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECD
:..::. :::..::.:.:. :: ::::::. .: :: :. : . :: .::..::
CCDS54 CYDQHNLVACQINDQIFYRVVADIAPGEELLLFMKSEDYPHETMAPDIHEERQYRCEDCD
40 50 60 70 80 90
240 250 260 270 280 290
pF1KA1 ELFQSKLDLRRHKKYTCGSVGAALY---EGLAEELKPEGLGGGSGQAHECKDCERMFPNK
.::.:: .: :.:. :.. .:. : . ..:. :. .:::.:...::.
CCDS54 QLFESKAELADHQKFPCSTPHSAFSMVEEDFQQKLESENDLQEIHTIQECKECDQVFPDL
100 110 120 130 140 150
300 310 320 330 340 350
pF1KA1 YSLEQHMVIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVK-VFTDPSNL
:::.::. :::::::::::::::::::::::::::::::::..:::::.: ::::::::
CCDS54 QSLEKHMLSHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKHYECENCAKQVFTDPSNL
160 170 180 190 200 210
360 370 380 390 400 410
pF1KA1 QRHIRSQHVGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRH
:::::::::::::::::.:::::::::::::::::::.::::::::::::::::::::::
CCDS54 QRHIRSQHVGARAHACPECGKTFATSSGLKQHKHIHSSVKPFICEVCHKSYTQFSNLCRH
220 230 240 250 260 270
420 430 440 450 460 470
pF1KA1 KRMHADCRTQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKA
::::::::::::::::::::::::::::::::::::::.. ::.:. :. : .: :::.
CCDS54 KRMHADCRTQIKCKDCGQMFSTTSSLNKHRRFCEGKNHFAAGGFFGQGISLPGTPAMDKT
280 290 300 310 320 330
480 490 500 510 520 530
pF1KA1 KPSPSLNHASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPT
. ...::. :. .:: . ::..: : :: :... .:::.:: .:: ::::.: .
CCDS54 SMV-NMSHANPGLADYFGANRHPAGLTF----PTAPGFSFSFPGLFPSGLYHRPPLIPAS
340 350 360 370 380
540 550 560 570 580 590
pF1KA1 PLLKSPLNHTQDAKLPSPL-GNPA-LPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEK
.:. . : : ::: .: :: .. . .. . ..: .. : . : : :.
CCDS54 SPVKGLSSTEQTNKSQSPLMTHPQILPATQDILKA-LSKHPSVGDNKPVELQPERSSEER
390 400 410 420 430 440
600 610 620 630 640 650
pF1KA1 LKTRSSDMSDGSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFG
. ::.:..::..::.: .:.::.::.: :::.::..:: .: : .:: :
CCDS54 PFEKISDQSESSDLDDVSTPSGSDLETTSG--SDLESDIESDKEKFKENGKM------FK
450 460 470 480 490
660 670 680 690 700
pF1KA1 GGLAPPGAPNSVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGP-GFM
..: :. . ::.::.: : :. ...::..::::::::::::::: :..
CCDS54 DKVSPLQNLASINNKKE-YSNHSIFSPSLEEQTAVSGAVNDSIKAIASIAEKYFGSTGLV
500 510 520 530 540 550
710 720 730 740 750 760
pF1KA1 GMQEKKLGSLPYHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSA
:.:.::.:.::: : ::. :.: : .:.::: :: : ..: .: ::.:: .. :. :.
CCDS54 GLQDKKVGALPYPSMFPLPFFPAFSQSMYPFPDRDL-RSLPLKMEPQSPGEVKKLQKGSS
560 570 580 590 600 610
770 780 790 800 810 820
pF1KA1 ECPFDLTTKPKDVKPILPMP-KGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVY
: ::::::: :: ::. :.: : : .::....::::::.:::.::: . :::::::.
CCDS54 ESPFDLTTKRKDEKPLTPVPSKPPVTPATSQDQPLDLSMGSRSRASGTKL-TEPRKNHVF
620 630 640 650 660 670
830 840 850 860 870 880
pF1KA1 GERKLGAGEGLPQVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLR
: .: . :. : .. :..:.:.:::::::: ::::::.:::. ::::::::
CCDS54 GGKKGSNVESRPA-------SDGSLQHARPTPFFMDPIY-RVEKRKLTDPLEALKEKYLR
680 690 700 710 720
890 900 910 920 930
pF1KA1 PSP-LLFHPQ---------MSAIETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPT
::: .::::: :::::.:.::::::.:.: ... :: .: ::::.:: .
CCDS54 PSPGFLFHPQFQLPDQRTWMSAIENMAEKLESFSALKPEASELLQSVPSM-FNFRAPPNA
730 740 750 760 770 780
940 950 960 970 980 990
pF1KA1 LSDPILRKGKERYTCRYCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHV
: . .:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LPENLLRKGKERYTCRYCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHV
790 800 810 820 830 840
1000 1010 1020 1030 1040 1050
pF1KA1 RNIHNKEKPFKCHLCNRCFGQQTNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSE
:::::::::::::::.:::::::::::::::::. : ::..::: ::
CCDS54 RNIHNKEKPFKCHLCDRCFGQQTNLDRHLKKHENGNMS------------GTATSSPHSE
850 860 870 880 890
1060 1070 1080 1090 1100 1110
pF1KA1 SDNH-ALLDEKEDSYFSEIRNFIANSEMNQASTRT-EKRAD-MQIVDGSAQCPGLASEKQ
.. :.::.:::.::.::::::.::. .. : :. :.: . .. : .: . :.
CCDS54 LESTGAILDDKEDAYFTEIRNFIGNSNHGSQSPRNVEERMNGSHFKDEKALVTSQNSDLL
900 910 920 930 940 950
1120 1130 1140 1150 1160 1170
pF1KA1 EDVEEEDDDDLEEDDEDS-LAGKSQDDTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRR
.: : ::. :.:.:::. ..::. . :. . .. ::. .: : .. . .:
CCDS54 DDEEVEDEVLLDEEDEDNDITGKTGKEPVT-SNLHEGNPEDDYEETSALEMSCKTSPVRY
960 970 980 990 1000 1010
1180 1190 1200 1210 1220 1230
pF1KA1 CAEDHEGGLLALEPMPTFGKGLDLRRAAEEAFEVKDV--LNSTLDSEALKHTLCRQAKNQ
:....:: ::. . : .: .:. .. . .. .... : ::. : :..:.:
CCDS54 KEEEYKSGLSALDHIRHFTDSLKMRKMEDNQYSEAELSSFSTSHVPEELKQPLHRKSKSQ
1020 1030 1040 1050 1060 1070
1240 1250 1260 1270
pF1KA1 AYAMMLSLSEDTPLHTPSQGSLDAWLKVTGATSESGAFHPINHL
:::::::::. ::. :..: ..: ... :..::.:.. :.:.
CCDS54 AYAMMLSLSDKESLHSTSHSSSNVWHSMARAAAESSAIQSISHV
1080 1090 1100 1110
>>CCDS54669.1 MECOM gene_id:2122|Hs108|chr3 (1042 aa)
initn: 2776 init1: 1228 opt: 1824 Z-score: 908.0 bits: 179.9 E(32554): 2.9e-44
Smith-Waterman score: 3627; 53.6% identity (75.4% similar) in 1078 aa overlap (215-1276:6-1042)
190 200 210 220 230 240
pF1KA1 MCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQSKLD
:: :. : . :: .::..::.::.:: .
CCDS54 MKSEDYPHETMAPDIHEERQYRCEDCDQLFESKAE
10 20 30
250 260 270 280 290 300
pF1KA1 LRRHKKYTCGSVGAALY---EGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHMV
: :.:. :.. .:. : . ..:. :. .:::.:...::. :::.::.
CCDS54 LADHQKFPCSTPHSAFSMVEEDFQQKLESENDLQEIHTIQECKECDQVFPDLQSLEKHML
40 50 60 70 80 90
310 320 330 340 350 360
pF1KA1 IHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQHV
:::::::::::::::::::::::::::::::::..:::::.::::::::::::::::::
CCDS54 SHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKHYECENCAKVFTDPSNLQRHIRSQHV
100 110 120 130 140 150
370 380 390 400 410 420
pF1KA1 GARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCRT
::::::::.:::::::::::::::::::.:::::::::::::::::::::::::::::::
CCDS54 GARAHACPECGKTFATSSGLKQHKHIHSSVKPFICEVCHKSYTQFSNLCRHKRMHADCRT
160 170 180 190 200 210
430 440 450 460 470 480
pF1KA1 QIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNHA
:::::::::::::::::::::::::::::.. ::.:. :. : .: :::.. ...::
CCDS54 QIKCKDCGQMFSTTSSLNKHRRFCEGKNHFAAGGFFGQGISLPGTPAMDKTS-MVNMSHA
220 230 240 250 260 270
490 500 510 520 530 540
pF1KA1 SLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTPLLKSPLNH
. :. .:: . ::..: : :: :... .:::.:: .:: ::::.: . .:. .
CCDS54 NPGLADYFGANRHPAGLTF----PTAPGFSFSFPGLFPSGLYHRPPLIPASSPVKGLSST
280 290 300 310 320 330
550 560 570 580 590
pF1KA1 TQDAKLPSPL-GNPA-LPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMS
: : ::: .: :: .. . .. . ..: .. : . : : :. . ::.:
CCDS54 EQTNKSQSPLMTHPQILPATQDILKA-LSKHPSVGDNKPVELQPERSSEERPFEKISDQS
340 350 360 370 380
600 610 620 630 640 650
pF1KA1 DGSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAP
..::..::.: .:.::.::.: :::.::..:: .: : .:: . . . .:: .
CCDS54 ESSDLDDVSTPSGSDLETTSG--SDLESDIESDKEKFKENGKMFKDKVSPLQNLA---SI
390 400 410 420 430 440
660 670 680 690 700 710
pF1KA1 NSVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGP-GFMGMQEKKLGS
:. : ::.::.: : :. ...::..::::::::::::::: :..:.:.::.:.
CCDS54 NNKKE----YSNHSIFSPSLEEQTAVSGAVNDSIKAIASIAEKYFGSTGLVGLQDKKVGA
450 460 470 480 490 500
720 730 740 750 760 770
pF1KA1 LPYHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTK
::: : ::. :.: : .:.::: :: : ..: .: ::.:: .. :. :.: :::::::
CCDS54 LPYPSMFPLPFFPAFSQSMYPFPDRDL-RSLPLKMEPQSPGEVKKLQKGSSESPFDLTTK
510 520 530 540 550
780 790 800 810 820 830
pF1KA1 PKDVKPILPMP-KGPSAPASGEEQPLDLSIGSRARASQNGGGR--EPRKNHVYGERKLGA
:: ::. :.: : : .::....::::::.:::.::: : . :::::::.: .: .
CCDS54 RKDEKPLTPVPSKPPVTPATSQDQPLDLSMGSRSRAS---GTKLTEPRKNHVFGGKKGSN
560 570 580 590 600 610
840 850 860 870 880 890
pF1KA1 GEGLPQVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSP-LLF
:. : .. :..:.:.:::::::: ::::::.:::. ::::::::::: .::
CCDS54 VESRPA-------SDGSLQHARPTPFFMDPIY-RVEKRKLTDPLEALKEKYLRPSPGFLF
620 630 640 650 660
900 910 920 930 940 950
pF1KA1 HPQMSAIETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCR
::::::::.:.::::::.:.: ... :: .: ::::.:: .: . .:::::::::::
CCDS54 HPQMSAIENMAEKLESFSALKPEASELLQSVPSM-FNFRAPPNALPENLLRKGKERYTCR
670 680 690 700 710 720
960 970 980 990 1000 1010
pF1KA1 YCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCN
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.
CCDS54 YCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCD
730 740 750 760 770 780
1020 1030 1040 1050 1060 1070
pF1KA1 RCFGQQTNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNH-ALLDEKEDSYF
:::::::::::::::::. : ::..::: :: .. :.::.:::.::
CCDS54 RCFGQQTNLDRHLKKHENGNMS------------GTATSSPHSELESTGAILDDKEDAYF
790 800 810 820 830
1080 1090 1100 1110 1120 1130
pF1KA1 SEIRNFIANSEMNQASTRT-EKRAD-MQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDE
.::::::.::. .. : :. :.: . .. : .: . :. .: : ::. :.:.::
CCDS54 TEIRNFIGNSNHGSQSPRNVEERMNGSHFKDEKALVTSQNSDLLDDEEVEDEVLLDEEDE
840 850 860 870 880 890
1140 1150 1160 1170 1180 1190
pF1KA1 DS-LAGKSQDDTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMP
:. ..::. . :. . .. ::. .: : .. . .: :....:: ::. .
CCDS54 DNDITGKTGKEPVT-SNLHEGNPEDDYEETSALEMSCKTSPVRYKEEEYKSGLSALDHIR
900 910 920 930 940 950
1200 1210 1220 1230 1240
pF1KA1 TFGKGLDLRRAAEEAFEVKDV--LNSTLDSEALKHTLCRQAKNQAYAMMLSLSEDTPLHT
: .: .:. .. . .. .... : ::. : :..:.::::::::::. ::.
CCDS54 HFTDSLKMRKMEDNQYSEAELSSFSTSHVPEELKQPLHRKSKSQAYAMMLSLSDKESLHS
960 970 980 990 1000 1010
1250 1260 1270
pF1KA1 PSQGSLDAWLKVTGATSESGAFHPINHL
:..: ..: ... :..::.:.. :.:.
CCDS54 TSHSSSNVWHSMARAAAESSAIQSISHV
1020 1030 1040
>>CCDS3205.1 MECOM gene_id:2122|Hs108|chr3 (1051 aa)
initn: 2547 init1: 1228 opt: 1686 Z-score: 840.8 bits: 167.5 E(32554): 1.6e-40
Smith-Waterman score: 3599; 53.2% identity (74.8% similar) in 1087 aa overlap (215-1276:6-1051)
190 200 210 220 230 240
pF1KA1 MCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQSKLD
:: :. : . :: .::..::.::.:: .
CCDS32 MKSEDYPHETMAPDIHEERQYRCEDCDQLFESKAE
10 20 30
250 260 270 280 290 300
pF1KA1 LRRHKKYTCGSVGAALY---EGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHMV
: :.:. :.. .:. : . ..:. :. .:::.:...::. :::.::.
CCDS32 LADHQKFPCSTPHSAFSMVEEDFQQKLESENDLQEIHTIQECKECDQVFPDLQSLEKHML
40 50 60 70 80 90
310 320 330 340 350 360
pF1KA1 IHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQHV
:::::::::::::::::::::::::::::::::..:::::.::::::::::::::::::
CCDS32 SHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKHYECENCAKVFTDPSNLQRHIRSQHV
100 110 120 130 140 150
370 380 390 400 410 420
pF1KA1 GARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCRT
::::::::.:::::::::::::::::::.:::::::::::::::::::::::::::::::
CCDS32 GARAHACPECGKTFATSSGLKQHKHIHSSVKPFICEVCHKSYTQFSNLCRHKRMHADCRT
160 170 180 190 200 210
430 440 450 460 470 480
pF1KA1 QIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNHA
:::::::::::::::::::::::::::::.. ::.:. :. : .: :::.. ...::
CCDS32 QIKCKDCGQMFSTTSSLNKHRRFCEGKNHFAAGGFFGQGISLPGTPAMDKTS-MVNMSHA
220 230 240 250 260 270
490 500 510 520 530 540
pF1KA1 SLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTPLLKSPLNH
. :. .:: . ::..: : :: :... .:::.:: .:: ::::.: . .:. .
CCDS32 NPGLADYFGANRHPAGLTF----PTAPGFSFSFPGLFPSGLYHRPPLIPASSPVKGLSST
280 290 300 310 320 330
550 560 570 580 590
pF1KA1 TQDAKLPSPL-GNPA-LPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMS
: : ::: .: :: .. . .. . ..: .. : . : : :. . ::.:
CCDS32 EQTNKSQSPLMTHPQILPATQDILKA-LSKHPSVGDNKPVELQPERSSEERPFEKISDQS
340 350 360 370 380
600 610 620 630 640 650
pF1KA1 DGSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAP
..::..::.: .:.::.::.: :::.::..:: .: : .:: . . . .:: .
CCDS32 ESSDLDDVSTPSGSDLETTSG--SDLESDIESDKEKFKENGKMFKDKVSPLQNLA---SI
390 400 410 420 430 440
660 670 680 690 700 710
pF1KA1 NSVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGP-GFMGMQEKKLGS
:. : ::.::.: : :. ...::..::::::::::::::: :..:.:.::.:.
CCDS32 NNKKE----YSNHSIFSPSLEEQTAVSGAVNDSIKAIASIAEKYFGSTGLVGLQDKKVGA
450 460 470 480 490 500
720 730 740 750 760 770
pF1KA1 LPYHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTK
::: : ::. :.: : .:.::: :: : ..: .: ::.:: .. :. :.: :::::::
CCDS32 LPYPSMFPLPFFPAFSQSMYPFPDRDL-RSLPLKMEPQSPGEVKKLQKGSSESPFDLTTK
510 520 530 540 550
780 790 800 810 820 830
pF1KA1 PKDVKPILPMP-KGPSAPASGEEQPLDLSIGSRARASQNGGGR--EPRKNHVYGERKLGA
:: ::. :.: : : .::....::::::.:::.::: : . :::::::.: .: .
CCDS32 RKDEKPLTPVPSKPPVTPATSQDQPLDLSMGSRSRAS---GTKLTEPRKNHVFGGKKGSN
560 570 580 590 600 610
840 850 860 870 880 890
pF1KA1 GEGLPQVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSP-LLF
:. : .. :..:.:.:::::::: ::::::.:::. ::::::::::: .::
CCDS32 VESRPA-------SDGSLQHARPTPFFMDPIY-RVEKRKLTDPLEALKEKYLRPSPGFLF
620 630 640 650 660
900 910 920 930 940
pF1KA1 HPQ---------MSAIETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILR
::: :::::.:.::::::.:.: ... :: .: ::::.:: .: . .::
CCDS32 HPQFQLPDQRTWMSAIENMAEKLESFSALKPEASELLQSVPSM-FNFRAPPNALPENLLR
670 680 690 700 710 720
950 960 970 980 990 1000
pF1KA1 KGKERYTCRYCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KGKERYTCRYCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKE
730 740 750 760 770 780
1010 1020 1030 1040 1050 1060
pF1KA1 KPFKCHLCNRCFGQQTNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNH-AL
::::::::.:::::::::::::::::. : ::..::: :: .. :.
CCDS32 KPFKCHLCDRCFGQQTNLDRHLKKHENGNMS------------GTATSSPHSELESTGAI
790 800 810 820 830
1070 1080 1090 1100 1110 1120
pF1KA1 LDEKEDSYFSEIRNFIANSEMNQASTRT-EKRAD-MQIVDGSAQCPGLASEKQEDVEEED
::.:::.::.::::::.::. .. : :. :.: . .. : .: . :. .: : ::
CCDS32 LDDKEDAYFTEIRNFIGNSNHGSQSPRNVEERMNGSHFKDEKALVTSQNSDLLDDEEVED
840 850 860 870 880 890
1130 1140 1150 1160 1170 1180
pF1KA1 DDDLEEDDEDS-LAGKSQDDTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEG
. :.:.:::. ..::. . :. . .. ::. .: : .. . .: :....
CCDS32 EVLLDEEDEDNDITGKTGKEPVT-SNLHEGNPEDDYEETSALEMSCKTSPVRYKEEEYKS
900 910 920 930 940 950
1190 1200 1210 1220 1230
pF1KA1 GLLALEPMPTFGKGLDLRRAAEEAFEVKDV--LNSTLDSEALKHTLCRQAKNQAYAMMLS
:: ::. . : .: .:. .. . .. .... : ::. : :..:.::::::::
CCDS32 GLSALDHIRHFTDSLKMRKMEDNQYSEAELSSFSTSHVPEELKQPLHRKSKSQAYAMMLS
960 970 980 990 1000 1010
1240 1250 1260 1270
pF1KA1 LSEDTPLHTPSQGSLDAWLKVTGATSESGAFHPINHL
::. ::. :..: ..: ... :..::.:.. :.:.
CCDS32 LSDKESLHSTSHSSSNVWHSMARAAAESSAIQSISHV
1020 1030 1040 1050
1276 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 11:18:42 2016 done: Thu Nov 3 11:18:43 2016
Total Scan time: 4.600 Total Display time: 0.260
Function used was FASTA [36.3.4 Apr, 2011]