FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1675, 1276 aa 1>>>pF1KA1675 1276 - 1276 aa - 1276 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.3421+/-0.00117; mu= 2.4857+/- 0.070 mean_var=421.9430+/-86.677, 0's: 0 Z-trim(114.0): 788 B-trim: 817 in 1/52 Lambda= 0.062438 statistics sampled from 13729 (14607) to 13729 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.75), E-opt: 0.2 (0.449), width: 16 Scan time: 4.600 The best scores are: opt bits E(32554) CCDS41236.2 PRDM16 gene_id:63976|Hs108|chr1 (1276) 8833 811.4 0 CCDS44048.2 PRDM16 gene_id:63976|Hs108|chr1 (1257) 8541 785.1 0 CCDS54670.1 MECOM gene_id:2122|Hs108|chr3 (1116) 1916 188.3 9.9e-47 CCDS54669.1 MECOM gene_id:2122|Hs108|chr3 (1042) 1824 179.9 2.9e-44 CCDS3205.1 MECOM gene_id:2122|Hs108|chr3 (1051) 1686 167.5 1.6e-40 >>CCDS41236.2 PRDM16 gene_id:63976|Hs108|chr1 (1276 aa) initn: 8833 init1: 8833 opt: 8833 Z-score: 4319.2 bits: 811.4 E(32554): 0 Smith-Waterman score: 8833; 99.9% identity (99.9% similar) in 1276 aa overlap (1-1276:1-1276) 10 20 30 40 50 60 pF1KA1 MRSKARARKLAKSDGDVVNNMYEPNRDLLASHSAEDEAEDSAMSPIPVGPPSPFPTSEDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MRSKARARKLAKSDGDVVNNMYEPNRDLLASHSAEDEAEDSAMSPIPVGPPSPFPTSEDF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 TPKEGSPYEAPVYIPEDIPIPADFELRESSIPGAGLGVWAKRKMEAGERLGPCVVVPRAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 TPKEGSPYEAPVYIPEDIPIPADFELRESSIPGAGLGVWAKRKMEAGERLGPCVVVPRAA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 AKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVACSCDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 AKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVACSCDD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 QNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 SKLDLRRHKKYTCGSVGAALYEGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SKLDLRRHKKYTCGSVGAALYEGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 VIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 VGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 TQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 TQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNH 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 ASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTPLLKSPLN :::::::::::::::::::::::::::::::::::::::::::::::::::: ::::::: CCDS41 ASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTSLLKSPLN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 HTQDAKLPSPLGNPALPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 HTQDAKLPSPLGNPALPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMSD 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 GSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAPN 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 SVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGPGFMGMQEKKLGSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGPGFMGMQEKKLGSLP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 YHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTKPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 YHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTKPK 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 DVKPILPMPKGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVYGERKLGAGEGLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 DVKPILPMPKGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVYGERKLGAGEGLP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA1 QVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSPLLFHPQMSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSPLLFHPQMSA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KA1 IETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCRYCGKIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 IETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCRYCGKIF 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KA1 PRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCNRCFGQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCNRCFGQQ 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KA1 TNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNHALLDEKEDSYFSEIRNFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 TNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNHALLDEKEDSYFSEIRNFI 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KA1 ANSEMNQASTRTEKRADMQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDEDSLAGKSQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 ANSEMNQASTRTEKRADMQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDEDSLAGKSQD 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KA1 DTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMPTFGKGLDLRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 DTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMPTFGKGLDLRR 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KA1 AAEEAFEVKDVLNSTLDSEALKHTLCRQAKNQAYAMMLSLSEDTPLHTPSQGSLDAWLKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 AAEEAFEVKDVLNSTLDSEALKHTLCRQAKNQAYAMMLSLSEDTPLHTPSQGSLDAWLKV 1210 1220 1230 1240 1250 1260 1270 pF1KA1 TGATSESGAFHPINHL :::::::::::::::: CCDS41 TGATSESGAFHPINHL 1270 >>CCDS44048.2 PRDM16 gene_id:63976|Hs108|chr1 (1257 aa) initn: 8541 init1: 8541 opt: 8541 Z-score: 4177.1 bits: 785.1 E(32554): 0 Smith-Waterman score: 8662; 98.4% identity (98.4% similar) in 1276 aa overlap (1-1276:1-1257) 10 20 30 40 50 60 pF1KA1 MRSKARARKLAKSDGDVVNNMYEPNRDLLASHSAEDEAEDSAMSPIPVGPPSPFPTSEDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MRSKARARKLAKSDGDVVNNMYEPNRDLLASHSAEDEAEDSAMSPIPVGPPSPFPTSEDF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 TPKEGSPYEAPVYIPEDIPIPADFELRESSIPGAGLGVWAKRKMEAGERLGPCVVVPRAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TPKEGSPYEAPVYIPEDIPIPADFELRESSIPGAGLGVWAKRKMEAGERLGPCVVVPRAA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 AKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVACSCDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVACSCDD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 QNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 SKLDLRRHKKYTCGSVGAALYEGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SKLDLRRHKKYTCGSVGAALYEGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 VIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 VGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 TQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNH 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 ASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTPLLKSPLN :::::::::::::::::::::::::::::::::::::::::::::::::::: ::::::: CCDS44 ASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTSLLKSPLN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 HTQDAKLPSPLGNPALPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HTQDAKLPSPLGNPALPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMSD 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 GSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAPN 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 SVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGPGFMGMQEKKLGSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGPGFMGMQEKKLGSLP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 YHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTKPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 YHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTKPK 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 DVKPILPMPKGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVYGERKLGAGEGLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DVKPILPMPKGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVYGERKLGAGEGLP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA1 QVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSPLLFHPQMSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSPLLFHPQMSA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KA1 IETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCRYCGKIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 IETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCRYCGKIF 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KA1 PRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCNRCFGQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCNRCFGQQ 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KA1 TNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNHALLDEKEDSYFSEIRNFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNHALLDEKEDSYFSEIRNFI 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KA1 ANSEMNQASTRTEKRADMQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDEDSLAGKSQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ANSEMNQASTRTEKRADMQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDEDSLAGKSQD 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KA1 DTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMPTFGKGLDLRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMPTFGKGLDLRR 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KA1 AAEEAFEVKDVLNSTLDSEALKHTLCRQAKNQAYAMMLSLSEDTPLHTPSQGSLDAWLKV :::::::::::::::::::::::::::::::: ::::::::: CCDS44 AAEEAFEVKDVLNSTLDSEALKHTLCRQAKNQ-------------------GSLDAWLKV 1210 1220 1230 1240 1270 pF1KA1 TGATSESGAFHPINHL :::::::::::::::: CCDS44 TGATSESGAFHPINHL 1250 >>CCDS54670.1 MECOM gene_id:2122|Hs108|chr3 (1116 aa) initn: 2395 init1: 834 opt: 1916 Z-score: 952.5 bits: 188.3 E(32554): 9.9e-47 Smith-Waterman score: 3829; 52.9% identity (74.6% similar) in 1154 aa overlap (147-1276:2-1116) 120 130 140 150 160 170 pF1KA1 PRAAAKETDFGWEQILTDVEVSPQEGCITKISEDLGSEKFCVDANQAGAGSWLKYIRVAC : ... . :::.::.: .:::::::: : CCDS54 MILDEFYNVKFCIDASQPDVGSWLKYIRFAG 10 20 30 180 190 200 210 220 230 pF1KA1 SCDDQNLTMCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECD :..::. :::..::.:.:. :: ::::::. .: :: :. : . :: .::..:: CCDS54 CYDQHNLVACQINDQIFYRVVADIAPGEELLLFMKSEDYPHETMAPDIHEERQYRCEDCD 40 50 60 70 80 90 240 250 260 270 280 290 pF1KA1 ELFQSKLDLRRHKKYTCGSVGAALY---EGLAEELKPEGLGGGSGQAHECKDCERMFPNK .::.:: .: :.:. :.. .:. : . ..:. :. .:::.:...::. CCDS54 QLFESKAELADHQKFPCSTPHSAFSMVEEDFQQKLESENDLQEIHTIQECKECDQVFPDL 100 110 120 130 140 150 300 310 320 330 340 350 pF1KA1 YSLEQHMVIHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVK-VFTDPSNL :::.::. :::::::::::::::::::::::::::::::::..:::::.: :::::::: CCDS54 QSLEKHMLSHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKHYECENCAKQVFTDPSNL 160 170 180 190 200 210 360 370 380 390 400 410 pF1KA1 QRHIRSQHVGARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRH :::::::::::::::::.:::::::::::::::::::.:::::::::::::::::::::: CCDS54 QRHIRSQHVGARAHACPECGKTFATSSGLKQHKHIHSSVKPFICEVCHKSYTQFSNLCRH 220 230 240 250 260 270 420 430 440 450 460 470 pF1KA1 KRMHADCRTQIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKA ::::::::::::::::::::::::::::::::::::::.. ::.:. :. : .: :::. CCDS54 KRMHADCRTQIKCKDCGQMFSTTSSLNKHRRFCEGKNHFAAGGFFGQGISLPGTPAMDKT 280 290 300 310 320 330 480 490 500 510 520 530 pF1KA1 KPSPSLNHASLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPT . ...::. :. .:: . ::..: : :: :... .:::.:: .:: ::::.: . CCDS54 SMV-NMSHANPGLADYFGANRHPAGLTF----PTAPGFSFSFPGLFPSGLYHRPPLIPAS 340 350 360 370 380 540 550 560 570 580 590 pF1KA1 PLLKSPLNHTQDAKLPSPL-GNPA-LPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEK .:. . : : ::: .: :: .. . .. . ..: .. : . : : :. CCDS54 SPVKGLSSTEQTNKSQSPLMTHPQILPATQDILKA-LSKHPSVGDNKPVELQPERSSEER 390 400 410 420 430 440 600 610 620 630 640 650 pF1KA1 LKTRSSDMSDGSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFG . ::.:..::..::.: .:.::.::.: :::.::..:: .: : .:: : CCDS54 PFEKISDQSESSDLDDVSTPSGSDLETTSG--SDLESDIESDKEKFKENGKM------FK 450 460 470 480 490 660 670 680 690 700 pF1KA1 GGLAPPGAPNSVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGP-GFM ..: :. . ::.::.: : :. ...::..::::::::::::::: :.. CCDS54 DKVSPLQNLASINNKKE-YSNHSIFSPSLEEQTAVSGAVNDSIKAIASIAEKYFGSTGLV 500 510 520 530 540 550 710 720 730 740 750 760 pF1KA1 GMQEKKLGSLPYHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSA :.:.::.:.::: : ::. :.: : .:.::: :: : ..: .: ::.:: .. :. :. CCDS54 GLQDKKVGALPYPSMFPLPFFPAFSQSMYPFPDRDL-RSLPLKMEPQSPGEVKKLQKGSS 560 570 580 590 600 610 770 780 790 800 810 820 pF1KA1 ECPFDLTTKPKDVKPILPMP-KGPSAPASGEEQPLDLSIGSRARASQNGGGREPRKNHVY : ::::::: :: ::. :.: : : .::....::::::.:::.::: . :::::::. CCDS54 ESPFDLTTKRKDEKPLTPVPSKPPVTPATSQDQPLDLSMGSRSRASGTKL-TEPRKNHVF 620 630 640 650 660 670 830 840 850 860 870 880 pF1KA1 GERKLGAGEGLPQVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLR : .: . :. : .. :..:.:.:::::::: ::::::.:::. :::::::: CCDS54 GGKKGSNVESRPA-------SDGSLQHARPTPFFMDPIY-RVEKRKLTDPLEALKEKYLR 680 690 700 710 720 890 900 910 920 930 pF1KA1 PSP-LLFHPQ---------MSAIETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPT ::: .::::: :::::.:.::::::.:.: ... :: .: ::::.:: . CCDS54 PSPGFLFHPQFQLPDQRTWMSAIENMAEKLESFSALKPEASELLQSVPSM-FNFRAPPNA 730 740 750 760 770 780 940 950 960 970 980 990 pF1KA1 LSDPILRKGKERYTCRYCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHV : . .::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LPENLLRKGKERYTCRYCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHV 790 800 810 820 830 840 1000 1010 1020 1030 1040 1050 pF1KA1 RNIHNKEKPFKCHLCNRCFGQQTNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSE :::::::::::::::.:::::::::::::::::. : ::..::: :: CCDS54 RNIHNKEKPFKCHLCDRCFGQQTNLDRHLKKHENGNMS------------GTATSSPHSE 850 860 870 880 890 1060 1070 1080 1090 1100 1110 pF1KA1 SDNH-ALLDEKEDSYFSEIRNFIANSEMNQASTRT-EKRAD-MQIVDGSAQCPGLASEKQ .. :.::.:::.::.::::::.::. .. : :. :.: . .. : .: . :. CCDS54 LESTGAILDDKEDAYFTEIRNFIGNSNHGSQSPRNVEERMNGSHFKDEKALVTSQNSDLL 900 910 920 930 940 950 1120 1130 1140 1150 1160 1170 pF1KA1 EDVEEEDDDDLEEDDEDS-LAGKSQDDTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRR .: : ::. :.:.:::. ..::. . :. . .. ::. .: : .. . .: CCDS54 DDEEVEDEVLLDEEDEDNDITGKTGKEPVT-SNLHEGNPEDDYEETSALEMSCKTSPVRY 960 970 980 990 1000 1010 1180 1190 1200 1210 1220 1230 pF1KA1 CAEDHEGGLLALEPMPTFGKGLDLRRAAEEAFEVKDV--LNSTLDSEALKHTLCRQAKNQ :....:: ::. . : .: .:. .. . .. .... : ::. : :..:.: CCDS54 KEEEYKSGLSALDHIRHFTDSLKMRKMEDNQYSEAELSSFSTSHVPEELKQPLHRKSKSQ 1020 1030 1040 1050 1060 1070 1240 1250 1260 1270 pF1KA1 AYAMMLSLSEDTPLHTPSQGSLDAWLKVTGATSESGAFHPINHL :::::::::. ::. :..: ..: ... :..::.:.. :.:. CCDS54 AYAMMLSLSDKESLHSTSHSSSNVWHSMARAAAESSAIQSISHV 1080 1090 1100 1110 >>CCDS54669.1 MECOM gene_id:2122|Hs108|chr3 (1042 aa) initn: 2776 init1: 1228 opt: 1824 Z-score: 908.0 bits: 179.9 E(32554): 2.9e-44 Smith-Waterman score: 3627; 53.6% identity (75.4% similar) in 1078 aa overlap (215-1276:6-1042) 190 200 210 220 230 240 pF1KA1 MCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQSKLD :: :. : . :: .::..::.::.:: . CCDS54 MKSEDYPHETMAPDIHEERQYRCEDCDQLFESKAE 10 20 30 250 260 270 280 290 300 pF1KA1 LRRHKKYTCGSVGAALY---EGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHMV : :.:. :.. .:. : . ..:. :. .:::.:...::. :::.::. CCDS54 LADHQKFPCSTPHSAFSMVEEDFQQKLESENDLQEIHTIQECKECDQVFPDLQSLEKHML 40 50 60 70 80 90 310 320 330 340 350 360 pF1KA1 IHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQHV :::::::::::::::::::::::::::::::::..:::::.:::::::::::::::::: CCDS54 SHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKHYECENCAKVFTDPSNLQRHIRSQHV 100 110 120 130 140 150 370 380 390 400 410 420 pF1KA1 GARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCRT ::::::::.:::::::::::::::::::.::::::::::::::::::::::::::::::: CCDS54 GARAHACPECGKTFATSSGLKQHKHIHSSVKPFICEVCHKSYTQFSNLCRHKRMHADCRT 160 170 180 190 200 210 430 440 450 460 470 480 pF1KA1 QIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNHA :::::::::::::::::::::::::::::.. ::.:. :. : .: :::.. ...:: CCDS54 QIKCKDCGQMFSTTSSLNKHRRFCEGKNHFAAGGFFGQGISLPGTPAMDKTS-MVNMSHA 220 230 240 250 260 270 490 500 510 520 530 540 pF1KA1 SLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTPLLKSPLNH . :. .:: . ::..: : :: :... .:::.:: .:: ::::.: . .:. . CCDS54 NPGLADYFGANRHPAGLTF----PTAPGFSFSFPGLFPSGLYHRPPLIPASSPVKGLSST 280 290 300 310 320 330 550 560 570 580 590 pF1KA1 TQDAKLPSPL-GNPA-LPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMS : : ::: .: :: .. . .. . ..: .. : . : : :. . ::.: CCDS54 EQTNKSQSPLMTHPQILPATQDILKA-LSKHPSVGDNKPVELQPERSSEERPFEKISDQS 340 350 360 370 380 600 610 620 630 640 650 pF1KA1 DGSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAP ..::..::.: .:.::.::.: :::.::..:: .: : .:: . . . .:: . CCDS54 ESSDLDDVSTPSGSDLETTSG--SDLESDIESDKEKFKENGKMFKDKVSPLQNLA---SI 390 400 410 420 430 440 660 670 680 690 700 710 pF1KA1 NSVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGP-GFMGMQEKKLGS :. : ::.::.: : :. ...::..::::::::::::::: :..:.:.::.:. CCDS54 NNKKE----YSNHSIFSPSLEEQTAVSGAVNDSIKAIASIAEKYFGSTGLVGLQDKKVGA 450 460 470 480 490 500 720 730 740 750 760 770 pF1KA1 LPYHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTK ::: : ::. :.: : .:.::: :: : ..: .: ::.:: .. :. :.: ::::::: CCDS54 LPYPSMFPLPFFPAFSQSMYPFPDRDL-RSLPLKMEPQSPGEVKKLQKGSSESPFDLTTK 510 520 530 540 550 780 790 800 810 820 830 pF1KA1 PKDVKPILPMP-KGPSAPASGEEQPLDLSIGSRARASQNGGGR--EPRKNHVYGERKLGA :: ::. :.: : : .::....::::::.:::.::: : . :::::::.: .: . CCDS54 RKDEKPLTPVPSKPPVTPATSQDQPLDLSMGSRSRAS---GTKLTEPRKNHVFGGKKGSN 560 570 580 590 600 610 840 850 860 870 880 890 pF1KA1 GEGLPQVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSP-LLF :. : .. :..:.:.:::::::: ::::::.:::. ::::::::::: .:: CCDS54 VESRPA-------SDGSLQHARPTPFFMDPIY-RVEKRKLTDPLEALKEKYLRPSPGFLF 620 630 640 650 660 900 910 920 930 940 950 pF1KA1 HPQMSAIETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILRKGKERYTCR ::::::::.:.::::::.:.: ... :: .: ::::.:: .: . .::::::::::: CCDS54 HPQMSAIENMAEKLESFSALKPEASELLQSVPSM-FNFRAPPNALPENLLRKGKERYTCR 670 680 690 700 710 720 960 970 980 990 1000 1010 pF1KA1 YCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS54 YCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKEKPFKCHLCD 730 740 750 760 770 780 1020 1030 1040 1050 1060 1070 pF1KA1 RCFGQQTNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNH-ALLDEKEDSYF :::::::::::::::::. : ::..::: :: .. :.::.:::.:: CCDS54 RCFGQQTNLDRHLKKHENGNMS------------GTATSSPHSELESTGAILDDKEDAYF 790 800 810 820 830 1080 1090 1100 1110 1120 1130 pF1KA1 SEIRNFIANSEMNQASTRT-EKRAD-MQIVDGSAQCPGLASEKQEDVEEEDDDDLEEDDE .::::::.::. .. : :. :.: . .. : .: . :. .: : ::. :.:.:: CCDS54 TEIRNFIGNSNHGSQSPRNVEERMNGSHFKDEKALVTSQNSDLLDDEEVEDEVLLDEEDE 840 850 860 870 880 890 1140 1150 1160 1170 1180 1190 pF1KA1 DS-LAGKSQDDTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEGGLLALEPMP :. ..::. . :. . .. ::. .: : .. . .: :....:: ::. . CCDS54 DNDITGKTGKEPVT-SNLHEGNPEDDYEETSALEMSCKTSPVRYKEEEYKSGLSALDHIR 900 910 920 930 940 950 1200 1210 1220 1230 1240 pF1KA1 TFGKGLDLRRAAEEAFEVKDV--LNSTLDSEALKHTLCRQAKNQAYAMMLSLSEDTPLHT : .: .:. .. . .. .... : ::. : :..:.::::::::::. ::. CCDS54 HFTDSLKMRKMEDNQYSEAELSSFSTSHVPEELKQPLHRKSKSQAYAMMLSLSDKESLHS 960 970 980 990 1000 1010 1250 1260 1270 pF1KA1 PSQGSLDAWLKVTGATSESGAFHPINHL :..: ..: ... :..::.:.. :.:. CCDS54 TSHSSSNVWHSMARAAAESSAIQSISHV 1020 1030 1040 >>CCDS3205.1 MECOM gene_id:2122|Hs108|chr3 (1051 aa) initn: 2547 init1: 1228 opt: 1686 Z-score: 840.8 bits: 167.5 E(32554): 1.6e-40 Smith-Waterman score: 3599; 53.2% identity (74.8% similar) in 1087 aa overlap (215-1276:6-1051) 190 200 210 220 230 240 pF1KA1 MCQISEQIYYKVIKDIEPGEELLVHVKEGVYPLGTVPPGLDEEPTFRCDECDELFQSKLD :: :. : . :: .::..::.::.:: . CCDS32 MKSEDYPHETMAPDIHEERQYRCEDCDQLFESKAE 10 20 30 250 260 270 280 290 300 pF1KA1 LRRHKKYTCGSVGAALY---EGLAEELKPEGLGGGSGQAHECKDCERMFPNKYSLEQHMV : :.:. :.. .:. : . ..:. :. .:::.:...::. :::.::. CCDS32 LADHQKFPCSTPHSAFSMVEEDFQQKLESENDLQEIHTIQECKECDQVFPDLQSLEKHML 40 50 60 70 80 90 310 320 330 340 350 360 pF1KA1 IHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKRFECENCVKVFTDPSNLQRHIRSQHV :::::::::::::::::::::::::::::::::..:::::.:::::::::::::::::: CCDS32 SHTEEREYKCDQCPKAFNWKSNLIRHQMSHDSGKHYECENCAKVFTDPSNLQRHIRSQHV 100 110 120 130 140 150 370 380 390 400 410 420 pF1KA1 GARAHACPDCGKTFATSSGLKQHKHIHSTVKPFICEVCHKSYTQFSNLCRHKRMHADCRT ::::::::.:::::::::::::::::::.::::::::::::::::::::::::::::::: CCDS32 GARAHACPECGKTFATSSGLKQHKHIHSSVKPFICEVCHKSYTQFSNLCRHKRMHADCRT 160 170 180 190 200 210 430 440 450 460 470 480 pF1KA1 QIKCKDCGQMFSTTSSLNKHRRFCEGKNHYTPGGIFAPGLPLTPSPMMDKAKPSPSLNHA :::::::::::::::::::::::::::::.. ::.:. :. : .: :::.. ...:: CCDS32 QIKCKDCGQMFSTTSSLNKHRRFCEGKNHFAAGGFFGQGISLPGTPAMDKTS-MVNMSHA 220 230 240 250 260 270 490 500 510 520 530 540 pF1KA1 SLGFNEYFPSRPHPGSLPFSTAPPTFPALTPGFPGIFPPSLYPRPPLLPPTPLLKSPLNH . :. .:: . ::..: : :: :... .:::.:: .:: ::::.: . .:. . CCDS32 NPGLADYFGANRHPAGLTF----PTAPGFSFSFPGLFPSGLYHRPPLIPASSPVKGLSST 280 290 300 310 320 330 550 560 570 580 590 pF1KA1 TQDAKLPSPL-GNPA-LPLVSAVSNSSQGTTAAAGPEEKFESRLEDSCVEKLKTRSSDMS : : ::: .: :: .. . .. . ..: .. : . : : :. . ::.: CCDS32 EQTNKSQSPLMTHPQILPATQDILKA-LSKHPSVGDNKPVELQPERSSEERPFEKISDQS 340 350 360 370 380 600 610 620 630 640 650 pF1KA1 DGSDFEDVNTTTGTDLDTTTGTGSDLDSDVDSDPDKDKGKGKSAEGQPKFGGGLAPPGAP ..::..::.: .:.::.::.: :::.::..:: .: : .:: . . . .:: . CCDS32 ESSDLDDVSTPSGSDLETTSG--SDLESDIESDKEKFKENGKMFKDKVSPLQNLA---SI 390 400 410 420 430 440 660 670 680 690 700 710 pF1KA1 NSVAEVPVFYSQHSFFPPPDEQLLTATGAAGDSIKAIASIAEKYFGP-GFMGMQEKKLGS :. : ::.::.: : :. ...::..::::::::::::::: :..:.:.::.:. CCDS32 NNKKE----YSNHSIFSPSLEEQTAVSGAVNDSIKAIASIAEKYFGSTGLVGLQDKKVGA 450 460 470 480 490 500 720 730 740 750 760 770 pF1KA1 LPYHSAFPFQFLPNFPHSLYPFTDRALAHNLLVKAEPKSPRDALKVGGPSAECPFDLTTK ::: : ::. :.: : .:.::: :: : ..: .: ::.:: .. :. :.: ::::::: CCDS32 LPYPSMFPLPFFPAFSQSMYPFPDRDL-RSLPLKMEPQSPGEVKKLQKGSSESPFDLTTK 510 520 530 540 550 780 790 800 810 820 830 pF1KA1 PKDVKPILPMP-KGPSAPASGEEQPLDLSIGSRARASQNGGGR--EPRKNHVYGERKLGA :: ::. :.: : : .::....::::::.:::.::: : . :::::::.: .: . CCDS32 RKDEKPLTPVPSKPPVTPATSQDQPLDLSMGSRSRAS---GTKLTEPRKNHVFGGKKGSN 560 570 580 590 600 610 840 850 860 870 880 890 pF1KA1 GEGLPQVCPARMPQQPPLHYAKPSPFFMDPIYSRVEKRKVTDPVGALKEKYLRPSP-LLF :. : .. :..:.:.:::::::: ::::::.:::. ::::::::::: .:: CCDS32 VESRPA-------SDGSLQHARPTPFFMDPIY-RVEKRKLTDPLEALKEKYLRPSPGFLF 620 630 640 650 660 900 910 920 930 940 pF1KA1 HPQ---------MSAIETMTEKLESFAAMKADSGSSLQPLPHHPFNFRSPPPTLSDPILR ::: :::::.:.::::::.:.: ... :: .: ::::.:: .: . .:: CCDS32 HPQFQLPDQRTWMSAIENMAEKLESFSALKPEASELLQSVPSM-FNFRAPPNALPENLLR 670 680 690 700 710 720 950 960 970 980 990 1000 pF1KA1 KGKERYTCRYCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KGKERYTCRYCGKIFPRSANLTRHLRTHTGEQPYRCKYCDRSFSISSNLQRHVRNIHNKE 730 740 750 760 770 780 1010 1020 1030 1040 1050 1060 pF1KA1 KPFKCHLCNRCFGQQTNLDRHLKKHEHENAPVSQHPGVLTNHLGTSASSPTSESDNH-AL ::::::::.:::::::::::::::::. : ::..::: :: .. :. CCDS32 KPFKCHLCDRCFGQQTNLDRHLKKHENGNMS------------GTATSSPHSELESTGAI 790 800 810 820 830 1070 1080 1090 1100 1110 1120 pF1KA1 LDEKEDSYFSEIRNFIANSEMNQASTRT-EKRAD-MQIVDGSAQCPGLASEKQEDVEEED ::.:::.::.::::::.::. .. : :. :.: . .. : .: . :. .: : :: CCDS32 LDDKEDAYFTEIRNFIGNSNHGSQSPRNVEERMNGSHFKDEKALVTSQNSDLLDDEEVED 840 850 860 870 880 890 1130 1140 1150 1160 1170 1180 pF1KA1 DDDLEEDDEDS-LAGKSQDDTVSPAPEPQAAYEDEEDEEPAASLAVGFDHTRRCAEDHEG . :.:.:::. ..::. . :. . .. ::. .: : .. . .: :.... CCDS32 EVLLDEEDEDNDITGKTGKEPVT-SNLHEGNPEDDYEETSALEMSCKTSPVRYKEEEYKS 900 910 920 930 940 950 1190 1200 1210 1220 1230 pF1KA1 GLLALEPMPTFGKGLDLRRAAEEAFEVKDV--LNSTLDSEALKHTLCRQAKNQAYAMMLS :: ::. . : .: .:. .. . .. .... : ::. : :..:.:::::::: CCDS32 GLSALDHIRHFTDSLKMRKMEDNQYSEAELSSFSTSHVPEELKQPLHRKSKSQAYAMMLS 960 970 980 990 1000 1010 1240 1250 1260 1270 pF1KA1 LSEDTPLHTPSQGSLDAWLKVTGATSESGAFHPINHL ::. ::. :..: ..: ... :..::.:.. :.:. CCDS32 LSDKESLHSTSHSSSNVWHSMARAAAESSAIQSISHV 1020 1030 1040 1050 1276 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 11:18:42 2016 done: Thu Nov 3 11:18:43 2016 Total Scan time: 4.600 Total Display time: 0.260 Function used was FASTA [36.3.4 Apr, 2011]