FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB0458, 949 aa
1>>>pF1KB0458 949 - 949 aa - 949 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1155+/-0.00105; mu= 17.6496+/- 0.063
mean_var=80.8783+/-16.478, 0's: 0 Z-trim(104.0): 27 B-trim: 26 in 1/48
Lambda= 0.142613
statistics sampled from 7683 (7704) to 7683 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.6), E-opt: 0.2 (0.237), width: 16
Scan time: 4.120
The best scores are: opt bits E(32554)
CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 ( 949) 6252 1296.8 0
CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 ( 949) 6232 1292.6 0
CCDS5574.1 GTF2I gene_id:2969|Hs108|chr7 ( 978) 1588 337.2 9.6e-92
CCDS5575.1 GTF2I gene_id:2969|Hs108|chr7 ( 977) 1473 313.5 1.3e-84
CCDS47614.1 GTF2I gene_id:2969|Hs108|chr7 ( 957) 1370 292.3 3e-78
CCDS64680.1 GTF2I gene_id:2969|Hs108|chr7 ( 274) 1331 284.1 2.6e-76
CCDS5573.1 GTF2I gene_id:2969|Hs108|chr7 ( 998) 1310 280.0 1.6e-74
CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1 (1325) 553 124.3 1.6e-27
CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5 ( 594) 517 116.7 1.3e-25
CCDS64682.1 GTF2IRD2 gene_id:84163|Hs108|chr7 ( 108) 505 113.9 1.7e-25
CCDS34355.1 ZBED9 gene_id:114821|Hs108|chr6 (1325) 454 103.9 2.2e-21
CCDS46790.1 EPM2AIP1 gene_id:9852|Hs108|chr3 ( 607) 449 102.7 2.2e-21
CCDS47028.1 FAM200B gene_id:285550|Hs108|chr4 ( 657) 426 98.0 6.3e-20
CCDS5668.1 FAM200A gene_id:221786|Hs108|chr7 ( 573) 408 94.3 7.3e-19
CCDS47613.1 GTF2IRD1 gene_id:9569|Hs108|chr7 ( 944) 343 81.0 1.2e-14
CCDS56492.1 GTF2IRD1 gene_id:9569|Hs108|chr7 ( 976) 343 81.0 1.2e-14
CCDS5571.1 GTF2IRD1 gene_id:9569|Hs108|chr7 ( 959) 342 80.8 1.4e-14
>>CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 (949 aa)
initn: 6252 init1: 6252 opt: 6252 Z-score: 6946.9 bits: 1296.8 E(32554): 0
Smith-Waterman score: 6252; 99.7% identity (99.9% similar) in 949 aa overlap (1-949:1-949)
10 20 30 40 50 60
pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 KALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIIN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 RPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESED
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB0 PNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 PNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB0 SAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB0 ITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB0 IDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 IDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMER
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB0 MRDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREK
::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::
CCDS55 MRDEKLHELKKGLRKYLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB0 IRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 IRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB0 KSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESL
::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KSLKNFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB0 CAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 CAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB0 KRFFESLEEIDSFMSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KRFFESLEEIDSFMSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQM
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB0 YDLIRAFLAKLCLWETHLTRNNLAHFPTLKLASRNESDGLNYIPKIAELKTEFQKRLSDF
:::::::::::::::::::::::::::::::::::::::::::::::::.::::::::::
CCDS55 YDLIRAFLAKLCLWETHLTRNNLAHFPTLKLASRNESDGLNYIPKIAELQTEFQKRLSDF
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB0 KLYESELTLFSSPFSTKIDSVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KLYESELTLFSSPFSTKIDSVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPK
850 860 870 880 890 900
910 920 930 940
pF1KB0 YKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 YKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT
910 920 930 940
>>CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 (949 aa)
initn: 6232 init1: 6232 opt: 6232 Z-score: 6924.6 bits: 1292.6 E(32554): 0
Smith-Waterman score: 6232; 99.4% identity (99.7% similar) in 949 aa overlap (1-949:1-949)
10 20 30 40 50 60
pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 KALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIIN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 RPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESED
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB0 PNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB0 SAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB0 ITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB0 IDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::
CCDS34 IDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYTER
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB0 MRDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREK
::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::
CCDS34 MRDEKLHELKKGLRKYLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB0 IRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVE
:::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::
CCDS34 IRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFLRVE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB0 KSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESL
::::::::.::.::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KSLKKFCINWSRLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB0 CAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 CAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB0 KRFFESLEEIDSFMSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KRFFESLEEIDSFMSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQM
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB0 YDLIRAFLAKLCLWETHLTRNNLAHFPTLKLASRNESDGLNYIPKIAELKTEFQKRLSDF
:::::::::::::::::::::::::::::::.::::::::::::::::::::::::::::
CCDS34 YDLIRAFLAKLCLWETHLTRNNLAHFPTLKLVSRNESDGLNYIPKIAELKTEFQKRLSDF
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB0 KLYESELTLFSSPFSTKIDSVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KLYESELTLFSSPFSTKIDSVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPK
850 860 870 880 890 900
910 920 930 940
pF1KB0 YKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 YKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT
910 920 930 940
>>CCDS5574.1 GTF2I gene_id:2969|Hs108|chr7 (978 aa)
initn: 1904 init1: 934 opt: 1588 Z-score: 1760.6 bits: 337.2 E(32554): 9.6e-92
Smith-Waterman score: 1590; 45.5% identity (67.7% similar) in 653 aa overlap (1-629:1-642)
10 20 30 40 50 60
pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
:::::.::::::.: :::.:::::::.:::::::::::::::::::::::::::::::::
CCDS55 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE
10 20 30 40 50 60
70 80 90 100 110
pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF
:: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.:::::
CCDS55 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI
::::::::: ...::::::::::::::::::::::::::.::::::::::::::::::::
CCDS55 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK
::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.::
CCDS55 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB0 KESEDPNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNS
.:::::.:::::.:::: :: .:: :::.: :::: :::: .::::.:: :: . :
CCDS55 EESEDPDYYQYNIQGSHHSSEGNEGTEMEVPAEDSTQHVPSET-SEDPEVEVTIEDDDYS
250 260 270 280 290
300 310 320 330 340
pF1KB0 SSVTNSAAGVEDLNIVQVTVPDN---EKERLSSIEK----IKQLREQVNDLFSRKFGEAI
:. .: : : : .: : ..:: : .::.::..:: ::...::
CCDS55 PPSKRPKAN--ELPQPPVPEPANAGKRKVREFNFEKWNARITDLRKQVEELFERKYAQAI
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB0 GVDFPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPL
. :: .:: . . . ..:.: :. :. :. : ..::: : : :.:.. .
CCDS55 KAKGPVTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVIKKH-
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB0 PGLELSNVGKR--KIDQEGRVFQEKWERAYFFVEVQNIPTCLICKQ-SMSVSKEYNLRRH
:: : .. ..:. . .:.: ....... :.::. . ....
CCDS55 ---ELLNSTREDLQLDKPASGVKEEWYAR--ITKLRKMVDQLFCKKFAEALGSTEAKAVP
420 430 440 450 460 470
470 480 490 500 510
pF1KB0 YQTNHSKHYDQYMERM------RDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSP--
:: ... : :.: . :. . . . . . .: .. ..... .
CCDS55 YQKFEAHPNDLYVEGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRPELLTHSTTEV
480 490 500 510 520 530
520 530 540 550 560 570
pF1KB0 TQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVS
:: ::.. . :::.... . ... . . ....... . . .:
CCDS55 TQPRTNTPVKEDWNVRITKLRKQVEEI--FNLKFAQALGLTEAVKVPYPVFESNPEFLYV
540 550 560 570 580
580 590 600 610 620 630
pF1KB0 EELLDTVPM-TGTKSGNEIFSRVEKSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLK
: : . .:. . : : . :. .. .:. . .: : : :.:.. :
CCDS55 EGLPEGIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASKINTKALQSP
590 600 610 620 630 640
640 650 660 670 680 690
pF1KB0 SRVATFCKGAELKSICCIIHPESLCAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLY
CCDS55 KRPRSPGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGREFSFEAWNAK
650 660 670 680 690 700
>--
initn: 864 init1: 655 opt: 674 Z-score: 744.2 bits: 149.1 E(32554): 3.9e-35
Smith-Waterman score: 681; 43.4% identity (58.4% similar) in 327 aa overlap (107-433:713-949)
80 90 100 110 120 130
pF1KB0 AKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTTVMVPVPYEKM
:.. ::. : :.::: : ::. .
CCDS55 TPTQTNGSNVPFKPRGREFSFEAWNAKITDLKQKVENLFNEKCGEALGLKQAVKVPFALF
690 700 710 720 730 740
140 150 160 170 180 190
pF1KB0 LRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGPESQLGGPGMV
:.:::::: :..: .. . :. ::.::: :.:::..:
CCDS55 ESFPEDFYVEGLPEGVPFRRPSTFGIPRLEKILRNKAKIKFIIKKP--------------
750 760 770 780
200 210 220 230 240 250
pF1KB0 TDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQYNMQGSHPSST
: ...: ::: ::
CCDS55 ----------------------EMFETAI----------KEST--------------SSK
790 800
260 270 280 290 300 310
pF1KB0 SNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVP
: : .. : .: :.:. .:.:::::::.:::.:
CCDS55 S-----------------PPRKINSSP--------NVNT-----TASGVEDLNIIQVTIP
810 820 830
320 330 340 350 360 370
pF1KB0 DNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPG
:...::::..:: .:::::::::::::::::::. :::::::::::.::::::.::::::
CCDS55 DDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDGMPPG
840 850 860 870 880 890
380 390 400 410 420 430
pF1KB0 VVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRKIDQEGRVFQEKWERAY
: ::::.:::::::::::..:::::::::::.::: ..: . ..:: :.::. :
CCDS55 VSFKAPSYLEISSMRRILDSAEFIKFTVIRPFPGLVINNQLVDQSESEGPVIQESAEPSQ
900 910 920 930 940 950
440 450 460 470 480 490
pF1KB0 FFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMERMRDEKLHELKKGLRKY
CCDS55 LEVPATEEIKETDGSSQIKQEPDPTW
960 970
>>CCDS5575.1 GTF2I gene_id:2969|Hs108|chr7 (977 aa)
initn: 1882 init1: 821 opt: 1473 Z-score: 1632.7 bits: 313.5 E(32554): 1.3e-84
Smith-Waterman score: 1473; 43.4% identity (66.3% similar) in 656 aa overlap (1-629:1-641)
10 20 30 40 50 60
pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
:::::.::::::.: :::.:::::::.:::::::::::::::::::::::::::::::::
CCDS55 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE
10 20 30 40 50 60
70 80 90 100 110
pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF
:: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.:::::
CCDS55 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI
::::::::: ...::::::::::::::::::::::::::.::::::::::::::::::::
CCDS55 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK
::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.::
CCDS55 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB0 KESEDPNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSE---EPNEDPEAEVKIEGN
.:::::.:::::.:.. :: :.. .. . :. : :: :. : :: : :: : .
CCDS55 EESEDPDYYQYNIQAG-PSETDD--VDEKQPL--SKPLQGSHHSSEGNEGTEMEVPAEDD
250 260 270 280 290
300 310 320 330 340
pF1KB0 TNSSSVTNSAAGVEDLNIVQVTVPDN---EKERLSSIEK----IKQLREQVNDLFSRKFG
: :. .: : : : .: : ..:: : .::.::..:: ::..
CCDS55 DYSPPSKRPKAN--ELPQPPVPEPANAGKRKVREFNFEKWNARITDLRKQVEELFERKYA
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB0 EAIGVDFPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVI
.:: . :: .:: . . . ..:.: :. :. :. : ..::: : : :.:..
CCDS55 QAIKAKGPVTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVIK
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB0 RPLPGLELSNVGKR--KIDQEGRVFQEKWERAYFFVEVQNIPTCLICKQ-SMSVSKEYNL
. :: : .. ..:. . .:.: ....... :.::. . ....
CCDS55 KH----ELLNSTREDLQLDKPASGVKEEWYAR--ITKLRKMVDQLFCKKFAEALGSTEAK
420 430 440 450 460
470 480 490 500 510
pF1KB0 RRHYQTNHSKHYDQYMERM------RDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPS
:: ... : :.: . :. . . . . . .: .. ..... .
CCDS55 AVPYQKFEAHPNDLYVEGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRPELLTHST
470 480 490 500 510 520
520 530 540 550 560 570
pF1KB0 P--TQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEITDINNTTQLAIFIRGVDENF
:: ::.. . :::.... . ... . . ....... . . .:
CCDS55 TEVTQPRTNTPVKEDWNVRITKLRKQVEEI--FNLKFAQALGLTEAVKVPYPVFESNPEF
530 540 550 560 570 580
580 590 600 610 620 630
pF1KB0 DVSEELLDTVPM-TGTKSGNEIFSRVEKSLKKFCIDWSKLVSVASTGTPAMVDANNGLVT
: : . .:. . : : . :. .. .:. . .: : : :.:.. :
CCDS55 LYVEGLPEGIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASKINTKAL
590 600 610 620 630 640
640 650 660 670 680 690
pF1KB0 KLKSRVATFCKGAELKSICCIIHPESLCAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTT
CCDS55 QSPKRPRSPGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGREFSFEAW
650 660 670 680 690 700
>--
initn: 864 init1: 655 opt: 674 Z-score: 744.2 bits: 149.1 E(32554): 3.9e-35
Smith-Waterman score: 681; 43.4% identity (58.4% similar) in 327 aa overlap (107-433:712-948)
80 90 100 110 120 130
pF1KB0 AKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTTVMVPVPYEKM
:.. ::. : :.::: : ::. .
CCDS55 TPTQTNGSNVPFKPRGREFSFEAWNAKITDLKQKVENLFNEKCGEALGLKQAVKVPFALF
690 700 710 720 730 740
140 150 160 170 180 190
pF1KB0 LRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGPESQLGGPGMV
:.:::::: :..: .. . :. ::.::: :.:::..:
CCDS55 ESFPEDFYVEGLPEGVPFRRPSTFGIPRLEKILRNKAKIKFIIKKP--------------
750 760 770 780
200 210 220 230 240 250
pF1KB0 TDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQYNMQGSHPSST
: ...: ::: ::
CCDS55 ----------------------EMFETAI----------KEST--------------SSK
790 800
260 270 280 290 300 310
pF1KB0 SNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVP
: : .. : .: :.:. .:.:::::::.:::.:
CCDS55 S-----------------PPRKINSSP--------NVNT-----TASGVEDLNIIQVTIP
810 820 830
320 330 340 350 360 370
pF1KB0 DNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPG
:...::::..:: .:::::::::::::::::::. :::::::::::.::::::.::::::
CCDS55 DDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDGMPPG
840 850 860 870 880 890
380 390 400 410 420 430
pF1KB0 VVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRKIDQEGRVFQEKWERAY
: ::::.:::::::::::..:::::::::::.::: ..: . ..:: :.::. :
CCDS55 VSFKAPSYLEISSMRRILDSAEFIKFTVIRPFPGLVINNQLVDQSESEGPVIQESAEPSQ
900 910 920 930 940 950
440 450 460 470 480 490
pF1KB0 FFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMERMRDEKLHELKKGLRKY
CCDS55 LEVPATEEIKETDGSSQIKQEPDPTW
960 970
>>CCDS47614.1 GTF2I gene_id:2969|Hs108|chr7 (957 aa)
initn: 1889 init1: 919 opt: 1370 Z-score: 1518.3 bits: 292.3 E(32554): 3e-78
Smith-Waterman score: 1521; 43.8% identity (67.6% similar) in 648 aa overlap (1-629:1-621)
10 20 30 40 50 60
pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
:::::.::::::.: :::.:::::::.:::::::::::::::::::::::::::::::::
CCDS47 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE
10 20 30 40 50 60
70 80 90 100 110
pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF
:: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.:::::
CCDS47 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI
::::::::: ...::::::::::::::::::::::::::.::::::::::::::::::::
CCDS47 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK
::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.::
CCDS47 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB0 KESEDPNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEP--NEDPEAEVKIEGNT
.:::::.:::::.:::: :: .:: :::.: ::. ::..: :: :. : .:.
CCDS47 EESEDPDYYQYNIQGSHHSSEGNEGTEMEVPAEDDDYSPPSKRPKANELPQPPVPEPANA
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB0 NSSSVTNSAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFP
.. .: ...:. :. .. .: .::.::..:: ::...:: . :
CCDS47 GKRKV-------REFNF----------EKWNA--RITDLRKQVEELFERKYAQAIKAKGP
310 320 330 340
360 370 380 390 400 410
pF1KB0 VKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLEL
: .:: . . . ..:.: :. :. :. : ..::: : : :.:.. . ::
CCDS47 VTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVIKKH----EL
350 360 370 380 390
420 430 440 450 460 470
pF1KB0 SNVGKR--KIDQEGRVFQEKWERAYFFVEVQNIPTCLICKQ-SMSVSKEYNLRRHYQTNH
: .. ..:. . .:.: ....... :.::. . .... :: .
CCDS47 LNSTREDLQLDKPASGVKEEWYAR--ITKLRKMVDQLFCKKFAEALGSTEAKAVPYQKFE
400 410 420 430 440 450
480 490 500 510 520
pF1KB0 SKHYDQYMERM------RDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSP--TQKSP
.. : :.: . :. . . . . . .: .. ..... . ::
CCDS47 AHPNDLYVEGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRPELLTHSTTEVTQPRT
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB0 VQPVEDLAGNLWEKLREKIRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLD
::.. . :::.... . ... . . ....... . . .: : : .
CCDS47 NTPVKEDWNVRITKLRKQVEEI--FNLKFAQALGLTEAVKVPYPVFESNPEFLYVEGLPE
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB0 TVPM-TGTKSGNEIFSRVEKSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVAT
.:. . : : . :. .. .:. . .: : : :.:.. :
CCDS47 GIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASKINTKALQSPKRPRS
580 590 600 610 620 630
650 660 670 680 690 700
pF1KB0 FCKGAELKSICCIIHPESLCAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQ
CCDS47 PGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGREFSFEAWNAKITDLK
640 650 660 670 680 690
>--
initn: 864 init1: 655 opt: 674 Z-score: 744.4 bits: 149.1 E(32554): 3.8e-35
Smith-Waterman score: 681; 43.4% identity (58.4% similar) in 327 aa overlap (107-433:692-928)
80 90 100 110 120 130
pF1KB0 AKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTTVMVPVPYEKM
:.. ::. : :.::: : ::. .
CCDS47 TPTQTNGSNVPFKPRGREFSFEAWNAKITDLKQKVENLFNEKCGEALGLKQAVKVPFALF
670 680 690 700 710 720
140 150 160 170 180 190
pF1KB0 LRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGPESQLGGPGMV
:.:::::: :..: .. . :. ::.::: :.:::..:
CCDS47 ESFPEDFYVEGLPEGVPFRRPSTFGIPRLEKILRNKAKIKFIIKKP--------------
730 740 750 760
200 210 220 230 240 250
pF1KB0 TDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQYNMQGSHPSST
: ...: ::: ::
CCDS47 ----------------------EMFETAI----------KEST--------------SSK
770 780
260 270 280 290 300 310
pF1KB0 SNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVP
: : .. : .: :.:. .:.:::::::.:::.:
CCDS47 S-----------------PPRKINSSP--------NVNT-----TASGVEDLNIIQVTIP
790 800 810
320 330 340 350 360 370
pF1KB0 DNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPG
:...::::..:: .:::::::::::::::::::. :::::::::::.::::::.::::::
CCDS47 DDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDGMPPG
820 830 840 850 860 870
380 390 400 410 420 430
pF1KB0 VVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRKIDQEGRVFQEKWERAY
: ::::.:::::::::::..:::::::::::.::: ..: . ..:: :.::. :
CCDS47 VSFKAPSYLEISSMRRILDSAEFIKFTVIRPFPGLVINNQLVDQSESEGPVIQESAEPSQ
880 890 900 910 920 930
440 450 460 470 480 490
pF1KB0 FFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMERMRDEKLHELKKGLRKY
CCDS47 LEVPATEEIKETDGSSQIKQEPDPTW
940 950
>>CCDS64680.1 GTF2I gene_id:2969|Hs108|chr7 (274 aa)
initn: 1314 init1: 867 opt: 1331 Z-score: 1483.4 bits: 284.1 E(32554): 2.6e-76
Smith-Waterman score: 1331; 75.8% identity (87.9% similar) in 273 aa overlap (1-268:1-273)
10 20 30 40 50 60
pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
:::::.::::::.: :::.:::::::.:::::::::::::::::::::::::::::::::
CCDS64 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE
10 20 30 40 50 60
70 80 90 100 110
pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF
:: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.:::::
CCDS64 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI
::::::::: ...::::::::::::::::::::::::::.::::::::::::::::::::
CCDS64 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK
::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.::
CCDS64 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB0 KESEDPNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNS
.:::::.:::::.:::: :: .:: :::.: :
CCDS64 EESEDPDYYQYNIQGSHHSSEGNEGTEMEVPAEG
250 260 270
300 310 320 330 340 350
pF1KB0 SSVTNSAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVK
>>CCDS5573.1 GTF2I gene_id:2969|Hs108|chr7 (998 aa)
initn: 2320 init1: 794 opt: 1310 Z-score: 1451.3 bits: 280.0 E(32554): 1.6e-74
Smith-Waterman score: 1541; 44.1% identity (65.7% similar) in 673 aa overlap (1-629:1-662)
10 20 30 40 50 60
pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
:::::.::::::.: :::.:::::::.:::::::::::::::::::::::::::::::::
CCDS55 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE
10 20 30 40 50 60
70 80 90 100 110
pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF
:: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.:::::
CCDS55 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI
::::::::: ...::::::::::::::::::::::::::.::::::::::::::::::::
CCDS55 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK
::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.::
CCDS55 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK
190 200 210 220 230 240
240 250 260 270
pF1KB0 KESEDPNYYQYN--------------------MQGSHPSSTSNEVIEMELPMEDSTPLVP
.:::::.::::: .:::: :: .:: :::.: :::: ::
CCDS55 EESEDPDYYQYNIQAGPSETDDVDEKQPLSKPLQGSHHSSEGNEGTEMEVPAEDSTQHVP
250 260 270 280 290 300
280 290 300 310 320
pF1KB0 SEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVPDN---EKERLSSIEK----
:: .::::.:: :: . : :. .: : : : .: : ..::
CCDS55 SET-SEDPEVEVTIEDDDYSPPSKRPKAN--ELPQPPVPEPANAGKRKVREFNFEKWNAR
310 320 330 340 350
330 340 350 360 370 380
pF1KB0 IKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEIS
: .::.::..:: ::...:: . :: .:: . . . ..:.: :. :. :. :
CCDS55 ITDLRKQVEELFERKYAQAIKAKGPVTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIP
360 370 380 390 400 410
390 400 410 420 430 440
pF1KB0 SMRRILEAAEFIKFTVIRPLPGLELSNVGKR--KIDQEGRVFQEKWERAYFFVEVQNIPT
..::: : : :.:.. . :: : .. ..:. . .:.: .......
CCDS55 RLERILLAKERIRFVIKKH----ELLNSTREDLQLDKPASGVKEEWYAR--ITKLRKMVD
420 430 440 450 460 470
450 460 470 480 490
pF1KB0 CLICKQ-SMSVSKEYNLRRHYQTNHSKHYDQYMERM------RDEKLHELKKGLRKYLLG
:.::. . .... :: ... : :.: . :. . . . . . .:
CCDS55 QLFCKKFAEALGSTEAKAVPYQKFEAHPNDLYVEGLPENIPFRSPSWYGIPRLEKIIQVG
480 490 500 510 520 530
500 510 520 530 540 550
pF1KB0 LSDTECPEQKQVFANPSP--TQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEITDI
.. ..... . :: ::.. . :::.... . ... . . .
CCDS55 NRIKFVIKRPELLTHSTTEVTQPRTNTPVKEDWNVRITKLRKQVEEI--FNLKFAQALGL
540 550 560 570 580
560 570 580 590 600 610
pF1KB0 NNTTQLAIFIRGVDENFDVSEELLDTVPM-TGTKSGNEIFSRVEKSLKKFCIDWSKLVSV
...... . . .: : : . .:. . : : . :. .. .:. . .: :
CCDS55 TEAVKVPYPVFESNPEFLYVEGLPEGIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELV
590 600 610 620 630 640
620 630 640 650 660 670
pF1KB0 ASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKLKMDHVMDVVVK
: :.:.. :
CCDS55 ISYLPPGMASKINTKALQSPKRPRSPGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNG
650 660 670 680 690 700
>--
initn: 864 init1: 655 opt: 674 Z-score: 744.1 bits: 149.1 E(32554): 4e-35
Smith-Waterman score: 681; 43.4% identity (58.4% similar) in 327 aa overlap (107-433:733-969)
80 90 100 110 120 130
pF1KB0 AKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTTVMVPVPYEKM
:.. ::. : :.::: : ::. .
CCDS55 TPTQTNGSNVPFKPRGREFSFEAWNAKITDLKQKVENLFNEKCGEALGLKQAVKVPFALF
710 720 730 740 750 760
140 150 160 170 180 190
pF1KB0 LRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGPESQLGGPGMV
:.:::::: :..: .. . :. ::.::: :.:::..:
CCDS55 ESFPEDFYVEGLPEGVPFRRPSTFGIPRLEKILRNKAKIKFIIKKP--------------
770 780 790 800
200 210 220 230 240 250
pF1KB0 TDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQYNMQGSHPSST
: ...: ::: ::
CCDS55 ----------------------EMFETAI----------KEST--------------SSK
810 820
260 270 280 290 300 310
pF1KB0 SNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVP
: : .. : .: :.:. .:.:::::::.:::.:
CCDS55 S-----------------PPRKINSSP--------NVNT-----TASGVEDLNIIQVTIP
830 840 850
320 330 340 350 360 370
pF1KB0 DNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPG
:...::::..:: .:::::::::::::::::::. :::::::::::.::::::.::::::
CCDS55 DDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDGMPPG
860 870 880 890 900 910
380 390 400 410 420 430
pF1KB0 VVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRKIDQEGRVFQEKWERAY
: ::::.:::::::::::..:::::::::::.::: ..: . ..:: :.::. :
CCDS55 VSFKAPSYLEISSMRRILDSAEFIKFTVIRPFPGLVINNQLVDQSESEGPVIQESAEPSQ
920 930 940 950 960 970
440 450 460 470 480 490
pF1KB0 FFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMERMRDEKLHELKKGLRKY
CCDS55 LEVPATEEIKETDGSSQIKQEPDPTW
980 990
>>CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1 (1325 aa)
initn: 332 init1: 141 opt: 553 Z-score: 607.6 bits: 124.3 E(32554): 1.6e-27
Smith-Waterman score: 566; 27.2% identity (58.0% similar) in 566 aa overlap (382-931:757-1297)
360 370 380 390 400 410
pF1KB0 FPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGL
:: : : . . .:... ..:
CCDS38 ELDSPPSKKKRLGFFQTYDTEYLKVGFIICPGSKESSPRPQCVICGEILSSENMKP---A
730 740 750 760 770 780
420 430 440 450 460
pF1KB0 ELSNVGKRKIDQEGRVFQEKWERAYFFVEVQN--IPTCLICKQSMSVSKEYNLRRHYQTN
.::. : : .. . .:. . .: :: . ::. ..:. :. : . .::
CCDS38 NLSHHLKTKHSELENKPVDFFEQKSLEMECQNSSLKKCLLVEKSL-VKASYLIA--FQTA
790 800 810 820 830 840
470 480 490 500 510 520
pF1KB0 HSKHYDQYMERMRDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSPTQKSPVQP-VED
::. . :.. : :. . .:: : . ..: . : .. .: ...
CCDS38 ASKKPFSIAEELIKPYLVEMCS----EVLGSSAGD--KMKTI-----PLSNVTIQHRIDE
850 860 870 880
530 540 550 560 570 580
pF1KB0 LAGNLWEKLREKIRSFVAYSIAIDEITDINNTTQLAIFIRGVDENF-DVSEELLDTVPMT
:.... ..: .:.: ... ::: ..:.: : : .:: .: . ::.:::: . :
CCDS38 LSADIEDQLIQKVRESKWFALQIDESSEISNITLLLCYIRFIDYDCRDVKEELLFCIEMP
890 900 910 920 930 940
590 600 610 620 630 640
pF1KB0 GTKSGNEIFSRVEKSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAE
.: ::: ..: . . ..:.. :.. . :. .:. .:: .:.. .:: . :
CCDS38 TQITGFEIFELINKYIDSKSLNWKHCVGLCTDGAASMTGRYSGLKAKIQ-EVAM--NTAA
950 960 970 980 990 1000
650 660 670 680 690 700
pF1KB0 LKSICCIIHPESLCAQKLK--MDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSL
. :.:: : : :.::. . ... .. ...: : .:: .: : :. :.. ::
CCDS38 FTH--CFIHRERLVAEKLSPCLHKILLQSAQILSFIKSNALNSRMLTILCEEMGSEHVSL
1010 1020 1030 1040 1050 1060
710 720 730 740 750 760
pF1KB0 LYYTEIKWLSRGLVLKRFFESLEEIDSFMSSRGKPLPQ-LSSIDWIRDLAFLVDMTMHLN
..:..:.::: .:::.:: .::. :.:.. . : . . . .:. ::.: :. .:
CCDS38 PLHAEVRWISRGRMLKRLFELRHEIEIFLSQKHSDLAKYFHDEEWVGKLAYLSDIFSLIN
1070 1080 1090 1100 1110 1120
770 780 790 800 810 820
pF1KB0 ALNISLQGHSQIVTQMYDLIRAFLAKLCLWETHLTRNNLAHFPTLKLASRNESDGLNYIP
::.:::: .. . : .: :: .: . .:. ::... : .:.::: .
CCDS38 ELNLSLQGTLTTFFNLCNKIDVFKRKLKMWLKRTQENDYDMFPSFSEFS--NSSGLN-MT
1130 1140 1150 1160 1170 1180
830 840 850 860 870
pF1KB0 KIAELKTEFQKRLSD-FK-LYESELTLFSS------PFSTKIDSVHEELQME-VIDLQCN
:... : . ::. :. . : : :. :: .. .. ... : . .:. .
CCDS38 DITRIIFEHLEGLSQVFSDCFPPEQDLRSGNLWIIHPFMNHQNNNLTDFEEEKLTELSSD
1190 1200 1210 1220 1230 1240
880 890 900 910 920 930
pF1KB0 TVLKTKYDKVGIPEFYKYLWGSYPKYKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQ
:.. . .:.. .:. :::. ... :.: :...:.:. :: . :: :
CCDS38 LGLQALFKSVSVTQFWINAKTSYPELHERAMKFLLPFSTVYLCDAAFSALTESKQKNLLG
1250 1260 1270 1280 1290 1300
940
pF1KB0 LKDSQWDSVLHIAT
CCDS38 SGPALRLAVTSLIPRIEKLVKEKE
1310 1320
>>CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5 (594 aa)
initn: 343 init1: 183 opt: 517 Z-score: 573.1 bits: 116.7 E(32554): 1.3e-25
Smith-Waterman score: 517; 24.9% identity (61.6% similar) in 425 aa overlap (526-938:150-566)
500 510 520 530 540 550
pF1KB0 YLLGLSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREKIR-SFVAYSIAIDEI
..... .. ... : :. : . .: . :
CCDS34 ALEIAQIVLGPDAQKKLQQVPLSDDVIHSRIDEMSQDILQQVLEDIKASPLKVGIQLAET
120 130 140 150 160 170
560 570 580 590 600 610
pF1KB0 TDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVEKSLKKFCIDWSKLV
::... .:: :.: . : .. ::.: :. . .: ..:. . . : : .
CCDS34 TDMDDCSQLMAFVRYIKER-EIVEEFLFCEPLQLSMKGIDVFNLFRDFFLKHKIALDVCG
180 190 200 210 220 230
620 630 640 650 660 670
pF1KB0 SVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKL--KMDHVMD
:: . :. .:. :. .:. .:... .. :...:..: . : :. ..
CCDS34 SVCTDGASSMLGENSEFVAYVKKEIP------HIVVTHCLLNPHALVIKTLPTKLRDALF
240 250 260 270 280 290
680 690 700 710 720 730
pF1KB0 VVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVLKRFFESLEEIDS
.::. .:.: .:. :: : ... :. .:. ::..::..::::: .: ..:: :::..
CCDS34 TVVRVINFIKGRAPNHRLFQAFFEEIGIEYSVLLFHTEMRWLSRGQILTHIFEMYEEINQ
300 310 320 330 340 350
740 750 760 770 780 790
pF1KB0 FMSSRGKPLPQ-LSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQMYDLIRAFLAKL
:. ... : . . . .. ::.:.:. ::: :. :.: .. ... . . ::. :.
CCDS34 FLHHKSSNLVDGFENKEFKIHLAYLADLFKHLNELSASMQRTGMNTVSAREKLSAFVRKF
360 370 380 390 400 410
800 810 820 830 840
pF1KB0 CLWETHLTRNNLAHFPTLKLASRNESDGLNYIPKIA----ELKTEFQKRLSDFKLYESEL
.:. .. . :...:: :. ....:. .:. .:.. :. .: : :.
CCDS34 PFWQKRIEKRNFTNFPFLEEIIVSDNEGIFIAAEITLHLQQLSNFFHGYFSIGDLNEASK
420 430 440 450 460 470
850 860 870 880 890 900
pF1KB0 TLFSSPFSTKIDSVHEELQM--EVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPKYKHHC
... :: .:: : . : .. .:. . . ... . . .:. . ..:. .
CCDS34 WILD-PFLFNIDFVDDSYLMKNDLAELRASGQILMEFETMKLEDFWCAQFTAFPNLAKTA
480 490 500 510 520 530
910 920 930 940
pF1KB0 AKILSMFGSTYICEQLFS-IMKL-SKTKYCSQLKDSQWDSVLHIAT
.:: :..::.:: :: .... .:.. : .:.:
CCDS34 LEILMPFATTYLCELGFSSLLHFKTKSRSCFNLSDDIRVAISKKVPRFSDIIEQKLQLQQ
540 550 560 570 580 590
CCDS34 KSL
>>CCDS64682.1 GTF2IRD2 gene_id:84163|Hs108|chr7 (108 aa)
initn: 505 init1: 505 opt: 505 Z-score: 571.3 bits: 113.9 E(32554): 1.7e-25
Smith-Waterman score: 505; 100.0% identity (100.0% similar) in 80 aa overlap (1-80:1-80)
10 20 30 40 50 60
pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG
::::::::::::::::::::
CCDS64 RGCAFVNARTDFQKDFAKYCRCFNFILCIPNLKRIAGKTSTVFSSKLS
70 80 90 100
949 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 16:57:45 2016 done: Sat Nov 5 16:57:46 2016
Total Scan time: 4.120 Total Display time: 0.240
Function used was FASTA [36.3.4 Apr, 2011]