FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB0458, 949 aa 1>>>pF1KB0458 949 - 949 aa - 949 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1155+/-0.00105; mu= 17.6496+/- 0.063 mean_var=80.8783+/-16.478, 0's: 0 Z-trim(104.0): 27 B-trim: 26 in 1/48 Lambda= 0.142613 statistics sampled from 7683 (7704) to 7683 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.6), E-opt: 0.2 (0.237), width: 16 Scan time: 4.120 The best scores are: opt bits E(32554) CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 ( 949) 6252 1296.8 0 CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 ( 949) 6232 1292.6 0 CCDS5574.1 GTF2I gene_id:2969|Hs108|chr7 ( 978) 1588 337.2 9.6e-92 CCDS5575.1 GTF2I gene_id:2969|Hs108|chr7 ( 977) 1473 313.5 1.3e-84 CCDS47614.1 GTF2I gene_id:2969|Hs108|chr7 ( 957) 1370 292.3 3e-78 CCDS64680.1 GTF2I gene_id:2969|Hs108|chr7 ( 274) 1331 284.1 2.6e-76 CCDS5573.1 GTF2I gene_id:2969|Hs108|chr7 ( 998) 1310 280.0 1.6e-74 CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1 (1325) 553 124.3 1.6e-27 CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5 ( 594) 517 116.7 1.3e-25 CCDS64682.1 GTF2IRD2 gene_id:84163|Hs108|chr7 ( 108) 505 113.9 1.7e-25 CCDS34355.1 ZBED9 gene_id:114821|Hs108|chr6 (1325) 454 103.9 2.2e-21 CCDS46790.1 EPM2AIP1 gene_id:9852|Hs108|chr3 ( 607) 449 102.7 2.2e-21 CCDS47028.1 FAM200B gene_id:285550|Hs108|chr4 ( 657) 426 98.0 6.3e-20 CCDS5668.1 FAM200A gene_id:221786|Hs108|chr7 ( 573) 408 94.3 7.3e-19 CCDS47613.1 GTF2IRD1 gene_id:9569|Hs108|chr7 ( 944) 343 81.0 1.2e-14 CCDS56492.1 GTF2IRD1 gene_id:9569|Hs108|chr7 ( 976) 343 81.0 1.2e-14 CCDS5571.1 GTF2IRD1 gene_id:9569|Hs108|chr7 ( 959) 342 80.8 1.4e-14 >>CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 (949 aa) initn: 6252 init1: 6252 opt: 6252 Z-score: 6946.9 bits: 1296.8 E(32554): 0 Smith-Waterman score: 6252; 99.7% identity (99.9% similar) in 949 aa overlap (1-949:1-949) 10 20 30 40 50 60 pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 KALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIIN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 RPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESED 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 PNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 SAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 ITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB0 IDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMER 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB0 MRDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREK ::::::::::::::::::: :::::::::::::::::::::::::::::::::::::::: CCDS55 MRDEKLHELKKGLRKYLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB0 IRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB0 KSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESL ::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KSLKNFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB0 CAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 CAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB0 KRFFESLEEIDSFMSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KRFFESLEEIDSFMSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQM 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB0 YDLIRAFLAKLCLWETHLTRNNLAHFPTLKLASRNESDGLNYIPKIAELKTEFQKRLSDF :::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::: CCDS55 YDLIRAFLAKLCLWETHLTRNNLAHFPTLKLASRNESDGLNYIPKIAELQTEFQKRLSDF 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB0 KLYESELTLFSSPFSTKIDSVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KLYESELTLFSSPFSTKIDSVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPK 850 860 870 880 890 900 910 920 930 940 pF1KB0 YKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 YKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT 910 920 930 940 >>CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 (949 aa) initn: 6232 init1: 6232 opt: 6232 Z-score: 6924.6 bits: 1292.6 E(32554): 0 Smith-Waterman score: 6232; 99.4% identity (99.7% similar) in 949 aa overlap (1-949:1-949) 10 20 30 40 50 60 pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 KALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIIN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 RPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESED 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 PNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 SAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 ITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB0 IDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMER ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: :: CCDS34 IDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYTER 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB0 MRDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREK ::::::::::::::::::: :::::::::::::::::::::::::::::::::::::::: CCDS34 MRDEKLHELKKGLRKYLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB0 IRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::: CCDS34 IRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFLRVE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB0 KSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESL ::::::::.::.:::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KSLKKFCINWSRLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB0 CAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 CAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB0 KRFFESLEEIDSFMSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KRFFESLEEIDSFMSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQM 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB0 YDLIRAFLAKLCLWETHLTRNNLAHFPTLKLASRNESDGLNYIPKIAELKTEFQKRLSDF :::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::: CCDS34 YDLIRAFLAKLCLWETHLTRNNLAHFPTLKLVSRNESDGLNYIPKIAELKTEFQKRLSDF 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB0 KLYESELTLFSSPFSTKIDSVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KLYESELTLFSSPFSTKIDSVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPK 850 860 870 880 890 900 910 920 930 940 pF1KB0 YKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 YKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT 910 920 930 940 >>CCDS5574.1 GTF2I gene_id:2969|Hs108|chr7 (978 aa) initn: 1904 init1: 934 opt: 1588 Z-score: 1760.6 bits: 337.2 E(32554): 9.6e-92 Smith-Waterman score: 1590; 45.5% identity (67.7% similar) in 653 aa overlap (1-629:1-642) 10 20 30 40 50 60 pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE :::::.::::::.: :::.:::::::.::::::::::::::::::::::::::::::::: CCDS55 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF :: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.::::: CCDS55 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI ::::::::: ...::::::::::::::::::::::::::.:::::::::::::::::::: CCDS55 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK ::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.:: CCDS55 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB0 KESEDPNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNS .:::::.:::::.:::: :: .:: :::.: :::: :::: .::::.:: :: . : CCDS55 EESEDPDYYQYNIQGSHHSSEGNEGTEMEVPAEDSTQHVPSET-SEDPEVEVTIEDDDYS 250 260 270 280 290 300 310 320 330 340 pF1KB0 SSVTNSAAGVEDLNIVQVTVPDN---EKERLSSIEK----IKQLREQVNDLFSRKFGEAI :. .: : : : .: : ..:: : .::.::..:: ::...:: CCDS55 PPSKRPKAN--ELPQPPVPEPANAGKRKVREFNFEKWNARITDLRKQVEELFERKYAQAI 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB0 GVDFPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPL . :: .:: . . . ..:.: :. :. :. : ..::: : : :.:.. . CCDS55 KAKGPVTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVIKKH- 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB0 PGLELSNVGKR--KIDQEGRVFQEKWERAYFFVEVQNIPTCLICKQ-SMSVSKEYNLRRH :: : .. ..:. . .:.: ....... :.::. . .... CCDS55 ---ELLNSTREDLQLDKPASGVKEEWYAR--ITKLRKMVDQLFCKKFAEALGSTEAKAVP 420 430 440 450 460 470 470 480 490 500 510 pF1KB0 YQTNHSKHYDQYMERM------RDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSP-- :: ... : :.: . :. . . . . . .: .. ..... . CCDS55 YQKFEAHPNDLYVEGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRPELLTHSTTEV 480 490 500 510 520 530 520 530 540 550 560 570 pF1KB0 TQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVS :: ::.. . :::.... . ... . . ....... . . .: CCDS55 TQPRTNTPVKEDWNVRITKLRKQVEEI--FNLKFAQALGLTEAVKVPYPVFESNPEFLYV 540 550 560 570 580 580 590 600 610 620 630 pF1KB0 EELLDTVPM-TGTKSGNEIFSRVEKSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLK : : . .:. . : : . :. .. .:. . .: : : :.:.. : CCDS55 EGLPEGIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASKINTKALQSP 590 600 610 620 630 640 640 650 660 670 680 690 pF1KB0 SRVATFCKGAELKSICCIIHPESLCAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLY CCDS55 KRPRSPGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGREFSFEAWNAK 650 660 670 680 690 700 >-- initn: 864 init1: 655 opt: 674 Z-score: 744.2 bits: 149.1 E(32554): 3.9e-35 Smith-Waterman score: 681; 43.4% identity (58.4% similar) in 327 aa overlap (107-433:713-949) 80 90 100 110 120 130 pF1KB0 AKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTTVMVPVPYEKM :.. ::. : :.::: : ::. . CCDS55 TPTQTNGSNVPFKPRGREFSFEAWNAKITDLKQKVENLFNEKCGEALGLKQAVKVPFALF 690 700 710 720 730 740 140 150 160 170 180 190 pF1KB0 LRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGPESQLGGPGMV :.:::::: :..: .. . :. ::.::: :.:::..: CCDS55 ESFPEDFYVEGLPEGVPFRRPSTFGIPRLEKILRNKAKIKFIIKKP-------------- 750 760 770 780 200 210 220 230 240 250 pF1KB0 TDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQYNMQGSHPSST : ...: ::: :: CCDS55 ----------------------EMFETAI----------KEST--------------SSK 790 800 260 270 280 290 300 310 pF1KB0 SNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVP : : .. : .: :.:. .:.:::::::.:::.: CCDS55 S-----------------PPRKINSSP--------NVNT-----TASGVEDLNIIQVTIP 810 820 830 320 330 340 350 360 370 pF1KB0 DNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPG :...::::..:: .:::::::::::::::::::. :::::::::::.::::::.:::::: CCDS55 DDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDGMPPG 840 850 860 870 880 890 380 390 400 410 420 430 pF1KB0 VVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRKIDQEGRVFQEKWERAY : ::::.:::::::::::..:::::::::::.::: ..: . ..:: :.::. : CCDS55 VSFKAPSYLEISSMRRILDSAEFIKFTVIRPFPGLVINNQLVDQSESEGPVIQESAEPSQ 900 910 920 930 940 950 440 450 460 470 480 490 pF1KB0 FFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMERMRDEKLHELKKGLRKY CCDS55 LEVPATEEIKETDGSSQIKQEPDPTW 960 970 >>CCDS5575.1 GTF2I gene_id:2969|Hs108|chr7 (977 aa) initn: 1882 init1: 821 opt: 1473 Z-score: 1632.7 bits: 313.5 E(32554): 1.3e-84 Smith-Waterman score: 1473; 43.4% identity (66.3% similar) in 656 aa overlap (1-629:1-641) 10 20 30 40 50 60 pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE :::::.::::::.: :::.:::::::.::::::::::::::::::::::::::::::::: CCDS55 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF :: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.::::: CCDS55 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI ::::::::: ...::::::::::::::::::::::::::.:::::::::::::::::::: CCDS55 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK ::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.:: CCDS55 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB0 KESEDPNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSE---EPNEDPEAEVKIEGN .:::::.:::::.:.. :: :.. .. . :. : :: :. : :: : :: : . CCDS55 EESEDPDYYQYNIQAG-PSETDD--VDEKQPL--SKPLQGSHHSSEGNEGTEMEVPAEDD 250 260 270 280 290 300 310 320 330 340 pF1KB0 TNSSSVTNSAAGVEDLNIVQVTVPDN---EKERLSSIEK----IKQLREQVNDLFSRKFG : :. .: : : : .: : ..:: : .::.::..:: ::.. CCDS55 DYSPPSKRPKAN--ELPQPPVPEPANAGKRKVREFNFEKWNARITDLRKQVEELFERKYA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB0 EAIGVDFPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVI .:: . :: .:: . . . ..:.: :. :. :. : ..::: : : :.:.. CCDS55 QAIKAKGPVTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVIK 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB0 RPLPGLELSNVGKR--KIDQEGRVFQEKWERAYFFVEVQNIPTCLICKQ-SMSVSKEYNL . :: : .. ..:. . .:.: ....... :.::. . .... CCDS55 KH----ELLNSTREDLQLDKPASGVKEEWYAR--ITKLRKMVDQLFCKKFAEALGSTEAK 420 430 440 450 460 470 480 490 500 510 pF1KB0 RRHYQTNHSKHYDQYMERM------RDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPS :: ... : :.: . :. . . . . . .: .. ..... . CCDS55 AVPYQKFEAHPNDLYVEGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRPELLTHST 470 480 490 500 510 520 520 530 540 550 560 570 pF1KB0 P--TQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEITDINNTTQLAIFIRGVDENF :: ::.. . :::.... . ... . . ....... . . .: CCDS55 TEVTQPRTNTPVKEDWNVRITKLRKQVEEI--FNLKFAQALGLTEAVKVPYPVFESNPEF 530 540 550 560 570 580 580 590 600 610 620 630 pF1KB0 DVSEELLDTVPM-TGTKSGNEIFSRVEKSLKKFCIDWSKLVSVASTGTPAMVDANNGLVT : : . .:. . : : . :. .. .:. . .: : : :.:.. : CCDS55 LYVEGLPEGIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASKINTKAL 590 600 610 620 630 640 640 650 660 670 680 690 pF1KB0 KLKSRVATFCKGAELKSICCIIHPESLCAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTT CCDS55 QSPKRPRSPGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGREFSFEAW 650 660 670 680 690 700 >-- initn: 864 init1: 655 opt: 674 Z-score: 744.2 bits: 149.1 E(32554): 3.9e-35 Smith-Waterman score: 681; 43.4% identity (58.4% similar) in 327 aa overlap (107-433:712-948) 80 90 100 110 120 130 pF1KB0 AKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTTVMVPVPYEKM :.. ::. : :.::: : ::. . CCDS55 TPTQTNGSNVPFKPRGREFSFEAWNAKITDLKQKVENLFNEKCGEALGLKQAVKVPFALF 690 700 710 720 730 740 140 150 160 170 180 190 pF1KB0 LRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGPESQLGGPGMV :.:::::: :..: .. . :. ::.::: :.:::..: CCDS55 ESFPEDFYVEGLPEGVPFRRPSTFGIPRLEKILRNKAKIKFIIKKP-------------- 750 760 770 780 200 210 220 230 240 250 pF1KB0 TDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQYNMQGSHPSST : ...: ::: :: CCDS55 ----------------------EMFETAI----------KEST--------------SSK 790 800 260 270 280 290 300 310 pF1KB0 SNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVP : : .. : .: :.:. .:.:::::::.:::.: CCDS55 S-----------------PPRKINSSP--------NVNT-----TASGVEDLNIIQVTIP 810 820 830 320 330 340 350 360 370 pF1KB0 DNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPG :...::::..:: .:::::::::::::::::::. :::::::::::.::::::.:::::: CCDS55 DDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDGMPPG 840 850 860 870 880 890 380 390 400 410 420 430 pF1KB0 VVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRKIDQEGRVFQEKWERAY : ::::.:::::::::::..:::::::::::.::: ..: . ..:: :.::. : CCDS55 VSFKAPSYLEISSMRRILDSAEFIKFTVIRPFPGLVINNQLVDQSESEGPVIQESAEPSQ 900 910 920 930 940 950 440 450 460 470 480 490 pF1KB0 FFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMERMRDEKLHELKKGLRKY CCDS55 LEVPATEEIKETDGSSQIKQEPDPTW 960 970 >>CCDS47614.1 GTF2I gene_id:2969|Hs108|chr7 (957 aa) initn: 1889 init1: 919 opt: 1370 Z-score: 1518.3 bits: 292.3 E(32554): 3e-78 Smith-Waterman score: 1521; 43.8% identity (67.6% similar) in 648 aa overlap (1-629:1-621) 10 20 30 40 50 60 pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE :::::.::::::.: :::.:::::::.::::::::::::::::::::::::::::::::: CCDS47 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF :: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.::::: CCDS47 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI ::::::::: ...::::::::::::::::::::::::::.:::::::::::::::::::: CCDS47 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK ::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.:: CCDS47 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB0 KESEDPNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEP--NEDPEAEVKIEGNT .:::::.:::::.:::: :: .:: :::.: ::. ::..: :: :. : .:. CCDS47 EESEDPDYYQYNIQGSHHSSEGNEGTEMEVPAEDDDYSPPSKRPKANELPQPPVPEPANA 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB0 NSSSVTNSAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFP .. .: ...:. :. .. .: .::.::..:: ::...:: . : CCDS47 GKRKV-------REFNF----------EKWNA--RITDLRKQVEELFERKYAQAIKAKGP 310 320 330 340 360 370 380 390 400 410 pF1KB0 VKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLEL : .:: . . . ..:.: :. :. :. : ..::: : : :.:.. . :: CCDS47 VTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVIKKH----EL 350 360 370 380 390 420 430 440 450 460 470 pF1KB0 SNVGKR--KIDQEGRVFQEKWERAYFFVEVQNIPTCLICKQ-SMSVSKEYNLRRHYQTNH : .. ..:. . .:.: ....... :.::. . .... :: . CCDS47 LNSTREDLQLDKPASGVKEEWYAR--ITKLRKMVDQLFCKKFAEALGSTEAKAVPYQKFE 400 410 420 430 440 450 480 490 500 510 520 pF1KB0 SKHYDQYMERM------RDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSP--TQKSP .. : :.: . :. . . . . . .: .. ..... . :: CCDS47 AHPNDLYVEGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRPELLTHSTTEVTQPRT 460 470 480 490 500 510 530 540 550 560 570 580 pF1KB0 VQPVEDLAGNLWEKLREKIRSFVAYSIAIDEITDINNTTQLAIFIRGVDENFDVSEELLD ::.. . :::.... . ... . . ....... . . .: : : . CCDS47 NTPVKEDWNVRITKLRKQVEEI--FNLKFAQALGLTEAVKVPYPVFESNPEFLYVEGLPE 520 530 540 550 560 570 590 600 610 620 630 640 pF1KB0 TVPM-TGTKSGNEIFSRVEKSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVAT .:. . : : . :. .. .:. . .: : : :.:.. : CCDS47 GIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASKINTKALQSPKRPRS 580 590 600 610 620 630 650 660 670 680 690 700 pF1KB0 FCKGAELKSICCIIHPESLCAQKLKMDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQ CCDS47 PGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGREFSFEAWNAKITDLK 640 650 660 670 680 690 >-- initn: 864 init1: 655 opt: 674 Z-score: 744.4 bits: 149.1 E(32554): 3.8e-35 Smith-Waterman score: 681; 43.4% identity (58.4% similar) in 327 aa overlap (107-433:692-928) 80 90 100 110 120 130 pF1KB0 AKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTTVMVPVPYEKM :.. ::. : :.::: : ::. . CCDS47 TPTQTNGSNVPFKPRGREFSFEAWNAKITDLKQKVENLFNEKCGEALGLKQAVKVPFALF 670 680 690 700 710 720 140 150 160 170 180 190 pF1KB0 LRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGPESQLGGPGMV :.:::::: :..: .. . :. ::.::: :.:::..: CCDS47 ESFPEDFYVEGLPEGVPFRRPSTFGIPRLEKILRNKAKIKFIIKKP-------------- 730 740 750 760 200 210 220 230 240 250 pF1KB0 TDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQYNMQGSHPSST : ...: ::: :: CCDS47 ----------------------EMFETAI----------KEST--------------SSK 770 780 260 270 280 290 300 310 pF1KB0 SNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVP : : .. : .: :.:. .:.:::::::.:::.: CCDS47 S-----------------PPRKINSSP--------NVNT-----TASGVEDLNIIQVTIP 790 800 810 320 330 340 350 360 370 pF1KB0 DNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPG :...::::..:: .:::::::::::::::::::. :::::::::::.::::::.:::::: CCDS47 DDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDGMPPG 820 830 840 850 860 870 380 390 400 410 420 430 pF1KB0 VVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRKIDQEGRVFQEKWERAY : ::::.:::::::::::..:::::::::::.::: ..: . ..:: :.::. : CCDS47 VSFKAPSYLEISSMRRILDSAEFIKFTVIRPFPGLVINNQLVDQSESEGPVIQESAEPSQ 880 890 900 910 920 930 440 450 460 470 480 490 pF1KB0 FFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMERMRDEKLHELKKGLRKY CCDS47 LEVPATEEIKETDGSSQIKQEPDPTW 940 950 >>CCDS64680.1 GTF2I gene_id:2969|Hs108|chr7 (274 aa) initn: 1314 init1: 867 opt: 1331 Z-score: 1483.4 bits: 284.1 E(32554): 2.6e-76 Smith-Waterman score: 1331; 75.8% identity (87.9% similar) in 273 aa overlap (1-268:1-273) 10 20 30 40 50 60 pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE :::::.::::::.: :::.:::::::.::::::::::::::::::::::::::::::::: CCDS64 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF :: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.::::: CCDS64 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI ::::::::: ...::::::::::::::::::::::::::.:::::::::::::::::::: CCDS64 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK ::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.:: CCDS64 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB0 KESEDPNYYQYNMQGSHPSSTSNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNS .:::::.:::::.:::: :: .:: :::.: : CCDS64 EESEDPDYYQYNIQGSHHSSEGNEGTEMEVPAEG 250 260 270 300 310 320 330 340 350 pF1KB0 SSVTNSAAGVEDLNIVQVTVPDNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVK >>CCDS5573.1 GTF2I gene_id:2969|Hs108|chr7 (998 aa) initn: 2320 init1: 794 opt: 1310 Z-score: 1451.3 bits: 280.0 E(32554): 1.6e-74 Smith-Waterman score: 1541; 44.1% identity (65.7% similar) in 673 aa overlap (1-629:1-662) 10 20 30 40 50 60 pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE :::::.::::::.: :::.:::::::.::::::::::::::::::::::::::::::::: CCDS55 MAQVAMSTLPVEDEESSESRMVVTFLMSALESMCKELAKSKAEVACIAVYETDVFVVGTE 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 RGCAFVNARTDFQKDFAKYCVAEG-----LCEVKPPCPVNGMQVHSGETEILRKAVEDYF :: ::::.: ::::::.:::: : . ..: .: :.: . : : :::.::::: CCDS55 RGRAFVNTRKDFQKDFVKYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYF 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 CFCYGKALGTTVMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGI ::::::::: ...::::::::::::::::::::::::::.:::::::::::::::::::: CCDS55 CFCYGKALGKSTVVPVPYEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGI 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 SFIINRPFLGPESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVK ::::.:::: :....:: :::::.:::.::. :::::.::::: :::::::. ::.:: CCDS55 SFIIKRPFLEPKKHVGGRVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVK 190 200 210 220 230 240 240 250 260 270 pF1KB0 KESEDPNYYQYN--------------------MQGSHPSSTSNEVIEMELPMEDSTPLVP .:::::.::::: .:::: :: .:: :::.: :::: :: CCDS55 EESEDPDYYQYNIQAGPSETDDVDEKQPLSKPLQGSHHSSEGNEGTEMEVPAEDSTQHVP 250 260 270 280 290 300 280 290 300 310 320 pF1KB0 SEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVPDN---EKERLSSIEK---- :: .::::.:: :: . : :. .: : : : .: : ..:: CCDS55 SET-SEDPEVEVTIEDDDYSPPSKRPKAN--ELPQPPVPEPANAGKRKVREFNFEKWNAR 310 320 330 340 350 330 340 350 360 370 380 pF1KB0 IKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEIS : .::.::..:: ::...:: . :: .:: . . . ..:.: :. :. :. : CCDS55 ITDLRKQVEELFERKYAQAIKAKGPVTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIP 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB0 SMRRILEAAEFIKFTVIRPLPGLELSNVGKR--KIDQEGRVFQEKWERAYFFVEVQNIPT ..::: : : :.:.. . :: : .. ..:. . .:.: ....... CCDS55 RLERILLAKERIRFVIKKH----ELLNSTREDLQLDKPASGVKEEWYAR--ITKLRKMVD 420 430 440 450 460 470 450 460 470 480 490 pF1KB0 CLICKQ-SMSVSKEYNLRRHYQTNHSKHYDQYMERM------RDEKLHELKKGLRKYLLG :.::. . .... :: ... : :.: . :. . . . . . .: CCDS55 QLFCKKFAEALGSTEAKAVPYQKFEAHPNDLYVEGLPENIPFRSPSWYGIPRLEKIIQVG 480 490 500 510 520 530 500 510 520 530 540 550 pF1KB0 LSDTECPEQKQVFANPSP--TQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEITDI .. ..... . :: ::.. . :::.... . ... . . . CCDS55 NRIKFVIKRPELLTHSTTEVTQPRTNTPVKEDWNVRITKLRKQVEEI--FNLKFAQALGL 540 550 560 570 580 560 570 580 590 600 610 pF1KB0 NNTTQLAIFIRGVDENFDVSEELLDTVPM-TGTKSGNEIFSRVEKSLKKFCIDWSKLVSV ...... . . .: : : . .:. . : : . :. .. .:. . .: : CCDS55 TEAVKVPYPVFESNPEFLYVEGLPEGIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELV 590 600 610 620 630 640 620 630 640 650 660 670 pF1KB0 ASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKLKMDHVMDVVVK : :.:.. : CCDS55 ISYLPPGMASKINTKALQSPKRPRSPGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNG 650 660 670 680 690 700 >-- initn: 864 init1: 655 opt: 674 Z-score: 744.1 bits: 149.1 E(32554): 4e-35 Smith-Waterman score: 681; 43.4% identity (58.4% similar) in 327 aa overlap (107-433:733-969) 80 90 100 110 120 130 pF1KB0 AKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTTVMVPVPYEKM :.. ::. : :.::: : ::. . CCDS55 TPTQTNGSNVPFKPRGREFSFEAWNAKITDLKQKVENLFNEKCGEALGLKQAVKVPFALF 710 720 730 740 750 760 140 150 160 170 180 190 pF1KB0 LRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGPESQLGGPGMV :.:::::: :..: .. . :. ::.::: :.:::..: CCDS55 ESFPEDFYVEGLPEGVPFRRPSTFGIPRLEKILRNKAKIKFIIKKP-------------- 770 780 790 800 200 210 220 230 240 250 pF1KB0 TDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQYNMQGSHPSST : ...: ::: :: CCDS55 ----------------------EMFETAI----------KEST--------------SSK 810 820 260 270 280 290 300 310 pF1KB0 SNEVIEMELPMEDSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTNSAAGVEDLNIVQVTVP : : .. : .: :.:. .:.:::::::.:::.: CCDS55 S-----------------PPRKINSSP--------NVNT-----TASGVEDLNIIQVTIP 830 840 850 320 330 340 350 360 370 pF1KB0 DNEKERLSSIEKIKQLREQVNDLFSRKFGEAIGVDFPVKVPYRKITFNPGCVVIDGMPPG :...::::..:: .:::::::::::::::::::. :::::::::::.::::::.:::::: CCDS55 DDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDGMPPG 860 870 880 890 900 910 380 390 400 410 420 430 pF1KB0 VVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGLELSNVGKRKIDQEGRVFQEKWERAY : ::::.:::::::::::..:::::::::::.::: ..: . ..:: :.::. : CCDS55 VSFKAPSYLEISSMRRILDSAEFIKFTVIRPFPGLVINNQLVDQSESEGPVIQESAEPSQ 920 930 940 950 960 970 440 450 460 470 480 490 pF1KB0 FFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHSKHYDQYMERMRDEKLHELKKGLRKY CCDS55 LEVPATEEIKETDGSSQIKQEPDPTW 980 990 >>CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1 (1325 aa) initn: 332 init1: 141 opt: 553 Z-score: 607.6 bits: 124.3 E(32554): 1.6e-27 Smith-Waterman score: 566; 27.2% identity (58.0% similar) in 566 aa overlap (382-931:757-1297) 360 370 380 390 400 410 pF1KB0 FPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGL :: : : . . .:... ..: CCDS38 ELDSPPSKKKRLGFFQTYDTEYLKVGFIICPGSKESSPRPQCVICGEILSSENMKP---A 730 740 750 760 770 780 420 430 440 450 460 pF1KB0 ELSNVGKRKIDQEGRVFQEKWERAYFFVEVQN--IPTCLICKQSMSVSKEYNLRRHYQTN .::. : : .. . .:. . .: :: . ::. ..:. :. : . .:: CCDS38 NLSHHLKTKHSELENKPVDFFEQKSLEMECQNSSLKKCLLVEKSL-VKASYLIA--FQTA 790 800 810 820 830 840 470 480 490 500 510 520 pF1KB0 HSKHYDQYMERMRDEKLHELKKGLRKYLLGLSDTECPEQKQVFANPSPTQKSPVQP-VED ::. . :.. : :. . .:: : . ..: . : .. .: ... CCDS38 ASKKPFSIAEELIKPYLVEMCS----EVLGSSAGD--KMKTI-----PLSNVTIQHRIDE 850 860 870 880 530 540 550 560 570 580 pF1KB0 LAGNLWEKLREKIRSFVAYSIAIDEITDINNTTQLAIFIRGVDENF-DVSEELLDTVPMT :.... ..: .:.: ... ::: ..:.: : : .:: .: . ::.:::: . : CCDS38 LSADIEDQLIQKVRESKWFALQIDESSEISNITLLLCYIRFIDYDCRDVKEELLFCIEMP 890 900 910 920 930 940 590 600 610 620 630 640 pF1KB0 GTKSGNEIFSRVEKSLKKFCIDWSKLVSVASTGTPAMVDANNGLVTKLKSRVATFCKGAE .: ::: ..: . . ..:.. :.. . :. .:. .:: .:.. .:: . : CCDS38 TQITGFEIFELINKYIDSKSLNWKHCVGLCTDGAASMTGRYSGLKAKIQ-EVAM--NTAA 950 960 970 980 990 1000 650 660 670 680 690 700 pF1KB0 LKSICCIIHPESLCAQKLK--MDHVMDVVVKSVNWICSRGLNHSEFTTLLYELDSQYGSL . :.:: : : :.::. . ... .. ...: : .:: .: : :. :.. :: CCDS38 FTH--CFIHRERLVAEKLSPCLHKILLQSAQILSFIKSNALNSRMLTILCEEMGSEHVSL 1010 1020 1030 1040 1050 1060 710 720 730 740 750 760 pF1KB0 LYYTEIKWLSRGLVLKRFFESLEEIDSFMSSRGKPLPQ-LSSIDWIRDLAFLVDMTMHLN ..:..:.::: .:::.:: .::. :.:.. . : . . . .:. ::.: :. .: CCDS38 PLHAEVRWISRGRMLKRLFELRHEIEIFLSQKHSDLAKYFHDEEWVGKLAYLSDIFSLIN 1070 1080 1090 1100 1110 1120 770 780 790 800 810 820 pF1KB0 ALNISLQGHSQIVTQMYDLIRAFLAKLCLWETHLTRNNLAHFPTLKLASRNESDGLNYIP ::.:::: .. . : .: :: .: . .:. ::... : .:.::: . CCDS38 ELNLSLQGTLTTFFNLCNKIDVFKRKLKMWLKRTQENDYDMFPSFSEFS--NSSGLN-MT 1130 1140 1150 1160 1170 1180 830 840 850 860 870 pF1KB0 KIAELKTEFQKRLSD-FK-LYESELTLFSS------PFSTKIDSVHEELQME-VIDLQCN :... : . ::. :. . : : :. :: .. .. ... : . .:. . CCDS38 DITRIIFEHLEGLSQVFSDCFPPEQDLRSGNLWIIHPFMNHQNNNLTDFEEEKLTELSSD 1190 1200 1210 1220 1230 1240 880 890 900 910 920 930 pF1KB0 TVLKTKYDKVGIPEFYKYLWGSYPKYKHHCAKILSMFGSTYICEQLFSIMKLSKTKYCSQ :.. . .:.. .:. :::. ... :.: :...:.:. :: . :: : CCDS38 LGLQALFKSVSVTQFWINAKTSYPELHERAMKFLLPFSTVYLCDAAFSALTESKQKNLLG 1250 1260 1270 1280 1290 1300 940 pF1KB0 LKDSQWDSVLHIAT CCDS38 SGPALRLAVTSLIPRIEKLVKEKE 1310 1320 >>CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5 (594 aa) initn: 343 init1: 183 opt: 517 Z-score: 573.1 bits: 116.7 E(32554): 1.3e-25 Smith-Waterman score: 517; 24.9% identity (61.6% similar) in 425 aa overlap (526-938:150-566) 500 510 520 530 540 550 pF1KB0 YLLGLSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREKIR-SFVAYSIAIDEI ..... .. ... : :. : . .: . : CCDS34 ALEIAQIVLGPDAQKKLQQVPLSDDVIHSRIDEMSQDILQQVLEDIKASPLKVGIQLAET 120 130 140 150 160 170 560 570 580 590 600 610 pF1KB0 TDINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVEKSLKKFCIDWSKLV ::... .:: :.: . : .. ::.: :. . .: ..:. . . : : . CCDS34 TDMDDCSQLMAFVRYIKER-EIVEEFLFCEPLQLSMKGIDVFNLFRDFFLKHKIALDVCG 180 190 200 210 220 230 620 630 640 650 660 670 pF1KB0 SVASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKL--KMDHVMD :: . :. .:. :. .:. .:... .. :...:..: . : :. .. CCDS34 SVCTDGASSMLGENSEFVAYVKKEIP------HIVVTHCLLNPHALVIKTLPTKLRDALF 240 250 260 270 280 290 680 690 700 710 720 730 pF1KB0 VVVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVLKRFFESLEEIDS .::. .:.: .:. :: : ... :. .:. ::..::..::::: .: ..:: :::.. CCDS34 TVVRVINFIKGRAPNHRLFQAFFEEIGIEYSVLLFHTEMRWLSRGQILTHIFEMYEEINQ 300 310 320 330 340 350 740 750 760 770 780 790 pF1KB0 FMSSRGKPLPQ-LSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQMYDLIRAFLAKL :. ... : . . . .. ::.:.:. ::: :. :.: .. ... . . ::. :. CCDS34 FLHHKSSNLVDGFENKEFKIHLAYLADLFKHLNELSASMQRTGMNTVSAREKLSAFVRKF 360 370 380 390 400 410 800 810 820 830 840 pF1KB0 CLWETHLTRNNLAHFPTLKLASRNESDGLNYIPKIA----ELKTEFQKRLSDFKLYESEL .:. .. . :...:: :. ....:. .:. .:.. :. .: : :. CCDS34 PFWQKRIEKRNFTNFPFLEEIIVSDNEGIFIAAEITLHLQQLSNFFHGYFSIGDLNEASK 420 430 440 450 460 470 850 860 870 880 890 900 pF1KB0 TLFSSPFSTKIDSVHEELQM--EVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPKYKHHC ... :: .:: : . : .. .:. . . ... . . .:. . ..:. . CCDS34 WILD-PFLFNIDFVDDSYLMKNDLAELRASGQILMEFETMKLEDFWCAQFTAFPNLAKTA 480 490 500 510 520 530 910 920 930 940 pF1KB0 AKILSMFGSTYICEQLFS-IMKL-SKTKYCSQLKDSQWDSVLHIAT .:: :..::.:: :: .... .:.. : .:.: CCDS34 LEILMPFATTYLCELGFSSLLHFKTKSRSCFNLSDDIRVAISKKVPRFSDIIEQKLQLQQ 540 550 560 570 580 590 CCDS34 KSL >>CCDS64682.1 GTF2IRD2 gene_id:84163|Hs108|chr7 (108 aa) initn: 505 init1: 505 opt: 505 Z-score: 571.3 bits: 113.9 E(32554): 1.7e-25 Smith-Waterman score: 505; 100.0% identity (100.0% similar) in 80 aa overlap (1-80:1-80) 10 20 30 40 50 60 pF1KB0 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYETDVFVVGTE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 RGCAFVNARTDFQKDFAKYCVAEGLCEVKPPCPVNGMQVHSGETEILRKAVEDYFCFCYG :::::::::::::::::::: CCDS64 RGCAFVNARTDFQKDFAKYCRCFNFILCIPNLKRIAGKTSTVFSSKLS 70 80 90 100 949 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 16:57:45 2016 done: Sat Nov 5 16:57:46 2016 Total Scan time: 4.120 Total Display time: 0.240 Function used was FASTA [36.3.4 Apr, 2011]