FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB0462, 976 aa 1>>>pF1KB0462 976 - 976 aa - 976 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9073+/-0.000817; mu= 14.7316+/- 0.050 mean_var=108.8742+/-21.833, 0's: 0 Z-trim(110.3): 14 B-trim: 0 in 0/53 Lambda= 0.122917 statistics sampled from 11488 (11501) to 11488 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.698), E-opt: 0.2 (0.353), width: 16 Scan time: 5.060 The best scores are: opt bits E(32554) CCDS56492.1 GTF2IRD1 gene_id:9569|Hs108|chr7 ( 976) 6524 1168.1 0 CCDS47613.1 GTF2IRD1 gene_id:9569|Hs108|chr7 ( 944) 5729 1027.1 0 CCDS5571.1 GTF2IRD1 gene_id:9569|Hs108|chr7 ( 959) 3821 688.7 1.4e-197 CCDS47614.1 GTF2I gene_id:2969|Hs108|chr7 ( 957) 355 74.1 1.5e-12 CCDS5575.1 GTF2I gene_id:2969|Hs108|chr7 ( 977) 355 74.1 1.5e-12 CCDS5574.1 GTF2I gene_id:2969|Hs108|chr7 ( 978) 355 74.1 1.5e-12 CCDS5573.1 GTF2I gene_id:2969|Hs108|chr7 ( 998) 355 74.1 1.6e-12 CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 ( 949) 343 72.0 6.5e-12 CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 ( 949) 343 72.0 6.5e-12 >>CCDS56492.1 GTF2IRD1 gene_id:9569|Hs108|chr7 (976 aa) initn: 6524 init1: 6524 opt: 6524 Z-score: 6250.9 bits: 1168.1 E(32554): 0 Smith-Waterman score: 6524; 100.0% identity (100.0% similar) in 976 aa overlap (1-976:1-976) 10 20 30 40 50 60 pF1KB0 MALLGKRCDVPTNGCGPDRWNSAFTRKDEIITSLVSALDSMCSALSKLNAEVACVAVHDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MALLGKRCDVPTNGCGPDRWNSAFTRKDEIITSLVSALDSMCSALSKLNAEVACVAVHDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 SAFVVGTEKGRMFLNARKELQSDFLRFCLSAAQHRAATSQLEGRVVRRVLTVASRALCPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 SAFVVGTEKGRMFLNARKELQSDFLRFCLSAAQHRAATSQLEGRVVRRVLTVASRALCPT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 GGPPWKDPEAEHPKKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 GGPPWKDPEAEHPKKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRAS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 VVPLPYERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLEDGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 VVPLPYERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLEDGG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 RDSKALVELNGVSLIPKGSRDCGLHGQAPKVPPQDLPPTATSSSMASFLYSTALPNHAIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 RDSKALVELNGVSLIPKGSRDCGLHGQAPKVPPQDLPPTATSSSMASFLYSTALPNHAIR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 ELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPTGPGGPLIQNVHASKRILF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPTGPGGPLIQNVHASKRILF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 SIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLDHMVPVPYRKIACDPEAVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 SIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLDHMVPVPYRKIACDPEAVE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB0 IVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDERIFTGNKFTKDTTKLEPAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 IVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDERIFTGNKFTKDTTKLEPAS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB0 PPEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGGLRPIKIEPEDLDIIQVTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PPEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGGLRPIKIEPEDLDIIQVTV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB0 PDPSPTSEEMTDSMPGHLPSEDSGYGMEMLTDKGLSEDARPEERPVEDSHGDVIRPLRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PDPSPTSEEMTDSMPGHLPSEDSGYGMEMLTDKGLSEDARPEERPVEDSHGDVIRPLRKQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB0 VELLFNTRYAKAIGISEPVKVPYSKFLMHPEELFVVGLPEGISLRRPNCFGIAKLRKILE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 VELLFNTRYAKAIGISEPVKVPYSKFLMHPEELFVVGLPEGISLRRPNCFGIAKLRKILE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB0 ASNSIQFVIKRPELLTEGVKEPIMDSQERDSGDPLVDESLKRQGFQENYDARLSRIDIAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ASNSIQFVIKRPELLTEGVKEPIMDSQERDSGDPLVDESLKRQGFQENYDARLSRIDIAN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB0 TLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPGIPFRKPCTFGSQNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 TLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPGIPFRKPCTFGSQNL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB0 ERILAVADKIKFTVTRPFQGLIPKPDEDDANRLGEKVILREQVKELFNEKYGEALGLNRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ERILAVADKIKFTVTRPFQGLIPKPDEDDANRLGEKVILREQVKELFNEKYGEALGLNRP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB0 VLVPYKLIRDSPDAVEVTGLPDDIPFRNPNTYDIHRLEKILKAREHVRMVIINQLQPFAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 VLVPYKLIRDSPDAVEVTGLPDDIPFRNPNTYDIHRLEKILKAREHVRMVIINQLQPFAE 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB0 ICNDAKVPAKDSSIPKRKRKRVSEGNSVSSSSSSSSSSSSNPDSVASANQISLVQWPMYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ICNDAKVPAKDSSIPKRKRKRVSEGNSVSSSSSSSSSSSSNPDSVASANQISLVQWPMYM 910 920 930 940 950 960 970 pF1KB0 VDYAGLNVQLPGPLNY :::::::::::::::: CCDS56 VDYAGLNVQLPGPLNY 970 >>CCDS47613.1 GTF2IRD1 gene_id:9569|Hs108|chr7 (944 aa) initn: 6306 init1: 5729 opt: 5729 Z-score: 5489.2 bits: 1027.1 E(32554): 0 Smith-Waterman score: 6243; 96.6% identity (96.6% similar) in 976 aa overlap (1-976:1-944) 10 20 30 40 50 60 pF1KB0 MALLGKRCDVPTNGCGPDRWNSAFTRKDEIITSLVSALDSMCSALSKLNAEVACVAVHDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MALLGKRCDVPTNGCGPDRWNSAFTRKDEIITSLVSALDSMCSALSKLNAEVACVAVHDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 SAFVVGTEKGRMFLNARKELQSDFLRFCLSAAQHRAATSQLEGRVVRRVLTVASRALCPT :::::::::::::::::::::::::::: CCDS47 SAFVVGTEKGRMFLNARKELQSDFLRFCR------------------------------- 70 80 130 140 150 160 170 180 pF1KB0 GGPPWKDPEAEHPKKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRAS ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 -GPPWKDPEAEHPKKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRAS 90 100 110 120 130 140 190 200 210 220 230 240 pF1KB0 VVPLPYERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLEDGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VVPLPYERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLEDGG 150 160 170 180 190 200 250 260 270 280 290 300 pF1KB0 RDSKALVELNGVSLIPKGSRDCGLHGQAPKVPPQDLPPTATSSSMASFLYSTALPNHAIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RDSKALVELNGVSLIPKGSRDCGLHGQAPKVPPQDLPPTATSSSMASFLYSTALPNHAIR 210 220 230 240 250 260 310 320 330 340 350 360 pF1KB0 ELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPTGPGGPLIQNVHASKRILF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPTGPGGPLIQNVHASKRILF 270 280 290 300 310 320 370 380 390 400 410 420 pF1KB0 SIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLDHMVPVPYRKIACDPEAVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLDHMVPVPYRKIACDPEAVE 330 340 350 360 370 380 430 440 450 460 470 480 pF1KB0 IVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDERIFTGNKFTKDTTKLEPAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 IVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDERIFTGNKFTKDTTKLEPAS 390 400 410 420 430 440 490 500 510 520 530 540 pF1KB0 PPEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGGLRPIKIEPEDLDIIQVTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PPEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGGLRPIKIEPEDLDIIQVTV 450 460 470 480 490 500 550 560 570 580 590 600 pF1KB0 PDPSPTSEEMTDSMPGHLPSEDSGYGMEMLTDKGLSEDARPEERPVEDSHGDVIRPLRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PDPSPTSEEMTDSMPGHLPSEDSGYGMEMLTDKGLSEDARPEERPVEDSHGDVIRPLRKQ 510 520 530 540 550 560 610 620 630 640 650 660 pF1KB0 VELLFNTRYAKAIGISEPVKVPYSKFLMHPEELFVVGLPEGISLRRPNCFGIAKLRKILE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VELLFNTRYAKAIGISEPVKVPYSKFLMHPEELFVVGLPEGISLRRPNCFGIAKLRKILE 570 580 590 600 610 620 670 680 690 700 710 720 pF1KB0 ASNSIQFVIKRPELLTEGVKEPIMDSQERDSGDPLVDESLKRQGFQENYDARLSRIDIAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ASNSIQFVIKRPELLTEGVKEPIMDSQERDSGDPLVDESLKRQGFQENYDARLSRIDIAN 630 640 650 660 670 680 730 740 750 760 770 780 pF1KB0 TLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPGIPFRKPCTFGSQNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPGIPFRKPCTFGSQNL 690 700 710 720 730 740 790 800 810 820 830 840 pF1KB0 ERILAVADKIKFTVTRPFQGLIPKPDEDDANRLGEKVILREQVKELFNEKYGEALGLNRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ERILAVADKIKFTVTRPFQGLIPKPDEDDANRLGEKVILREQVKELFNEKYGEALGLNRP 750 760 770 780 790 800 850 860 870 880 890 900 pF1KB0 VLVPYKLIRDSPDAVEVTGLPDDIPFRNPNTYDIHRLEKILKAREHVRMVIINQLQPFAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VLVPYKLIRDSPDAVEVTGLPDDIPFRNPNTYDIHRLEKILKAREHVRMVIINQLQPFAE 810 820 830 840 850 860 910 920 930 940 950 960 pF1KB0 ICNDAKVPAKDSSIPKRKRKRVSEGNSVSSSSSSSSSSSSNPDSVASANQISLVQWPMYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ICNDAKVPAKDSSIPKRKRKRVSEGNSVSSSSSSSSSSSSNPDSVASANQISLVQWPMYM 870 880 890 900 910 920 970 pF1KB0 VDYAGLNVQLPGPLNY :::::::::::::::: CCDS47 VDYAGLNVQLPGPLNY 930 940 >>CCDS5571.1 GTF2IRD1 gene_id:9569|Hs108|chr7 (959 aa) initn: 6292 init1: 3821 opt: 3821 Z-score: 3660.5 bits: 688.7 E(32554): 1.4e-197 Smith-Waterman score: 6203; 95.2% identity (95.2% similar) in 991 aa overlap (1-976:1-959) 10 20 30 40 50 60 pF1KB0 MALLGKRCDVPTNGCGPDRWNSAFTRKDEIITSLVSALDSMCSALSKLNAEVACVAVHDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MALLGKRCDVPTNGCGPDRWNSAFTRKDEIITSLVSALDSMCSALSKLNAEVACVAVHDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 SAFVVGTEKGRMFLNARKELQSDFLRFCLSAAQHRAATSQLEGRVVRRVLTVASRALCPT :::::::::::::::::::::::::::: CCDS55 SAFVVGTEKGRMFLNARKELQSDFLRFCR------------------------------- 70 80 130 140 150 160 170 180 pF1KB0 GGPPWKDPEAEHPKKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRAS ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 -GPPWKDPEAEHPKKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRAS 90 100 110 120 130 140 190 200 210 220 230 240 pF1KB0 VVPLPYERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLEDGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VVPLPYERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLEDGG 150 160 170 180 190 200 250 260 270 280 290 300 pF1KB0 RDSKALVELNGVSLIPKGSRDCGLHGQAPKVPPQDLPPTATSSSMASFLYSTALPNHAIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RDSKALVELNGVSLIPKGSRDCGLHGQAPKVPPQDLPPTATSSSMASFLYSTALPNHAIR 210 220 230 240 250 260 310 320 330 340 350 360 pF1KB0 ELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPTGPGGPLIQNVHASKRILF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPTGPGGPLIQNVHASKRILF 270 280 290 300 310 320 370 380 390 400 410 420 pF1KB0 SIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLDHMVPVPYRKIACDPEAVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLDHMVPVPYRKIACDPEAVE 330 340 350 360 370 380 430 440 450 460 470 480 pF1KB0 IVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDERIFTGNKFTKDTTKLEPAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDERIFTGNKFTKDTTKLEPAS 390 400 410 420 430 440 490 500 510 520 530 540 pF1KB0 PPEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGGLRPIKIEPEDLDIIQVTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PPEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGGLRPIKIEPEDLDIIQVTV 450 460 470 480 490 500 550 560 570 580 590 600 pF1KB0 PDPSPTSEEMTDSMPGHLPSEDSGYGMEMLTDKGLSEDARPEERPVEDSHGDVIRPLRKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PDPSPTSEEMTDSMPGHLPSEDSGYGMEMLTDKGLSEDARPEERPVEDSHGDVIRPLRKQ 510 520 530 540 550 560 610 620 630 640 650 660 pF1KB0 VELLFNTRYAKAIGISEPVKVPYSKFLMHPEELFVVGLPEGISLRRPNCFGIAKLRKILE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VELLFNTRYAKAIGISEPVKVPYSKFLMHPEELFVVGLPEGISLRRPNCFGIAKLRKILE 570 580 590 600 610 620 670 680 690 700 pF1KB0 ASNSIQFVIKRPELLTEGVKEPIMDSQ---------------ERDSGDPLVDESLKRQGF ::::::::::::::::::::::::::: :::::::::::::::::: CCDS55 ASNSIQFVIKRPELLTEGVKEPIMDSQGTASSLGFSPPALPPERDSGDPLVDESLKRQGF 630 640 650 660 670 680 710 720 730 740 750 760 pF1KB0 QENYDARLSRIDIANTLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QENYDARLSRIDIANTLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPP 690 700 710 720 730 740 770 780 790 800 810 820 pF1KB0 GIPFRKPCTFGSQNLERILAVADKIKFTVTRPFQGLIPKPDEDDANRLGEKVILREQVKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GIPFRKPCTFGSQNLERILAVADKIKFTVTRPFQGLIPKPDEDDANRLGEKVILREQVKE 750 760 770 780 790 800 830 840 850 860 870 880 pF1KB0 LFNEKYGEALGLNRPVLVPYKLIRDSPDAVEVTGLPDDIPFRNPNTYDIHRLEKILKARE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LFNEKYGEALGLNRPVLVPYKLIRDSPDAVEVTGLPDDIPFRNPNTYDIHRLEKILKARE 810 820 830 840 850 860 890 900 910 920 930 940 pF1KB0 HVRMVIINQLQPFAEICNDAKVPAKDSSIPKRKRKRVSEGNSVSSSSSSSSSSSSNPDSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 HVRMVIINQLQPFAEICNDAKVPAKDSSIPKRKRKRVSEGNSVSSSSSSSSSSSSNPDSV 870 880 890 900 910 920 950 960 970 pF1KB0 ASANQISLVQWPMYMVDYAGLNVQLPGPLNY ::::::::::::::::::::::::::::::: CCDS55 ASANQISLVQWPMYMVDYAGLNVQLPGPLNY 930 940 950 >>CCDS47614.1 GTF2I gene_id:2969|Hs108|chr7 (957 aa) initn: 1286 init1: 355 opt: 355 Z-score: 338.8 bits: 74.1 E(32554): 1.5e-12 Smith-Waterman score: 1096; 31.2% identity (56.5% similar) in 859 aa overlap (156-915:108-921) 130 140 150 160 170 180 pF1KB0 KDPEAEHPKKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRASVVPLP .. ::: ::. : :..:::...:::.: CCDS47 KYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYFCFCYGKALGKSTVVPVP 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB0 YERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLED-----GG ::..::. . ..:::::::.::..: .:: .: :::.. : : .:::. . :: CCDS47 YEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGISFIIKRPFLEPKKHVGG 140 150 160 170 180 190 250 260 270 280 290 pF1KB0 RDSKALVELNGVSLI-PKGSRDCGLHGQAPKVPPQDLPPTATSSSMASFLYS--TALPNH : ..: :.. : :: :: :: . .. : ::. . . :.. CCDS47 R---VMVTDADRSILSPGGS--CG----PIKVKTEPTEDSGISLEMAAVTVKEESEDPDY 200 210 220 230 240 300 310 320 330 340 350 pF1KB0 AIRELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPTG---PGGPLIQNVHA ... : . .. : .: .:.: ...: . : :. . ..: CCDS47 YQYNIQGSHHS---SEGNEGTEMEVPAED----DDYSPP-SKRPKANELPQPPVPEPANA 250 260 270 280 290 300 360 370 380 390 400 410 pF1KB0 SKRILFSIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLDHMVPVPYRKIAC .:: .. . . :::.: : . ::. :. ::. .::.:. : .:: . CCDS47 GKR---KVREFNFEKWNARITD------LRKQVEELFERKYAQAIKAKGPVTIPYPLFQS 310 320 330 340 350 420 430 440 450 460 470 pF1KB0 DPEAVEIVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDERIFTGNKFTKDTT : . . :.:. :::.:: :::.:.:.::: .. :.:.::. : . :. .: CCDS47 HVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVIKKH--ELL---NSTREDLQ 360 370 380 390 400 480 490 500 510 520 530 pF1KB0 KLEPASP-PEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGGLRPIKIEPEDL .::: :. :.... . .. . : ..: : .: .. . .. .:.:: CCDS47 LDKPASGVKEEWYARITK--LRKMVDQLFCKK--FAEALG-STEAKAVPYQKFEAHPNDL 410 420 430 440 450 460 540 550 560 570 580 pF1KB0 DIIQVTVPDPSPTSEEMTDSMPGHLPSEDSGYGM-------EMLTDKGLSEDARPE-ERP . .:. : ..: . : . :.:: .. .: ..:. . : CCDS47 YV--EGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRPELLT-HSTTEVTQPRTNTP 470 480 490 500 510 590 600 610 620 630 640 pF1KB0 VEDSHGDVIRPLRKQVELLFNTRYAKAIGISEPVKVPYSKFLMHPEELFVVGLPEGISLR :... . : :::::: .:: ..:.:.:..: ::::: : .:: :.: :::::: .: CCDS47 VKEDWNVRITKLRKQVEEIFNLKFAQALGLTEAVKVPYPVFESNPEFLYVEGLPEGIPFR 520 530 540 550 560 570 650 660 670 680 690 pF1KB0 RPNCFGIAKLRKILEASNSIQFVIKRPEL----LTEGVKEPI----MDSQER------DS :. ::: .:..:...::.:.::.:.::: : :. : ..: .: .: CCDS47 SPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASKINTKALQSPKRPRSPGSNS 580 590 600 610 620 630 700 710 720 pF1KB0 GDPLVDESL--------------------------KRQGFQENYDARLSRIDIANTLREQ : .. .. : .: . ...: ..: . :... CCDS47 KVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGREFSFEAWNAKI---TDLKQK 640 650 660 670 680 690 730 740 750 760 770 780 pF1KB0 VQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPGIPFRKPCTFGSQNLERILA :..:::.: :::::.: :.::. ..: : . .:::: :.:::.: ::: ::.:: CCDS47 VENLFNEKCGEALGLKQAVKVPFALFESFPEDFYVEGLPEGVPFRRPSTFGIPRLEKILR 700 710 720 730 740 750 790 800 810 pF1KB0 VADKIKFTVTRP--FQGLI---------PK-----PD-------------------EDDA :::: . .: :. : :. :. .:: CCDS47 NKAKIKFIIKKPEMFETAIKESTSSKSPPRKINSSPNVNTTASGVEDLNIIQVTIPDDDN 760 770 780 790 800 810 820 830 840 850 860 pF1KB0 NRLG--EKV-ILREQVKELFNEKYGEALGLNRPVLVPYKLIRDSPDAVEVTGLPDDIPFR .::. ::. :::::..::..:.:::.:.. :: :::. : .: : : :.: . :. CCDS47 ERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDGMPPGVSFK 820 830 840 850 860 870 870 880 890 900 910 920 pF1KB0 NPNTYDIHRLEKILKAREHVRMVIINQLQPF-AEICNDAKVPAKDSSIPKRKRKRVSEGN :. .: ...:: . : .....: .:: . . :. : ..: : CCDS47 APSYLEISSMRRILDSAEFIKFTVI---RPFPGLVINNQLVDQSESEGPVIQESAEPSQL 880 890 900 910 920 930 930 940 950 960 970 pF1KB0 SVSSSSSSSSSSSSNPDSVASANQISLVQWPMYMVDYAGLNVQLPGPLNY CCDS47 EVPATEEIKETDGSSQIKQEPDPTW 940 950 >>CCDS5575.1 GTF2I gene_id:2969|Hs108|chr7 (977 aa) initn: 1289 init1: 355 opt: 355 Z-score: 338.6 bits: 74.1 E(32554): 1.5e-12 Smith-Waterman score: 1095; 30.9% identity (55.9% similar) in 874 aa overlap (156-915:108-941) 130 140 150 160 170 180 pF1KB0 KDPEAEHPKKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRASVVPLP .. ::: ::. : :..:::...:::.: CCDS55 KYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYFCFCYGKALGKSTVVPVP 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB0 YERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLED-----GG ::..::. . ..:::::::.::..: .:: .: :::.. : : .:::. . :: CCDS55 YEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGISFIIKRPFLEPKKHVGG 140 150 160 170 180 190 250 260 270 280 290 pF1KB0 RDSKALVELNGVSLI-PKGSRDCGLHGQAPKVPPQDLPPTATSSSMASFLYSTALPNHAI : ..: :.. : :: :: :: . .. : ::. . . CCDS55 R---VMVTDADRSILSPGGS--CG----PIKVKTEPTEDSGISLEMAAVTVKEESEDPDY 200 210 220 230 240 300 310 320 330 340 pF1KB0 RELKQEAPSCPLAPSDLGLSRPMPEP------KATGAQ-----------DFSDCCGQKPT . . .: : .:. ..:. .: .. : . :.: ...: CCDS55 YQYNIQAG--PSETDDVDEKQPLSKPLQGSHHSSEGNEGTEMEVPAEDDDYSPP-SKRPK 250 260 270 280 290 300 350 360 370 380 390 pF1KB0 G---PGGPLIQNVHASKRILFSIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEAL . : :. . ..:.:: .. . . :::.: : . ::. :. ::. .::.:. CCDS55 ANELPQPPVPEPANAGKR---KVREFNFEKWNARITD------LRKQVEELFERKYAQAI 310 320 330 340 350 400 410 420 430 440 450 pF1KB0 GLDHMVPVPYRKIACDPEAVEIVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMF : .:: . : . . :.:. :::.:: :::.:.:.::: .. :.:.::. CCDS55 KAKGPVTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVIKKH- 360 370 380 390 400 410 460 470 480 490 500 510 pF1KB0 DERIFTGNKFTKDTTKLEPASP-PEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSG : . :. .: .::: :. :.... . .. . : ..: : .: . CCDS55 -ELL---NSTREDLQLDKPASGVKEEWYARITK--LRKMVDQLFCKK--FAEALG-STEA 420 430 440 450 460 520 530 540 550 560 570 pF1KB0 ELGGLRPIKIEPEDLDIIQVTVPDPSPTSEEMTDSMPGHLPSEDSGYGM-------EMLT . . .. .:.:: . .:. : ..: . : . :.:: CCDS55 KAVPYQKFEAHPNDLYV--EGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRPELLT 470 480 490 500 510 520 580 590 600 610 620 630 pF1KB0 DKGLSEDARPE-ERPVEDSHGDVIRPLRKQVELLFNTRYAKAIGISEPVKVPYSKFLMHP .. .: ..:. . ::... . : :::::: .:: ..:.:.:..: ::::: : .: CCDS55 -HSTTEVTQPRTNTPVKEDWNVRITKLRKQVEEIFNLKFAQALGLTEAVKVPYPVFESNP 530 540 550 560 570 580 640 650 660 670 680 pF1KB0 EELFVVGLPEGISLRRPNCFGIAKLRKILEASNSIQFVIKRPEL----LTEGVKEPI--- : :.: :::::: .: :. ::: .:..:...::.:.::.:.::: : :. : CCDS55 EFLYVEGLPEGIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASKINTK 590 600 610 620 630 640 690 700 710 pF1KB0 -MDSQER------DSGDPLVDESL--------------------------KRQGFQENYD ..: .: .: : .. .. : .: . ... CCDS55 ALQSPKRPRSPGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGREFSFE 650 660 670 680 690 700 720 730 740 750 760 770 pF1KB0 ARLSRIDIANTLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPGIPFR : ..: . :...:..:::.: :::::.: :.::. ..: : . .:::: :.::: CCDS55 AWNAKI---TDLKQKVENLFNEKCGEALGLKQAVKVPFALFESFPEDFYVEGLPEGVPFR 710 720 730 740 750 760 780 790 800 pF1KB0 KPCTFGSQNLERILAVADKIKFTVTRP--FQGLI---------PK-----PD-------- .: ::: ::.:: :::: . .: :. : :. :. CCDS55 RPSTFGIPRLEKILRNKAKIKFIIKKPEMFETAIKESTSSKSPPRKINSSPNVNTTASGV 770 780 790 800 810 820 810 820 830 840 850 pF1KB0 -----------EDDANRLG--EKV-ILREQVKELFNEKYGEALGLNRPVLVPYKLIRDSP .:: .::. ::. :::::..::..:.:::.:.. :: :::. : .: CCDS55 EDLNIIQVTIPDDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINP 830 840 850 860 870 880 860 870 880 890 900 910 pF1KB0 DAVEVTGLPDDIPFRNPNTYDIHRLEKILKAREHVRMVIINQLQPF-AEICNDAKVPAKD : : :.: . :. :. .: ...:: . : .....: .:: . . :. : .. CCDS55 GCVVVDGMPPGVSFKAPSYLEISSMRRILDSAEFIKFTVI---RPFPGLVINNQLVDQSE 890 900 910 920 930 920 930 940 950 960 970 pF1KB0 SSIPKRKRKRVSEGNSVSSSSSSSSSSSSNPDSVASANQISLVQWPMYMVDYAGLNVQLP : : CCDS55 SEGPVIQESAEPSQLEVPATEEIKETDGSSQIKQEPDPTW 940 950 960 970 >>CCDS5574.1 GTF2I gene_id:2969|Hs108|chr7 (978 aa) initn: 1286 init1: 355 opt: 355 Z-score: 338.6 bits: 74.1 E(32554): 1.5e-12 Smith-Waterman score: 1097; 31.1% identity (56.5% similar) in 867 aa overlap (156-915:108-942) 130 140 150 160 170 180 pF1KB0 KDPEAEHPKKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRASVVPLP .. ::: ::. : :..:::...:::.: CCDS55 KYCVEEEEKAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYFCFCYGKALGKSTVVPVP 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB0 YERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLED-----GG ::..::. . ..:::::::.::..: .:: .: :::.. : : .:::. . :: CCDS55 YEKMLRDQSAVVVQGLPEGVAFKHPENYDLATLKWILENKAGISFIIKRPFLEPKKHVGG 140 150 160 170 180 190 250 260 270 280 pF1KB0 R----DSKALVELNGVSLIP-----KGSRDCG--LHGQAPKVPPQDLPPTATSSSMASFL : :. . : : : . ..: : :. : : .. : . .. . CCDS55 RVMVTDADRSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVKEESEDPDYYQYNIQGSH 200 210 220 230 240 250 290 300 310 320 330 340 pF1KB0 YSTALPNHAIRELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPTG---PGG .:. . . :. : : .::. . :: ..: .: . ...: . : CCDS55 HSSEGNEGTEMEVPAE-DSTQHVPSE---TSEDPEVEVTIEDDDYSPPSKRPKANELPQP 260 270 280 290 300 310 350 360 370 380 390 400 pF1KB0 PLIQNVHASKRILFSIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLDHMVP :. . ..:.:: .. . . :::.: : . ::. :. ::. .::.:. : CCDS55 PVPEPANAGKR---KVREFNFEKWNARITD------LRKQVEELFERKYAQAIKAKGPVT 320 330 340 350 360 410 420 430 440 450 460 pF1KB0 VPYRKIACDPEAVEIVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDERIFTG .:: . : . . :.:. :::.:: :::.:.:.::: .. :.:.::. : . CCDS55 IPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVIKKH--ELL--- 370 380 390 400 410 470 480 490 500 510 520 pF1KB0 NKFTKDTTKLEPASP-PEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGGLRP :. .: .::: :. :.... . .. . : ..: : .: .. . CCDS55 NSTREDLQLDKPASGVKEEWYARITK--LRKMVDQLFCKK--FAEALG-STEAKAVPYQK 420 430 440 450 460 470 530 540 550 560 570 pF1KB0 IKIEPEDLDIIQVTVPDPSPTSEEMTDSMPGHLPSEDSGYGM-------EMLTDKGLSED .. .:.:: . .:. : ..: . : . :.:: .. .: CCDS55 FEAHPNDLYV--EGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRPELLT-HSTTEV 480 490 500 510 520 530 580 590 600 610 620 630 pF1KB0 ARPE-ERPVEDSHGDVIRPLRKQVELLFNTRYAKAIGISEPVKVPYSKFLMHPEELFVVG ..:. . ::... . : :::::: .:: ..:.:.:..: ::::: : .:: :.: : CCDS55 TQPRTNTPVKEDWNVRITKLRKQVEEIFNLKFAQALGLTEAVKVPYPVFESNPEFLYVEG 540 550 560 570 580 590 640 650 660 670 680 pF1KB0 LPEGISLRRPNCFGIAKLRKILEASNSIQFVIKRPEL----LTEGVKEPI----MDSQER ::::: .: :. ::: .:..:...::.:.::.:.::: : :. : ..: .: CCDS55 LPEGIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASKINTKALQSPKR 600 610 620 630 640 650 690 700 710 pF1KB0 ------DSGDPLVDESL--------------------------KRQGFQENYDARLSRID .: : .. .. : .: . ...: ..: CCDS55 PRSPGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGREFSFEAWNAKI- 660 670 680 690 700 710 720 730 740 750 760 770 pF1KB0 IANTLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPGIPFRKPCTFGS . :...:..:::.: :::::.: :.::. ..: : . .:::: :.:::.: ::: CCDS55 --TDLKQKVENLFNEKCGEALGLKQAVKVPFALFESFPEDFYVEGLPEGVPFRRPSTFGI 720 730 740 750 760 780 790 800 pF1KB0 QNLERILAVADKIKFTVTRP--FQGLI---------PK-----PD--------------- ::.:: :::: . .: :. : :. :. CCDS55 PRLEKILRNKAKIKFIIKKPEMFETAIKESTSSKSPPRKINSSPNVNTTASGVEDLNIIQ 770 780 790 800 810 820 810 820 830 840 850 pF1KB0 ----EDDANRLG--EKV-ILREQVKELFNEKYGEALGLNRPVLVPYKLIRDSPDAVEVTG .:: .::. ::. :::::..::..:.:::.:.. :: :::. : .: : : : CCDS55 VTIPDDDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRKITINPGCVVVDG 830 840 850 860 870 880 860 870 880 890 900 910 pF1KB0 LPDDIPFRNPNTYDIHRLEKILKAREHVRMVIINQLQPF-AEICNDAKVPAKDSSIPKRK .: . :. :. .: ...:: . : .....: .:: . . :. : ..: : CCDS55 MPPGVSFKAPSYLEISSMRRILDSAEFIKFTVI---RPFPGLVINNQLVDQSESEGPVIQ 890 900 910 920 930 940 920 930 940 950 960 970 pF1KB0 RKRVSEGNSVSSSSSSSSSSSSNPDSVASANQISLVQWPMYMVDYAGLNVQLPGPLNY CCDS55 ESAEPSQLEVPATEEIKETDGSSQIKQEPDPTW 950 960 970 >>CCDS5573.1 GTF2I gene_id:2969|Hs108|chr7 (998 aa) initn: 1286 init1: 355 opt: 355 Z-score: 338.5 bits: 74.1 E(32554): 1.6e-12 Smith-Waterman score: 1062; 30.4% identity (56.1% similar) in 879 aa overlap (164-915:116-962) 140 150 160 170 180 190 pF1KB0 KKVQRGEGGGRSLPRSSLEHGSDVYLLRKMVEEVFDVLYSEALGRASVVPLPYERLLREP ::. : :..:::...:::.:::..::. CCDS55 KAAEMHKMKSTTQANRMSVDAVEIETLRKTVEDYFCFCYGKALGKSTVVPVPYEKMLRDQ 90 100 110 120 130 140 200 210 220 230 240 pF1KB0 GLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLED-----GGR------D . ..:::::::.::..: .:: .: :::.. : : .:::. . ::: : CCDS55 SAVVVQGLPEGVAFKHPENYDLATLKWILENKAGISFIIKRPFLEPKKHVGGRVMVTDAD 150 160 170 180 190 200 250 260 270 280 pF1KB0 SKAL---------------VELNGVSL------IPKGSRDCGLHGQAPKVPPQDLPPTAT . : .: .:.:: . . :.: . .. :.. . CCDS55 RSILSPGGSCGPIKVKTEPTEDSGISLEMAAVTVKEESEDPDYYQYNIQAGPSETDDVDE 210 220 230 240 250 260 290 300 310 320 330 pF1KB0 SSSMASFLYSTALPNHAIRELKQEAP---SCPLAPSDLGLSRPMPEPKATGAQDFSDCCG .. ... : .. ... . ..:.: : .::. . :: ..: .: . . CCDS55 KQPLSKPLQGSHHSSEGNEGTEMEVPAEDSTQHVPSE---TSEDPEVEVTIEDDDYSPPS 270 280 290 300 310 320 340 350 360 370 380 390 pF1KB0 QKPTG---PGGPLIQNVHASKRILFSIVHDKSEKWDAFIKETEDINTLRECVQILFNSRY ..: . : :. . ..:.:: .. . . :::.: : . ::. :. ::. .: CCDS55 KRPKANELPQPPVPEPANAGKR---KVREFNFEKWNARITD------LRKQVEELFERKY 330 340 350 360 370 400 410 420 430 440 450 pF1KB0 AEALGLDHMVPVPYRKIACDPEAVEIVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFII :.:. : .:: . : . . :.:. :::.:: :::.:.:.::: .. :.:.: CCDS55 AQAIKAKGPVTIPYPLFQSHVEDLYVEGLPEGIPFRRPSTYGIPRLERILLAKERIRFVI 380 390 400 410 420 430 460 470 480 490 500 510 pF1KB0 KRMFDERIFTGNKFTKDTTKLEPASP-PEDTSAEVSRATVLDLAGNARSDKGSMSEDCGP :. : . :. .: .::: :. :.... . .. . : ..: : CCDS55 KK--HELL---NSTREDLQLDKPASGVKEEWYARITK--LRKMVDQLFCKK--FAEALG- 440 450 460 470 480 520 530 540 550 560 pF1KB0 GTSGELGGLRPIKIEPEDLDIIQVTVPDPSPTSEEMTDSMPGHLPSEDSGYGM------- .: .. . .. .:.:: . .:. : ..: . : . CCDS55 STEAKAVPYQKFEAHPNDLYV--EGLPENIPFRSPSWYGIPRLEKIIQVGNRIKFVIKRP 490 500 510 520 530 540 570 580 590 600 610 620 pF1KB0 EMLTDKGLSEDARPE-ERPVEDSHGDVIRPLRKQVELLFNTRYAKAIGISEPVKVPYSKF :.:: .. .: ..:. . ::... . : :::::: .:: ..:.:.:..: ::::: : CCDS55 ELLT-HSTTEVTQPRTNTPVKEDWNVRITKLRKQVEEIFNLKFAQALGLTEAVKVPYPVF 550 560 570 580 590 600 630 640 650 660 670 680 pF1KB0 LMHPEELFVVGLPEGISLRRPNCFGIAKLRKILEASNSIQFVIKRPEL----LTEGVKEP .:: :.: :::::: .: :. ::: .:..:...::.:.::.:.::: : :. CCDS55 ESNPEFLYVEGLPEGIPFRSPTWFGIPRLERIVRGSNKIKFVVKKPELVISYLPPGMASK 610 620 630 640 650 660 690 700 pF1KB0 I----MDSQER------DSGDPLVDESL--------------------------KRQGFQ : ..: .: .: : .. .. : .: . CCDS55 INTKALQSPKRPRSPGSNSKVPEIEVTVEGPNNNNPQTSAVRTPTQTNGSNVPFKPRGRE 670 680 690 700 710 720 710 720 730 740 750 760 pF1KB0 ENYDARLSRIDIANTLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPG ...: ..: . :...:..:::.: :::::.: :.::. ..: : . .:::: : CCDS55 FSFEAWNAKI---TDLKQKVENLFNEKCGEALGLKQAVKVPFALFESFPEDFYVEGLPEG 730 740 750 760 770 770 780 790 800 pF1KB0 IPFRKPCTFGSQNLERILAVADKIKFTVTRP--FQGLI---------PK----------- .:::.: ::: ::.:: :::: . .: :. : :. CCDS55 VPFRRPSTFGIPRLEKILRNKAKIKFIIKKPEMFETAIKESTSSKSPPRKINSSPNVNTT 780 790 800 810 820 830 810 820 830 840 pF1KB0 --------------PDEDDANRLG--EKV-ILREQVKELFNEKYGEALGLNRPVLVPYKL :: :: .::. ::. :::::..::..:.:::.:.. :: :::. CCDS55 ASGVEDLNIIQVTIPD-DDNERLSKVEKARQLREQVNDLFSRKFGEAIGMGFPVKVPYRK 840 850 860 870 880 890 850 860 870 880 890 900 pF1KB0 IRDSPDAVEVTGLPDDIPFRNPNTYDIHRLEKILKAREHVRMVIINQLQPF-AEICNDAK : .: : : :.: . :. :. .: ...:: . : .....: .:: . . :. CCDS55 ITINPGCVVVDGMPPGVSFKAPSYLEISSMRRILDSAEFIKFTVI---RPFPGLVINNQL 900 910 920 930 940 950 910 920 930 940 950 960 pF1KB0 VPAKDSSIPKRKRKRVSEGNSVSSSSSSSSSSSSNPDSVASANQISLVQWPMYMVDYAGL : ..: : CCDS55 VDQSESEGPVIQESAEPSQLEVPATEEIKETDGSSQIKQEPDPTW 960 970 980 990 >>CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 (949 aa) initn: 893 init1: 342 opt: 343 Z-score: 327.3 bits: 72.0 E(32554): 6.5e-12 Smith-Waterman score: 593; 31.8% identity (58.5% similar) in 446 aa overlap (30-457:22-406) 10 20 30 40 50 60 pF1KB0 MALLGKRCDVPTNGCGPDRWNSAFTRKDEIITSLVSALDSMCSALSKLNAEVACVAVHDE ..: :::::.:::. :.: .:::::.::.. CCDS34 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYET 10 20 30 40 50 70 80 90 100 110 120 pF1KB0 SAFVVGTEKGRMFLNARKELQSDFLRFCLSAAQHRAATSQLEGRVVRRVLTVASRALCPT ..::::::.: :.::: ..:.:: ..:.. :: :: . CCDS34 DVFVVGTERGCAFVNARTDFQKDFAKYCVA-----------EG-------------LCEV 60 70 80 130 140 150 160 170 pF1KB0 GGPPWKDPEAEHPKKVQRGEGGGRSLPRSSLE-HGSDVYLLRKMVEEVFDVLYSEALGRA :: : .... :.... .::: ::. : :..::: . CCDS34 K-PP---------------------CPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTT 90 100 110 120 180 190 200 210 220 230 pF1KB0 SVVPLPYERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPL--- .::.:::..::. . ..:::::::.::..: .:: .: :::.. : : ..::. CCDS34 VMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGP 130 140 150 160 170 180 240 250 260 270 280 pF1KB0 --EDGG----RDS-KALV---ELNG-VSLIPKGSRDCG--LHGQAPKVPPQDLPPTATSS . :: :. ...: : : ... . .: : :...: .: .. :. . CCDS34 ESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQY 190 200 210 220 230 240 290 300 310 320 330 340 pF1KB0 SMASFLYSTALPNHAIR-ELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPT .: . . .. :..:. :: .: : ::.::. : : : : . :. . . CCDS34 NMQGS-HPSSTSNEVIEMELPME-DSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN---S 250 260 270 280 290 300 350 360 370 380 390 400 pF1KB0 GPGGPLIQNVHASKRILFSIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLD . : ..... . .. ...:. .. : :. ::: :. ::. ...::.:.: CCDS34 AAG---VEDLNI---VQVTVPDNEKER----LSSIEKIKQLREQVNDLFSRKFGEAIGVD 310 320 330 340 350 410 420 430 440 450 460 pF1KB0 HMVPVPYRKIACDPEAVEIVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDER : ::::::. .: : : :.: . :: : . ...:::: . :.: . : CCDS34 FPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGL 360 370 380 390 400 410 470 480 490 500 510 520 pF1KB0 IFTGNKFTKDTTKLEPASPPEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGG CCDS34 ELSNVGKRKIDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHS 420 430 440 450 460 470 >>CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 (949 aa) initn: 893 init1: 342 opt: 343 Z-score: 327.3 bits: 72.0 E(32554): 6.5e-12 Smith-Waterman score: 593; 31.8% identity (58.5% similar) in 446 aa overlap (30-457:22-406) 10 20 30 40 50 60 pF1KB0 MALLGKRCDVPTNGCGPDRWNSAFTRKDEIITSLVSALDSMCSALSKLNAEVACVAVHDE ..: :::::.:::. :.: .:::::.::.. CCDS55 MAQVAVSTLPVEEESSSETRMVVTFLVSALESMCKELAKSKAEVACIAVYET 10 20 30 40 50 70 80 90 100 110 120 pF1KB0 SAFVVGTEKGRMFLNARKELQSDFLRFCLSAAQHRAATSQLEGRVVRRVLTVASRALCPT ..::::::.: :.::: ..:.:: ..:.. :: :: . CCDS55 DVFVVGTERGCAFVNARTDFQKDFAKYCVA-----------EG-------------LCEV 60 70 80 130 140 150 160 170 pF1KB0 GGPPWKDPEAEHPKKVQRGEGGGRSLPRSSLE-HGSDVYLLRKMVEEVFDVLYSEALGRA :: : .... :.... .::: ::. : :..::: . CCDS55 K-PP---------------------CPVNGMQVHSGETEILRKAVEDYFCFCYGKALGTT 90 100 110 120 180 190 200 210 220 230 pF1KB0 SVVPLPYERLLREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPL--- .::.:::..::. . ..:::::::.::..: .:: .: :::.. : : ..::. CCDS55 VMVPVPYEKMLRDQSAVVVQGLPEGVAFQHPENYDLATLKWILENKAGISFIINRPFLGP 130 140 150 160 170 180 240 250 260 270 280 pF1KB0 --EDGG----RDS-KALV---ELNG-VSLIPKGSRDCG--LHGQAPKVPPQDLPPTATSS . :: :. ...: : : ... . .: : :...: .: .. :. . CCDS55 ESQLGGPGMVTDAERSIVSPSESCGPINVKTEPMEDSGISLKAEAVSVKKESEDPNYYQY 190 200 210 220 230 240 290 300 310 320 330 340 pF1KB0 SMASFLYSTALPNHAIR-ELKQEAPSCPLAPSDLGLSRPMPEPKATGAQDFSDCCGQKPT .: . . .. :..:. :: .: : ::.::. : : : : . :. . . CCDS55 NMQGS-HPSSTSNEVIEMELPME-DSTPLVPSEEPNEDPEAEVKIEGNTNSSSVTN---S 250 260 270 280 290 300 350 360 370 380 390 400 pF1KB0 GPGGPLIQNVHASKRILFSIVHDKSEKWDAFIKETEDINTLRECVQILFNSRYAEALGLD . : ..... . .. ...:. .. : :. ::: :. ::. ...::.:.: CCDS55 AAG---VEDLNI---VQVTVPDNEKER----LSSIEKIKQLREQVNDLFSRKFGEAIGVD 310 320 330 340 350 410 420 430 440 450 460 pF1KB0 HMVPVPYRKIACDPEAVEIVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFIIKRMFDER : ::::::. .: : : :.: . :: : . ...:::: . :.: . : CCDS55 FPVKVPYRKITFNPGCVVIDGMPPGVVFKAPGYLEISSMRRILEAAEFIKFTVIRPLPGL 360 370 380 390 400 410 470 480 490 500 510 520 pF1KB0 IFTGNKFTKDTTKLEPASPPEDTSAEVSRATVLDLAGNARSDKGSMSEDCGPGTSGELGG CCDS55 ELSNVGKRKIDQEGRVFQEKWERAYFFVEVQNIPTCLICKQSMSVSKEYNLRRHYQTNHS 420 430 440 450 460 470 976 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 16:58:53 2016 done: Sat Nov 5 16:58:54 2016 Total Scan time: 5.060 Total Display time: 0.310 Function used was FASTA [36.3.4 Apr, 2011]