FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3683, 1174 aa 1>>>pF1KB3683 1174 - 1174 aa - 1174 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8091+/-0.00117; mu= 19.3292+/- 0.070 mean_var=66.1258+/-13.693, 0's: 0 Z-trim(101.4): 25 B-trim: 348 in 2/47 Lambda= 0.157721 statistics sampled from 6487 (6497) to 6487 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.545), E-opt: 0.2 (0.2), width: 16 Scan time: 3.970 The best scores are: opt bits E(32554) CCDS3511.1 POLR2B gene_id:5431|Hs108|chr4 (1174) 7858 1797.8 0 CCDS77915.1 POLR2B gene_id:5431|Hs108|chr4 (1167) 7808 1786.5 0 CCDS77916.1 POLR2B gene_id:5431|Hs108|chr4 (1099) 7299 1670.6 0 CCDS53824.1 POLR3B gene_id:55703|Hs108|chr12 (1075) 1625 379.6 2.3e-104 CCDS9105.1 POLR3B gene_id:55703|Hs108|chr12 (1133) 1625 379.6 2.4e-104 CCDS62990.1 POLR1B gene_id:84172|Hs108|chr2 ( 924) 416 104.4 1.3e-21 CCDS62989.1 POLR1B gene_id:84172|Hs108|chr2 ( 952) 416 104.4 1.3e-21 CCDS46395.1 POLR1B gene_id:84172|Hs108|chr2 (1079) 416 104.5 1.5e-21 CCDS2097.1 POLR1B gene_id:84172|Hs108|chr2 (1135) 416 104.5 1.5e-21 CCDS62988.1 POLR1B gene_id:84172|Hs108|chr2 (1173) 416 104.5 1.6e-21 >>CCDS3511.1 POLR2B gene_id:5431|Hs108|chr4 (1174 aa) initn: 7858 init1: 7858 opt: 7858 Z-score: 9651.6 bits: 1797.8 E(32554): 0 Smith-Waterman score: 7858; 100.0% identity (100.0% similar) in 1174 aa overlap (1-1174:1-1174) 10 20 30 40 50 60 pF1KB3 MYDADEDMQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MYDADEDMQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRPTSTIWVSML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRPTSTIWVSML 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 ARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMMEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMMEM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 VKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHVGVSDFCETK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHVGVSDFCETK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 KAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKEVRIYAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKEVRIYAQ 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 KFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLNRLTFASTLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLNRLTFASTLS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 HLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAYISVGSQPSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 HLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAYISVGSQPSP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB3 ILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLRRQMDIIVSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLRRQMDIIVSE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB3 VSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB3 VVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB3 RNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 RNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIV 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB3 AIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEKPTRETCQGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEKPTRETCQGM 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB3 RHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRDCSTFLRTSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 RHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRDCSTFLRTSE 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB3 TGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB3 ITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKISNLLSDYGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKISNLLSDYGY 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB3 HLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 HLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSR 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB3 DGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTRTHTYECRGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTRTHTYECRGC 1090 1100 1110 1120 1130 1140 1150 1160 1170 pF1KB3 RNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV :::::::::::::::::::::::::::::::::: CCDS35 RNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV 1150 1160 1170 >>CCDS77915.1 POLR2B gene_id:5431|Hs108|chr4 (1167 aa) initn: 7808 init1: 7808 opt: 7808 Z-score: 9590.2 bits: 1786.5 E(32554): 0 Smith-Waterman score: 7808; 100.0% identity (100.0% similar) in 1167 aa overlap (8-1174:1-1167) 10 20 30 40 50 60 pF1KB3 MYDADEDMQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 MQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE 10 20 30 40 50 70 80 90 100 110 120 pF1KB3 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB3 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB3 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRPTSTIWVSML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRPTSTIWVSML 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB3 ARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMMEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMMEM 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB3 VKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHVGVSDFCETK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 VKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHVGVSDFCETK 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB3 KAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKEVRIYAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 KAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKEVRIYAQ 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB3 KFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLNRLTFASTLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 KFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLNRLTFASTLS 420 430 440 450 460 470 490 500 510 520 530 540 pF1KB3 HLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAYISVGSQPSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 HLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAYISVGSQPSP 480 490 500 510 520 530 550 560 570 580 590 600 pF1KB3 ILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLRRQMDIIVSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLRRQMDIIVSE 540 550 560 570 580 590 610 620 630 640 650 660 pF1KB3 VSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 VSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASG 600 610 620 630 640 650 670 680 690 700 710 720 pF1KB3 VVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 VVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSP 660 670 680 690 700 710 730 740 750 760 770 780 pF1KB3 RNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 RNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIV 720 730 740 750 760 770 790 800 810 820 830 840 pF1KB3 AIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEKPTRETCQGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 AIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEKPTRETCQGM 780 790 800 810 820 830 850 860 870 880 890 900 pF1KB3 RHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRDCSTFLRTSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 RHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRDCSTFLRTSE 840 850 860 870 880 890 910 920 930 940 950 960 pF1KB3 TGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 TGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEG 900 910 920 930 940 950 970 980 990 1000 1010 1020 pF1KB3 ITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKISNLLSDYGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKISNLLSDYGY 960 970 980 990 1000 1010 1030 1040 1050 1060 1070 1080 pF1KB3 HLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 HLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSR 1020 1030 1040 1050 1060 1070 1090 1100 1110 1120 1130 1140 pF1KB3 DGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTRTHTYECRGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTRTHTYECRGC 1080 1090 1100 1110 1120 1130 1150 1160 1170 pF1KB3 RNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV :::::::::::::::::::::::::::::::::: CCDS77 RNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV 1140 1150 1160 >>CCDS77916.1 POLR2B gene_id:5431|Hs108|chr4 (1099 aa) initn: 7299 init1: 7299 opt: 7299 Z-score: 8964.7 bits: 1670.6 E(32554): 0 Smith-Waterman score: 7299; 100.0% identity (100.0% similar) in 1093 aa overlap (82-1174:7-1099) 60 70 80 90 100 110 pF1KB3 QMSVQRIVEDAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPN :::::::::::::::::::::::::::::: CCDS77 MLDCNQPRYLLKFEQIYLSKPTHWERDGAPSPMMPN 10 20 30 120 130 140 150 160 170 pF1KB3 EARLRNLTYSAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 EARLRNLTYSAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDL 40 50 60 70 80 90 180 190 200 210 220 230 pF1KB3 CELNECPLDPGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 CELNECPLDPGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRP 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB3 TSTIWVSMLARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 TSTIWVSMLARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYD 160 170 180 190 200 210 300 310 320 330 340 350 pF1KB3 FEDPEMMEMVKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 FEDPEMMEMVKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHV 220 230 240 250 260 270 360 370 380 390 400 410 pF1KB3 GVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 GVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNL 280 290 300 310 320 330 420 430 440 450 460 470 pF1KB3 LKEVRIYAQKFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LKEVRIYAQKFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLN 340 350 360 370 380 390 480 490 500 510 520 530 pF1KB3 RLTFASTLSHLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 RLTFASTLSHLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAY 400 410 420 430 440 450 540 550 560 570 580 590 pF1KB3 ISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLR 460 470 480 490 500 510 600 610 620 630 640 650 pF1KB3 RQMDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 RQMDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNY 520 530 540 550 560 570 660 670 680 690 700 710 pF1KB3 SWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 SWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASII 580 590 600 610 620 630 720 730 740 750 760 770 pF1KB3 PFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 PFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRE 640 650 660 670 680 690 780 790 800 810 820 830 pF1KB3 LPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEK 700 710 720 730 740 750 840 850 860 870 880 890 pF1KB3 PTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 PTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRD 760 770 780 790 800 810 900 910 920 930 940 950 pF1KB3 CSTFLRTSETGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 CSTFLRTSETGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQ 820 830 840 850 860 870 960 970 980 990 1000 1010 pF1KB3 EDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 EDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKI 880 890 900 910 920 930 1020 1030 1040 1050 1060 1070 pF1KB3 SNLLSDYGYHLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 SNLLSDYGYHLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILN 940 950 960 970 980 990 1080 1090 1100 1110 1120 1130 pF1KB3 RQPMEGRSRDGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 RQPMEGRSRDGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTR 1000 1010 1020 1030 1040 1050 1140 1150 1160 1170 pF1KB3 THTYECRGCRNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV ::::::::::::::::::::::::::::::::::::::::::: CCDS77 THTYECRGCRNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV 1060 1070 1080 1090 >>CCDS53824.1 POLR3B gene_id:55703|Hs108|chr12 (1075 aa) initn: 2121 init1: 802 opt: 1625 Z-score: 1987.3 bits: 379.6 E(32554): 2.3e-104 Smith-Waterman score: 2618; 39.4% identity (69.2% similar) in 1109 aa overlap (82-1171:13-1068) 60 70 80 90 100 110 pF1KB3 QMSVQRIVEDAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPN : . ::. .::.. : : .. :. :. CCDS53 MKANEKVTSDADPMWYLKYLNIYVGLPDVEESFNVTRPVSPH 10 20 30 40 120 130 140 150 160 170 pF1KB3 EARLRNLTYSAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDL : :::..:::::. ::: : .: ... .. ::..::::::. :.:.: : .. CCDS53 ECRLRDMTYSAPITVDIEYT---RGSQRII--RNALPIGRMPIMLRSSNCVLTGKTPAEF 50 60 70 80 90 180 190 200 210 220 230 pF1KB3 CELNECPLDPGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCL-ENSSR .:::::::::::::..: :::.. ::... : . : : : : : . : :..:: CCDS53 AKLNECPLDPGGYFIVKGVEKVILIQEQLSKNRIIVEA--DRKGAVGASVTSSTHEKKSR 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB3 PTSTIWVSMLARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIY ..: .. : :. .....::.:.:.:.: ::..:.. : CCDS53 ------TNMAVKQG----------RFYLRHNTLSEDIPIVIIFKAMGVESDQEIVQMIG- 160 170 180 190 300 310 320 330 340 pF1KB3 DFEDPEMMEMVKPSLDEAFVIQ--EQNVALNFIGSRGAKP----GVTKEKRIKYAKEVLQ . ..: :::.: : : ::..::.. . : :. .:. :.:.: CCDS53 --TEEHVMAAFGPSLEECQKAQIFTQMQALKYIGNKVRRQRMWGGGPKKTKIEEARELLA 200 210 220 230 240 250 350 360 370 380 390 400 pF1KB3 KEMLPHVGVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLF . .: :: :..: : . . ::.:..:: : ..::::.::::::.::: ::..:: CCDS53 STILTHVPVKEFNFRAKCIYTAVMVRRVILAQ-GDNKVDDRDYYGNKRLELAGQLLSLLF 260 270 280 290 300 310 410 420 430 440 450 460 pF1KB3 RGMFKNLLKEVRIYAQKFI--DRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQA . .::.. .:.. :.. : .:. .:.. .. :..:. ...::::. :. .. CCDS53 EDLFKKFNSEMKKIADQVIPKQRAAQFDVVKHMRQDQITNGMVNAISTGNWS-LKRFKMD 320 330 340 350 360 370 470 480 490 500 510 520 pF1KB3 RAGVSQVLNRLTFASTLSHLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGL : ::.:::.::.. :.:. . :..: . . :.. ::.:. . :::.::..::::.: :: CCDS53 RQGVTQVLSRLSYISALGMMTRISSQFEKTRKVSGPRSLQPSQWGMLCPSDTPEGEACGL 380 390 400 410 420 430 530 540 550 560 570 580 pF1KB3 VKNLALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIA--DATKIFVNGCWVGIHKDP :::::::..:.. . .::... . ..:... . .. .. .:.:: .:. .: CCDS53 VKNLALMTHITTDMEDGPIVKLASNLGVEDVNLLCGEELSYPNVFLVFLNGNILGVIRDH 440 450 460 470 480 490 590 600 610 620 630 640 pF1KB3 EQLMNTLRKLRRQMDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHI ..:.::.: .:: : ::. .. .: . : .:.::.::: .::.::: . ..:. CCDS53 KKLVNTFRLMRRA-GYINEFVSISTNLTDRCVYISSDGGRLCRPYIIVKKQKPAVTNKHM 500 510 520 530 540 550 650 660 670 680 690 700 pF1KB3 DQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHP ..: . : :. .:.. ..:::.:. ::. .:. ... :: ::.: CCDS53 EELAQG-YRNF--EDFLHESLVEYLDVNEENDCNIALYEHTINKDT-------THLEIEP 560 570 580 590 600 710 720 730 740 750 760 pF1KB3 SMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVT .:::::..::.: :::::::::: ::::::::. : . :.::: ..: :::::.: CCDS53 FTLLGVCAGLIPYPHHNQSPRNTYQCAMGKQAMGTIGYNQRNRIDTLMYLLAYPQKPMVK 610 620 630 640 650 660 770 780 790 800 810 pF1KB3 TRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYK---EQ :...: ..:..:::: :. ::. ::.::. ::....:....:::: : . :.. : .. CCDS53 TKTIELIEFEKLPAGQNATVAVMSYSGYDIEDALVLNKASLDRGFGRCLVYKNAKCTLKR 670 680 690 700 710 720 820 830 840 850 860 870 pF1KB3 ESKKGFDQE--EVFEKPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPE ... ::. ... ::. :: : :: ::. .:: .: . .:...:. .: CCDS53 YTNQTFDKVMGPMLDAATRKPIW--RHEI---LDADGICSPGEKVENKQVLVNKS--MPT 730 740 750 760 770 880 890 900 910 920 930 pF1KB3 -NEDELESTN--RRYTKRDCSTFLRTSETGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIG .. ::..: .. .: . . . ...::.. : : . :. .:..: :.:: CCDS53 VTQIPLEGSNVPQQPQYKDVPITYKGATDSYIEKVMISSNAEDAFLIKMLLRQTRRPEIG 780 790 800 810 820 830 940 950 960 970 980 990 pF1KB3 DKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQGKVSAN :::.:::::::.::. :::::: :: ::::.:::..:::::.:.::: : ::... CCDS53 DKFSSRHGQKGVCGLIVPQEDMPFCDSGICPDIIMNPHGFPSRMTVGKLIELLAGKAGVL 840 850 860 870 880 890 1000 1010 1020 1030 1040 1050 pF1KB3 KGEIGDATPFNDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITSQIFIGPTYYQRLK :.. .: :. . .:. . . : .::. :.. . .:.::. . . :..::.:::.:: CCDS53 DGRFHYGTAFGGS-KVKDVCEDLVRHGYNYLGKDYVTSGITGEPLEAYIYFGPVYYQKLK 900 910 920 930 940 950 1060 1070 1080 1090 1100 1110 pF1KB3 HMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGAAQFLRERLFEASD ::: ::.:.::::: .:.::: ::::::::::.::::::: :..::...: :::. .:: CCDS53 HMVLDKMHARARGPRAVLTRQPTEGRSRDGGLRLGEMERDCLIGYGASMLLLERLMISSD 960 970 980 990 1000 1010 1120 1130 1140 1150 1160 1170 pF1KB3 PYQVHVCNLCGIMAIANTRTHTYECRGCRNKTQISLVRMPYACKLLFQELMSMSIAPRMM ..: ::. ::... .. :. :... ..: .:.:::::::::::.::.: ::. CCDS53 AFEVDVCGQCGLLG------YSGWCHYCKSSCHVSSLRIPYACKLLFQELQSMNIIPRLK 1020 1030 1040 1050 1060 pF1KB3 SV CCDS53 LSKYNE 1070 >>CCDS9105.1 POLR3B gene_id:55703|Hs108|chr12 (1133 aa) initn: 2189 init1: 802 opt: 1625 Z-score: 1986.9 bits: 379.6 E(32554): 2.4e-104 Smith-Waterman score: 2692; 38.6% identity (68.6% similar) in 1167 aa overlap (24-1171:24-1126) 10 20 30 40 50 60 pF1KB3 MYDADEDMQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE : : .. ... ::::.:..:::. ::.. ...:.. CCDS91 MDVLAEEFGNLTPEQLAAPIPTVEEKWRLLPAFLKVKGLVKQHIDSFNYFINVEIKKIMK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY . .:. : . ::. .::.. : : .. :. :.: :::..:: CCDS91 ANEKVTSDAD-----------PMWYLKYLNIYVGLPDVEESFNVTRPVSPHECRLRDMTY 70 80 90 100 130 140 150 160 170 180 pF1KB3 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD :::. ::: : .: ... .. ::..::::::. :.:.: : .. .::::::: CCDS91 SAPITVDIEYT---RGSQRII--RNALPIGRMPIMLRSSNCVLTGKTPAEFAKLNECPLD 110 120 130 140 150 160 190 200 210 220 230 pF1KB3 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCL-ENSSRPTSTIWVSM ::::::..: :::.. ::... : . : : : : : . : :..:: ..: CCDS91 PGGYFIVKGVEKVILIQEQLSKNRIIVEA--DRKGAVGASVTSSTHEKKSR------TNM 170 180 190 200 210 240 250 260 270 280 290 pF1KB3 LARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMME .. : :. .....::.:.:.:.: ::..:.. : . ..: CCDS91 AVKQG----------RFYLRHNTLSEDIPIVIIFKAMGVESDQEIVQMIG---TEEHVMA 220 230 240 250 260 300 310 320 330 340 350 pF1KB3 MVKPSLDEAFVIQ--EQNVALNFIGSRGAKP----GVTKEKRIKYAKEVLQKEMLPHVGV :::.: : : ::..::.. . : :. .:. :.:.: . .: :: : CCDS91 AFGPSLEECQKAQIFTQMQALKYIGNKVRRQRMWGGGPKKTKIEEARELLASTILTHVPV 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB3 SDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLK ..: : . . ::.:..:: : ..::::.::::::.::: ::..::. .::.. . CCDS91 KEFNFRAKCIYTAVMVRRVILAQ-GDNKVDDRDYYGNKRLELAGQLLSLLFEDLFKKFNS 330 340 350 360 370 380 420 430 440 450 460 470 pF1KB3 EVRIYAQKFI--DRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLN :.. :.. : .:. .:.. .. :..:. ...::::. :. .. : ::.:::. CCDS91 EMKKIADQVIPKQRAAQFDVVKHMRQDQITNGMVNAISTGNWS-LKRFKMDRQGVTQVLS 390 400 410 420 430 440 480 490 500 510 520 530 pF1KB3 RLTFASTLSHLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAY ::.. :.:. . :..: . . :.. ::.:. . :::.::..::::.: :::::::::.. CCDS91 RLSYISALGMMTRISSQFEKTRKVSGPRSLQPSQWGMLCPSDTPEGEACGLVKNLALMTH 450 460 470 480 490 500 540 550 560 570 580 pF1KB3 ISVGSQPSPILEFLEEWSMENLEEISPAAIA--DATKIFVNGCWVGIHKDPEQLMNTLRK :.. . .::... . ..:... . .. .. .:.:: .:. .: ..:.::.: CCDS91 ITTDMEDGPIVKLASNLGVEDVNLLCGEELSYPNVFLVFLNGNILGVIRDHKKLVNTFRL 510 520 530 540 550 560 590 600 610 620 630 640 pF1KB3 LRRQMDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYN .:: : ::. .. .: . : .:.::.::: .::.::: . ..:...: . : CCDS91 MRRA-GYINEFVSISTNLTDRCVYISSDGGRLCRPYIIVKKQKPAVTNKHMEELAQG-YR 570 580 590 600 610 650 660 670 680 690 700 pF1KB3 NYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCAS :. .:.. ..:::.:. ::. .:. ... :: ::.: .:::::. CCDS91 NF--EDFLHESLVEYLDVNEENDCNIALYEHTINKDT-------THLEIEPFTLLGVCAG 620 630 640 650 660 670 710 720 730 740 750 760 pF1KB3 IIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRF .::.: :::::::::: ::::::::. : . :.::: ..: :::::.: :...: ..: CCDS91 LIPYPHHNQSPRNTYQCAMGKQAMGTIGYNQRNRIDTLMYLLAYPQKPMVKTKTIELIEF 680 690 700 710 720 730 770 780 790 800 810 820 pF1KB3 RELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYK---EQESKKGFDQE ..:::: :. ::. ::.::. ::....:....:::: : . :.. : .. ... ::. CCDS91 EKLPAGQNATVAVMSYSGYDIEDALVLNKASLDRGFGRCLVYKNAKCTLKRYTNQTFDKV 740 750 760 770 780 790 830 840 850 860 870 880 pF1KB3 --EVFEKPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPE-NEDELEST ... ::. :: : :: ::. .:: .: . .:...:. .: .. ::.. CCDS91 MGPMLDAATRKPI--WRHEI---LDADGICSPGEKVENKQVLVNKS--MPTVTQIPLEGS 800 810 820 830 840 890 900 910 920 930 940 pF1KB3 N--RRYTKRDCSTFLRTSETGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQ : .. .: . . . ...::.. : : . :. .:..: :.:::::.::::: CCDS91 NVPQQPQYKDVPITYKGATDSYIEKVMISSNAEDAFLIKMLLRQTRRPEIGDKFSSRHGQ 850 860 870 880 890 900 950 960 970 980 990 1000 pF1KB3 KGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATP ::.::. :::::: :: ::::.:::..:::::.:.::: : ::... :.. .: CCDS91 KGVCGLIVPQEDMPFCDSGICPDIIMNPHGFPSRMTVGKLIELLAGKAGVLDGRFHYGTA 910 920 930 940 950 960 1010 1020 1030 1040 1050 1060 pF1KB3 FNDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHS :. . .:. . . : .::. :.. . .:.::. . . :..::.:::.::::: ::.:. CCDS91 FGGS-KVKDVCEDLVRHGYNYLGKDYVTSGITGEPLEAYIYFGPVYYQKLKHMVLDKMHA 970 980 990 1000 1010 1020 1070 1080 1090 1100 1110 1120 pF1KB3 RARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNL ::::: .:.::: ::::::::::.::::::: :..::...: :::. .:: ..: ::. CCDS91 RARGPRAVLTRQPTEGRSRDGGLRLGEMERDCLIGYGASMLLLERLMISSDAFEVDVCGQ 1030 1040 1050 1060 1070 1080 1130 1140 1150 1160 1170 pF1KB3 CGIMAIANTRTHTYECRGCRNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV ::... .. :. :... ..: .:.:::::::::::.::.: ::. CCDS91 CGLLG------YSGWCHYCKSSCHVSSLRIPYACKLLFQELQSMNIIPRLKLSKYNE 1090 1100 1110 1120 1130 >>CCDS62990.1 POLR1B gene_id:84172|Hs108|chr2 (924 aa) initn: 1126 init1: 368 opt: 416 Z-score: 501.6 bits: 104.4 E(32554): 1.3e-21 Smith-Waterman score: 1271; 30.7% identity (57.4% similar) in 952 aa overlap (267-1171:36-921) 240 250 260 270 280 290 pF1KB3 VSMLARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPE .:. ....:: :: .:....: :: CCDS62 EEHSAVNMNLHYLENGTVMLNFIYRKELFFLPLGFALKALVSFSDYQIFQELIKGKEDDS 10 20 30 40 50 60 300 310 320 330 340 350 pF1KB3 MM-----EMVKPSLDEAFVIQEQNVALNFIGS-RGAKPGVTKEKRIKYAKEVLQKEMLPH .. .:.. ..:. :.: .::..: .: .: . : : : .. CCDS62 FLRNSVSQMLRIVMEEGCSTQKQ--VLNYLGECFRVKLNVPDWYPNEQAAEFLFNQC--- 70 80 90 100 110 120 360 370 380 390 400 410 pF1KB3 VGVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKN . . .:.: :.: :...:. : :. :. : :... : :. .... ... CCDS62 ICIHLKSNTEKFYMLCLMTRKLFALAKGECMEDNPDSLVNQEVLTPGQLFLMFLKEKLEG 130 140 150 160 170 180 420 430 440 450 460 pF1KB3 LLKEVRIYAQKFIDRGKDFNLELAIKTRIISDGL------KYSLATGNWGDQKKAHQAR- : ..: .: .. . ... ::.. :. .: .:::: .. . CCDS62 WLVSIKIAFDKKAQK-TSVSMNTDNLMRIFTMGIDLTKPFEYLFATGNLRSKTGLGLLQD 190 200 210 220 230 470 480 490 500 510 520 pF1KB3 AGVSQVLNRLTFASTLSHLRRLNSPIGRD-GKLAKP--RQLHNTLWGMVCPAETPEGHAV .:. : ..:.: :::.: .. : : .:. :.: ::..::..::.:. CCDS62 SGLCVVADKLNFIRYLSHFRCVHR--GADFAKMRTTTVRRLLPESWGFLCPVHTPDGEPC 240 250 260 270 280 290 530 540 550 560 570 pF1KB3 GLVKNL-ALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVG-IHK ::...: :. .. . : .: . .. .. . .. ....: :: . : CCDS62 GLMNHLTAVCEVVTQFVYTASIPALLCNLGVTPIDGAPHRSYSECYPVLLDGVMVGWVDK 300 310 320 330 340 350 580 590 600 610 620 pF1KB3 D-PEQLMNTLRK---LRRQ-----MDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVE : . ..::. ::.. :.... .. .. . ..: :. ::. CCDS62 DLAPGIADSLRHFKVLREKRIPPWMEVVLIPMTGKPSLYPG-LFLFTTPCRLVRPV---- 360 370 380 390 400 410 630 640 650 660 670 680 pF1KB3 KQKLLLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAY :.: : :. : : :.:. . .:. :.. . CCDS62 -QNLALGKE------------------------ELIGTMEQIFMNVAIFEDEV------F 420 430 440 690 700 710 720 730 740 pF1KB3 CSTYTHCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAH .. :: :. : .:.: :..::: :::::::: :: ::::.:: . ... : :. . CCDS62 AGVTTHQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQDRSDNKLY 450 460 470 480 490 500 750 760 770 780 790 800 pF1KB3 VLYYPQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSV : ::.::: ..: . . : : :.:::. :::::..::..:.:... .::: .. CCDS62 RLQTPQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASWERGFAHGS 510 520 530 540 550 560 810 820 830 840 850 860 pF1KB3 FYRS--YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVI :.: .:. : :. :: :: . .::::::: :.... : CCDS62 VYKSEFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGAKLQYGDPY 570 580 590 600 610 870 880 890 900 910 920 pF1KB3 IGKTVTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG---YKFCKIR . : . :: : .:..: .::.. : :. : .: : CCDS62 YSYL-----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSGKFKCVCIT 620 630 640 650 930 940 950 960 970 980 pF1KB3 VRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLI .: : : ::::::::::::: . . :::::: :..:::..:::..::::::: :: CCDS62 MRVPRNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPSRMTIGMLI 660 670 680 690 700 710 990 1000 1010 1020 1030 pF1KB3 ECLQGKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITS : . :: .: .: ::::: .. .. ....:. ::.. :.: ::.:..: .. . CCDS62 ESMAGKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSGISGLELEA 720 730 740 750 760 770 1040 1050 1060 1070 1080 1090 pF1KB3 QIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGA .:::: .:::::.:::.::.. :. : . .. ::. ::. .::.:::::::: .:::. CCDS62 DIFIGVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMERDALLAHGT 780 790 800 810 820 830 1100 1110 1120 1130 1140 pF1KB3 AQFLRERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCRNKTQISLV . .:..:::. :: .::: :: . . . :.. :.: : . :. : CCDS62 SFLLHDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCSRSDTIDTV 840 850 860 870 880 890 1150 1160 1170 pF1KB3 RMPYACKLLFQELMSMSIAPRMMSV .::. . . :: .:.: .. CCDS62 SVPYVFRYFVAELAAMNIKVKLDVV 900 910 920 >>CCDS62989.1 POLR1B gene_id:84172|Hs108|chr2 (952 aa) initn: 1158 init1: 368 opt: 416 Z-score: 501.4 bits: 104.4 E(32554): 1.3e-21 Smith-Waterman score: 1115; 38.5% identity (62.5% similar) in 538 aa overlap (654-1171:441-949) 630 640 650 660 670 680 pF1KB3 PLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQ :.: : : : : :.:. . .:. :.. CCDS62 EVVLIPMTGKPSLYPGLFLFTTPCRLVRPVQNL-ALGKEELIGTMEQIFMNVAIFEDEV- 420 430 440 450 460 690 700 710 720 730 740 pF1KB3 EKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVR . .. :: :. : .:.: :..::: :::::::: :: ::::.:: . ... : CCDS62 -----FAGVTTHQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQDR 470 480 490 500 510 520 750 760 770 780 790 800 pF1KB3 MDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDR :. . : ::.::: ..: . . : : :.:::. :::::..::..:.:... .: CCDS62 SDNKLYRLQTPQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASWER 530 540 550 560 570 580 810 820 830 840 850 860 pF1KB3 GFFRSVFYRS--YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGVRV :: .. :.: .:. : :. :: :: . .::::::: :... CCDS62 GFAHGSVYKSEFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGAKL 590 600 610 620 630 870 880 890 900 910 pF1KB3 SGDDVIIGKTVTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG---Y . : . : . :: : .:..: .::.. : :. : . CCDS62 QYGDPYYSYL-----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSGKF 640 650 660 670 680 920 930 940 950 960 970 pF1KB3 KFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRM : : .: : : ::::::::::::: . . :::::: :..:::..:::..:::: CCDS62 KCVCITMRVPRNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPSRM 690 700 710 720 730 740 980 990 1000 1010 1020 1030 pF1KB3 TIGHLIECLQGKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNGFT ::: ::: . :: .: .: ::::: .. .. ....:. ::.. :.: ::.:.. CCDS62 TIGMLIESMAGKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSGIS 750 760 770 780 790 800 1040 1050 1060 1070 1080 1090 pF1KB3 GRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDC : .. ..:::: .:::::.:::.::.. :. : . .. ::. ::. .::.:::::::: CCDS62 GLELEADIFIGVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMERDA 810 820 830 840 850 860 1100 1110 1120 1130 1140 pF1KB3 QIAHGAAQFLRERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCRNK .:::.. .:..:::. :: .::: :: . . . :.. :.: : . CCDS62 LLAHGTSFLLHDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCSRS 870 880 890 900 910 920 1150 1160 1170 pF1KB3 TQISLVRMPYACKLLFQELMSMSIAPRMMSV :. : .::. . . :: .:.: .. CCDS62 DTIDTVSVPYVFRYFVAELAAMNIKVKLDVV 930 940 950 >>CCDS46395.1 POLR1B gene_id:84172|Hs108|chr2 (1079 aa) initn: 1234 init1: 368 opt: 416 Z-score: 500.5 bits: 104.5 E(32554): 1.5e-21 Smith-Waterman score: 1368; 30.0% identity (56.4% similar) in 1080 aa overlap (146-1171:75-1076) 120 130 140 150 160 170 pF1KB3 RNLTYSAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELN : :.: .:::..: : : .: . : : . CCDS46 SFNYAVHEGLGLAVQADINWAVNGISKGIIKQFLGYVPIMVKSKLCNLRNLPPQALIEHH 50 60 70 80 90 100 180 190 200 210 220 230 pF1KB3 ECPLDPGGYFIINGSEKV--LIAQEKMATNTVYVFAKKDSK---YAYTGECRSCLENSSR : . :::::::: ::: .. . . ... : .. :. : :... CCDS46 EEAEEMGGYFIINGIEKVIRMLIMPRRNFPIAMIRPKWKTRGPGYTQYGVSMHCVREEHS 110 120 130 140 150 160 240 250 260 270 280 pF1KB3 PTSTIWVSMLARGGQGAKKSAIGQRIVATLPYIKQE--VPIIIVFRALGFVSDRDILEHI .. . . .: : .. .. : :. .:. ....:: :: .:.... CCDS46 AVN-MNLHYLENG-----------TVMLNFIYRKELFFLPLGFALKALVSFSDYQIFQEL 170 180 190 200 210 290 300 310 320 330 340 pF1KB3 IYDFEDPEMM-----EMVKPSLDEAFVIQEQNVALNFIGS-RGAKPGVTKEKRIKYAKEV : :: .. .:.. ..:. :.: .::..: .: .: . : : CCDS46 IKGKEDDSFLRNSVSQMLRIVMEEGCSTQKQ--VLNYLGECFRVKLNVPDWYPNEQAAEF 220 230 240 250 260 270 350 360 370 380 390 400 pF1KB3 LQKEMLPHVGVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAF : .. . . .:.: :.: :...:. : :. :. : :... : :. . CCDS46 LFNQC---ICIHLKSNTEKFYMLCLMTRKLFALAKGECMEDNPDSLVNQEVLTPGQLFLM 280 290 300 310 320 410 420 430 440 450 pF1KB3 LFRGMFKNLLKEVRIYAQKFIDRGKDFNLELAIKTRIISDGL------KYSLATGNWGDQ ... ... : ..: .: .. . ... ::.. :. .: .:::: .. CCDS46 FLKEKLEGWLVSIKIAFDKKAQK-TSVSMNTDNLMRIFTMGIDLTKPFEYLFATGNLRSK 330 340 350 360 370 380 460 470 480 490 500 510 pF1KB3 KKAHQAR-AGVSQVLNRLTFASTLSHLRRLNSPIGRD-GKLAKP--RQLHNTLWGMVCPA . .:. : ..:.: :::.: .. : : .:. :.: ::..::. CCDS46 TGLGLLQDSGLCVVADKLNFIRYLSHFRCVHR--GADFAKMRTTTVRRLLPESWGFLCPV 390 400 410 420 430 440 520 530 540 550 560 570 pF1KB3 ETPEGHAVGLVKNL-ALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNG .::.:. ::...: :. .. . : .: . .. .. . .. ....: CCDS46 HTPDGEPCGLMNHLTAVCEVVTQFVYTASIPALLCNLGVTPIDGAPHRSYSECYPVLLDG 450 460 470 480 490 500 580 590 600 610 620 pF1KB3 CWVG-IHKD-PEQLMNTLRK---LRRQ-----MDIIVSEVSMIRDIREREIRIYTDAGRI :: . :: . ..::. ::.. :.... .. .. . ..: :. CCDS46 VMVGWVDKDLAPGIADSLRHFKVLREKRIPPWMEVVLIPMTGKPSLYPG-LFLFTTPCRL 510 520 530 540 550 560 630 640 650 660 670 680 pF1KB3 CRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDD ::. :.: : :. : : :.:. . .:. :. CCDS46 VRPV-----QNLALGKE------------------------ELIGTMEQIFMNVAIFEDE 570 580 590 690 700 710 720 730 740 pF1KB3 LQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFH . . .. :: :. : .:.: :..::: :::::::: :: ::::.:: . ... CCDS46 V------FAGVTTHQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQ 600 610 620 630 640 750 760 770 780 790 800 pF1KB3 VRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAV : :. . : ::.::: ..: . . : : :.:::. :::::..::..:.:... CCDS46 DRSDNKLYRLQTPQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASW 650 660 670 680 690 700 810 820 830 840 850 pF1KB3 DRGFFRSVFYRS--YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGV .::: .. :.: .:. : :. :: :: . .::::::: :. CCDS46 ERGFAHGSVYKSEFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGA 710 720 730 740 750 760 860 870 880 890 900 910 pF1KB3 RVSGDDVIIGKTVTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG-- ... : . : . :: : .:..: .::.. : :. : CCDS46 KLQYGDPYYSYL-----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSG 770 780 790 800 920 930 940 950 960 970 pF1KB3 -YKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPS .: : .: : : ::::::::::::: . . :::::: :..:::..:::..:: CCDS46 KFKCVCITMRVPRNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPS 810 820 830 840 850 860 980 990 1000 1010 1020 1030 pF1KB3 RMTIGHLIECLQGKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNG ::::: ::: . :: .: .: ::::: .. .. ....:. ::.. :.: ::.: CCDS46 RMTIGMLIESMAGKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSG 870 880 890 900 910 920 1040 1050 1060 1070 1080 1090 pF1KB3 FTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMER ..: .. ..:::: .:::::.:::.::.. :. : . .. ::. ::. .::.::::::: CCDS46 ISGLELEADIFIGVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMER 930 940 950 960 970 980 1100 1110 1120 1130 1140 pF1KB3 DCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCR : .:::.. .:..:::. :: .::: :: . . . :.. :.: : CCDS46 DALLAHGTSFLLHDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCS 990 1000 1010 1020 1030 1040 1150 1160 1170 pF1KB3 NKTQISLVRMPYACKLLFQELMSMSIAPRMMSV . :. : .::. . . :: .:.: .. CCDS46 RSDTIDTVSVPYVFRYFVAELAAMNIKVKLDVV 1050 1060 1070 >>CCDS2097.1 POLR1B gene_id:84172|Hs108|chr2 (1135 aa) initn: 1234 init1: 368 opt: 416 Z-score: 500.1 bits: 104.5 E(32554): 1.5e-21 Smith-Waterman score: 1397; 29.1% identity (55.6% similar) in 1188 aa overlap (39-1171:38-1132) 10 20 30 40 50 60 pF1KB3 QYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVEDAPPIDLQ :.: ...::. .. .. :. ::... CCDS20 RNLPSGPSLKHLTDPSYGIPREQQKAALQELTRAHVESFNYAVHEGLGLAVQAIPPFEFA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 AEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERD-GAPSPMMPNEARLRNLTYSAPLYVD . .. : . . .: :: . . ..: : : : :: . : .: CCDS20 FKDERISFTILD----------AVISPPTVPKGTICKEANVYPAECRGRRSTYRGKLTAD 70 80 90 100 110 130 140 150 160 170 180 pF1KB3 ITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLDPGGYFII :. .: .: .. : :.: .:::..: : : .: . : : .: . :::::: CCDS20 INWAV--NG---ISKGIIKQFLGYVPIMVKSKLCNLRNLPPQALIEHHEEAEEMGGYFII 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB3 NGSEKV--LIAQEKMATNTVYVFAKKDSK---YAYTGECRSCLENSSRPTSTIWVSMLAR :: ::: .. . . ... : .. :. : :... .. . . .: CCDS20 NGIEKVIRMLIMPRRNFPIAMIRPKWKTRGPGYTQYGVSMHCVREEHSAVN-MNLHYLEN 180 190 200 210 220 230 250 260 270 280 290 pF1KB3 GGQGAKKSAIGQRIVATLPYIKQE--VPIIIVFRALGFVSDRDILEHIIYDFEDPEMM-- : .. .. : :. .:. ....:: :: .:....: :: .. CCDS20 G-----------TVMLNFIYRKELFFLPLGFALKALVSFSDYQIFQELIKGKEDDSFLRN 240 250 260 270 280 300 310 320 330 340 350 pF1KB3 ---EMVKPSLDEAFVIQEQNVALNFIGS-RGAKPGVTKEKRIKYAKEVLQKEMLPHVGVS .:.. ..:. :.: .::..: .: .: . : : : .. . . CCDS20 SVSQMLRIVMEEGCSTQKQ--VLNYLGECFRVKLNVPDWYPNEQAAEFLFNQC---ICIH 290 300 310 320 330 360 370 380 390 400 410 pF1KB3 DFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKE .:.: :.: :...:. : :. :. : :... : :. .... ... : CCDS20 LKSNTEKFYMLCLMTRKLFALAKGECMEDNPDSLVNQEVLTPGQLFLMFLKEKLEGWLVS 340 350 360 370 380 390 420 430 440 450 460 pF1KB3 VRIYAQKFIDRGKDFNLELAIKTRIISDGL------KYSLATGNWGDQKKAHQAR-AGVS ..: .: .. . ... ::.. :. .: .:::: .. . .:. CCDS20 IKIAFDKKAQK-TSVSMNTDNLMRIFTMGIDLTKPFEYLFATGNLRSKTGLGLLQDSGLC 400 410 420 430 440 450 470 480 490 500 510 520 pF1KB3 QVLNRLTFASTLSHLRRLNSPIGRD-GKLAKP--RQLHNTLWGMVCPAETPEGHAVGLVK : ..:.: :::.: .. : : .:. :.: ::..::..::.:. ::.. CCDS20 VVADKLNFIRYLSHFRCVHR--GADFAKMRTTTVRRLLPESWGFLCPVHTPDGEPCGLMN 460 470 480 490 500 510 530 540 550 560 570 580 pF1KB3 NL-ALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVG-IHKD-PE .: :. .. . : .: . .. .. . .. ....: :: . :: CCDS20 HLTAVCEVVTQFVYTASIPALLCNLGVTPIDGAPHRSYSECYPVLLDGVMVGWVDKDLAP 520 530 540 550 560 570 590 600 610 620 630 pF1KB3 QLMNTLRK---LRRQ-----MDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKL . ..::. ::.. :.... .. .. . ..: :. ::. :.: CCDS20 GIADSLRHFKVLREKRIPPWMEVVLIPMTGKPSLYPG-LFLFTTPCRLVRPV-----QNL 580 590 600 610 620 640 650 660 670 680 690 pF1KB3 LLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTY : :. : : :.:. . .:. :.. . .. CCDS20 ALGKE------------------------ELIGTMEQIFMNVAIFEDEV------FAGVT 630 640 650 700 710 720 730 740 750 pF1KB3 THCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYY :: :. : .:.: :..::: :::::::: :: ::::.:: . ... : :. . : CCDS20 THQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQDRSDNKLYRLQT 660 670 680 690 700 710 760 770 780 790 800 810 pF1KB3 PQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRS ::.::: ..: . . : : :.:::. :::::..::..:.:... .::: .. :.: CCDS20 PQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASWERGFAHGSVYKS 720 730 740 750 760 770 820 830 840 850 860 870 pF1KB3 --YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKT .:. : :. :: :: . .::::::: :.... : . CCDS20 EFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGAKLQYGDPYYSYL 780 790 800 810 820 880 890 900 910 920 pF1KB3 VTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG---YKFCKIRVRSV : . :: : .:..: .::.. : :. : .: : .: CCDS20 -----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSGKFKCVCITMRVP 830 840 850 860 870 930 940 950 960 970 980 pF1KB3 RIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQ : : ::::::::::::: . . :::::: :..:::..:::..::::::: ::: . CCDS20 RNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPSRMTIGMLIESMA 880 890 900 910 920 930 990 1000 1010 1020 1030 1040 pF1KB3 GKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITSQIFI :: .: .: ::::: .. .. ....:. ::.. :.: ::.:..: .. ..::: CCDS20 GKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSGISGLELEADIFI 940 950 960 970 980 990 1050 1060 1070 1080 1090 1100 pF1KB3 GPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGAAQFL : .:::::.:::.::.. :. : . .. ::. ::. .::.:::::::: .:::.. .: CCDS20 GVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMERDALLAHGTSFLL 1000 1010 1020 1030 1040 1050 1110 1120 1130 1140 1150 pF1KB3 RERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCRNKTQISLVRMPY ..:::. :: .::: :: . . . :.. :.: : . :. : .:: CCDS20 HDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCSRSDTIDTVSVPY 1060 1070 1080 1090 1100 1110 1160 1170 pF1KB3 ACKLLFQELMSMSIAPRMMSV . . . :: .:.: .. CCDS20 VFRYFVAELAAMNIKVKLDVV 1120 1130 >>CCDS62988.1 POLR1B gene_id:84172|Hs108|chr2 (1173 aa) initn: 1234 init1: 368 opt: 416 Z-score: 499.9 bits: 104.5 E(32554): 1.6e-21 Smith-Waterman score: 1397; 29.1% identity (55.6% similar) in 1188 aa overlap (39-1171:76-1170) 10 20 30 40 50 60 pF1KB3 QYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVEDAPPIDLQ :.: ...::. .. .. :. ::... CCDS62 RNLPSGPSLKHLTDPSYGIPREQQKAALQELTRAHVESFNYAVHEGLGLAVQAIPPFEFA 50 60 70 80 90 100 70 80 90 100 110 120 pF1KB3 AEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERD-GAPSPMMPNEARLRNLTYSAPLYVD . .. : . . .: :: . . ..: : : : :: . : .: CCDS62 FKDERISFTILD----------AVISPPTVPKGTICKEANVYPAECRGRRSTYRGKLTAD 110 120 130 140 150 130 140 150 160 170 180 pF1KB3 ITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLDPGGYFII :. .: .: .. : :.: .:::..: : : .: . : : .: . :::::: CCDS62 INWAV--NG---ISKGIIKQFLGYVPIMVKSKLCNLRNLPPQALIEHHEEAEEMGGYFII 160 170 180 190 200 210 190 200 210 220 230 240 pF1KB3 NGSEKV--LIAQEKMATNTVYVFAKKDSK---YAYTGECRSCLENSSRPTSTIWVSMLAR :: ::: .. . . ... : .. :. : :... .. . . .: CCDS62 NGIEKVIRMLIMPRRNFPIAMIRPKWKTRGPGYTQYGVSMHCVREEHSAVN-MNLHYLEN 220 230 240 250 260 250 260 270 280 290 pF1KB3 GGQGAKKSAIGQRIVATLPYIKQE--VPIIIVFRALGFVSDRDILEHIIYDFEDPEMM-- : .. .. : :. .:. ....:: :: .:....: :: .. CCDS62 G-----------TVMLNFIYRKELFFLPLGFALKALVSFSDYQIFQELIKGKEDDSFLRN 270 280 290 300 310 300 310 320 330 340 350 pF1KB3 ---EMVKPSLDEAFVIQEQNVALNFIGS-RGAKPGVTKEKRIKYAKEVLQKEMLPHVGVS .:.. ..:. :.: .::..: .: .: . : : : .. . . CCDS62 SVSQMLRIVMEEGCSTQKQ--VLNYLGECFRVKLNVPDWYPNEQAAEFLFNQC---ICIH 320 330 340 350 360 370 360 370 380 390 400 410 pF1KB3 DFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKE .:.: :.: :...:. : :. :. : :... : :. .... ... : CCDS62 LKSNTEKFYMLCLMTRKLFALAKGECMEDNPDSLVNQEVLTPGQLFLMFLKEKLEGWLVS 380 390 400 410 420 430 420 430 440 450 460 pF1KB3 VRIYAQKFIDRGKDFNLELAIKTRIISDGL------KYSLATGNWGDQKKAHQAR-AGVS ..: .: .. . ... ::.. :. .: .:::: .. . .:. CCDS62 IKIAFDKKAQK-TSVSMNTDNLMRIFTMGIDLTKPFEYLFATGNLRSKTGLGLLQDSGLC 440 450 460 470 480 490 470 480 490 500 510 520 pF1KB3 QVLNRLTFASTLSHLRRLNSPIGRD-GKLAKP--RQLHNTLWGMVCPAETPEGHAVGLVK : ..:.: :::.: .. : : .:. :.: ::..::..::.:. ::.. CCDS62 VVADKLNFIRYLSHFRCVHR--GADFAKMRTTTVRRLLPESWGFLCPVHTPDGEPCGLMN 500 510 520 530 540 550 530 540 550 560 570 580 pF1KB3 NL-ALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVG-IHKD-PE .: :. .. . : .: . .. .. . .. ....: :: . :: CCDS62 HLTAVCEVVTQFVYTASIPALLCNLGVTPIDGAPHRSYSECYPVLLDGVMVGWVDKDLAP 560 570 580 590 600 610 590 600 610 620 630 pF1KB3 QLMNTLRK---LRRQ-----MDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKL . ..::. ::.. :.... .. .. . ..: :. ::. :.: CCDS62 GIADSLRHFKVLREKRIPPWMEVVLIPMTGKPSLYPG-LFLFTTPCRLVRPV-----QNL 620 630 640 650 660 640 650 660 670 680 690 pF1KB3 LLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTY : :. : : :.:. . .:. :.. . .. CCDS62 ALGKE------------------------ELIGTMEQIFMNVAIFEDEV------FAGVT 670 680 690 700 710 720 730 740 750 pF1KB3 THCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYY :: :. : .:.: :..::: :::::::: :: ::::.:: . ... : :. . : CCDS62 THQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQDRSDNKLYRLQT 700 710 720 730 740 750 760 770 780 790 800 810 pF1KB3 PQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRS ::.::: ..: . . : : :.:::. :::::..::..:.:... .::: .. :.: CCDS62 PQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASWERGFAHGSVYKS 760 770 780 790 800 810 820 830 840 850 860 870 pF1KB3 --YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKT .:. : :. :: :: . .::::::: :.... : . CCDS62 EFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGAKLQYGDPYYSYL 820 830 840 850 860 880 890 900 910 920 pF1KB3 VTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG---YKFCKIRVRSV : . :: : .:..: .::.. : :. : .: : .: CCDS62 -----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSGKFKCVCITMRVP 870 880 890 900 910 930 940 950 960 970 980 pF1KB3 RIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQ : : ::::::::::::: . . :::::: :..:::..:::..::::::: ::: . CCDS62 RNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPSRMTIGMLIESMA 920 930 940 950 960 970 990 1000 1010 1020 1030 1040 pF1KB3 GKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITSQIFI :: .: .: ::::: .. .. ....:. ::.. :.: ::.:..: .. ..::: CCDS62 GKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSGISGLELEADIFI 980 990 1000 1010 1020 1030 1050 1060 1070 1080 1090 1100 pF1KB3 GPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGAAQFL : .:::::.:::.::.. :. : . .. ::. ::. .::.:::::::: .:::.. .: CCDS62 GVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMERDALLAHGTSFLL 1040 1050 1060 1070 1080 1090 1110 1120 1130 1140 1150 pF1KB3 RERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCRNKTQISLVRMPY ..:::. :: .::: :: . . . :.. :.: : . :. : .:: CCDS62 HDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCSRSDTIDTVSVPY 1100 1110 1120 1130 1140 1150 1160 1170 pF1KB3 ACKLLFQELMSMSIAPRMMSV . . . :: .:.: .. CCDS62 VFRYFVAELAAMNIKVKLDVV 1160 1170 1174 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 13:40:43 2016 done: Thu Nov 3 13:40:43 2016 Total Scan time: 3.970 Total Display time: 0.520 Function used was FASTA [36.3.4 Apr, 2011]