FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3496, 1970 aa 1>>>pF1KE3496 1970 - 1970 aa - 1970 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 16.2353+/-0.00174; mu= -21.3961+/- 0.105 mean_var=960.0840+/-202.256, 0's: 0 Z-trim(110.4): 199 B-trim: 0 in 0/55 Lambda= 0.041392 statistics sampled from 11597 (11727) to 11597 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.638), E-opt: 0.2 (0.351), width: 16 Scan time: 3.150 The best scores are: opt bits E(33420) CCDS7354.1 POLR3A gene_id:11128|Hs109|chr10 (1390) 1364 99.4 1.1e-19 >>CCDS7354.1 POLR3A gene_id:11128|Hs109|chr10 (1390 aa) initn: 2203 init1: 656 opt: 1364 Z-score: 467.4 bits: 99.4 E(33420): 1.1e-19 Smith-Waterman score: 2501; 34.5% identity (62.0% similar) in 1493 aa overlap (16-1479:13-1368) 10 20 30 40 50 pF1KE3 MHGGGPPSGDSACPLRTIKRVQFGVLSPDELKRMSVTEGGIK--YPETTEGGRPKLGGLM . :... ::. ::.:..... . : : . .. . : : :.. CCDS73 MVKEQFRETDVAKKISHICFGMKSPEEMRQQAHIQVVSKNLYSQDNQHA-PLLYGVL 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 DPRQGVIERTGRCQTCAGNMTECPGHFGHIELAKPVFHVGFLVKTMKVLRCVCFFCSKLL : :.:. :. :.::. :...: ::.:.:.: : ::::.. .. .:. .: : ... CCDS73 DHRMGTSEKDRPCETCGKNLADCLGHYGYIDLELPCFHVGYFRAVIGILQMICKTCCHIM 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 VDSNNPK-IKDILAKSKG----QPKKRLTHVYDLCKGKNICEGGEEMDNKFGVEQPEGDE ..... : . : : : : : . .. : :. ::::. .. :. . : CCDS73 LSQEEKKQFLDYL-KRPGLTYLQKRGLKKKISDKCRKKNICHHCGAFN---GTVKKCGLL 120 130 140 150 160 170 180 190 200 210 220 pF1KE3 DLTKEKGHGGCGRYQPRIR------RSGLELYAEWKHVNEDSQEKKILLSPERVHEIFKR . .:: . . .: . ....: : . . .::. :.: : ..::: CCDS73 KIIHEKYKTNKKVVDPIVSNFLQSFETAIEHNKEVEPLLGRAQEN---LNPLVVLNLFKR 180 190 200 210 220 230 240 250 260 270 280 pF1KE3 ISDEECFVLGMEPRYARPEWMIVTVLPVPPLSVRPAVVMQ-GSARNQDDLTHKLADIVKI : :. .: :.:. ..: .:.: : :::: .::.:: . :. :.:::: ::..:. . CCDS73 IPAEDVPLLLMNPEAGKPSDLILTRLLVPPLCIRPSVVSDLKSGTNEDDLTMKLTEIIFL 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE3 NNQLRRNEQNGAAAHVIAEDVKLLQFHVATMVDNELPGLPRAMQKSGRPLKSLKQRLKGK :. ..... .:: ...: :: .::.. : ....:: :.: : . . ... :::::: CCDS73 NDVIKKHRISGAKTQMIMEDWDFLQLQCALYINSELSGIPLNMAPK-KWTRGFVQRLKGK 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE3 EGRVRGNLMGKRVDFSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNIDRLQELV .:: :::: :::::::.::::.::::: ::.:.:: .: .:: : :. ::. :..:: CCDS73 QGRFRGNLSGKRVDFSGRTVISPDPNLRIDEVAVPVHVAKILTFPEKVNKANINFLRKLV 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE3 RRGNSQYPGAKYII-RDNGDRIDLRFHPKPS-DLHLQTGYKVERHMCDGDIVIFNRQPTL . : .:::..: : . . :.. . . .:. : ::::. :::.:.:::::.: CCDS73 QNGPEVHPGANFIQQRHTQMKRFLKYGNREKMAQELKYGDIVERHLIDGDVVLFNRQPSL 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE3 HKMSMMGHRVRILPWSTFRLNLSVTTPYNADFDGDEMNLHLPQSLETRAEIQELAMVPRM ::.:.:.: .:. : :::.: : ::::::::::::::::::. :..:: : . CCDS73 HKLSIMAHLARVKPHRTFRFNECVCTPYNADFDGDEMNLHLPQTEEAKAEALVLMGTKAN 470 480 490 500 510 520 530 540 550 560 570 pF1KE3 IVTPQSNRPVMGIVQDTLTAVRKFTKRDVFLERGEVMNLLM-FLSTWDGKV----PQPAI .:::....:... .:: ::.. .: .:.:..:... ... .: : :. : :.: CCDS73 LVTPRNGEPLIAAIQDFLTGAYLLTLKDTFFDRAKACQIIASILVGKDEKIKVRLPPPTI 530 540 550 560 570 580 580 590 600 610 620 630 pF1KE3 LKPRPLWTGKQIFSLII-PGHINCIRTHSTHPDDEDSGPYKHISPGDTKVVVENGELIMG ::: :::::::::.:. :. : .:.. . : . . .:. :...:.::. : CCDS73 LKPVTLWTGKQIFSVILRPSDDNPVRANLRTKGKQYCGKGEDLCANDSYVTIQNSELMSG 590 600 610 620 630 640 640 650 660 670 680 690 pF1KE3 ILCKKSLGT-SAGSLVHISYLEMGHDITRLFYSNIQTVINNWLLIEGHTIGIGDSIADSK . : .::. : ... .: . :.. . .: . . .: .: .::::: . CCDS73 SMDKGTLGSGSKNNIFYILLRDWGQNEAADAMSRLARLAPVYLSNRGFSIGIGDVTPGQG 650 660 670 680 690 700 700 710 720 730 740 750 pF1KE3 TYQDIQNTIKKAKQDVIEVIEKAHNNELEPTPGNTLRQTFENQVNRILNDARDKTGSSAQ . . .. . . : :: ....:. :: : ..:.: . . :. ::..::. CCDS73 LLKAKYELLNAGYKKCDEYIEALNTGKLQQQPGCTAEETLEALILKELSVIRDHAGSACL 710 720 730 740 750 760 760 770 780 790 800 810 pF1KE3 KSLSEYNNFKSMVVSGAKGSKINISQVIAVVGQQNVEGKRIPFGFKHRTLPHFIKDDYGP . :.. :. .:.. :.::: :::::.:: :::: . :.:.: ::..:.:::: : . : CCDS73 RELDKSNSPLTMALCGSKGSFINISQMIACVGQQAISGSRVPDGFENRSLPHFEKHSKLP 770 780 790 800 810 820 820 830 840 850 860 870 pF1KE3 ESRGFVENSYLAGLTPTEFFFHAMGGREGLIDTAVKTAETGYIQRRLIKSMESVMVKYDA ..::: ::. .::::::::::.:.:::::.:::::::::::.::::.::.:.. .:: CCDS73 AAKGFVANSFYSGLTPTEFFFHTMAGREGLVDTAVKTAETGYMQRRLVKSLEDLCSQYDL 830 840 850 860 870 880 880 890 900 910 920 930 pF1KE3 TVRNSINQVVQLRYGEDGLAGESVEFQNLATLKPSNKAFEKKFRFDYTNERALRRTLQED :::.: ....:. :: ::: :. :.: : .: CCDS73 TVRSSTGDIIQFIYGGDGL-------------DPA--AMEGK---------------DEP 890 900 910 940 950 960 970 980 990 pF1KE3 LVKDVLSNAHIQNELEREFERMREDREVLRVIFPTGDSKVVLPCNLLRMIWNAQKIFHIN : ::.:. .. ....:: :. .: : ..: ....:.. . CCDS73 L----------------EFKRVLDN---IKAVFPC-PSEPALSKN--ELILTTESIMKKS 920 930 940 950 1000 1010 1020 1030 1040 1050 pF1KE3 PRL---PSDLHPIK-VVEGVKELSKKLVIVNGDDPLSRQAQENATLLFNIHLRSTLCSRR : : :. :: ..::.: :: .:. ..:. .: : CCDS73 EFLCCQDSFLQEIKKFIKGVSEKIKK----------TRDK-------YGINDNGTTEPRV 960 970 980 990 1060 1070 1080 1090 1100 1110 pF1KE3 MAEEFRLSGEAFDWLLGEIESKFNQAIAHPGEMVGALAAQSLGEPATQMTLNTFHYAGVS . . :.. . .: ..:. .: .:: :::: :::.:::.:::::.:::.:::. CCDS73 LYQLDRITPTQVEKFLETCRDKYMRAQMEPGSAVGALCAQSIGEPGTQMTLKTFHFAGVA 1000 1010 1020 1030 1040 1050 1120 1130 1140 1150 1160 1170 pF1KE3 AKNVTLGVPRLKELINISKKPKTPSLTVFLLGQSARDAERAKDILCRLEHTTLRKVTANT . :.::::::.::.:: :: .:: .:. : .. ::. :. . :.:.: : ... CCDS73 SMNITLGVPRIKEIINASKAISTPIITAQL--DKDDDADYARLVKGRIEKTLLGEIS--- 1060 1070 1080 1090 1100 1110 1180 1190 1200 1210 1220 1230 pF1KE3 AIYYDPNPQSTVVAEDQEWVNVYYEMPD--FDVARISPWLLRVELDRKHMTDRKLTMEQI :... . .:: : ....: : :..: : ... . . . CCDS73 -----------------EYIEEVF-LPDDCFILVKLS--LERIRLLRLEVNAETVRYSIC 1120 1130 1140 1150 1240 1250 1260 1270 1280 1290 pF1KE3 AEKINAGFGDDLNCIFNDDNAEKLVLRIRIMNSDENKMQEEEEVVDKMDDDVFLRCIESN . :. . :: ..: .: .. ::. . :.. . .: CCDS73 TSKLRVKPGDVAV------HGEAVVC----VTPRENSKSSMYYVLQFLKED--------- 1160 1170 1180 1190 1300 1310 1320 1330 1340 1350 pF1KE3 MLTDMTLQGIEQISKVYMHLPQTDNKKKIIITEDGEFKALQEWILETDGVSLMRVLSEKD : ...::: ..:.. .:. . ..:.: .: : : : .: :.. . CCDS73 -LPKVVVQGIPEVSRAVIHIDEQSGKEK--------YKLLVE------GDNLRAVMATHG 1200 1210 1220 1230 1240 1360 1370 1380 1390 1400 1410 pF1KE3 VDPVRTTSNDIVEIFTVLGIEAVRKALERELYHVISFDGSYVNYRHLALLCDTMTCRGHL : .:::::. :. .:::::.: .. :. ... : .. ::. :: : :: .:.. CCDS73 VKGTRTTSNNTYEVEKTLGIEAARTTIINEIQYTMVNHGMSIDRRHVMLLSDLMTYKGEV 1250 1260 1270 1280 1290 1300 1420 1430 1440 1450 1460 1470 pF1KE3 MAITRHGVNRQDTGPLMKCSFEETVDVLMEAAAHGESDPMKGVSENIMLGQLAPAGTGCF ..::: :. .. . :: :::.:.: :..:: :..: . :::: :..: ::: : CCDS73 LGITRFGLAKMKESVLMLASFEKTADHLFDAAYFGQKDSVCGVSECIIMGIPMNIGTGLF 1310 1320 1330 1340 1350 1360 1480 1490 1500 1510 1520 1530 pF1KE3 DLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFGSAPSPMGGISPAMTPWNQGATPAYGAW :: :.. CCDS73 KLLHKADRDPNPPKRPLIFDTNEFHIPLVT 1370 1380 1390 1970 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Jul 16 16:08:01 2019 done: Tue Jul 16 16:08:02 2019 Total Scan time: 3.150 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]