FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6406, 335 aa 1>>>pF1KB6406 335 - 335 aa - 335 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.8271+/-0.00101; mu= 8.4274+/- 0.060 mean_var=84.4227+/-17.703, 0's: 0 Z-trim(104.8): 19 B-trim: 0 in 0/48 Lambda= 0.139587 statistics sampled from 8095 (8104) to 8095 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.618), E-opt: 0.2 (0.249), width: 16 Scan time: 2.540 The best scores are: opt bits E(32554) CCDS6129.1 POLB gene_id:5423|Hs108|chr8 ( 335) 2196 452.2 2.8e-127 CCDS7513.1 POLL gene_id:27343|Hs108|chr10 ( 575) 653 141.5 1.6e-33 CCDS76332.1 POLL gene_id:27343|Hs108|chr10 ( 300) 622 135.2 6.6e-32 CCDS34625.1 POLM gene_id:27434|Hs108|chr7 ( 494) 346 79.6 5.8e-15 CCDS44465.1 DNTT gene_id:1791|Hs108|chr10 ( 508) 281 66.5 5.2e-11 CCDS7447.1 DNTT gene_id:1791|Hs108|chr10 ( 509) 281 66.5 5.2e-11 >>CCDS6129.1 POLB gene_id:5423|Hs108|chr8 (335 aa) initn: 2196 init1: 2196 opt: 2196 Z-score: 2398.5 bits: 452.2 E(32554): 2.8e-127 Smith-Waterman score: 2196; 100.0% identity (100.0% similar) in 335 aa overlap (1-335:1-335) 10 20 30 40 50 60 pF1KB6 MSKRKAPQETLNGGITDMLTELANFEKNVSQAIHKYNAYRKAASVIAKYPHKIKSGAEAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MSKRKAPQETLNGGITDMLTELANFEKNVSQAIHKYNAYRKAASVIAKYPHKIKSGAEAK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 KLPGVGTKIAEKIDEFLATGKLRKLEKIRQDDTSSSINFLTRVSGIGPSAARKFVDEGIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KLPGVGTKIAEKIDEFLATGKLRKLEKIRQDDTSSSINFLTRVSGIGPSAARKFVDEGIK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 TLEDLRKNEDKLNHHQRIGLKYFGDFEKRIPREEMLQMQDIVLNEVKKVDSEYIATVCGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 TLEDLRKNEDKLNHHQRIGLKYFGDFEKRIPREEMLQMQDIVLNEVKKVDSEYIATVCGS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 FRRGAESSGDMDVLLTHPSFTSESTKQPKLLHQVVEQLQKVHFITDTLSKGETKFMGVCQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 FRRGAESSGDMDVLLTHPSFTSESTKQPKLLHQVVEQLQKVHFITDTLSKGETKFMGVCQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 LPSKNDEKEYPHRRIDIRLIPKDQYYCGVLYFTGSDIFNKNMRAHALEKGFTINEYTIRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LPSKNDEKEYPHRRIDIRLIPKDQYYCGVLYFTGSDIFNKNMRAHALEKGFTINEYTIRP 250 260 270 280 290 300 310 320 330 pF1KB6 LGVTGVAGEPLPVDSEKDIFDYIQWKYREPKDRSE ::::::::::::::::::::::::::::::::::: CCDS61 LGVTGVAGEPLPVDSEKDIFDYIQWKYREPKDRSE 310 320 330 >>CCDS7513.1 POLL gene_id:27343|Hs108|chr10 (575 aa) initn: 582 init1: 207 opt: 653 Z-score: 715.2 bits: 141.5 E(32554): 1.6e-33 Smith-Waterman score: 653; 34.2% identity (67.5% similar) in 345 aa overlap (2-333:245-573) 10 20 30 pF1KB6 MSKRKAPQETLNGGITDMLTELANFEKNVSQ :..:: ...:. ::. : :: : : CCDS75 ISGHYPTSLEGDCEPSPAPAVLDKWVCAQPSSQKATNHNLH--ITEKLEVLA---KAYSV 220 230 240 250 260 40 50 60 70 80 pF1KB6 AIHKYNA--YRKAASVIAKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLRKLEKIR :. : : :: ... .. . . : :: ..::.: ..:::: :.: .:.::::..: CCDS75 QGDKWRALGYAKAINALKSFHKPVTSYQEACSIPGIGKRMAEKIIEILESGHLRKLDHI- 270 280 290 300 310 320 90 100 110 120 130 140 pF1KB6 QDDTSSSINFLTRVSGIGPSAARKFVDEGIKTLEDLRKNEDKLNHHQRIGLKYFGDFEKR ... ..... . : : ..:. . ..:...:::.: .. .:. .: ::::...:: .: CCDS75 -SESVPVLELFSNIWGAGTKTAQMWYQQGFRSLEDIR-SQASLTTQQAIGLKHYSDFLER 330 340 350 360 370 380 150 160 170 180 190 200 pF1KB6 IPREEMLQMQDIVLNEVKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSESTKQPK .:::: .... : . .. .: . ..:::.::: . ::.:::.::: .. .. CCDS75 MPREEATEIEQTVQKAAQAFNSGLLCVACGSYRRGKATCGDVDVLITHP----DGRSHRG 390 400 410 420 430 440 210 220 230 240 250 260 pF1KB6 LLHQVVEQLQKVHFITDTLSKGET-----KFMGVCQLPSKNDEKEYPHRRIDIRLIPKDQ .. .....:.. :.:: : . : :..:::.::. . . :::.:: ..: .. CCDS75 IFSRLLDSLRQEGFLTDDLVSQEENGQQQKYLGVCRLPGPGRR----HRRLDIIVVPYSE 450 460 470 480 490 270 280 290 300 310 pF1KB6 YYCGVLYFTGSDIFNKNMRAHALEKGFTINEYTIRPLGVTGV------AGEPLPVDSEKD . :..:::::: ::..::: : ::....:... : .. :. ::. .::: CCDS75 FACALLYFTGSAHFNRSMRALAKTKGMSLSEHALSTAVVRNTHGCKVGPGRVLPTPTEKD 500 510 520 530 540 550 320 330 pF1KB6 IFDYIQWKYREPKDRSE .: . :::: .: CCDS75 VFRLLGLPYREPAERDW 560 570 >>CCDS76332.1 POLL gene_id:27343|Hs108|chr10 (300 aa) initn: 565 init1: 207 opt: 622 Z-score: 686.2 bits: 135.2 E(32554): 6.6e-32 Smith-Waterman score: 622; 35.4% identity (69.4% similar) in 291 aa overlap (54-333:19-298) 30 40 50 60 70 80 pF1KB6 NFEKNVSQAIHKYNAYRKAASVIAKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLR :. :: ..::.: ..:::: :.: .:.:: CCDS76 MLMHHQKYLQRFLGGKREKKQKEACSIPGIGKRMAEKIIEILESGHLR 10 20 30 40 90 100 110 120 130 140 pF1KB6 KLEKIRQDDTSSSINFLTRVSGIGPSAARKFVDEGIKTLEDLRKNEDKLNHHQRIGLKYF ::..: ... ..... . : : ..:. . ..:...:::.: .. .:. .: ::::.. CCDS76 KLDHI--SESVPVLELFSNIWGAGTKTAQMWYQQGFRSLEDIR-SQASLTTQQAIGLKHY 50 60 70 80 90 100 150 160 170 180 190 200 pF1KB6 GDFEKRIPREEMLQMQDIVLNEVKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSE .:: .:.:::: .... : . .. .: . ..:::.::: . ::.:::.:::. :. CCDS76 SDFLERMPREEATEIEQTVQKAAQAFNSGLLCVACGSYRRGKATCGDVDVLITHPDGRSH 110 120 130 140 150 160 210 220 230 240 250 pF1KB6 STKQPKLLHQVVEQLQKVHFITDTLSKGET-----KFMGVCQLPSKNDEKEYPHRRIDIR .. .....:.. :.:: : . : :..:::.::. . . :::.:: CCDS76 RG----IFSRLLDSLRQEGFLTDDLVSQEENGQQQKYLGVCRLPGPGRR----HRRLDII 170 180 190 200 210 260 270 280 290 300 310 pF1KB6 LIPKDQYYCGVLYFTGSDIFNKNMRAHALEKGFTINEYTIRPLGVTGV------AGEPLP ..: ... :..:::::: ::..::: : ::....:... : .. :. :: CCDS76 VVPYSEFACALLYFTGSAHFNRSMRALAKTKGMSLSEHALSTAVVRNTHGCKVGPGRVLP 220 230 240 250 260 270 320 330 pF1KB6 VDSEKDIFDYIQWKYREPKDRSE . .:::.: . :::: .: CCDS76 TPTEKDVFRLLGLPYREPAERDW 280 290 300 >>CCDS34625.1 POLM gene_id:27434|Hs108|chr7 (494 aa) initn: 365 init1: 324 opt: 346 Z-score: 382.2 bits: 79.6 E(32554): 5.8e-15 Smith-Waterman score: 398; 24.8% identity (60.2% similar) in 359 aa overlap (3-334:144-493) 10 20 pF1KB6 MSKRKAPQETLNGGITD---MLTELANFEKNV .: .: : :... .:.: :.:: . CCDS34 PVPVECRHRLEVAGPRKGPLSPAWMPAYACQRPTPLTHHNTGLSEALEILAEAAGFEGSE 120 130 140 150 160 170 30 40 50 60 70 80 pF1KB6 SQAIHKYNAYRKAASVIAKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLRKLEKIR .. . .. .::::. : . . .. . :: : . .. ..:.: : ...:..: CCDS34 GRLL----TFCRAASVLKALPSPVTTLSQLQGLPHFGEHSSRVVQELLEHGVCEEVERVR 180 190 200 210 220 90 100 110 120 130 140 pF1KB6 QDDTSSSINFLTRVSGIGPSAARKFVDEGIKTLEDLRKNEDKLNHHQRIGLKYFGDFEKR ... ......:.. :.: ..: .. ::..::.:::.. .::...:. ::.. :. CCDS34 RSERYQTMKLFTQIFGVGVKTADRWYREGLRTLDDLREQPQKLTQQQKAGLQHHQDLSTP 230 240 250 260 270 280 150 160 170 180 190 200 pF1KB6 IPREEMLQMQDIVLNEVKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSESTKQPK . : .. .:..: . : .. .:. :.:::: .. :.: :.:::. .:. :. CCDS34 VLRSDVDALQQVVEEAVGQALPGATVTLTGGFRRGKLQGHDVDFLITHPKEGQEAGLLPR 290 300 310 320 330 340 210 220 230 240 250 pF1KB6 LLHQVVEQ-----LQKVHFITDTLSK-GETKFMGV-----C--QLPSK------NDEKEY .. .. .: :. : .. .. .. . : . : .::. .. . CCDS34 VMCRLQDQGLILYHQHQHSCCESPTRLAQQSHMDAFERSFCIFRLPQPPGAAVGGSTRPC 350 360 370 380 390 400 260 270 280 290 300 pF1KB6 PHR---RIDIRLIPKDQYYCGVLYFTGSDIFNKNMRAHAL-EKGFTINEYTI-RPLGVTG : :.:. . : .:. ..: .::: .:....: . :::. .: . . : : CCDS34 PSWKAVRVDLVVAPVSQFPFALLGWTGSKLFQRELRRFSRKEKGLWLNSHGLFDPEQKTF 410 420 430 440 450 460 310 320 330 pF1KB6 VAGEPLPVDSEKDIFDYIQWKYREPKDRSE . . ::.::: .. .: :..:. CCDS34 -----FQAASEEDIFRHLGLEYLPPEQRNA 470 480 490 >>CCDS44465.1 DNTT gene_id:1791|Hs108|chr10 (508 aa) initn: 103 init1: 66 opt: 281 Z-score: 311.2 bits: 66.5 E(32554): 5.2e-11 Smith-Waterman score: 317; 24.1% identity (60.0% similar) in 345 aa overlap (17-334:173-507) 10 20 30 40 pF1KB6 MSKRKAPQETLNGGITDMLTELANFEKNVSQAIHKYNAYRKAASVI :.:.: .:..: .. . .. .::::. CCDS44 PPIAVQKISQYACQRRTTLNNCNQIFTDAFDILAENCEFRENEDSCV----TFMRAASVL 150 160 170 180 190 50 60 70 80 90 100 pF1KB6 AKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLRKLEKIRQDDTSSSINFLTRVSGI . : : : ... .: .:.:. :.:.. :. ... . .:. .:....: : :. CCDS44 KSLPFTIISMKDTEGIPCLGSKVKGIIEEIIEDGESSEVKAVLNDERYQSFKLFTSVFGV 200 210 220 230 240 250 110 120 130 140 150 160 pF1KB6 GPSAARKFVDEGIKTLEDLRKNED-KLNHHQRIGLKYFGDFEKRIPREEMLQMQDIVLNE : ....:. :..:: .:.... :... :. :. :. :. . . : : .. .: . CCDS44 GLKTSEKWFRMGFRTLSKVRSDKSLKFTRMQKAGFLYYEDLVSCVTRAEAEAVSVLVKEA 260 270 280 290 300 310 170 180 190 200 210 pF1KB6 VKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSESTK---------QPK---LLHQ : . ..:. :.:::: . . :.: :.: :. : . . . : : .. CCDS44 VWAFLPDAFVTMTGGFRRGKKMGHDVDFLITSPGSTEDEEQLLQKVMNLWEKKGLLLYYD 320 330 340 350 360 370 220 230 240 250 260 pF1KB6 VVEQ-LQKVHFIT---DTLSKGETKFMGVCQLPSK---NDE------KEYPHRRIDIRLI .::. ..:... . :.:.. . :. . .:: . .:. : . :.:. : CCDS44 LVESTFEKLRLPSRKVDALDHFQKCFL-IFKLPRQRVDSDQSSWQEGKTWKAIRVDLVLC 380 390 400 410 420 430 270 280 290 300 310 pF1KB6 PKDQYYCGVLYFTGSDIFNKNMRAHAL-EKGFTINEYTIRPLGVTGVAGEPLPVDSEKDI : .. ..: .::: :....: .: :. . ...... . : ..::..: CCDS44 PYERRAFALLGWTGSR-FERDLRRYATHERKMILDNHALYD----KTKRIFLKAESEEEI 440 450 460 470 480 490 320 330 pF1KB6 FDYIQWKYREPKDRSE : .. : :: .:. CCDS44 FAHLGLDYIEPWERNA 500 >>CCDS7447.1 DNTT gene_id:1791|Hs108|chr10 (509 aa) initn: 103 init1: 66 opt: 281 Z-score: 311.2 bits: 66.5 E(32554): 5.2e-11 Smith-Waterman score: 326; 24.1% identity (60.0% similar) in 345 aa overlap (17-334:173-508) 10 20 30 40 pF1KB6 MSKRKAPQETLNGGITDMLTELANFEKNVSQAIHKYNAYRKAASVI :.:.: .:..: .. . .. .::::. CCDS74 PPIAVQKISQYACQRRTTLNNCNQIFTDAFDILAENCEFRENEDSCV----TFMRAASVL 150 160 170 180 190 50 60 70 80 90 100 pF1KB6 AKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLRKLEKIRQDDTSSSINFLTRVSGI . : : : ... .: .:.:. :.:.. :. ... . .:. .:....: : :. CCDS74 KSLPFTIISMKDTEGIPCLGSKVKGIIEEIIEDGESSEVKAVLNDERYQSFKLFTSVFGV 200 210 220 230 240 250 110 120 130 140 150 160 pF1KB6 GPSAARKFVDEGIKTLEDLRKNED-KLNHHQRIGLKYFGDFEKRIPREEMLQMQDIVLNE : ....:. :..:: .:.... :... :. :. :. :. . . : : .. .: . CCDS74 GLKTSEKWFRMGFRTLSKVRSDKSLKFTRMQKAGFLYYEDLVSCVTRAEAEAVSVLVKEA 260 270 280 290 300 310 170 180 190 200 210 pF1KB6 VKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSESTK---------QPK---LLHQ : . ..:. :.:::: . . :.: :.: :. : . . . : : .. CCDS74 VWAFLPDAFVTMTGGFRRGKKMGHDVDFLITSPGSTEDEEQLLQKVMNLWEKKGLLLYYD 320 330 340 350 360 370 220 230 240 250 260 pF1KB6 VVEQ-LQKVHFIT---DTLSKGETKFMGVCQLPSK---NDE------KEYPHRRIDIRLI .::. ..:... . :.:.. . :. . .:: . .:. : . :.:. : CCDS74 LVESTFEKLRLPSRKVDALDHFQKCFL-IFKLPRQRVDSDQSSWQEGKTWKAIRVDLVLC 380 390 400 410 420 430 270 280 290 300 310 pF1KB6 PKDQYYCGVLYFTGSDIFNKNMRAHAL-EKGFTINEYTIRPLGVTGVAGEPLPVDSEKDI : .. ..: .::: :....: .: :. . ...... . : ..::..: CCDS74 PYERRAFALLGWTGSRQFERDLRRYATHERKMILDNHALYD----KTKRIFLKAESEEEI 440 450 460 470 480 490 320 330 pF1KB6 FDYIQWKYREPKDRSE : .. : :: .:. CCDS74 FAHLGLDYIEPWERNA 500 335 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 20:50:29 2016 done: Fri Nov 4 20:50:30 2016 Total Scan time: 2.540 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]