FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4907, 402 aa 1>>>pF1KB4907 402 - 402 aa - 402 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.2503+/-0.00104; mu= -10.5886+/- 0.062 mean_var=359.8388+/-80.151, 0's: 0 Z-trim(112.9): 712 B-trim: 0 in 0/54 Lambda= 0.067611 statistics sampled from 12778 (13616) to 12778 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.747), E-opt: 0.2 (0.418), width: 16 Scan time: 2.740 The best scores are: opt bits E(32554) CCDS9449.1 KLF12 gene_id:11278|Hs108|chr13 ( 402) 2671 274.4 1.3e-73 CCDS3444.1 KLF3 gene_id:51274|Hs108|chr4 ( 345) 668 79.0 7.7e-15 CCDS66562.1 KLF5 gene_id:688|Hs108|chr13 ( 366) 608 73.1 4.7e-13 CCDS9448.1 KLF5 gene_id:688|Hs108|chr13 ( 457) 608 73.2 5.5e-13 CCDS14373.1 KLF8 gene_id:11279|Hs108|chrX ( 359) 605 72.8 5.6e-13 CCDS7060.1 KLF6 gene_id:1316|Hs108|chr10 ( 283) 586 70.9 1.7e-12 CCDS59440.1 KLF7 gene_id:8609|Hs108|chr2 ( 269) 567 69.0 5.9e-12 CCDS59438.1 KLF7 gene_id:8609|Hs108|chr2 ( 274) 567 69.0 6e-12 CCDS2373.1 KLF7 gene_id:8609|Hs108|chr2 ( 302) 567 69.1 6.5e-12 >>CCDS9449.1 KLF12 gene_id:11278|Hs108|chr13 (402 aa) initn: 2671 init1: 2671 opt: 2671 Z-score: 1434.9 bits: 274.4 E(32554): 1.3e-73 Smith-Waterman score: 2671; 100.0% identity (100.0% similar) in 402 aa overlap (1-402:1-402) 10 20 30 40 50 60 pF1KB4 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHNYPDMEAVPLLLNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHNYPDMEAVPLLLNN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 VKGEPPEDSLSVDHFQTQTEPVDLSINKARTSPTAVSSSPVSMTASASSPSSTSTSSSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 VKGEPPEDSLSVDHFQTQTEPVDLSINKARTSPTAVSSSPVSMTASASSPSSTSTSSSSS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 SRLASSPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPMNLQSNKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 SRLASSPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPMNLQSNKL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 SHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGRGHGKAQMDPRGLSPRQSKSDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 SHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGRGHGKAQMDPRGLSPRQSKSDS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 DDDDLPNVTLDSVNETGSTALSIARAVQEVHPSPVSRVRGNRMNNQKFPCSISPFSIEST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 DDDDLPNVTLDSVNETGSTALSIARAVQEVHPSPVSRVRGNRMNNQKFPCSISPFSIEST 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 RRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWEGCTWKFAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 RRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWEGCTWKFAR 310 320 330 340 350 360 370 380 390 400 pF1KB4 SDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV :::::::::::::::::::::::::::::::::::::::::: CCDS94 SDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV 370 380 390 400 >>CCDS3444.1 KLF3 gene_id:51274|Hs108|chr4 (345 aa) initn: 785 init1: 645 opt: 668 Z-score: 379.9 bits: 79.0 E(32554): 7.7e-15 Smith-Waterman score: 795; 40.9% identity (63.1% similar) in 401 aa overlap (20-402:1-345) 10 20 30 40 50 pF1KB4 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHNYPD--MEAV-PLL :::.: .: :: : .. : .::. ::.. : CCDS34 MLMFDPVP---VKQEAMD-----PVSVSYPSNYMESMKPNK 10 20 30 60 70 80 90 100 110 pF1KB4 LNNVKGEP-PEDSLSVDHFQT---QTEPVDLSINKARTSPTAVSSSPVSMTASASSPSST . . . : :: ... . . : :::::..:: :.:: ....:: :. . ::: CCDS34 YGVIYSTPLPEKFFQTPEGLSHGIQMEPVDLTVNK-RSSPPSAGNSPSSL----KFPSSH 40 50 60 70 80 120 130 140 150 160 pF1KB4 STSSSSSSRLASSPTVITSVSSASSS----STVLTPGPLVASA---SGVGGQQFLHIIHP .: . : .::: : . : : . .. :. :..:.: :. . .: .:.: CCDS34 RRASPGLSMPSSSPP-IKKYSPPSPGVQPFGVPLSMPPVMAAALSRHGIRSPGILPVIQP 90 100 110 120 130 140 170 180 190 200 210 220 pF1KB4 VPPSSPMNLQSNKLSHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGR---GHGK : .:. .. . ::... :.. . . : .... ::..:. . .. : CCDS34 VV-VQPVPFMYT--SHLQQ--------PLMVSLSEEMENSSSSMQVPVIESYEKPISQKK 150 160 170 180 190 230 240 250 260 270 280 pF1KB4 AQMDPRGLSPRQSKSDSDDDDLPNVTLDSVNETGSTALSIARAVQEVHPSPVSRVRGNRM ...: :. :. ..: ... ..::. :: .:: ::: . . :.: CCDS34 IKIEP-GIEPQ--RTDYYPEEMSPPLMNSVSPP--QAL-----LQENHPSVIVQP-GKR- 200 210 220 230 240 290 300 310 320 330 340 pF1KB4 NNQKFPCSISPFSIESTRRQRRSESPDS-RKRRIHRCDFEGCNKVYTKSSHLKAHRRTHT :. . ::::. :::::::::..:::::::::::::::::::: CCDS34 ----------PLPV---------ESPDTQRKRRIHRCDYDGCNKVYTKSSHLKAHRRTHT 250 260 270 280 350 360 370 380 390 400 pF1KB4 GEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV :::::::::::::::::::::::::.:::::.:::.: ::::::::::::::::.::::: CCDS34 GEKPYKCTWEGCTWKFARSDELTRHFRKHTGIKPFQCPDCDRSFSRSDHLALHRKRHMLV 290 300 310 320 330 340 >>CCDS66562.1 KLF5 gene_id:688|Hs108|chr13 (366 aa) initn: 642 init1: 584 opt: 608 Z-score: 347.9 bits: 73.1 E(32554): 4.7e-13 Smith-Waterman score: 627; 34.3% identity (60.5% similar) in 382 aa overlap (26-399:9-364) 10 20 30 40 50 pF1KB4 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHN--YPDMEAVPLLL .: : . : . .. : .: . . : :..: . CCDS66 MEKYLTPQLPPVPIIPEHKKYRRDSASVVDQFFTDTEGLPYSI 10 20 30 40 60 70 80 90 100 110 pF1KB4 NNVKGEPPEDSLSVDHFQTQTEPVDLSINKARTSPTAVSSSPVSMTASASSPSSTSTSSS : : : . ...: .: ... .: :.:. : :: :. :.. CCDS66 NMNVFLPDITHLRTGLYKSQ-RPC---VTHIKTEPVAIFSHQSETTAPP--PAPTQALPE 50 60 70 80 90 120 130 140 150 160 170 pF1KB4 SSSRLASSPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPMNLQSN .: ..: :. :.. .. . :: .. . : .. .... :. : ..: CCDS66 FTSIFSSHQTAAPEVNNIFIKQELPTPDLHLSVPTQQG--HLYQLLN--TPDLDMPSSTN 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB4 KLSHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGRGHGKAQMDPRGLS-PRQSK . . ..... : ..:. . :.... .:: . .: : : . : : CCDS66 QTA-------AMDTLNVSMSAAMAGLNTHTS-AVPQTAVKQFQG---MPPCTYTMPSQFL 160 170 180 190 200 240 250 260 270 280 290 pF1KB4 SDSDDDDLPNVTLDSVNETGSTALSIARAVQEVHPSP--VSRVRGN-RMNNQKFPCS--I .. :. .: :: . :. .:.. : : .. . .. ..: ..: . . CCDS66 PQQATYFPPS---PPSSEPGSPDRQ-AEMLQNLTPPPSYAATIASKLAIHNPNLPTTLPV 210 220 230 240 250 300 310 320 330 340 350 pF1KB4 SPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWE . .:. .: .::: .:: .::::: ::. ::.:::::::::::: :::::::::::::: CCDS66 NSQNIQPVRYNRRS-NPDLEKRRIHYCDYPGCTKVYTKSSHLKAHLRTHTGEKPYKCTWE 260 270 280 290 300 310 360 370 380 390 400 pF1KB4 GCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV :: :.::::::::::::::::.:::.:. :.:::::::::::: .:: CCDS66 GCDWRFARSDELTRHYRKHTGAKPFQCGVCNRSFSRSDHLALHMKRHQN 320 330 340 350 360 >>CCDS9448.1 KLF5 gene_id:688|Hs108|chr13 (457 aa) initn: 618 init1: 584 opt: 608 Z-score: 346.6 bits: 73.2 E(32554): 5.5e-13 Smith-Waterman score: 627; 34.3% identity (60.5% similar) in 382 aa overlap (26-399:100-455) 10 20 30 40 50 pF1KB4 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHN--YPDMEA .: : . : . .. : .: . . : :. CCDS94 PAQPPATGPRLPPEDLVQTRCEMEKYLTPQLPPVPIIPEHKKYRRDSASVVDQFFTDTEG 70 80 90 100 110 120 60 70 80 90 100 110 pF1KB4 VPLLLNNVKGEPPEDSLSVDHFQTQTEPVDLSINKARTSPTAVSSSPVSMTASASSPSST .: .: : : . ...: .: ... .: :.:. : :: :. : CCDS94 LPYSINMNVFLPDITHLRTGLYKSQ-RPC---VTHIKTEPVAIFSHQSETTAPP--PAPT 130 140 150 160 170 180 120 130 140 150 160 170 pF1KB4 STSSSSSSRLASSPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPM .. .: ..: :. :.. .. . :: .. . : .. .... :. : CCDS94 QALPEFTSIFSSHQTAAPEVNNIFIKQELPTPDLHLSVPTQQG--HLYQLLN--TPDLDM 190 200 210 220 230 180 190 200 210 220 230 pF1KB4 NLQSNKLSHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGRGHGKAQMDPRGLS- ..:. . ..... : ..:. . :.... .:: . .: : : . CCDS94 PSSTNQTA-------AMDTLNVSMSAAMAGLNTHTS-AVPQTAVKQFQG---MPPCTYTM 240 250 260 270 280 240 250 260 270 280 pF1KB4 PRQSKSDSDDDDLPNVTLDSVNETGSTALSIARAVQEVHPSP--VSRVRGN-RMNNQKFP : : .. :. .: :: . :. .:.. : : .. . .. ..: ..: CCDS94 PSQFLPQQATYFPPS---PPSSEPGSPDRQ-AEMLQNLTPPPSYAATIASKLAIHNPNLP 290 300 310 320 330 340 290 300 310 320 330 340 pF1KB4 CS--ISPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPY . .. .:. .: .::: .:: .::::: ::. ::.:::::::::::: ::::::::: CCDS94 TTLPVNSQNIQPVRYNRRS-NPDLEKRRIHYCDYPGCTKVYTKSSHLKAHLRTHTGEKPY 350 360 370 380 390 400 350 360 370 380 390 400 pF1KB4 KCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV ::::::: :.::::::::::::::::.:::.:. :.:::::::::::: .:: CCDS94 KCTWEGCDWRFARSDELTRHYRKHTGAKPFQCGVCNRSFSRSDHLALHMKRHQN 410 420 430 440 450 >>CCDS14373.1 KLF8 gene_id:11279|Hs108|chrX (359 aa) initn: 989 init1: 605 opt: 605 Z-score: 346.4 bits: 72.8 E(32554): 5.6e-13 Smith-Waterman score: 981; 44.4% identity (70.7% similar) in 365 aa overlap (38-399:44-356) 10 20 30 40 50 60 pF1KB4 KTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHNYPDMEAVPLLLNNVKGEPPE :.. ::.. . :: : :.:..: :::: CCDS14 QLNSEGGSMQVFKQVTASVRNRDPPEIEYRSNMTSPTLLDANPMEN-PALFNDIKIEPPE 20 30 40 50 60 70 70 80 90 100 110 120 pF1KB4 DSLSVDHFQTQTEPVDLSINKART--SPTAVSSSPVSMTASASSPSSTSTSSSSSSRLAS . :. : :.::::::..: .. .:... ..:. :::.. .:.:.:. CCDS14 ELLASDFSLPQVEPVDLSFHKPKAPLQPASMLQAPIRPPKPQSSPQTLVVSTSTSD---- 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 SPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPMNLQSNKLSHVHR .:.... :::::: ...:....:.::.::.:: .: : ::.. .. CCDS14 -------MSTSANIPTVLTPGSVLTSSQSTGSQQILHVIHTIPSVS----LPNKMGGLKT 130 140 150 160 170 190 200 210 220 230 240 pF1KB4 IPVVVQSVPVVYTAVRSPGNVNNTIVVPLLE-DGRGHGKAQMDPRGLSPRQSKSDSDDDD :::::::.:.:::.. . :. .:.:::. ::.. :....:: ..:: . :::.. CCDS14 IPVVVQSLPMVYTTLPADGG-PAAITVPLIGGDGKNAGSVKVDPTSMSPLEIPSDSEE-- 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB4 LPNVTLDSVNETGSTALSIARAVQEVHPSPVSRVRGNRMNNQKFPCSISPFSIESTRRQR :. :.::.::. ...:. .:. .....:. CCDS14 -------STIESGSSALQSLQGLQQ-EPAAMAQMQGE----------------------- 240 250 260 310 320 330 340 350 360 pF1KB4 RSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWEGCTWKFARSDEL :: : ..::::.::: ::.:::::::::::::: :::::::::::.::.::::::::: CCDS14 --ESLDLKRRRIHQCDFAGCSKVYTKSSHLKAHRRIHTGEKPYKCTWDGCSWKFARSDEL 270 280 290 300 310 320 370 380 390 400 pF1KB4 TRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV :::.:::::.:::.:.::.:::::::::.:::::: CCDS14 TRHFRKHTGIKPFRCTDCNRSFSRSDHLSLHRRRHDTM 330 340 350 >>CCDS7060.1 KLF6 gene_id:1316|Hs108|chr10 (283 aa) initn: 783 init1: 559 opt: 586 Z-score: 337.8 bits: 70.9 E(32554): 1.7e-12 Smith-Waterman score: 600; 52.0% identity (72.3% similar) in 173 aa overlap (238-400:113-283) 210 220 230 240 250 260 pF1KB4 NTIVVPLLEDGRGHGKAQMDPRGLSPRQSKSDSDDDDLPNVTLDSVNETGSTALSIARAV :::... :.. . : . : . .: .. CCDS70 SSPPEDTLISPSFCYNLETNSLNSDVSSESSDSSEELSPTAKFTS-DPIGEVLVSSGKLS 90 100 110 120 130 140 270 280 290 300 310 pF1KB4 QEVHPSPVSRVRGNRMNNQKFPCSI----SPFSIESTRRQRRSE------SPDSRKRRIH . : .: : . .: .: . : :: ...: . .. :::.: ::.: CCDS70 SSVTSTPPSSPELSREPSQLWGCVPGELPSPGKVRSGTSGKPGDKGNGDASPDGR-RRVH 150 160 170 180 190 200 320 330 340 350 360 370 pF1KB4 RCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPF :: :.:: ::::::::::::.:::::::::.:.:::: :.::::::::::.:::::.::: CCDS70 RCHFNGCRKVYTKSSHLKAHQRTHTGEKPYRCSWEGCEWRFARSDELTRHFRKHTGAKPF 210 220 230 240 250 260 380 390 400 pF1KB4 KCADCDRSFSRSDHLALHRRRHMLV ::. ::: :::::::::: .::. CCDS70 KCSHCDRCFSRSDHLALHMKRHL 270 280 >>CCDS59440.1 KLF7 gene_id:8609|Hs108|chr2 (269 aa) initn: 691 init1: 546 opt: 567 Z-score: 328.1 bits: 69.0 E(32554): 5.9e-12 Smith-Waterman score: 567; 79.3% identity (92.4% similar) in 92 aa overlap (309-400:179-269) 280 290 300 310 320 330 pF1KB4 RGNRMNNQKFPCSISPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHR :...:: .:::.:.:: ::::::::::::. CCDS59 ATAAAAVTAAGAVKSGQSDSDQGGLGAEACPENKKR-VHRCQFNGCRKVYTKSSHLKAHQ 150 160 170 180 190 200 340 350 360 370 380 390 pF1KB4 RTHTGEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRR :::::::::::.:::: :.::::::::::::::::.::::: ::: :::::::::: .: CCDS59 RTHTGEKPYKCSWEGCEWRFARSDELTRHYRKHTGAKPFKCNHCDRCFSRSDHLALHMKR 210 220 230 240 250 260 400 pF1KB4 HMLV :. CCDS59 HI >>CCDS59438.1 KLF7 gene_id:8609|Hs108|chr2 (274 aa) initn: 691 init1: 546 opt: 567 Z-score: 328.0 bits: 69.0 E(32554): 6e-12 Smith-Waterman score: 567; 79.3% identity (92.4% similar) in 92 aa overlap (309-400:184-274) 280 290 300 310 320 330 pF1KB4 RGNRMNNQKFPCSISPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHR :...:: .:::.:.:: ::::::::::::. CCDS59 ATAAAAVTAAGAVKSGQSDSDQGGLGAEACPENKKR-VHRCQFNGCRKVYTKSSHLKAHQ 160 170 180 190 200 210 340 350 360 370 380 390 pF1KB4 RTHTGEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRR :::::::::::.:::: :.::::::::::::::::.::::: ::: :::::::::: .: CCDS59 RTHTGEKPYKCSWEGCEWRFARSDELTRHYRKHTGAKPFKCNHCDRCFSRSDHLALHMKR 220 230 240 250 260 270 400 pF1KB4 HMLV :. CCDS59 HI >>CCDS2373.1 KLF7 gene_id:8609|Hs108|chr2 (302 aa) initn: 691 init1: 546 opt: 567 Z-score: 327.4 bits: 69.1 E(32554): 6.5e-12 Smith-Waterman score: 567; 79.3% identity (92.4% similar) in 92 aa overlap (309-400:212-302) 280 290 300 310 320 330 pF1KB4 RGNRMNNQKFPCSISPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHR :...:: .:::.:.:: ::::::::::::. CCDS23 ATAAAAVTAAGAVKSGQSDSDQGGLGAEACPENKKR-VHRCQFNGCRKVYTKSSHLKAHQ 190 200 210 220 230 240 340 350 360 370 380 390 pF1KB4 RTHTGEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRR :::::::::::.:::: :.::::::::::::::::.::::: ::: :::::::::: .: CCDS23 RTHTGEKPYKCSWEGCEWRFARSDELTRHYRKHTGAKPFKCNHCDRCFSRSDHLALHMKR 250 260 270 280 290 300 400 pF1KB4 HMLV :. CCDS23 HI 402 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 15:36:07 2016 done: Thu Nov 3 15:36:08 2016 Total Scan time: 2.740 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]