FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4907, 402 aa
1>>>pF1KB4907 402 - 402 aa - 402 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.2503+/-0.00104; mu= -10.5886+/- 0.062
mean_var=359.8388+/-80.151, 0's: 0 Z-trim(112.9): 712 B-trim: 0 in 0/54
Lambda= 0.067611
statistics sampled from 12778 (13616) to 12778 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.747), E-opt: 0.2 (0.418), width: 16
Scan time: 2.740
The best scores are: opt bits E(32554)
CCDS9449.1 KLF12 gene_id:11278|Hs108|chr13 ( 402) 2671 274.4 1.3e-73
CCDS3444.1 KLF3 gene_id:51274|Hs108|chr4 ( 345) 668 79.0 7.7e-15
CCDS66562.1 KLF5 gene_id:688|Hs108|chr13 ( 366) 608 73.1 4.7e-13
CCDS9448.1 KLF5 gene_id:688|Hs108|chr13 ( 457) 608 73.2 5.5e-13
CCDS14373.1 KLF8 gene_id:11279|Hs108|chrX ( 359) 605 72.8 5.6e-13
CCDS7060.1 KLF6 gene_id:1316|Hs108|chr10 ( 283) 586 70.9 1.7e-12
CCDS59440.1 KLF7 gene_id:8609|Hs108|chr2 ( 269) 567 69.0 5.9e-12
CCDS59438.1 KLF7 gene_id:8609|Hs108|chr2 ( 274) 567 69.0 6e-12
CCDS2373.1 KLF7 gene_id:8609|Hs108|chr2 ( 302) 567 69.1 6.5e-12
>>CCDS9449.1 KLF12 gene_id:11278|Hs108|chr13 (402 aa)
initn: 2671 init1: 2671 opt: 2671 Z-score: 1434.9 bits: 274.4 E(32554): 1.3e-73
Smith-Waterman score: 2671; 100.0% identity (100.0% similar) in 402 aa overlap (1-402:1-402)
10 20 30 40 50 60
pF1KB4 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHNYPDMEAVPLLLNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHNYPDMEAVPLLLNN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 VKGEPPEDSLSVDHFQTQTEPVDLSINKARTSPTAVSSSPVSMTASASSPSSTSTSSSSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 VKGEPPEDSLSVDHFQTQTEPVDLSINKARTSPTAVSSSPVSMTASASSPSSTSTSSSSS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 SRLASSPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPMNLQSNKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 SRLASSPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPMNLQSNKL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 SHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGRGHGKAQMDPRGLSPRQSKSDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 SHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGRGHGKAQMDPRGLSPRQSKSDS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 DDDDLPNVTLDSVNETGSTALSIARAVQEVHPSPVSRVRGNRMNNQKFPCSISPFSIEST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 DDDDLPNVTLDSVNETGSTALSIARAVQEVHPSPVSRVRGNRMNNQKFPCSISPFSIEST
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 RRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWEGCTWKFAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 RRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWEGCTWKFAR
310 320 330 340 350 360
370 380 390 400
pF1KB4 SDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV
::::::::::::::::::::::::::::::::::::::::::
CCDS94 SDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV
370 380 390 400
>>CCDS3444.1 KLF3 gene_id:51274|Hs108|chr4 (345 aa)
initn: 785 init1: 645 opt: 668 Z-score: 379.9 bits: 79.0 E(32554): 7.7e-15
Smith-Waterman score: 795; 40.9% identity (63.1% similar) in 401 aa overlap (20-402:1-345)
10 20 30 40 50
pF1KB4 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHNYPD--MEAV-PLL
:::.: .: :: : .. : .::. ::.. :
CCDS34 MLMFDPVP---VKQEAMD-----PVSVSYPSNYMESMKPNK
10 20 30
60 70 80 90 100 110
pF1KB4 LNNVKGEP-PEDSLSVDHFQT---QTEPVDLSINKARTSPTAVSSSPVSMTASASSPSST
. . . : :: ... . . : :::::..:: :.:: ....:: :. . :::
CCDS34 YGVIYSTPLPEKFFQTPEGLSHGIQMEPVDLTVNK-RSSPPSAGNSPSSL----KFPSSH
40 50 60 70 80
120 130 140 150 160
pF1KB4 STSSSSSSRLASSPTVITSVSSASSS----STVLTPGPLVASA---SGVGGQQFLHIIHP
.: . : .::: : . : : . .. :. :..:.: :. . .: .:.:
CCDS34 RRASPGLSMPSSSPP-IKKYSPPSPGVQPFGVPLSMPPVMAAALSRHGIRSPGILPVIQP
90 100 110 120 130 140
170 180 190 200 210 220
pF1KB4 VPPSSPMNLQSNKLSHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGR---GHGK
: .:. .. . ::... :.. . . : .... ::..:. . .. :
CCDS34 VV-VQPVPFMYT--SHLQQ--------PLMVSLSEEMENSSSSMQVPVIESYEKPISQKK
150 160 170 180 190
230 240 250 260 270 280
pF1KB4 AQMDPRGLSPRQSKSDSDDDDLPNVTLDSVNETGSTALSIARAVQEVHPSPVSRVRGNRM
...: :. :. ..: ... ..::. :: .:: ::: . . :.:
CCDS34 IKIEP-GIEPQ--RTDYYPEEMSPPLMNSVSPP--QAL-----LQENHPSVIVQP-GKR-
200 210 220 230 240
290 300 310 320 330 340
pF1KB4 NNQKFPCSISPFSIESTRRQRRSESPDS-RKRRIHRCDFEGCNKVYTKSSHLKAHRRTHT
:. . ::::. :::::::::..::::::::::::::::::::
CCDS34 ----------PLPV---------ESPDTQRKRRIHRCDYDGCNKVYTKSSHLKAHRRTHT
250 260 270 280
350 360 370 380 390 400
pF1KB4 GEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV
:::::::::::::::::::::::::.:::::.:::.: ::::::::::::::::.:::::
CCDS34 GEKPYKCTWEGCTWKFARSDELTRHFRKHTGIKPFQCPDCDRSFSRSDHLALHRKRHMLV
290 300 310 320 330 340
>>CCDS66562.1 KLF5 gene_id:688|Hs108|chr13 (366 aa)
initn: 642 init1: 584 opt: 608 Z-score: 347.9 bits: 73.1 E(32554): 4.7e-13
Smith-Waterman score: 627; 34.3% identity (60.5% similar) in 382 aa overlap (26-399:9-364)
10 20 30 40 50
pF1KB4 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHN--YPDMEAVPLLL
.: : . : . .. : .: . . : :..: .
CCDS66 MEKYLTPQLPPVPIIPEHKKYRRDSASVVDQFFTDTEGLPYSI
10 20 30 40
60 70 80 90 100 110
pF1KB4 NNVKGEPPEDSLSVDHFQTQTEPVDLSINKARTSPTAVSSSPVSMTASASSPSSTSTSSS
: : : . ...: .: ... .: :.:. : :: :. :..
CCDS66 NMNVFLPDITHLRTGLYKSQ-RPC---VTHIKTEPVAIFSHQSETTAPP--PAPTQALPE
50 60 70 80 90
120 130 140 150 160 170
pF1KB4 SSSRLASSPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPMNLQSN
.: ..: :. :.. .. . :: .. . : .. .... :. : ..:
CCDS66 FTSIFSSHQTAAPEVNNIFIKQELPTPDLHLSVPTQQG--HLYQLLN--TPDLDMPSSTN
100 110 120 130 140 150
180 190 200 210 220 230
pF1KB4 KLSHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGRGHGKAQMDPRGLS-PRQSK
. . ..... : ..:. . :.... .:: . .: : : . : :
CCDS66 QTA-------AMDTLNVSMSAAMAGLNTHTS-AVPQTAVKQFQG---MPPCTYTMPSQFL
160 170 180 190 200
240 250 260 270 280 290
pF1KB4 SDSDDDDLPNVTLDSVNETGSTALSIARAVQEVHPSP--VSRVRGN-RMNNQKFPCS--I
.. :. .: :: . :. .:.. : : .. . .. ..: ..: . .
CCDS66 PQQATYFPPS---PPSSEPGSPDRQ-AEMLQNLTPPPSYAATIASKLAIHNPNLPTTLPV
210 220 230 240 250
300 310 320 330 340 350
pF1KB4 SPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWE
. .:. .: .::: .:: .::::: ::. ::.:::::::::::: ::::::::::::::
CCDS66 NSQNIQPVRYNRRS-NPDLEKRRIHYCDYPGCTKVYTKSSHLKAHLRTHTGEKPYKCTWE
260 270 280 290 300 310
360 370 380 390 400
pF1KB4 GCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV
:: :.::::::::::::::::.:::.:. :.:::::::::::: .::
CCDS66 GCDWRFARSDELTRHYRKHTGAKPFQCGVCNRSFSRSDHLALHMKRHQN
320 330 340 350 360
>>CCDS9448.1 KLF5 gene_id:688|Hs108|chr13 (457 aa)
initn: 618 init1: 584 opt: 608 Z-score: 346.6 bits: 73.2 E(32554): 5.5e-13
Smith-Waterman score: 627; 34.3% identity (60.5% similar) in 382 aa overlap (26-399:100-455)
10 20 30 40 50
pF1KB4 MNIHMKRKTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHN--YPDMEA
.: : . : . .. : .: . . : :.
CCDS94 PAQPPATGPRLPPEDLVQTRCEMEKYLTPQLPPVPIIPEHKKYRRDSASVVDQFFTDTEG
70 80 90 100 110 120
60 70 80 90 100 110
pF1KB4 VPLLLNNVKGEPPEDSLSVDHFQTQTEPVDLSINKARTSPTAVSSSPVSMTASASSPSST
.: .: : : . ...: .: ... .: :.:. : :: :. :
CCDS94 LPYSINMNVFLPDITHLRTGLYKSQ-RPC---VTHIKTEPVAIFSHQSETTAPP--PAPT
130 140 150 160 170 180
120 130 140 150 160 170
pF1KB4 STSSSSSSRLASSPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPM
.. .: ..: :. :.. .. . :: .. . : .. .... :. :
CCDS94 QALPEFTSIFSSHQTAAPEVNNIFIKQELPTPDLHLSVPTQQG--HLYQLLN--TPDLDM
190 200 210 220 230
180 190 200 210 220 230
pF1KB4 NLQSNKLSHVHRIPVVVQSVPVVYTAVRSPGNVNNTIVVPLLEDGRGHGKAQMDPRGLS-
..:. . ..... : ..:. . :.... .:: . .: : : .
CCDS94 PSSTNQTA-------AMDTLNVSMSAAMAGLNTHTS-AVPQTAVKQFQG---MPPCTYTM
240 250 260 270 280
240 250 260 270 280
pF1KB4 PRQSKSDSDDDDLPNVTLDSVNETGSTALSIARAVQEVHPSP--VSRVRGN-RMNNQKFP
: : .. :. .: :: . :. .:.. : : .. . .. ..: ..:
CCDS94 PSQFLPQQATYFPPS---PPSSEPGSPDRQ-AEMLQNLTPPPSYAATIASKLAIHNPNLP
290 300 310 320 330 340
290 300 310 320 330 340
pF1KB4 CS--ISPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPY
. .. .:. .: .::: .:: .::::: ::. ::.:::::::::::: :::::::::
CCDS94 TTLPVNSQNIQPVRYNRRS-NPDLEKRRIHYCDYPGCTKVYTKSSHLKAHLRTHTGEKPY
350 360 370 380 390 400
350 360 370 380 390 400
pF1KB4 KCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV
::::::: :.::::::::::::::::.:::.:. :.:::::::::::: .::
CCDS94 KCTWEGCDWRFARSDELTRHYRKHTGAKPFQCGVCNRSFSRSDHLALHMKRHQN
410 420 430 440 450
>>CCDS14373.1 KLF8 gene_id:11279|Hs108|chrX (359 aa)
initn: 989 init1: 605 opt: 605 Z-score: 346.4 bits: 72.8 E(32554): 5.6e-13
Smith-Waterman score: 981; 44.4% identity (70.7% similar) in 365 aa overlap (38-399:44-356)
10 20 30 40 50 60
pF1KB4 KTIKNINTFENRMLMLDGMPAVRVKTELLESEQGSPNVHNYPDMEAVPLLLNNVKGEPPE
:.. ::.. . :: : :.:..: ::::
CCDS14 QLNSEGGSMQVFKQVTASVRNRDPPEIEYRSNMTSPTLLDANPMEN-PALFNDIKIEPPE
20 30 40 50 60 70
70 80 90 100 110 120
pF1KB4 DSLSVDHFQTQTEPVDLSINKART--SPTAVSSSPVSMTASASSPSSTSTSSSSSSRLAS
. :. : :.::::::..: .. .:... ..:. :::.. .:.:.:.
CCDS14 ELLASDFSLPQVEPVDLSFHKPKAPLQPASMLQAPIRPPKPQSSPQTLVVSTSTSD----
80 90 100 110 120
130 140 150 160 170 180
pF1KB4 SPTVITSVSSASSSSTVLTPGPLVASASGVGGQQFLHIIHPVPPSSPMNLQSNKLSHVHR
.:.... :::::: ...:....:.::.::.:: .: : ::.. ..
CCDS14 -------MSTSANIPTVLTPGSVLTSSQSTGSQQILHVIHTIPSVS----LPNKMGGLKT
130 140 150 160 170
190 200 210 220 230 240
pF1KB4 IPVVVQSVPVVYTAVRSPGNVNNTIVVPLLE-DGRGHGKAQMDPRGLSPRQSKSDSDDDD
:::::::.:.:::.. . :. .:.:::. ::.. :....:: ..:: . :::..
CCDS14 IPVVVQSLPMVYTTLPADGG-PAAITVPLIGGDGKNAGSVKVDPTSMSPLEIPSDSEE--
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB4 LPNVTLDSVNETGSTALSIARAVQEVHPSPVSRVRGNRMNNQKFPCSISPFSIESTRRQR
:. :.::.::. ...:. .:. .....:.
CCDS14 -------STIESGSSALQSLQGLQQ-EPAAMAQMQGE-----------------------
240 250 260
310 320 330 340 350 360
pF1KB4 RSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWEGCTWKFARSDEL
:: : ..::::.::: ::.:::::::::::::: :::::::::::.::.:::::::::
CCDS14 --ESLDLKRRRIHQCDFAGCSKVYTKSSHLKAHRRIHTGEKPYKCTWDGCSWKFARSDEL
270 280 290 300 310 320
370 380 390 400
pF1KB4 TRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRRHMLV
:::.:::::.:::.:.::.:::::::::.::::::
CCDS14 TRHFRKHTGIKPFRCTDCNRSFSRSDHLSLHRRRHDTM
330 340 350
>>CCDS7060.1 KLF6 gene_id:1316|Hs108|chr10 (283 aa)
initn: 783 init1: 559 opt: 586 Z-score: 337.8 bits: 70.9 E(32554): 1.7e-12
Smith-Waterman score: 600; 52.0% identity (72.3% similar) in 173 aa overlap (238-400:113-283)
210 220 230 240 250 260
pF1KB4 NTIVVPLLEDGRGHGKAQMDPRGLSPRQSKSDSDDDDLPNVTLDSVNETGSTALSIARAV
:::... :.. . : . : . .: ..
CCDS70 SSPPEDTLISPSFCYNLETNSLNSDVSSESSDSSEELSPTAKFTS-DPIGEVLVSSGKLS
90 100 110 120 130 140
270 280 290 300 310
pF1KB4 QEVHPSPVSRVRGNRMNNQKFPCSI----SPFSIESTRRQRRSE------SPDSRKRRIH
. : .: : . .: .: . : :: ...: . .. :::.: ::.:
CCDS70 SSVTSTPPSSPELSREPSQLWGCVPGELPSPGKVRSGTSGKPGDKGNGDASPDGR-RRVH
150 160 170 180 190 200
320 330 340 350 360 370
pF1KB4 RCDFEGCNKVYTKSSHLKAHRRTHTGEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPF
:: :.:: ::::::::::::.:::::::::.:.:::: :.::::::::::.:::::.:::
CCDS70 RCHFNGCRKVYTKSSHLKAHQRTHTGEKPYRCSWEGCEWRFARSDELTRHFRKHTGAKPF
210 220 230 240 250 260
380 390 400
pF1KB4 KCADCDRSFSRSDHLALHRRRHMLV
::. ::: :::::::::: .::.
CCDS70 KCSHCDRCFSRSDHLALHMKRHL
270 280
>>CCDS59440.1 KLF7 gene_id:8609|Hs108|chr2 (269 aa)
initn: 691 init1: 546 opt: 567 Z-score: 328.1 bits: 69.0 E(32554): 5.9e-12
Smith-Waterman score: 567; 79.3% identity (92.4% similar) in 92 aa overlap (309-400:179-269)
280 290 300 310 320 330
pF1KB4 RGNRMNNQKFPCSISPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHR
:...:: .:::.:.:: ::::::::::::.
CCDS59 ATAAAAVTAAGAVKSGQSDSDQGGLGAEACPENKKR-VHRCQFNGCRKVYTKSSHLKAHQ
150 160 170 180 190 200
340 350 360 370 380 390
pF1KB4 RTHTGEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRR
:::::::::::.:::: :.::::::::::::::::.::::: ::: :::::::::: .:
CCDS59 RTHTGEKPYKCSWEGCEWRFARSDELTRHYRKHTGAKPFKCNHCDRCFSRSDHLALHMKR
210 220 230 240 250 260
400
pF1KB4 HMLV
:.
CCDS59 HI
>>CCDS59438.1 KLF7 gene_id:8609|Hs108|chr2 (274 aa)
initn: 691 init1: 546 opt: 567 Z-score: 328.0 bits: 69.0 E(32554): 6e-12
Smith-Waterman score: 567; 79.3% identity (92.4% similar) in 92 aa overlap (309-400:184-274)
280 290 300 310 320 330
pF1KB4 RGNRMNNQKFPCSISPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHR
:...:: .:::.:.:: ::::::::::::.
CCDS59 ATAAAAVTAAGAVKSGQSDSDQGGLGAEACPENKKR-VHRCQFNGCRKVYTKSSHLKAHQ
160 170 180 190 200 210
340 350 360 370 380 390
pF1KB4 RTHTGEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRR
:::::::::::.:::: :.::::::::::::::::.::::: ::: :::::::::: .:
CCDS59 RTHTGEKPYKCSWEGCEWRFARSDELTRHYRKHTGAKPFKCNHCDRCFSRSDHLALHMKR
220 230 240 250 260 270
400
pF1KB4 HMLV
:.
CCDS59 HI
>>CCDS2373.1 KLF7 gene_id:8609|Hs108|chr2 (302 aa)
initn: 691 init1: 546 opt: 567 Z-score: 327.4 bits: 69.1 E(32554): 6.5e-12
Smith-Waterman score: 567; 79.3% identity (92.4% similar) in 92 aa overlap (309-400:212-302)
280 290 300 310 320 330
pF1KB4 RGNRMNNQKFPCSISPFSIESTRRQRRSESPDSRKRRIHRCDFEGCNKVYTKSSHLKAHR
:...:: .:::.:.:: ::::::::::::.
CCDS23 ATAAAAVTAAGAVKSGQSDSDQGGLGAEACPENKKR-VHRCQFNGCRKVYTKSSHLKAHQ
190 200 210 220 230 240
340 350 360 370 380 390
pF1KB4 RTHTGEKPYKCTWEGCTWKFARSDELTRHYRKHTGVKPFKCADCDRSFSRSDHLALHRRR
:::::::::::.:::: :.::::::::::::::::.::::: ::: :::::::::: .:
CCDS23 RTHTGEKPYKCSWEGCEWRFARSDELTRHYRKHTGAKPFKCNHCDRCFSRSDHLALHMKR
250 260 270 280 290 300
400
pF1KB4 HMLV
:.
CCDS23 HI
402 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 15:36:07 2016 done: Thu Nov 3 15:36:08 2016
Total Scan time: 2.740 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]