FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1572, 441 aa 1>>>pF1KSDA1572 441 - 441 aa - 441 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.4727+/-0.00131; mu= 2.8543+/- 0.076 mean_var=267.2253+/-57.515, 0's: 0 Z-trim(108.5): 864 B-trim: 415 in 1/50 Lambda= 0.078458 statistics sampled from 9288 (10277) to 9288 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.672), E-opt: 0.2 (0.316), width: 16 Scan time: 3.130 The best scores are: opt bits E(32554) CCDS6847.1 ZBTB26 gene_id:57684|Hs108|chr9 ( 441) 3022 356.0 4.4e-98 CCDS6846.1 ZBTB6 gene_id:10773|Hs108|chr9 ( 424) 672 89.9 5.1e-18 CCDS4727.1 ZBTB12 gene_id:221527|Hs108|chr6 ( 459) 472 67.3 3.5e-11 >>CCDS6847.1 ZBTB26 gene_id:57684|Hs108|chr9 (441 aa) initn: 3022 init1: 3022 opt: 3022 Z-score: 1874.3 bits: 356.0 E(32554): 4.4e-98 Smith-Waterman score: 3022; 100.0% identity (100.0% similar) in 441 aa overlap (1-441:1-441) 10 20 30 40 50 60 pF1KSD MSERSDLLHFKFENYGDSMLQKMNKLREENKFCDVTVLIDDIEVQGHKIVFAAGSPFLRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 MSERSDLLHFKFENYGDSMLQKMNKLREENKFCDVTVLIDDIEVQGHKIVFAAGSPFLRD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD QFLLNDSREVKISILQSSEVGRQLLLSCYSGVLEFPEMELVNYLTAASFLQMSHIVERCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 QFLLNDSREVKISILQSSEVGRQLLLSCYSGVLEFPEMELVNYLTAASFLQMSHIVERCT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD QALWKFIKPKQPMDSKEGCEPQSASPQSKEQQGDARGSPKQDSPCIHPSEDSMDMEDSDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 QALWKFIKPKQPMDSKEGCEPQSASPQSKEQQGDARGSPKQDSPCIHPSEDSMDMEDSDI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD QIVKVESIGDVSEVRSKKDQNQFISSEPTALHSSEPQHSLINSTVENRVSEIEQNHLHNY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 QIVKVESIGDVSEVRSKKDQNQFISSEPTALHSSEPQHSLINSTVENRVSEIEQNHLHNY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD ALSYTGSDNIIMASKDVFGPNIRGVDKGLQWHHQCPKCTRVFRHLENYANHLKMHKLFMC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 ALSYTGSDNIIMASKDVFGPNIRGVDKGLQWHHQCPKCTRVFRHLENYANHLKMHKLFMC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD LLCGKTFTQKGNLHRHMRVHAGIKPFQCKICGKTFSQKCSLQDHLNLHSGDKPHKCNYCD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 LLCGKTFTQKGNLHRHMRVHAGIKPFQCKICGKTFSQKCSLQDHLNLHSGDKPHKCNYCD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD MVFAHKPVLRKHLKQLHGKNSFDNANERNVQDLTVDFDSFACTTVTDSKGCQPQPDATQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 MVFAHKPVLRKHLKQLHGKNSFDNANERNVQDLTVDFDSFACTTVTDSKGCQPQPDATQV 370 380 390 400 410 420 430 440 pF1KSD LDAGKLAQAVLNLRNDSTCVN ::::::::::::::::::::: CCDS68 LDAGKLAQAVLNLRNDSTCVN 430 440 >>CCDS6846.1 ZBTB6 gene_id:10773|Hs108|chr9 (424 aa) initn: 1391 init1: 570 opt: 672 Z-score: 437.0 bits: 89.9 E(32554): 5.1e-18 Smith-Waterman score: 1178; 46.0% identity (70.0% similar) in 420 aa overlap (1-381:1-409) 10 20 30 40 50 60 pF1KSD MSERSDLLHFKFENYGDSMLQKMNKLREENKFCDVTVLIDDIEVQGHKIVFAAGSPFLRD :. .::.:::.::. :: .::::: ::..: ::::.. :.: : ::::...:: : :.:: CCDS68 MAAESDVLHFQFEQQGDVVLQKMNLLRQQNLFCDVSIYINDTEFQGHKVILAACSTFMRD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD QFLLNDSREVKISILQSSEVGRQLLLSCYSGVLEFPEMELVNYLTAASFLQMSHIVERCT ::::..:..:.:.::::.::::.::::::.:.:: . ::..::::::.::: ::::.:: CCDS68 QFLLTQSKHVRITILQSAEVGRKLLLSCYTGALEVKRKELLKYLTAASYLQMVHIVEKCT 70 80 90 100 110 120 130 140 150 pF1KSD QALWKFIKPKQPM----------------------DSKEGCE--------PQSASPQSKE .:: :... : .: . :: : . . . :: CCDS68 EALSKYLEIDLSMKNNNQHTDLCQSSDPDVKNEDENSDKDCEIIEISEDSPVNIDFHVKE 130 140 150 160 170 180 160 170 180 190 200 pF1KSD QQGDARGSP-----KQDSPCIHPSEDSMDM--EDSDIQIVKVESIGDVSEVRSKKDQ-NQ ....: : .. . : ...:. .:..: :..:::: : . .. : .: CCDS68 EESNALQSTVESLTSERKEMKSPELSTVDIGFKDNEICILHVESI---STAGVENGQFSQ 190 200 210 220 230 210 220 230 240 250 260 pF1KSD FISSEPTALHSSEPQHSLINSTVENRVSEIEQNHLHN-YALSYTGSDNIIMASKDVFGPN .: .... :: ::::::::::.::.:. :. .. . . :: . . . CCDS68 PCTSSKASMYFSETQHSLINSTVESRVAEVPGNQDQGLFCENTEGSYGTV--------SE 240 250 260 270 280 270 280 290 300 310 320 pF1KSD IRGVDKGLQWHHQCPKCTRVFRHLENYANHLKMHKLFMCLLCGKTFTQKGNLHRHMRVHA :.....: . .::::.: : : :.::: ::::::::.:: :::::::: ::.::.: : CCDS68 IQNLEEGYSLRHQCPRCPRGFLHVENYLRHLKMHKLFLCLQCGKTFTQKKNLNRHIRGHM 290 300 310 320 330 340 330 340 350 360 370 380 pF1KSD GIKPFQCKICGKTFSQKCSLQDHLNLHSGDKPHKCNYCDMVFAHKPVLRKHLKQLHGKNS ::.:::: .: :::. : .::::::.::::.:.::. ::: : :: .:.::: ..::..: CCDS68 GIRPFQCTVCLKTFTAKSTLQDHLNIHSGDRPYKCHCCDMDFKHKSALKKHLTSVHGRSS 350 360 370 380 390 400 390 400 410 420 430 440 pF1KSD FDNANERNVQDLTVDFDSFACTTVTDSKGCQPQPDATQVLDAGKLAQAVLNLRNDSTCVN CCDS68 GEKLSRPDLKRQSLL 410 420 >>CCDS4727.1 ZBTB12 gene_id:221527|Hs108|chr6 (459 aa) initn: 1134 init1: 455 opt: 472 Z-score: 314.2 bits: 67.3 E(32554): 3.5e-11 Smith-Waterman score: 871; 36.0% identity (62.0% similar) in 458 aa overlap (1-395:1-456) 10 20 30 40 50 60 pF1KSD MSERSDLLHFKFENYGDSMLQKMNKLREENKFCDVTVLIDDIEVQGHKIVFAAGSPFLRD :. ..:.:.. .. . :..::.:: :..:::::.. :... .:::...:: :::::: CCDS47 MASGVEVLRFQLPGHEAATLRNMNQLRAEERFCDVTIVADSLKFRGHKVILAACSPFLRD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD QFLLNDSREVKISILQSSEVGRQLLLSCYSGVLEFPEMELVNYLTAASFLQMSHIVERCT ::::: : :...:...:... .::::::.:.::: ..::::::::.::: :.::.: CCDS47 QFLLNPSSELQVSLMHSARIVADLLLSCYTGALEFAVRDIVNYLTAASYLQMEHVVEKCR 70 80 90 100 110 120 130 140 150 160 pF1KSD QALWKFIKPKQPMDSKEGCEP----------QSASPQSKEQQGDARGSPKQD--SPCIHP .:: .::.:: . ...: .: : .. . . : : ..: CCDS47 NALSQFIEPKIGL-KEDGVSEASLVSSISATKSLLPPARTPKPAPKPPPPPPLPPPLLRP 130 140 150 160 170 170 180 190 200 pF1KSD ----------------SEDSMDMED-SDIQIVKVESIGDVSEVRSKKDQNQ--------F :: . :: ::: :::::: .:.. : : . CCDS47 VKLEFPLDEDLELKAEEEDEDEDEDVSDICIVKVESALEVAH-RLKPPGGLGGGLGIGGS 180 190 200 210 220 230 210 220 230 240 250 pF1KSD ISSEPTAL-HSSEPQHSLI--NSTVENRVSEIEQNHLHNYALSYTGSDNI---------- .... : .:: : .. ...:. : :. . .. : : .. CCDS47 VGGHLGELAQSSVPPSTVAPPQGVVKACYSLSEDAEGEGLLLIPGGRASVGATSGLVEAA 240 250 260 270 280 290 260 270 280 290 pF1KSD --IMASKDV---------FGPNIRGVDKGLQWHH-QCPKCTRVFRHLENYANHLK-MHKL ::.. . :: : . : .. .: :: .::. .:. . :.. .: . CCDS47 AVAMAARGAGGSLGAGGSRGPLPGGFSGGNPLKNIKCTKCPEVFQGVEKLVFHMRAQHFI 300 310 320 330 340 350 300 310 320 330 340 350 pF1KSD FMCLLCGKTFTQKGNLHRHMRVHAGIKPFQCKICGKTFSQKCSLQDHLNLHSGDKPHKCN ::: ::: :....::.::: :: :.: .: :::: :.:: .:.:::::::: .:..:. CCDS47 FMCPRCGKQFNHSSNLNRHMNVHRGVKSHSCGICGKCFTQKSTLHDHLNLHSGARPYRCS 360 370 380 390 400 410 360 370 380 390 400 410 pF1KSD YCDMVFAHKPVLRKHLKQLHGKNSFDNANERNVQDLTVDFDSFACTTVTDSKGCQPQPDA :::. :::::..:.:::. :::.. .:. : .: ...: CCDS47 YCDVRFAHKPAIRRHLKEQHGKTTAENVLEASVAEINVLIR 420 430 440 450 420 430 440 pF1KSD TQVLDAGKLAQAVLNLRNDSTCVN 441 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 06:41:01 2016 done: Thu Nov 3 06:41:02 2016 Total Scan time: 3.130 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]