FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0414, 467 aa 1>>>pF1KSDA0414 467 - 467 aa - 467 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.2016+/-0.0016; mu= -1.1385+/- 0.091 mean_var=340.1990+/-80.708, 0's: 0 Z-trim(106.9): 773 B-trim: 358 in 1/49 Lambda= 0.069536 statistics sampled from 8368 (9279) to 8368 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.642), E-opt: 0.2 (0.285), width: 16 Scan time: 2.320 The best scores are: opt bits E(32554) CCDS6867.1 ZBTB43 gene_id:23099|Hs108|chr9 ( 467) 3166 332.4 6e-91 CCDS44278.1 ZBTB37 gene_id:84614|Hs108|chr1 ( 503) 703 85.4 1.5e-16 CCDS4780.1 ZBTB9 gene_id:221504|Hs108|chr6 ( 473) 660 81.0 2.9e-15 CCDS48023.1 ZBTB34 gene_id:403341|Hs108|chr9 ( 500) 627 77.8 3e-14 CCDS4775.1 ZBTB22 gene_id:9278|Hs108|chr6 ( 634) 513 66.4 9.6e-11 >>CCDS6867.1 ZBTB43 gene_id:23099|Hs108|chr9 (467 aa) initn: 3166 init1: 3166 opt: 3166 Z-score: 1746.2 bits: 332.4 E(32554): 6e-91 Smith-Waterman score: 3166; 100.0% identity (100.0% similar) in 467 aa overlap (1-467:1-467) 10 20 30 40 50 60 pF1KSD MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFRAHKAVLAASSPYFCD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFRAHKAVLAASSPYFCD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD QVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLTAASFLQMWHVVDKCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 QVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLTAASFLQMWHVVDKCT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD EVLEGNPTVLCQKLNHGSDHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDGENEEES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 EVLEGNPTVLCQKLNHGSDHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDGENEEES 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD TKDELSSQLTEHEYLPSNSSTEHDRLSTEMASQDGEEGASDSAEFHYTRPMYSKPSIMAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 TKDELSSQLTEHEYLPSNSSTEHDRLSTEMASQDGEEGASDSAEFHYTRPMYSKPSIMAH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD KRWIHVKPERLEQACEGMDVHATYDEHQVTESINTVQTEHTVQPSGVEEDFHIGEKKVEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 KRWIHVKPERLEQACEGMDVHATYDEHQVTESINTVQTEHTVQPSGVEEDFHIGEKKVEA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD EFDEQADESNYDEQVDFYGSSMEEFSGERSDGNLIGHRQEAALAAGYSENIEMVTGIKEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 EFDEQADESNYDEQVDFYGSSMEEFSGERSDGNLIGHRQEAALAAGYSENIEMVTGIKEE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD ASHLGFSATDKLYPCQCGKSFTHKSQRDRHMSMHLGLRPYGCGVCGKKFKMKHHLVGHMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 ASHLGFSATDKLYPCQCGKSFTHKSQRDRHMSMHLGLRPYGCGVCGKKFKMKHHLVGHMK 370 380 390 400 410 420 430 440 450 460 pF1KSD IHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQNTTEAN ::::::::::::::::::::::::::::::::::::::::::::::: CCDS68 IHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQNTTEAN 430 440 450 460 >>CCDS44278.1 ZBTB37 gene_id:84614|Hs108|chr1 (503 aa) initn: 672 init1: 451 opt: 703 Z-score: 410.5 bits: 85.4 E(32554): 1.5e-16 Smith-Waterman score: 703; 31.0% identity (60.6% similar) in 462 aa overlap (1-446:1-447) 10 20 30 40 50 60 pF1KSD MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFRAHKAVLAASSPYFCD :: : : ...:.::::...:..::: :.::.:::. . :::. :::::.::::::::: : CCDS44 MEKGGN-IQLEIPDFSNSVLSHLNQLRMQGRLCDIVVNVQGQAFRAHKVVLAASSPYFRD 10 20 30 40 50 70 80 90 100 110 120 pF1KSD QVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLTAASFLQMWHVVDKCT .. :.. . . . :: :::..: ::::. . .:.::::::::::: :..:::: CCDS44 HMSLNEMSTVSISVIKNPTVFEQLLSFCYTGRICLQLADIISYLTAASFLQMQHIIDKCT 60 70 80 90 100 110 130 140 150 160 170 pF1KSD EVLEG-----NPTVLCQKLNHG-SDHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDG ..::: : . . .:.. . :: :. .. ... . . . . ::.. : : CCDS44 QILEGIHFKINVAEVEAELSQTRTKHQERPPESHR-VTPNLNRSLSPRHNTPKGN--RRG 120 130 140 150 160 170 180 190 200 210 220 pF1KSD ENEEESTKDELSS--QLTEHEYLPSNSSTEHDR--LSTEMASQ-DGEEGASDSAEFHYTR . ::: . : . . .:..: . : . :.: : :..: : CCDS44 QVSAVLDIRELSPPEESTSPQIIEPSSDVESREPILRINRAGQWYVETGVAD-------R 180 190 200 210 220 230 240 250 260 270 280 pF1KSD PMYSKPSIMAHKRWIHVKPERLEQACEGMDVHATYDEHQVTESINTVQTEHTVQPSGVEE : . . .:.: : ::. : . . . .. . .: .... . : . : .: CCDS44 GGRSDDEVRVLGA-VHIKTENLEEWL-GPENQPSGEDGSSAEEVTAMVIDTTGHGSVGQE 230 240 250 260 270 280 290 300 310 320 330 340 pF1KSD DFHIGEKKVEAEFDEQADESNYDEQVDFYGSSMEEFSGERSDGNLIGHRQ-----EAALA .. .: . ... ... . .. . . . .. . .: : . .: : . CCDS44 NYTLGSSGAKVARPTSSEVDRFSPSGSVVPLTERHRARSESPGRMDEPKQPSSQVEESAM 290 300 310 320 330 340 350 360 370 380 390 400 pF1KSD AGYSENIEMVTGIKEEASHLGFSATDKLYPCQCGKSFTHKSQRDRHMSMHLGLRPYGCGV : : .:.. ..:.:. : . .: :.:::..:.. :::: .:.:. :. : . CCDS44 MGVSGYVEYLR--EQEVSERWFRYNPRLTCIYCAKSFNQKGSLDRHMRLHMGITPFVCRM 350 360 370 380 390 400 410 420 430 440 450 460 pF1KSD CGKKFKMKHHLVGHMKIHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQNTT ::::. : .: :.. ::: ::..:..:.: : .. ...: CCDS44 CGKKYTRKDQLEYHIRKHTGNKPFHCHVCGKSFPFQAILNQHFRKNHPGCIPLEGPHSIS 410 420 430 440 450 460 pF1KSD EAN CCDS44 PETTVTSRGQAEEESPSQEETVAPGEAVQGSVSTTGPD 470 480 490 500 >>CCDS4780.1 ZBTB9 gene_id:221504|Hs108|chr6 (473 aa) initn: 675 init1: 417 opt: 660 Z-score: 387.5 bits: 81.0 E(32554): 2.9e-15 Smith-Waterman score: 662; 32.2% identity (58.8% similar) in 466 aa overlap (3-450:18-460) 10 20 30 40 pF1KSD MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFR :. ....:::. ::..:..::..: .:..::::..:::. .: CCDS47 METPTPLPPVPASPTCNPAPRTIQIEFPQHSSSLLESLNRHRLEGKFCDVSLLVQGRELR 10 20 30 40 50 60 50 60 70 80 90 100 pF1KSD AHKAVLAASSPYFCDQVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLT ::::::::.:::: :..:: .. :..::.:.. .::..: :.::: .: . ..: CCDS47 AHKAVLAAASPYFHDKLLLGDAPRLTLPSVIEADAFEGLLQLIYSGRLRLPLDALPAHLL 70 80 90 100 110 120 110 120 130 140 150 pF1KSD AASFLQMWHVVDKCTEVLEGNPTVLCQKLNHGSD--HQSPSSSSYNG--LVES--FE--L .:: ::::.:::.:.:.:. : .:.. : :..: .: ..: :. . CCDS47 VASGLQMWQVVDQCSEILRELETSGGGISARGGNSYHALLSTTSSTGGWCIRSSPFQTPV 130 140 150 160 170 180 160 170 180 190 200 210 pF1KSD GSGGHTDFPKAQELRDGENEEESTKDELSSQLTEHEYLPSNSSTEHDRLSTEMASQDGEE :.. :. : . : : .: . :. :. :.: ... : :. :. ... . CCDS47 QSSASTESPASTESPVG-GEGSELGEVLQIQVEEEEEEEEDDDDE-DQGSATLSQTPQPQ 190 200 210 220 230 220 230 240 250 260 270 pF1KSD GASDSAEFHYTRPMYSKPSIM-AHKRWI---HVKPERLEQACEGMDVHATYDEHQVTESI .: . :: .: : : : . . : .: : .. . : ... : CCDS47 RVSGV----FPRPHGPHPLPMTATPRKLPEGESAPLELP-APPALPPKIFYIKQEPFEPK 240 250 260 270 280 290 280 290 300 310 320 330 pF1KSD NTVQTEHTVQPSGVEEDFHIGEKKVEAEFDEQADESNYDEQVDFYGSSMEEFSGERSDGN . .. : ::.:..: : :: :. :.: . . .. .: . . CCDS47 EEISGSGT-QPGGAKE-----ETKV---FSGGDTEGNGELGFLLPSGPGPTSGGGGPSWK 300 310 320 330 340 340 350 360 370 380 pF1KSD LIGHRQEAALAAGYSENIEMVTGIKEEASH----LGFS--ATDKLYPCQCGKSFTHKSQR . . . :..: . : .: : :: . : : . : ::: :. : .: CCDS47 PVDLHGNEILSGGGGP------GGAGQAVHGPVKLGGTPPADGKRFGCLCGKRFAVKPKR 350 360 370 380 390 390 400 410 420 430 440 pF1KSD DRHMSMHLGLRPYGCGVCGKKFKMKHHLVGHMKIHTGIKPYECNICAKRFMWRDSFHRHV :::. . ..:::.:::.:.:.::.::::. ::: :.: . : :..:: . : :: CCDS47 DRHIMLTFSLRPFGCGICNKRFKLKHHLTEHMKTHAGAL-HACPHCGRRFRVHACFLRHR 400 410 420 430 440 450 450 460 pF1KSD TSCTKSYEAAKAEQNTTEAN : CCDS47 DLCKGQGWATAHWTYK 460 470 >>CCDS48023.1 ZBTB34 gene_id:403341|Hs108|chr9 (500 aa) initn: 784 init1: 406 opt: 627 Z-score: 369.3 bits: 77.8 E(32554): 3e-14 Smith-Waterman score: 628; 30.4% identity (58.4% similar) in 461 aa overlap (5-447:3-447) 10 20 30 40 50 pF1KSD MEPGTNSF-RVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFRAHKAVLAASSPYFC ..:: . . :..:::.:..::. : ::.:::. . .::. ::::::::::::::: CCDS48 MDSSSFIQFDVPEYSSTVLSQLNELRLQGKLCDIIVHIQGQPFRAHKAVLAASSPYFR 10 20 30 40 50 60 70 80 90 100 110 pF1KSD DQVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLTAASFLQMWHVVDKC :. :.. . . . :: :::..: ::::. . ..::.::::::::: :.::: CCDS48 DHSALSTMSGLSISVIKNPNVFEQLLSFCYTGRMSLQLKDVVSFLTAASFLQMQCVIDKC 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD TEVLEG-NPTVLCQKLNHGSDHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDGENEE :..::. . . .. . . : ::. .: ... . . : .. : CCDS48 TQILESIHSKISVGDVDSVTVGAEENPESRNGVKDSSFFANPVEISPPYCSQGR------ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD ESTKDELSSQLTEHEYLPSNSSTEHDRLSTEMASQDGEEGASDSAEFHYTRPMYSKPSIM . ::.: . : ::.. ..::. : :. : :. . :.. . . ... CCDS48 ---QPTASSDL-RMETTPSKAL--RSRLQEEGHSDRGSSGSVSEYEIQIEGD-HEQGDLL 180 190 200 210 220 240 250 260 270 280 290 pF1KSD AHKRWI---HVKPERLEQ-ACEGMDVHATYDEHQVTESINTVQTEHT-VQPSGVEEDFHI ... : .:: :. .. .: : . :. :: .. :. . : : . CCDS48 VRESQITEVKVKMEKSDRPSCS--DSSSLGDDGYHTEMVDGEQVVAVNVGSYGSVLQHAY 230 240 250 260 270 280 300 310 320 330 340 pF1KSD GEKKVEAEFDEQADESNYDEQVDFYGSSMEEFSGERSDG----NLIGHRQEAALAAGYSE . ... .. . .. . . . : . : : :. .. : . .:. : :. CCDS48 SYSQAASQPTNVSEAFGSLSNSSPSRSMLSCFRGGRARQKRALSVHLHSDLQGLVQG-SD 290 300 310 320 330 340 350 360 370 380 390 400 pF1KSD NIEMVTGIKEEASHLGFSATDKLYP------C-QCGKSFTHKSQRDRHMSMHLGLRPYGC . :... :.: :: . :: : :::::..:.. :::: .:.:. :. : CCDS48 SEAMMNNPGYESSPRERSARGHWYPYNERLICIYCGKSFNQKGSLDRHMRLHMGITPFVC 350 360 370 380 390 400 410 420 430 440 450 460 pF1KSD GVCGKKFKMKHHLVGHMKIHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQN ::::. : .: :.. :: ::..:.::.: : .. ....:. CCDS48 KFCGKKYTRKDQLEYHIRGHTDDKPFRCEICGKCFPFQGTLNQHLRKNHPGVAEVRSRIE 410 420 430 440 450 460 pF1KSD TTEAN CCDS48 SPERTDVYVEQKLENDASASEMGLDSRMEIHTVSDAPD 470 480 490 500 >>CCDS4775.1 ZBTB22 gene_id:9278|Hs108|chr6 (634 aa) initn: 1074 init1: 510 opt: 513 Z-score: 306.3 bits: 66.4 E(32554): 9.6e-11 Smith-Waterman score: 693; 34.7% identity (57.0% similar) in 505 aa overlap (3-410:27-523) 10 20 30 pF1KSD MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVS :.. .: ::. .:..:..::::: :::::::: CCDS47 MEPSPLSPSGAALPLPLSLAPPPLPLPAAAVVHVSFPEVTSALLESLNQQRLQGQLCDVS 10 20 30 40 50 60 40 50 60 70 80 90 pF1KSD IVVQGHIFRAHKAVLAASSPYFCDQVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMP : :::. ::::.:::::::::: ::::::. : ::.::.: .::..: :.::::: : CCDS47 IRVQGREFRAHRAVLAASSPYFHDQVLLKGMTSISLPSVMDPGAFETVLASAYTGRLSMA 70 80 90 100 110 120 100 110 120 pF1KSD APEIVSYLTAASFLQMWHVVDKCTEVL-EGN----------------------------- : .::..::..: :::::.::::::.: :: CCDS47 AADIVNFLTVGSVLQMWHIVDKCTELLREGRASATTTITTAAATSVTVPGAGVPSGSGGT 130 140 150 160 170 180 130 140 150 160 170 180 pF1KSD --PTVLCQKLNHGS----DHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDGENEEES :... . .:.: ..::::::.: . :: ...:... : . : .:... CCDS47 VAPATMGSARSHASSRASENQSPSSSNYFSPRESTDFSSSSQEAFAASAV---GSGERRG 190 200 210 220 230 190 200 210 220 230 pF1KSD TKDELSSQLTEHEYLPSNSST-EHDRLSTEMASQDGEEGASDSAEFHYTRPMYSKPSIMA . . .. :.. : :.: . . ::. .. .: .. :: :. :::: CCDS47 GGPVFPAPVVGSGGATSGKLLLEADELCDD--GGDGRGAVVPGAGLR--RPTYTPPSIMP 240 250 260 270 280 290 240 250 260 pF1KSD HKRWIHVK------------PER--LEQACEGMDVHAT----YDEH-------------Q .:.:..:: :. ::. : :. : ::. . CCDS47 QKHWVYVKRGGNCPAPTPLVPQDPDLEEEEEEEDLVLTCEDDEDEELGGSSRVPVGGGPE 300 310 320 330 340 350 270 280 290 300 310 pF1KSD VTESINTVQTEHTVQPSGVEE--------DF--HIGEKKVEAEFDEQADE--SNYDEQ-- .: ::. :.: .: :. :: . : : : .:... :.: . CCDS47 ATLSISDVRTLSEPPDKGEEQVNFCESSNDFGPYEGGGPV-AGLDDSGGPTPSSYAPSHP 360 370 380 390 400 410 320 330 340 350 pF1KSD ------VDFYGSSMEEF------SGERSDGNLIGHRQE--AALAAGYSENIEMVTG-IKE .:. :... : :. .. :. :.. : :. ..: : . : : . CCDS47 PRPLLPLDMQGNQILVFPSSSSSSSSQAPGQPPGNQAEHGAVTVGGTSVGSLGVPGSVGG 420 430 440 450 460 470 360 370 380 390 400 410 pF1KSD EASHLGFSATDKLYPCQCGKSFTHKSQRDRHMSMHLGLRPYGCGVCGKKFKMKHHLVGHM . : . .:.. :.:::.:.:::.::::..:::.:::. : ::.:::: CCDS47 VPGGTGSGDGNKIFLCHCGKAFSHKSMRDRHVNMHLNLRPFDCPVCNKKFKMKHHLTEHM 480 490 500 510 520 530 420 430 440 450 460 pF1KSD KIHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQNTTEAN CCDS47 KTHTGLKPYECGVCAKKFMWRDSFMRHRGHCERRHRLGGVGAVPGPGTPTGPSLPSKRES 540 550 560 570 580 590 467 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 01:38:33 2016 done: Thu Nov 3 01:38:33 2016 Total Scan time: 2.320 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]