FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7694, 413 aa 1>>>pF1KB7694 413 - 413 aa - 413 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.2028+/-0.000762; mu= 5.9120+/- 0.046 mean_var=176.4014+/-36.795, 0's: 0 Z-trim(115.2): 18 B-trim: 0 in 0/52 Lambda= 0.096566 statistics sampled from 15692 (15707) to 15692 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.799), E-opt: 0.2 (0.482), width: 16 Scan time: 3.060 The best scores are: opt bits E(32554) CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX ( 413) 2847 408.2 7.4e-114 CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 ( 480) 830 127.2 3.2e-29 CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 ( 444) 789 121.5 1.6e-27 CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 ( 443) 781 120.4 3.4e-27 CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 ( 397) 701 109.2 7.1e-24 CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 ( 443) 694 108.3 1.5e-23 CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 ( 236) 687 107.1 1.8e-23 CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 ( 442) 691 107.8 2e-23 CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 ( 595) 639 100.7 3.9e-21 CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 ( 466) 440 72.9 7.1e-13 >>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX (413 aa) initn: 2847 init1: 2847 opt: 2847 Z-score: 2157.6 bits: 408.2 E(32554): 7.4e-114 Smith-Waterman score: 2847; 100.0% identity (100.0% similar) in 413 aa overlap (1-413:1-413) 10 20 30 40 50 60 pF1KB7 MEFPGLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MEFPGLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAAL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 AYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGLYPASTVCPTREDSPPQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 AYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGLYPASTVCPTREDSPPQA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 VEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSPL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 NSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 NSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 LIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 GIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPGT 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 AHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 AHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS 370 380 390 400 410 >>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 (480 aa) initn: 956 init1: 724 opt: 830 Z-score: 638.0 bits: 127.2 E(32554): 3.2e-29 Smith-Waterman score: 846; 43.1% identity (61.3% similar) in 408 aa overlap (16-407:115-479) 10 20 30 40 pF1KB7 MEFPGLGSLGTSEPLPQFVDPALVSSTP--ESGVFFPSGPEGLDA : :.: :.:: :.. :.:: .. CCDS30 CRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP--FSKTPLHPSAAGGPGGPLSVYP 90 100 110 120 130 140 50 60 70 80 90 100 pF1KB7 AASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGL .:.. . . . ...:.:. . :. : .: .: : : : .: : CCDS30 GAGGGSGGGSGSSVASLT---PTAAHSGSHLFG-FPPTPPKEVSPDPST-TGAAS----- 150 160 170 180 190 110 120 130 140 150 pF1KB7 YPASTVCPTREDSPPQAVEDLDG-KGSTSFLETLKTER---LSPDLLTLGPALPSSLPVP :::. . : .. :: :: : ..:. :..: : : : : :.: . :.: CCDS30 -PASS---SAGGSAARG-EDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQPATHHPIP 200 210 220 230 240 160 170 180 190 200 210 pF1KB7 NSAYGGP----DFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPC-EARECVNCGATATPL . : :.:: .: : : . :. .:: :. : :.::::::::::::: CCDS30 TYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKAR--SCSEGRECVNCGATATPL 250 260 270 280 290 300 220 230 240 250 260 270 pF1KB7 WRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNAS :::: :::::::::::::::::::::::.::.:: ...:::: :.::::::::::::::. CCDS30 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNAN 310 320 330 340 350 360 280 290 300 310 320 330 pF1KB7 GDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK-KRGSSLGGTGAAEGPAGG :::::::::::::::.:::::::.:.:::::::: :.:.:: :.: : CCDS30 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKG------------AEC 370 380 390 400 410 340 350 360 370 380 390 pF1KB7 FMVVAGGSGSGNCGEVASGLTLGPPGTAHLYQGLGPVVLSGPVSH---LMPFPGPLLGSP : .. .: . :. : ..: : ..:: : :: ..: : :. : CCDS30 FEELS------KCMQEKSS----PFSAAALAGHMAPVGHLPPFSHSGHILPTPTPI--HP 420 430 440 450 460 400 410 pF1KB7 TGSFPTG-PMPPTTSTTVVAPLSS ..:. : : : . :.. CCDS30 SSSLSFGHPHPSSMVTAMG 470 480 >>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 (444 aa) initn: 777 init1: 725 opt: 789 Z-score: 607.6 bits: 121.5 E(32554): 1.6e-27 Smith-Waterman score: 795; 41.2% identity (61.2% similar) in 381 aa overlap (51-408:105-443) 30 40 50 60 70 pF1KB7 PALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSP-VFQVYP : ::. :. . . .. :: ..::: CCDS31 YPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYP 80 90 100 110 120 130 80 90 100 110 120 130 pF1KB7 LLNCMEGIPGG--SPYAGWAYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLK . .. :: ::. ... : : . : : : : .. :.. . : :: CCDS31 PASS-SSLSGGHASPHL-FTFPPT---PPKDVSPDPSLSTPGSA----GSARQDEKECLK 140 150 160 170 180 140 150 160 170 pF1KB7 TERLSPD------------LLTLGPALPSSLPVPNSAYGG--PDFSSTFFSPT----GSP . :: . .:: : :: : ..: :..:: .: :. ::: CCDS31 YQVPLPDSMKLESSHSRGSMTALGGA-SSSTHHPITTYPPYVPEYSSGLFPPSSLLGGSP 190 200 210 220 230 240 180 190 200 210 220 230 pF1KB7 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR . . : :: :.. :.:::::::::.::::::: :::::::::::::::::::: CCDS31 TGFGCKSRPKARSST-----EGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNR 250 260 270 280 290 240 250 260 270 280 290 pF1KB7 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK :::.::.:: ...::::.:.::::::::::::::.:::::::::::::::..::::::.: CCDS31 PLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKK 300 310 320 330 340 350 300 310 320 330 340 350 pF1KB7 DGIQTRNRKASGKGKK--KRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGP .:::::::: :.:.:: : .:: . : .. ...: CCDS31 EGIQTRNRKMSSKSKKCKKVHDSL-----EDFPKNS--------------------SFNP 360 370 380 390 360 370 380 390 400 410 pF1KB7 PGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS . .. ...:. . . ::.. : :. : .:. :: :.. .:.. CCDS31 AALSRHMSSLSHISPFSHSSHMLTTPTPM--HPPSSLSFGPHHPSSMVTAMG 400 410 420 430 440 >>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 (443 aa) initn: 771 init1: 719 opt: 781 Z-score: 601.6 bits: 120.4 E(32554): 3.4e-27 Smith-Waterman score: 787; 40.9% identity (60.9% similar) in 381 aa overlap (51-408:105-442) 30 40 50 60 70 pF1KB7 PALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSP-VFQVYP : ::. :. . . .. :: ..::: CCDS70 YPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYP 80 90 100 110 120 130 80 90 100 110 120 130 pF1KB7 LLNCMEGIPGG--SPYAGWAYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLK . .. :: ::. ... : : . : : : : .. :.. . : :: CCDS70 PASS-SSLSGGHASPHL-FTFPPT---PPKDVSPDPSLSTPGSA----GSARQDEKECLK 140 150 160 170 180 140 150 160 170 pF1KB7 TERLSPD------------LLTLGPALPSSLPVPNSAYGG--PDFSSTFFSPT----GSP . :: . .:: : :: : ..: :..:: .: :. ::: CCDS70 YQVPLPDSMKLESSHSRGSMTALGGA-SSSTHHPITTYPPYVPEYSSGLFPPSSLLGGSP 190 200 210 220 230 240 180 190 200 210 220 230 pF1KB7 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR . . : :: :.. .:::::::::.::::::: :::::::::::::::::::: CCDS70 TGFGCKSRPKARSST------GRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNR 250 260 270 280 290 240 250 260 270 280 290 pF1KB7 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK :::.::.:: ...::::.:.::::::::::::::.:::::::::::::::..::::::.: CCDS70 PLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKK 300 310 320 330 340 350 300 310 320 330 340 350 pF1KB7 DGIQTRNRKASGKGKK--KRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGP .:::::::: :.:.:: : .:: . : .. ...: CCDS70 EGIQTRNRKMSSKSKKCKKVHDSL-----EDFPKNS--------------------SFNP 360 370 380 390 360 370 380 390 400 410 pF1KB7 PGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS . .. ...:. . . ::.. : :. : .:. :: :.. .:.. CCDS70 AALSRHMSSLSHISPFSHSSHMLTTPTPM--HPPSSLSFGPHHPSSMVTAMG 400 410 420 430 440 >>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 (397 aa) initn: 720 init1: 633 opt: 701 Z-score: 542.1 bits: 109.2 E(32554): 7.1e-24 Smith-Waterman score: 721; 39.8% identity (58.7% similar) in 402 aa overlap (4-400:26-378) 10 20 30 pF1KB7 MEFPGLGSLGTSEPLPQFVDPALVSS--TPESGVFFPS :: :: :.:: :: : : . :: :: CCDS13 MYQSLALAASPRQAAYADSGSFLHAPGAGS-------PMFVPPARVPSMLSYLSGCE-PS 10 20 30 40 50 40 50 60 70 80 90 pF1KB7 GPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGW :. . :: .:::: ..:.. : : ..:. . : ::.. :: CCDS13 -PQPPELAARPGWAQTATADSSAFGPGSPHPPAAHPPGATAFPFAHSPSG-PGSGGSAG- 60 70 80 90 100 100 110 120 130 140 150 pF1KB7 AYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSL :. : ... : .. . : : .::. : . .::: CCDS13 --GRDGSAYQGALLPREQFAAP-----LGRPVGTSYSATYPA-YVSPD------------ 110 120 130 140 160 170 180 190 200 210 pF1KB7 PVPNSAYGGPDFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWR : .: .:: :... . : : .. : :. : :.:::::::: .::::: CCDS13 -VAQSWTAGP-FDGSVLH--GLPGRRPTFVSDFLEEF----PGEGRECVNCGALSTPLWR 150 160 170 180 190 200 220 230 240 250 260 270 pF1KB7 RDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGD :: ::::::::::::::::: ::::.::.::: :.::: ::::.::.:::::::. :. CCDS13 RDGTGHYLCNACGLYHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSEGE 210 220 230 240 250 260 280 290 300 310 320 330 pF1KB7 PVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMV :::::::::.::: : :::.:.:..::::.:: . .: :::: . .:. .:.. CCDS13 PVCNACGLYMKLHGVPRPLAMKKESIQTRKRKPKTIAKA-RGSSGSTRNASASPSA---- 270 280 290 300 310 340 350 360 370 380 390 pF1KB7 VAGGSGSGNCGEVASGLTLGP--PGTAHLYQGLGPVVLSGPVSHL-MPFPGPLLGSPTGS ::. ..:. ... .:. .: :: . :. : : .:: . : .. :. CCDS13 VASTDSSAATSKAKPSLA-SPVCPGPSMAPQASGQEDDSLAPGHLEFKFEPEDFAFPS-- 320 330 340 350 360 370 400 410 pF1KB7 FPTGPMPPTTSTTVVAPLSS :.: : CCDS13 --TAPSPQAGLRGALRQEAWCALALA 380 390 >>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 (443 aa) initn: 820 init1: 644 opt: 694 Z-score: 536.1 bits: 108.3 E(32554): 1.5e-23 Smith-Waterman score: 700; 36.4% identity (56.8% similar) in 426 aa overlap (39-404:3-423) 10 20 30 40 50 60 pF1KB7 LGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEA ..: ::. : : :.. :... : : CCDS78 MYQSLAMAANHGPPPGAYEAGGPGAFMHGAGA 10 20 30 70 80 90 100 110 120 pF1KB7 YRHSPVFQVYPL-------LNCMEGIPGGSPYAGWAYGKTGLYPASTVCP-TREDSPPQA :::. : :. ..: .:: .: . :..: :: . : :.. :: . CCDS78 AS-SPVYVPTPRVPSSVLGLSYLQGGGAGSASGGASGGSSG-GAASGAGPGTQQGSPGWS 40 50 60 70 80 90 130 140 150 160 pF1KB7 VEDLDGK-----------------GSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAY :: :: . . . : . . : : ..: . : CCDS78 QAGADGAAYTPPPVSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL-AGREQY 100 110 120 130 140 170 180 190 pF1KB7 GGPDFSSTFFSP-------TGSPLNSAA------YSSPKLRGTLP--LPPC--------- : :.... :: .:. .:: ..:: :. .:: : CCDS78 GRAGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLH-SLPGRANPAARHPNLVDM 150 160 170 180 190 200 200 210 220 230 240 250 pF1KB7 -----EARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRA :.:::::::: .::::::: ::::::::::::::::: :::::.:..:: .:.:. CCDS78 FDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRV 210 220 230 240 250 260 260 270 280 290 300 310 pF1KB7 GTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGK : .:.:::::::::::::: :.:::::::::.::: : :::.:::.:::::.:: .. .: CCDS78 GLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNK 270 280 290 300 310 320 320 330 340 350 360 pF1KB7 KKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEV-----ASGLTLGPPGTAHLYQGLGP .: .. .:. . ::.: .... ... :. ::. .. . : .. CCDS78 SKTPAAPSGS-ESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSV 330 340 350 360 370 380 370 380 390 400 410 pF1KB7 VVLSGPVSHLMPFPGPLLGSPTG-SFPTGPMPPTTSTTVVAPLSS ..:: . : . : :: : . :.. : :.: CCDS78 SAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA 390 400 410 420 430 440 >>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 (236 aa) initn: 852 init1: 644 opt: 687 Z-score: 534.7 bits: 107.1 E(32554): 1.8e-23 Smith-Waterman score: 687; 50.7% identity (73.0% similar) in 211 aa overlap (200-404:7-216) 170 180 190 200 210 220 pF1KB7 STFFSPTGSPLNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACG :.:::::::: .::::::: :::::::::: CCDS78 MFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACG 10 20 30 230 240 250 260 270 280 pF1KB7 LYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLH ::::::: :::::.:..:: .:.:.: .:.:::::::::::::: :.:::::::::.::: CCDS78 LYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLH 40 50 60 70 80 90 290 300 310 320 330 340 pF1KB7 QVNRPLTMRKDGIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEV : :::.:::.:::::.:: .. .:.: .. .:. . ::.: .... ... :. CCDS78 GVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGS-ESLPPASGASSNSSNATTSSSEEM 100 110 120 130 140 150 350 360 370 380 390 400 pF1KB7 -----ASGLTLGPPGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTG-SFPTGPMPPTT ::. .. . : .. ..:: . : . : :: : . :.. : :. CCDS78 RPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTS 160 170 180 190 200 210 410 pF1KB7 STTVVAPLSS : CCDS78 SKQDSWNSLVLADSHGDIITA 220 230 >>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 (442 aa) initn: 820 init1: 644 opt: 691 Z-score: 533.9 bits: 107.8 E(32554): 2e-23 Smith-Waterman score: 702; 36.5% identity (56.9% similar) in 425 aa overlap (39-404:3-422) 10 20 30 40 50 60 pF1KB7 LGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEA ..: ::. : : :.. :... : : CCDS59 MYQSLAMAANHGPPPGAYEAGGPGAFMHGAGA 10 20 30 70 80 90 100 110 120 pF1KB7 YRHSPVFQVYPL-------LNCMEGIPGGSPYAGWAYGKTGLYPASTVCP-TREDSPPQA :::. : :. ..: .:: .: . :..: :: . : :.. :: . CCDS59 AS-SPVYVPTPRVPSSVLGLSYLQGGGAGSASGGASGGSSG-GAASGAGPGTQQGSPGWS 40 50 60 70 80 90 130 140 150 160 pF1KB7 VEDLDGK-----------------GSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAY :: :: . . . : . . : : ..: . : CCDS59 QAGADGAAYTPPPVSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL-AGREQY 100 110 120 130 140 170 180 190 pF1KB7 GGPDFSSTFFSP-------TGSPLNSAA------YSSPKLRGTLP--LPPC--------- : :.... :: .:. .:: ..:: :. .:: : CCDS59 GRAGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLH-SLPGRANPAARHPNLDMF 150 160 170 180 190 200 200 210 220 230 240 250 pF1KB7 ----EARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAG :.:::::::: .::::::: ::::::::::::::::: :::::.:..:: .:.:.: CCDS59 DDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRVG 210 220 230 240 250 260 260 270 280 290 300 310 pF1KB7 TQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK .:.:::::::::::::: :.:::::::::.::: : :::.:::.:::::.:: .. .:. CCDS59 LSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKS 270 280 290 300 310 320 320 330 340 350 360 370 pF1KB7 KRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEV-----ASGLTLGPPGTAHLYQGLGPV : .. .:. . ::.: .... ... :. ::. .. . : .. CCDS59 KTPAAPSGS-ESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVS 330 340 350 360 370 380 380 390 400 410 pF1KB7 VLSGPVSHLMPFPGPLLGSPTG-SFPTGPMPPTTSTTVVAPLSS ..:: . : . : :: : . :.. : :.: CCDS59 AMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA 390 400 410 420 430 440 >>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 (595 aa) initn: 777 init1: 608 opt: 639 Z-score: 492.9 bits: 100.7 E(32554): 3.9e-21 Smith-Waterman score: 678; 36.9% identity (56.9% similar) in 385 aa overlap (35-412:234-588) 10 20 30 40 50 60 pF1KB7 GLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYR : : : :......:. : .::: .. CCDS11 HLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGGAAGGGAAGPGGAGSAAAHVSARF 210 220 230 240 250 260 70 80 90 100 110 pF1KB7 DAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGLYPASTVCPTREDSPPQ----- : :: :. : ::: :: . : :. ... . :: CCDS11 P---YSPSP-----PMANGAAREPGGYAAAG-SGGAGGVSGGGSSLAAMGGREPQYSSLS 270 280 290 300 310 120 130 140 150 160 170 pF1KB7 AVEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSP :.. :.: .. . . .. :. . . : . : . . : . : . : .:.: CCDS11 AARPLNG----TYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLHS-LQSRAGAP 320 330 340 350 360 180 190 200 210 220 230 pF1KB7 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR : : : : :.:::::::. ::::::: :::::::::::: :::: .: CCDS11 LPVPRGPSADLLEDLS----ESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSR 370 380 390 400 410 420 240 250 260 270 280 290 pF1KB7 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK :::.:.::. :.: : .:.::.::::::::::: :.:::::::::.::: : :::.:.: CCDS11 PLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKK 430 440 450 460 470 480 300 310 320 330 340 350 pF1KB7 DGIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPG .:::::.:: .. .:.: :. .... :. . .:.: .:.. .: : CCDS11 EGIQTRKRKPKNINKSKTCSGNSNNSIPMTPT------STSSNSDDCSKNTS------PT 490 500 510 520 530 360 370 380 390 400 410 pF1KB7 TAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGP--MPPTTSTTVVAPLSS : .: : :..: : . : : .. : :. :. : : : CCDS11 TQPTASGAGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALA 540 550 560 570 580 590 CCDS11 LA >>CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 (466 aa) initn: 685 init1: 343 opt: 440 Z-score: 344.6 bits: 72.9 E(32554): 7.1e-13 Smith-Waterman score: 745; 41.2% identity (58.3% similar) in 408 aa overlap (16-407:115-465) 10 20 30 40 pF1KB7 MEFPGLGSLGTSEPLPQFVDPALVSSTP--ESGVFFPSGPEGLDA : :.: :.:: :.. :.:: .. CCDS46 CRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP--FSKTPLHPSAAGGPGGPLSVYP 90 100 110 120 130 140 50 60 70 80 90 100 pF1KB7 AASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGL .:.. . . . ...:.:. . :. : .: .: : : : .: : CCDS46 GAGGGSGGGSGSSVASLT---PTAAHSGSHLFG-FPPTPPKEVSPDPST-TGAAS----- 150 160 170 180 190 110 120 130 140 150 pF1KB7 YPASTVCPTREDSPPQAVEDLDG-KGSTSFLETLKTER---LSPDLLTLGPALPSSLPVP :::. . : .. :: :: : ..:. :..: : : : : :.: . :.: CCDS46 -PASS---SAGGSAARG-EDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQPATHHPIP 200 210 220 230 240 160 170 180 190 200 210 pF1KB7 NSAYGGP----DFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPC-EARECVNCGATATPL . : :.:: .: : : . :. .:: :. : :.::::::::::::: CCDS46 TYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKAR--SCSEGRECVNCGATATPL 250 260 270 280 290 300 220 230 240 250 260 270 pF1KB7 WRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNAS :::: :::::::::::::::::::::::.::.:: :::::::::::. CCDS46 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRL--------------TTTTTLWRRNAN 310 320 330 340 350 280 290 300 310 320 330 pF1KB7 GDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK-KRGSSLGGTGAAEGPAGG :::::::::::::::.:::::::.:.:::::::: :.:.:: :.: : CCDS46 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKG------------AEC 360 370 380 390 340 350 360 370 380 390 pF1KB7 FMVVAGGSGSGNCGEVASGLTLGPPGTAHLYQGLGPVVLSGPVSH---LMPFPGPLLGSP : .. .: . :. : ..: : ..:: : :: ..: : :. : CCDS46 FEELS------KCMQEKSS----PFSAAALAGHMAPVGHLPPFSHSGHILPTPTPI--HP 400 410 420 430 440 400 410 pF1KB7 TGSFPTG-PMPPTTSTTVVAPLSS ..:. : : : . :.. CCDS46 SSSLSFGHPHPSSMVTAMG 450 460 413 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 21:36:01 2016 done: Fri Nov 4 21:36:02 2016 Total Scan time: 3.060 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]