FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7730, 480 aa 1>>>pF1KB7730 480 - 480 aa - 480 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.2541+/-0.000846; mu= -3.1783+/- 0.051 mean_var=267.1429+/-56.121, 0's: 0 Z-trim(116.2): 22 B-trim: 0 in 0/52 Lambda= 0.078470 statistics sampled from 16793 (16813) to 16793 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.807), E-opt: 0.2 (0.516), width: 16 Scan time: 3.050 The best scores are: opt bits E(32554) CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 ( 480) 3401 397.8 1.3e-110 CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 ( 466) 2446 289.7 4.5e-78 CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 ( 444) 1362 167.0 3.8e-41 CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 ( 443) 1347 165.3 1.2e-40 CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 ( 443) 855 109.6 7.2e-24 CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 ( 442) 846 108.5 1.5e-23 CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX ( 413) 830 106.7 4.9e-23 CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 ( 595) 768 99.8 8.4e-21 CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 ( 236) 730 95.2 7.9e-20 CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 ( 397) 722 94.5 2.3e-19 >>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 (480 aa) initn: 3401 init1: 3401 opt: 3401 Z-score: 2099.2 bits: 397.8 E(32554): 1.3e-110 Smith-Waterman score: 3401; 100.0% identity (100.0% similar) in 480 aa overlap (1-480:1-480) 10 20 30 40 50 60 pF1KB7 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLW 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG 430 440 450 460 470 480 >>CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 (466 aa) initn: 2573 init1: 2417 opt: 2446 Z-score: 1515.1 bits: 289.7 E(32554): 4.5e-78 Smith-Waterman score: 3258; 97.1% identity (97.1% similar) in 480 aa overlap (1-480:1-466) 10 20 30 40 50 60 pF1KB7 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLW ::::::::::::::::::::::::::::::::::::::: ::::::: CCDS46 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRL--------------TTTTTLW 310 320 330 340 370 380 390 400 410 420 pF1KB7 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB7 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG 410 420 430 440 450 460 >>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 (444 aa) initn: 1622 init1: 930 opt: 1362 Z-score: 852.2 bits: 167.0 E(32554): 3.8e-41 Smith-Waterman score: 1938; 62.6% identity (78.0% similar) in 486 aa overlap (1-480:1-444) 10 20 30 40 50 pF1KB7 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN- :::. .::::..: :::::.::::.:::::.:.::. :: :.::::.:: .:.::: CCDS31 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHH-N :::.: ..: .. : :.: :.:.::: :::. .::::::::: : :: . CCDS31 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGS----HHTAS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 PWTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFP ::..:::::: .: :.:: :::::: :...: .:. :.. ::: :: CCDS31 PWNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFP 120 130 140 150 180 190 200 210 220 230 pF1KB7 PTPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLA :::::.:::::: . .:.:. ::: : ..:. .:::: : .:::.::. : CCDS31 PTPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTA 160 170 180 190 200 240 250 260 270 280 290 pF1KB7 TMGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRE :.. .::::: ::: ::: .:::::: :...::: ..: :.: :::: .:::: CCDS31 LGGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARSSTEGRE 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB7 CVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQT :::::::.::::::::::::::::::::::::::::::::::::::::::::: :::::: CCDS31 CVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQT 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB7 TTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECF :::::::::::::::::::::::::::.:::::::::::::::::::.:::: :: . . CCDS31 TTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSL 330 340 350 360 370 380 420 430 440 450 460 470 pF1KB7 EELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSS :.. : .: :. :::. ::. ..:. :::::.:.: ::::.:: :::::: :::: CCDS31 EDFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSS 390 400 410 420 430 480 pF1KB7 MVTAMG :::::: CCDS31 MVTAMG 440 >>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 (443 aa) initn: 1482 init1: 819 opt: 1347 Z-score: 843.0 bits: 165.3 E(32554): 1.2e-40 Smith-Waterman score: 1923; 62.6% identity (77.8% similar) in 486 aa overlap (1-480:1-443) 10 20 30 40 50 pF1KB7 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN- :::. .::::..: :::::.::::.:::::.:.::. :: :.::::.:: .:.::: CCDS70 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHH-N :::.: ..: .. : :.: :.:.::: :::. .::::::::: : :: . CCDS70 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGS----HHTAS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 PWTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFP ::..:::::: .: :.:: :::::: :...: .:. :.. ::: :: CCDS70 PWNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFP 120 130 140 150 180 190 200 210 220 230 pF1KB7 PTPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLA :::::.:::::: . .:.:. ::: : ..:. .:::: : .:::.::. : CCDS70 PTPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTA 160 170 180 190 200 240 250 260 270 280 290 pF1KB7 TMGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRE :.. .::::: ::: ::: .:::::: :...::: ..: :.: :::: : ::: CCDS70 LGGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARS-STGRE 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB7 CVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQT :::::::.::::::::::::::::::::::::::::::::::::::::::::: :::::: CCDS70 CVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQT 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB7 TTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECF :::::::::::::::::::::::::::.:::::::::::::::::::.:::: :: . . CCDS70 TTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSL 330 340 350 360 370 380 420 430 440 450 460 470 pF1KB7 EELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSS :.. : .: :. :::. ::. ..:. :::::.:.: ::::.:: :::::: :::: CCDS70 EDFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSS 390 400 410 420 430 480 pF1KB7 MVTAMG :::::: CCDS70 MVTAMG 440 >>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 (443 aa) initn: 802 init1: 704 opt: 855 Z-score: 542.0 bits: 109.6 E(32554): 7.2e-24 Smith-Waterman score: 855; 43.4% identity (64.0% similar) in 403 aa overlap (93-472:15-399) 70 80 90 100 110 120 pF1KB7 PAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSPFS :: . :: .:. .:. .: : : CCDS78 MYQSLAMAANHGPPPG-AYEAGGPGAFMHGAGAASSPVYV-P-- 10 20 30 40 130 140 150 160 170 pF1KB7 KTPLHPSAAGG-----PGGPLSVYPGAGGGSGGGSGSSVASLT----PTAAHSGSHLFGF :: ::.. : :: :. ::.:::.::..:... : : ...:. .. CCDS78 -TPRVPSSVLGLSYLQGGGAGSASGGASGGSSGGAASGAGPGTQQGSPGWSQAGADGAAY 50 60 70 80 90 180 190 200 210 220 230 pF1KB7 PPTPPKEVSPD---PSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLR : :: ::: :.:::. . :...:.. : . .. : ..: . . . : : CCDS78 TP-PP--VSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL--AGREQYG---R 100 110 120 130 140 150 240 250 260 270 280 pF1KB7 PGLATMGTQPATHHPIPTYPSYVPAAAHD---YSSGLFH--PGGFLGGPASSFTPKQRSK :.: ..: . . :.. ::: . ..: ..: :: ..::. :. . CCDS78 AGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLHSLPG--RANPAARH-PNLVDM 160 170 180 190 200 290 300 310 320 330 340 pF1KB7 ARSCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA . ::::::::::: .::::::::::::::::::::::::: :::::::.:::::.::. CCDS78 FDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRV 210 220 230 240 250 260 350 360 370 380 390 400 pF1KB7 GTCCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK : ::::::::::::::::.:.:::::::::.:::.: :::.:.:::::::.:: .: .: CCDS78 GLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNK 270 280 290 300 310 320 410 420 430 440 450 460 pF1KB7 KSKKGAECFEELSKCMQEKSSPFSAAALAG--HMAPVGHLPPFS-HSGHILPTPTPIHPS .. .: : . :: : :. .. .: :. : .: : :: . . CCDS78 SKTPAAPSGSESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHS-SSVSQTFSV 330 340 350 360 370 380 470 480 pF1KB7 SSLSFGH-P--HPSSMVTAMG :..: :: : :: CCDS78 SAMS-GHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA 390 400 410 420 430 440 >>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 (442 aa) initn: 794 init1: 704 opt: 846 Z-score: 536.5 bits: 108.5 E(32554): 1.5e-23 Smith-Waterman score: 846; 43.4% identity (64.0% similar) in 403 aa overlap (93-472:15-398) 70 80 90 100 110 120 pF1KB7 PAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSPFS :: . :: .:. .:. .: : : CCDS59 MYQSLAMAANHGPPPG-AYEAGGPGAFMHGAGAASSPVYV-P-- 10 20 30 40 130 140 150 160 170 pF1KB7 KTPLHPSAAGG-----PGGPLSVYPGAGGGSGGGSGSSVASLT----PTAAHSGSHLFGF :: ::.. : :: :. ::.:::.::..:... : : ...:. .. CCDS59 -TPRVPSSVLGLSYLQGGGAGSASGGASGGSSGGAASGAGPGTQQGSPGWSQAGADGAAY 50 60 70 80 90 180 190 200 210 220 230 pF1KB7 PPTPPKEVSPD---PSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLR : :: ::: :.:::. . :...:.. : . .. : ..: . . . : : CCDS59 TP-PP--VSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL--AGREQYG---R 100 110 120 130 140 150 240 250 260 270 280 pF1KB7 PGLATMGTQPATHHPIPTYPSYVPAAAHD---YSSGLFH--PGGFLGGPASSFTPKQRSK :.: ..: . . :.. ::: . ..: ..: :: ..::. :. . CCDS59 AGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLHSLPG--RANPAARH-PNL-DM 160 170 180 190 200 290 300 310 320 330 340 pF1KB7 ARSCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA . ::::::::::: .::::::::::::::::::::::::: :::::::.:::::.::. CCDS59 FDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRV 210 220 230 240 250 260 350 360 370 380 390 400 pF1KB7 GTCCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK : ::::::::::::::::.:.:::::::::.:::.: :::.:.:::::::.:: .: .: CCDS59 GLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNK 270 280 290 300 310 320 410 420 430 440 450 460 pF1KB7 KSKKGAECFEELSKCMQEKSSPFSAAALAG--HMAPVGHLPPFS-HSGHILPTPTPIHPS .. .: : . :: : :. .. .: :. : .: : :: . . CCDS59 SKTPAAPSGSESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHS-SSVSQTFSV 330 340 350 360 370 380 470 480 pF1KB7 SSLSFGH-P--HPSSMVTAMG :..: :: : :: CCDS59 SAMS-GHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA 390 400 410 420 430 440 >>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX (413 aa) initn: 956 init1: 724 opt: 830 Z-score: 527.1 bits: 106.7 E(32554): 4.9e-23 Smith-Waterman score: 846; 43.1% identity (61.3% similar) in 408 aa overlap (115-479:16-407) 90 100 110 120 130 140 pF1KB7 CRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP--FSKTPLHPSAAGGPGGPLSVYP : :.: :.:: :.. :.:: .. CCDS14 MEFPGLGSLGTSEPLPQFVDPALVSSTP--ESGVFFPSGPEGLDA 10 20 30 40 150 160 170 180 190 pF1KB7 GAGGGSGGGSGSSVASLT---PTAAHSGSHLFG-FPPTPPKEVSPDPST-TGAAS----- .:.. . . . ...:.:. . :. : .: .: : : : .: : CCDS14 AASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGL 50 60 70 80 90 100 200 210 220 230 240 pF1KB7 -PASS---SAGGSAARG-EDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQPATHHPIP :::. . : .. :: :: : ..:. :..: : : : : :.: . :.: CCDS14 YPASTVCPTREDSPPQAVEDLDG-KGSTSFLETLKTER---LSPDLLTLGPALPSSLPVP 110 120 130 140 150 250 260 270 280 290 300 pF1KB7 TYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKAR--SCSEGRECVNCGATATPL . : :.:: .: : : . :. .:: :. : :.::::::::::::: CCDS14 NSAYGGP----DFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPC-EARECVNCGATATPL 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB7 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNAN :::: :::::::::::::::::::::::.::.:: ...:::: :.::::::::::::::. CCDS14 WRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNAS 220 230 240 250 260 270 370 380 390 400 410 pF1KB7 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKG------------AEC :::::::::::::::.:::::::.:.:::::::: :.:.:: :.: : CCDS14 GDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK-KRGSSLGGTGAAEGPAGG 280 290 300 310 320 330 420 430 440 450 460 pF1KB7 FEELS------KCMQEKSS----PFSAAALAGHMAPVGHLPPFSHSGHILPTPTPI--HP : .. .: . :. : ..: : ..:: : : :..: : :. : CCDS14 FMVVAGGSGSGNCGEVASGLTLGPPGTAHLYQGLGPVVLSGPVS---HLMPFPGPLLGSP 340 350 360 370 380 390 470 480 pF1KB7 SSSLSFGHPHPSSMVTAMG ..:. : : : . :.. CCDS14 TGSFPTG-PMPPTTSTTVVAPLSS 400 410 >>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 (595 aa) initn: 756 init1: 648 opt: 768 Z-score: 486.9 bits: 99.8 E(32554): 8.4e-21 Smith-Waterman score: 781; 40.9% identity (60.7% similar) in 394 aa overlap (42-410:144-506) 20 30 40 50 60 pF1KB7 AHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY----------A :.:. . :.::: : : CCDS11 LFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSA 120 130 140 150 160 170 70 80 90 100 110 pF1KB7 NPAHARARVSYSPAHARLTG-GQMCRPHLLHSPGLPW-LDGGKA--ALSAAAAHHHNPWT : : : .. ::... : :.: ::::. :.:. . : :..: : : CCDS11 AAAAAAAAAASSPVYVPTTRVGSML-------PGLPYHLQGSGSGPANHAGGAGAHPGW- 180 190 200 210 220 120 130 140 150 160 170 pF1KB7 VSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTP : ... : ..:: . ::::..: .:.. : ::: ... : . :.: CCDS11 --PQASADSPPYGSGGGA--------AGGGAAGPGGAGSA-----AAHVSAR-FPYSPSP 230 240 250 260 180 190 200 210 220 230 pF1KB7 PKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMG : . : :. .:..::: .. : . .. . :.. .. :: : CCDS11 PMANGAAREPGGYAAAGSGGAGGVSGGGSSLAAMGGREPQYSSLS--AARPLN-GTYHHH 270 280 290 300 310 320 240 250 260 270 280 pF1KB7 TQPATHHPIPTYPSYV-----PA-AAHDYSSGLFHPGGFLGGPASSFTPKQRSKA----R . ::: : : :: :: : . . ..: : . :.. : :. . . CCDS11 HHHHHHHPSP-YSPYVGAPLTPAWPAGPFETPVLHS---LQSRAGAPLPVPRGPSADLLE 330 340 350 360 370 380 290 300 310 320 330 340 pF1KB7 SCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGT . ::.:::::::. :::::::::::::::::::: :::: .::::::..:. ..:: : CCDS11 DLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGL 390 400 410 420 430 440 350 360 370 380 390 400 pF1KB7 CCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK-K ::::.:::::::::::.:.:::::::::.:::.: :::.:::::::::.:: .: .: : CCDS11 SCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSK 450 460 470 480 490 500 410 420 430 440 450 460 pF1KB7 SKKGAECFEELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLS . .: CCDS11 TCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSELKY 510 520 530 540 550 560 >>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 (236 aa) initn: 748 init1: 704 opt: 730 Z-score: 469.5 bits: 95.2 E(32554): 7.9e-20 Smith-Waterman score: 730; 61.4% identity (75.7% similar) in 189 aa overlap (290-472:6-192) 260 270 280 290 300 310 pF1KB7 YSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGATATPLWRRDGTGHYLCNAC ::::::::::: .::::::::::::::::: CCDS78 MFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNAC 10 20 30 320 330 340 350 360 370 pF1KB7 GLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNANGDPVCNACGLYYKL :::::::: :::::::.:::::.::.: ::::::::::::::::.:.:::::::::.:: CCDS78 GLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKL 40 50 60 70 80 90 380 390 400 410 420 430 pF1KB7 HNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKCMQEKSSPFSAAALAG--HM :.: :::.:.:::::::.:: .: .:.. .: : . :: : :. .. .: CCDS78 HGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEM 100 110 120 130 140 150 440 450 460 470 480 pF1KB7 APVGHLPPFS-HSGHILPTPTPIHPSSSLSFGH-P--HPSSMVTAMG :. : .: : :: . . :..: :: : :: CCDS78 RPIKTEPGLSSHYGHS-SSVSQTFSVSAMS-GHGPSIHPVLSALKLSPQGYASPVSQSPQ 160 170 180 190 200 210 CCDS78 TSSKQDSWNSLVLADSHGDIITA 220 230 >>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 (397 aa) initn: 736 init1: 671 opt: 722 Z-score: 461.3 bits: 94.5 E(32554): 2.3e-19 Smith-Waterman score: 786; 41.5% identity (64.5% similar) in 369 aa overlap (102-464:13-348) 80 90 100 110 120 130 pF1KB7 YSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSPFSKTPLH-PSA .:: . ... : : . ::. : . :: CCDS13 MYQSLALAASPRQAAYADSGSFLHAPGAGSPMFVPPARVPSM 10 20 30 40 140 150 160 170 180 pF1KB7 AGGPGG--PLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKEVSPDPSTT . .: : : : .. : . ...:. .: :: : :: : .. CCDS13 LSYLSGCEP-SPQPPELAARPGWAQTATAD--SSAFGPGS------PHPPAAHPPGATAF 50 60 70 80 90 190 200 210 220 230 240 pF1KB7 G-AASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPL-RPGLATMGTQPATHHPI : ::.. ..::::. .:: :: .: . . ..:: :: .::. .. CCDS13 PFAHSPSGPGSGGSAG---GRDGSAYQGALLP--REQFAAPLGRP----VGTSYSA---- 100 110 120 130 140 250 260 270 280 290 300 pF1KB7 PTYPSYV-PAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGATATPL :::.:: : .:.....: : . . : :. : . . .:::::::::: .::: CCDS13 -TYPAYVSPDVAQSWTAGPFDGSVLHGLPGRRPTFVSDFLEEFPGEGRECVNCGALSTPL 150 160 170 180 190 310 320 330 340 350 360 pF1KB7 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNAN :::::::::::::::::::::: ::::..:..:::..:::: ::.::.::.:::::::.. CCDS13 WRRDGTGHYLCNACGLYHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSE 200 210 220 230 240 250 370 380 390 400 410 420 pF1KB7 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKCMQEKS :.:::::::::.:::.: :::.::::.::::.:: :. . .:. : .. : CCDS13 GEPVCNACGLYMKLHGVPRPLAMKKESIQTRKRK--PKTIAKARGS------SGSTRNAS 260 270 280 290 300 310 430 440 450 460 470 480 pF1KB7 SPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG . ::.: . : ... : : .. . : :. . :..: CCDS13 ASPSAVASTDSSAATSKAKP-SLASPVCPGPS-MAPQASGQEDDSLAPGHLEFKFEPEDF 320 330 340 350 360 CCDS13 AFPSTAPSPQAGLRGALRQEAWCALALA 370 380 390 480 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 09:17:12 2016 done: Fri Nov 4 09:17:12 2016 Total Scan time: 3.050 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]