FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8362, 443 aa 1>>>pF1KB8362 443 - 443 aa - 443 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.7969+/-0.000894; mu= -2.2156+/- 0.054 mean_var=228.1141+/-47.195, 0's: 0 Z-trim(115.3): 18 B-trim: 770 in 1/51 Lambda= 0.084918 statistics sampled from 15802 (15818) to 15802 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.797), E-opt: 0.2 (0.486), width: 16 Scan time: 3.100 The best scores are: opt bits E(32554) CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 ( 443) 3145 397.7 1.2e-110 CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 ( 444) 3133 396.2 3.4e-110 CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 ( 480) 1342 176.8 4e-44 CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX ( 413) 776 107.5 2.7e-23 CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 ( 397) 747 103.9 3e-22 CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 ( 442) 727 101.5 1.8e-21 CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 ( 443) 724 101.1 2.3e-21 CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 ( 236) 715 99.9 3e-21 CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 ( 595) 672 94.8 2.5e-19 CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 ( 466) 664 93.8 4e-19 >>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 (443 aa) initn: 3145 init1: 3145 opt: 3145 Z-score: 2099.9 bits: 397.7 E(32554): 1.2e-110 Smith-Waterman score: 3145; 99.8% identity (100.0% similar) in 443 aa overlap (1-443:1-443) 10 20 30 40 50 60 pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 GGSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 GGSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 IKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEG :::::::::::::::::::::::::::::::::::::::::::::.:::::::::::::: CCDS70 IKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 IQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 IQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPT 370 380 390 400 410 420 430 440 pF1KB8 PMHPPSSLSFGPHHPSSMVTAMG ::::::::::::::::::::::: CCDS70 PMHPPSSLSFGPHHPSSMVTAMG 430 440 >>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 (444 aa) initn: 2010 init1: 1849 opt: 3133 Z-score: 2091.9 bits: 396.2 E(32554): 3.4e-110 Smith-Waterman score: 3133; 99.5% identity (99.8% similar) in 444 aa overlap (1-443:1-444) 10 20 30 40 50 60 pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 GGSPTGFGCKSRPKARSST-GRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRP ::::::::::::::::::: :::::::::::::::::::::::::::::::::::::::: CCDS31 GGSPTGFGCKSRPKARSSTEGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRP 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB8 LIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKE ::::::::::::::::::::::::::::::::::::::::::::::.::::::::::::: CCDS31 LIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKE 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB8 GIQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GIQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTP 370 380 390 400 410 420 420 430 440 pF1KB8 TPMHPPSSLSFGPHHPSSMVTAMG :::::::::::::::::::::::: CCDS31 TPMHPPSSLSFGPHHPSSMVTAMG 430 440 >>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 (480 aa) initn: 1477 init1: 814 opt: 1342 Z-score: 905.6 bits: 176.8 E(32554): 4e-44 Smith-Waterman score: 1918; 62.3% identity (77.7% similar) in 485 aa overlap (1-443:1-480) 10 20 30 40 50 pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH :::. .::::..: :::::.::::.:::::.:.::. :: :.::::.:: .:.::: CCDS30 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN- 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGSH---HTASP :::.: ..: .. : :.: :.:.::: :::. .::::::::: : : .: CCDS30 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNP 60 70 80 90 100 110 120 130 140 150 pF1KB8 WNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFPP :..:::::: .: :.:: :::::: :...: .:. :.. ::: ::: CCDS30 WTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPP 120 130 140 150 160 170 160 170 180 190 200 pF1KB8 TPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTAL ::::.:::::: . .:.:. ::: : ..:. .:::: : .:::.::. : CCDS30 TPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLAT 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB8 GGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARS-STGREC :.. .::::: ::: ::: .:::::: :...::: ..: :.: :::: : :::: CCDS30 MGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGREC 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB8 VNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTT ::::::.::::::::::::::::::::::::::::::::::::::::::::: ::::::: CCDS30 VNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTT 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB8 TTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSLE ::::::::::::::::::::::.:::.:::::::::::::::::::.:::: :: . .: CCDS30 TTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFE 360 370 380 390 400 410 390 400 410 420 430 pF1KB8 DFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSSM .. : .: :. :::. ::. ..:. :::::.:.: ::::.:: :::::: ::::: CCDS30 ELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSM 420 430 440 450 460 470 440 pF1KB8 VTAMG ::::: CCDS30 VTAMG 480 >>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX (413 aa) initn: 766 init1: 714 opt: 776 Z-score: 531.8 bits: 107.5 E(32554): 2.7e-23 Smith-Waterman score: 782; 40.7% identity (60.9% similar) in 381 aa overlap (105-442:51-408) 80 90 100 110 120 130 pF1KB8 YPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYP : ::. :. . . .. :: ..::: CCDS14 PALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSP-VFQVYP 30 40 50 60 70 140 150 160 170 180 pF1KB8 PASS-SSLSGGHASPHL-FTFPPT---PPKDVSPDPSLSTPGSA----GSARQDEKECLK . .. :: ::. ... : : . : : : : .. :.. . : :: CCDS14 LLNCMEGIPGG--SPYAGWAYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLK 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB8 YQVPLPDSMKLESSHSRGSMTALGGA-SSSTHHPITTYPPYVPEYSSGLFPPSSLLGGSP . :: . .:: : :: : ..: :..:: .: :. ::: CCDS14 TERLSPD------------LLTLGPALPSSLPVPNSAYGG--PDFSSTFFSPT----GSP 140 150 160 170 250 260 270 280 290 pF1KB8 TGFGCKSRPKARSST------GRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNR . . : :: :.. .:::::::::.::::::: :::::::::::::::::::: CCDS14 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR 180 190 200 210 220 230 300 310 320 330 340 350 pF1KB8 PLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKK :::.::.:: ...::::.:.::::::::::::::.::::::::::::.::..::::::.: CCDS14 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK 240 250 260 270 280 290 360 370 380 390 pF1KB8 EGIQTRNRKMSSKSKKCKKVHDSL-----EDFPKNS--------------------SFNP .:::::::: :.:.: :: .:: . : .. ...: CCDS14 DGIQTRNRKASGKGK--KKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGP 300 310 320 330 340 350 400 410 420 430 440 pF1KB8 AALSRHMSSLSHISPFSHSSHMLTTPTPM--HPPSSLSFGPHHPSSMVTAMG . .. ...:. . . ::.. : :. : .:. :: :.. .:.. CCDS14 PGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS 360 370 380 390 400 410 >>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 (397 aa) initn: 889 init1: 651 opt: 747 Z-score: 512.9 bits: 103.9 E(32554): 3e-22 Smith-Waterman score: 747; 41.8% identity (61.8% similar) in 361 aa overlap (98-434:18-359) 70 80 90 100 110 120 pF1KB8 VRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSP------FSKTS :.:. : . ..:: . : .: : CCDS13 MYQSLALAASPRQAAYADSGSFLHAPGAGSPMFVPPARVPSMLSYLS 10 20 30 40 130 140 150 160 170 pF1KB8 IHHGSPGP--LSVYP----PASSSSLSGGHASPHLFTFPPTP-PKDVSPDP---SLSTPG . :: : :.. : :...: . : .::: ::. : .. : : : :: CCDS13 GCEPSPQPPELAARPGWAQTATADSSAFGPGSPH----PPAAHPPGATAFPFAHSPSGPG 50 60 70 80 90 100 180 190 200 210 220 230 pF1KB8 SAGSARQDEKECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSS :.::: .. :: : .. . .: :.: :. .: . : . ... CCDS13 SGGSA--GGRDGSAYQGALLPREQFAAPLGRPV-----GTSYSATYPAYVSPDVAQSWTA 110 120 130 140 150 240 250 260 270 280 pF1KB8 GLFPPSSLLG--GSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNACGL : : : : : : : .. . . ::::::::: :::::::::::::::::::: CCDS13 GPFDGSVLHGLPGRRPTF-VSDFLEEFPGEGRECVNCGALSTPLWRRDGTGHYLCNACGL 160 170 180 190 200 210 290 300 310 320 330 340 pF1KB8 YHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHN :::::: ::::..:..:::..:::: :.::.::.:::::::..:.:::::::::..::. CCDS13 YHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSEGEPVCNACGLYMKLHG 220 230 240 250 260 270 350 360 370 380 390 400 pF1KB8 INRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSS--LSHIS . :::.::::.::::.: : : :.. : .:.: .:.:.. :: :. . CCDS13 VPRPLAMKKESIQTRKR----KPKTIAKARGS-SGSTRNASASPSAVASTDSSAATSKAK 280 290 300 310 320 330 410 420 430 440 pF1KB8 PFSHSSHMLTTPTPMHPPSSL----SFGPHHPSSMVTAMG : : .: . :. : : .: :..: : CCDS13 P-SLASPVCPGPS-MAPQASGQEDDSLAPGHLEFKFEPEDFAFPSTAPSPQAGLRGALRQ 340 350 360 370 380 CCDS13 EAWCALALA 390 >>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 (442 aa) initn: 690 init1: 690 opt: 727 Z-score: 498.9 bits: 101.5 E(32554): 1.8e-21 Smith-Waterman score: 748; 40.6% identity (62.4% similar) in 362 aa overlap (94-436:51-395) 70 80 90 100 110 120 pF1KB8 YGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIH : .:.:: : :: :: . : . CCDS59 GGPGAFMHGAGAASSPVYVPTPRVPSSVLGLSYLQGGGA-GS---ASGGASGGSSGGAAS 30 40 50 60 70 130 140 150 160 170 180 pF1KB8 HGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKEC ..:: . : :... .:. .: ::. :. : . : ..:..: .: CCDS59 GAGPGTQQGSPGWSQAGADGAAYTP-----PPVSPRFSFPGTTGSLAAAAAAAAA--REA 80 90 100 110 120 190 200 210 220 230 240 pF1KB8 LKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLLGG- :. . ... . . ....:. :: : :: :. . ... .. .: CCDS59 AAYSSGGGAAGAGLAGREQYGRAGFAGSYSS---P---YPAYMADVGASWAAAAAASAGP 130 140 150 160 170 180 250 260 270 280 pF1KB8 --SPTGFGCKSR--PKARS---------STGRECVNCGATSTPLWRRDGTGHYLCNACGL ::. . .: : :: : ::::::::: :::::::::::::::::::: CCDS59 FDSPVLHSLPGRANPAARHPNLDMFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGL 190 200 210 220 230 240 290 300 310 320 330 340 pF1KB8 YHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHN :::::: :::::::.:::::.::.: :::::::::::::::::.:.:::::::::..::. CCDS59 YHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHG 250 260 270 280 290 300 350 360 370 380 390 400 pF1KB8 INRPLTMKKEGIQTRNRKMSSKSK-KCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISP . :::.:.:::::::.:: .. .: : . .. :..: :. . . . :: .. : CCDS59 VPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEMRP 310 320 330 340 350 360 410 420 430 440 pF1KB8 FSH----SSHMLTTPTPMHPPSSLSFGPHHPSSMVTAMG .. :::. . . . : ... : :: CCDS59 IKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSSK 370 380 390 400 410 420 CCDS59 QDSWNSLVLADSHGDIITA 430 440 >>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 (443 aa) initn: 690 init1: 690 opt: 724 Z-score: 496.9 bits: 101.1 E(32554): 2.3e-21 Smith-Waterman score: 746; 40.5% identity (62.3% similar) in 363 aa overlap (94-436:51-396) 70 80 90 100 110 120 pF1KB8 YGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIH : .:.:: : :: :: . : . CCDS78 GGPGAFMHGAGAASSPVYVPTPRVPSSVLGLSYLQGGGA-GS---ASGGASGGSSGGAAS 30 40 50 60 70 130 140 150 160 170 180 pF1KB8 HGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKEC ..:: . : :... .:. .: ::. :. : . : ..:..: .: CCDS78 GAGPGTQQGSPGWSQAGADGAAYTP-----PPVSPRFSFPGTTGSLAAAAAAAAA--REA 80 90 100 110 120 190 200 210 220 230 240 pF1KB8 LKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLLGG- :. . ... . . ....:. :: : :: :. . ... .. .: CCDS78 AAYSSGGGAAGAGLAGREQYGRAGFAGSYSS---P---YPAYMADVGASWAAAAAASAGP 130 140 150 160 170 180 250 260 270 280 pF1KB8 --SPTGFGCKSR--PKARS----------STGRECVNCGATSTPLWRRDGTGHYLCNACG ::. . .: : :: : ::::::::: ::::::::::::::::::: CCDS78 FDSPVLHSLPGRANPAARHPNLVDMFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACG 190 200 210 220 230 240 290 300 310 320 330 340 pF1KB8 LYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELH ::::::: :::::::.:::::.::.: :::::::::::::::::.:.:::::::::..:: CCDS78 LYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLH 250 260 270 280 290 300 350 360 370 380 390 400 pF1KB8 NINRPLTMKKEGIQTRNRKMSSKSK-KCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHIS .. :::.:.:::::::.:: .. .: : . .. :..: :. . . . :: .. CCDS78 GVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEMR 310 320 330 340 350 360 410 420 430 440 pF1KB8 PFSH----SSHMLTTPTPMHPPSSLSFGPHHPSSMVTAMG :.. :::. . . . : ... : :: CCDS78 PIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSS 370 380 390 400 410 420 CCDS78 KQDSWNSLVLADSHGDIITA 430 440 >>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 (236 aa) initn: 690 init1: 690 opt: 715 Z-score: 495.1 bits: 99.9 E(32554): 3e-21 Smith-Waterman score: 715; 58.7% identity (77.7% similar) in 184 aa overlap (258-436:6-189) 230 240 250 260 270 280 pF1KB8 EYSSGLFPPSSLLGGSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNAC : ::::::::: :::::::::::::::::: CCDS78 MFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNAC 10 20 30 290 300 310 320 330 340 pF1KB8 GLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYEL :::::::: :::::::.:::::.::.: :::::::::::::::::.:.:::::::::..: CCDS78 GLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKL 40 50 60 70 80 90 350 360 370 380 390 400 pF1KB8 HNINRPLTMKKEGIQTRNRKMSSKSK-KCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHI :.. :::.:.:::::::.:: .. .: : . .. :..: :. . . . :: .. CCDS78 HGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEM 100 110 120 130 140 150 410 420 430 440 pF1KB8 SPFSH----SSHMLTTPTPMHPPSSLSFGPHHPSSMVTAMG :.. :::. . . . : ... : :: CCDS78 RPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTS 160 170 180 190 200 210 CCDS78 SKQDSWNSLVLADSHGDIITA 220 230 >>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 (595 aa) initn: 726 init1: 634 opt: 672 Z-score: 460.6 bits: 94.8 E(32554): 2.5e-19 Smith-Waterman score: 711; 35.9% identity (57.2% similar) in 437 aa overlap (6-417:142-547) 10 20 30 pF1KB8 MEVTADQPRWVSHHHPAVLNGQHP---DTHHPGLS .::. . .. :.:..: : : :. CCDS11 LLLFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEM-YQTLAALSSQGPAAYDGAPGGFV 120 130 140 150 160 170 40 50 60 70 80 90 pF1KB8 HSYMDAAQYPLPEEVDVLFNIDGQGNHVP--PYYGNSVRATVQRYPPTHHGSQVCRPPLL :: :: : :. .: ::. .. . : .: :. .: CCDS11 HSAAAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSG----PANHAGGAGAHPGWP 180 190 200 210 220 100 110 120 130 140 pF1KB8 HGSL---PWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYPPASSSSLS--GGH ..: :. .:: : :. .:.: . . ... : .. : : :: .... ::. CCDS11 QASADSPPYGSGGGAAGGG-AAGPGGAG---SAAAHVSARFPYSPSPPMANGAAREPGGY 230 240 250 260 270 280 150 160 170 180 190 200 pF1KB8 ASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKECLKYQVPLPDSMKLESSHSRGSM :. :: : : . .: :. . :. :: ... . : . CCDS11 AAAG-----SGGAGGVSGGGS-SLAAMGG--REPQYSSLSAARPLNGTYHHHHHHHH--- 290 300 310 320 330 210 220 230 240 250 pF1KB8 TALGGASSSTHHPITTYPPYV-----PEYSSGLFP-P--SSLLGGSPTGFGCKSRPKARS ::: . : ::: : . .: : : :: . . . . :.: CCDS11 ----------HHP-SPYSPYVGAPLTPAWPAGPFETPVLHSLQSRAGAPLPVPRGPSADL 340 350 360 370 380 260 270 280 290 300 310 pF1KB8 ----STGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA : .:::::::. .:::::::::::::::::::: :::: .::::::..:. ..:: CCDS11 LEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRL 390 400 410 420 430 440 320 330 340 350 360 370 pF1KB8 GTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEGIQTRNRKMSS--K : :::::.:::::::::::.:.:::::::::..::.. :::.:::::::::.:: .. : CCDS11 GLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINK 450 460 470 480 490 500 380 390 400 410 420 430 pF1KB8 SKKCK-KVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSF :: :. . ..:. : ..: : :.. : .. . . .. ..: CCDS11 SKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSEL 510 520 530 540 550 560 440 pF1KB8 GPHHPSSMVTAMG CCDS11 KYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA 570 580 590 >>CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 (466 aa) initn: 1117 init1: 365 opt: 664 Z-score: 456.9 bits: 93.8 E(32554): 4e-19 Smith-Waterman score: 1789; 59.6% identity (75.1% similar) in 485 aa overlap (1-443:1-466) 10 20 30 40 50 pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH :::. .::::..: :::::.::::.:::::.:.::. :: :.::::.:: .:.::: CCDS46 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN- 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGSH---HTASP :::.: ..: .. : :.: :.:.::: :::. .::::::::: : : .: CCDS46 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNP 60 70 80 90 100 110 120 130 140 150 pF1KB8 WNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFPP :..:::::: .: :.:: :::::: :...: .:. :.. ::: ::: CCDS46 WTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPP 120 130 140 150 160 170 160 170 180 190 200 pF1KB8 TPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTAL ::::.:::::: . .:.:. ::: : ..:. .:::: : .:::.::. : CCDS46 TPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLAT 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB8 GGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARS-STGREC :.. .::::: ::: ::: .:::::: :...::: ..: :.: :::: : :::: CCDS46 MGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGREC 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB8 VNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTT ::::::.::::::::::::::::::::::::::::::::::::: :: CCDS46 VNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRL--------------TT 300 310 320 330 340 330 340 350 360 370 380 pF1KB8 TTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSLE ::::::::::::::::::::::.:::.:::::::::::::::::::.:::: :: . .: CCDS46 TTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFE 350 360 370 380 390 400 390 400 410 420 430 pF1KB8 DFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSSM .. : .: :. :::. ::. ..:. :::::.:.: ::::.:: :::::: ::::: CCDS46 ELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSM 410 420 430 440 450 460 440 pF1KB8 VTAMG ::::: CCDS46 VTAMG 443 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 12:09:39 2016 done: Fri Nov 4 12:09:39 2016 Total Scan time: 3.100 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]