FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4367, 1124 aa 1>>>pF1KB4367 1124 - 1124 aa - 1124 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.2145+/-0.00118; mu= -8.0253+/- 0.071 mean_var=465.7472+/-96.890, 0's: 0 Z-trim(114.3): 754 B-trim: 0 in 0/54 Lambda= 0.059429 statistics sampled from 14012 (14849) to 14012 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.747), E-opt: 0.2 (0.456), width: 16 Scan time: 6.030 The best scores are: opt bits E(32554) CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10 (1124) 7521 660.4 6.5e-189 CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10 (1125) 7501 658.7 2.1e-188 CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10 (1108) 7360 646.6 9.2e-185 CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10 (1057) 6922 609.0 1.8e-173 CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10 (1104) 6813 599.7 1.2e-170 CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2 (1190) 1071 107.4 2e-22 CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2 (1214) 1071 107.4 2e-22 >>CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10 (1124 aa) initn: 7521 init1: 7521 opt: 7521 Z-score: 3505.1 bits: 660.4 E(32554): 6.5e-189 Smith-Waterman score: 7521; 100.0% identity (100.0% similar) in 1124 aa overlap (1-1124:1-1124) 10 20 30 40 50 60 pF1KB4 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 LPTDQTVLPGRSSEREGNAKNCWEDDRKEGQEILGPEAQADEAGCTVKDDECESDAENEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 LPTDQTVLPGRSSEREGNAKNCWEDDRKEGQEILGPEAQADEAGCTVKDDECESDAENEQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 NHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 NHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGYK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 RFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 RFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRKF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 KCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 KCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 RPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 RPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIVV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 ASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 ASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVAV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 DGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 DGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSLE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 QPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 QPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPGD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 INALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 INALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYY 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB4 ALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 ALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNND 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB4 QPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 QPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB4 YTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 YTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQKD 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB4 SCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 SCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQ 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB4 VAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 VAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTE 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB4 NGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 NGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPY 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB4 QCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 QCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQG 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB4 DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS71 DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEEA 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 pF1KB4 ENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA :::::::::::::::::::::::::::::::::::::::::::: CCDS71 ENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA 1090 1100 1110 1120 >>CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10 (1125 aa) initn: 6925 init1: 6925 opt: 7501 Z-score: 3495.8 bits: 658.7 E(32554): 2.1e-188 Smith-Waterman score: 7501; 99.8% identity (99.8% similar) in 1125 aa overlap (1-1124:1-1125) 10 20 30 40 50 60 pF1KB4 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD 10 20 30 40 50 60 70 80 90 100 110 pF1KB4 LPTDQTVLPGRSSEREGNAKNCWEDDR-KEGQEILGPEAQADEAGCTVKDDECESDAENE :::::::::::::::::::::::::: :::::::::::::::::::::::::::::::: CCDS53 LPTDQTVLPGRSSEREGNAKNCWEDDTGKEGQEILGPEAQADEAGCTVKDDECESDAENE 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB4 QNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGY 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB4 KRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRK 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB4 FKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 FKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVN 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB4 GRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIV 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB4 VASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVA 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB4 VDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSL 430 440 450 460 470 480 480 490 500 510 520 530 pF1KB4 EQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPG 490 500 510 520 530 540 540 550 560 570 580 590 pF1KB4 DINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAY 550 560 570 580 590 600 600 610 620 630 640 650 pF1KB4 YALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 YALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNN 610 620 630 640 650 660 660 670 680 690 700 710 pF1KB4 DQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGY 670 680 690 700 710 720 720 730 740 750 760 770 pF1KB4 LYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 LYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQK 730 740 750 760 770 780 780 790 800 810 820 830 pF1KB4 DSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIP 790 800 810 820 830 840 840 850 860 870 880 890 pF1KB4 QVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKT 850 860 870 880 890 900 900 910 920 930 940 950 pF1KB4 ENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKP 910 920 930 940 950 960 960 970 980 990 1000 1010 pF1KB4 YQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 YQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQ 970 980 990 1000 1010 1020 1020 1030 1040 1050 1060 1070 pF1KB4 GDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEE 1030 1040 1050 1060 1070 1080 1080 1090 1100 1110 1120 pF1KB4 AENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA ::::::::::::::::::::::::::::::::::::::::::::: CCDS53 AENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA 1090 1100 1110 1120 >>CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10 (1108 aa) initn: 6925 init1: 6925 opt: 7360 Z-score: 3430.5 bits: 646.6 E(32554): 9.2e-185 Smith-Waterman score: 7360; 99.8% identity (99.8% similar) in 1106 aa overlap (20-1124:3-1108) 10 20 30 40 50 60 pF1KB4 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD ::::::::::::::::::::::::::::::::::::::::: CCDS44 MKVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD 10 20 30 40 70 80 90 100 110 pF1KB4 LPTDQTVLPGRSSEREGNAKNCWEDDR-KEGQEILGPEAQADEAGCTVKDDECESDAENE :::::::::::::::::::::::::: :::::::::::::::::::::::::::::::: CCDS44 LPTDQTVLPGRSSEREGNAKNCWEDDTGKEGQEILGPEAQADEAGCTVKDDECESDAENE 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB4 QNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGY 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB4 KRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 KRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRK 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB4 FKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVN 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB4 GRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIV 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB4 VASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVA 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB4 VDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSL 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB4 EQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPG 470 480 490 500 510 520 540 550 560 570 580 590 pF1KB4 DINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAY 530 540 550 560 570 580 600 610 620 630 640 650 pF1KB4 YALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 YALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNN 590 600 610 620 630 640 660 670 680 690 700 710 pF1KB4 DQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGY 650 660 670 680 690 700 720 730 740 750 760 770 pF1KB4 LYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQK 710 720 730 740 750 760 780 790 800 810 820 830 pF1KB4 DSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIP 770 780 790 800 810 820 840 850 860 870 880 890 pF1KB4 QVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKT 830 840 850 860 870 880 900 910 920 930 940 950 pF1KB4 ENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKP 890 900 910 920 930 940 960 970 980 990 1000 1010 pF1KB4 YQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 YQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQ 950 960 970 980 990 1000 1020 1030 1040 1050 1060 1070 pF1KB4 GDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEE 1010 1020 1030 1040 1050 1060 1080 1090 1100 1110 1120 pF1KB4 AENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA ::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA 1070 1080 1090 1100 >>CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10 (1057 aa) initn: 6920 init1: 6920 opt: 6922 Z-score: 3227.9 bits: 609.0 E(32554): 1.8e-173 Smith-Waterman score: 6922; 98.7% identity (99.2% similar) in 1055 aa overlap (70-1124:4-1057) 40 50 60 70 80 90 pF1KB4 HIVEEESVTDAADCEGVPEDDLPTDQTVLPGRSSEREGNAKNCWEDDRKEGQEILGPEAQ : .:. .: : ... :::::::::::: CCDS53 MADGPRCKRRKQA-NPRRNNGKEGQEILGPEAQ 10 20 30 100 110 120 130 140 150 pF1KB4 ADEAGCTVKDDECESDAENEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ADEAGCTVKDDECESDAENEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDE 40 50 60 70 80 90 160 170 180 190 200 210 pF1KB4 NGTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 NGTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHM 100 110 120 130 140 150 220 230 240 250 260 270 pF1KB4 TSHKSGRDQRHVTQSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TSHKSGRDQRHVTQSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSH 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB4 SGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQE 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB4 QLSVNQIKTEPVDYEFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QLSVNQIKTEPVDYEFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTV 280 290 300 310 320 330 400 410 420 430 440 450 pF1KB4 GLVSPISINLSDIQNVLKVAVDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GLVSPISINLSDIQNVLKVAVDGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISA 340 350 360 370 380 390 460 470 480 490 500 510 pF1KB4 ISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKD 400 410 420 430 440 450 520 530 540 550 560 570 pF1KB4 KSFEGGVNDSTCLLCDDCPGDINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KSFEGGVNDSTCLLCDDCPGDINALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGD 460 470 480 490 500 510 580 590 600 610 620 630 pF1KB4 GNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV 520 530 540 550 560 570 640 650 660 670 680 690 pF1KB4 QSSEPSSPEPGKVNIPAKNNDQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QSSEPSSPEPGKVNIPAKNNDQPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSR 580 590 600 610 620 630 700 710 720 730 740 750 pF1KB4 SSTPSPSPLNLSSSRNTQGYLYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SSTPSPSPLNLSSSRNTQGYLYTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNS 640 650 660 670 680 690 760 770 780 790 800 810 pF1KB4 VYSVQEEPLNLSCAKKEPQKDSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VYSVQEEPLNLSCAKKEPQKDSCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIAD 700 710 720 730 740 750 820 830 840 850 860 870 pF1KB4 QNSVPCLRALAANKQTILIPQVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QNSVPCLRALAANKQTILIPQVAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVS 760 770 780 790 800 810 880 890 900 910 920 930 pF1KB4 NVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 NVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKK 820 830 840 850 860 870 940 950 960 970 980 990 pF1KB4 AFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 AFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE 880 890 900 910 920 930 1000 1010 1020 1030 1040 1050 pF1KB4 EAGPEILSNEHVGARASPSQGDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EAGPEILSNEHVGARASPSQGDSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKP 940 950 960 970 980 990 1060 1070 1080 1090 1100 1110 pF1KB4 QGDEEEEEEEEEVEEEEVEEAENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QGDEEEEEEEEEVEEEEVEEAENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEE 1000 1010 1020 1030 1040 1050 1120 pF1KB4 KTNEA ::::: CCDS53 KTNEA >>CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10 (1104 aa) initn: 6789 init1: 6789 opt: 6813 Z-score: 3177.1 bits: 599.7 E(32554): 1.2e-170 Smith-Waterman score: 7334; 98.1% identity (98.2% similar) in 1124 aa overlap (1-1124:1-1104) 10 20 30 40 50 60 pF1KB4 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVPEDD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 LPTDQTVLPGRSSEREGNAKNCWEDDRKEGQEILGPEAQADEAGCTVKDDECESDAENEQ :::::::::::::::::::::::::: .::::::::::::: CCDS53 LPTDQTVLPGRSSEREGNAKNCWEDD--------------------IKDDECESDAENEQ 70 80 90 100 130 140 150 160 170 180 pF1KB4 NHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 NHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDENGTPDAFSQLLTCPYCDRGYK 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB4 RFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHVTQSGCNRKF 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB4 KCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNG 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB4 RPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RPRTGLKTSQCSSPSLSASPGSPTRPQIRQKIENKPLQEQLSVNQIKTEPVDYEFKPIVV 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB4 ASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVLPTVGLVSPISINLSDIQNVLKVAV 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB4 DGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DGNVIRQVLENNQANLASKEQETINASPIQQGGHSVISAISLPLVDQDGTTKIIINYSLE 410 420 430 440 450 460 490 500 510 520 530 540 pF1KB4 QPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDCPGD 470 480 490 500 510 520 550 560 570 580 590 600 pF1KB4 INALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 INALPELKHYDLKQPTQPPPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYY 530 540 550 560 570 580 610 620 630 640 650 660 pF1KB4 ALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISVQSSEPSSPEPGKVNIPAKNND 590 600 610 620 630 640 670 680 690 700 710 720 pF1KB4 QPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QPQSANANEPQDSTVNLQSPLKMTNSPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYL 650 660 670 680 690 700 730 740 750 760 770 780 pF1KB4 YTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 YTAEGAQEEPQVEPLDLSLPKQQGELLERSTITSVYQNSVYSVQEEPLNLSCAKKEPQKD 710 720 730 740 750 760 790 800 810 820 830 840 pF1KB4 SCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SCVTDSEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQ 770 780 790 800 810 820 850 860 870 880 890 900 pF1KB4 VAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VAYTYSTTVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTE 830 840 850 860 870 880 910 920 930 940 950 960 pF1KB4 NGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 NGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPY 890 900 910 920 930 940 970 980 990 1000 1010 1020 pF1KB4 QCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQEEAGPEILSNEHVGARASPSQG 950 960 970 980 990 1000 1030 1040 1050 1060 1070 1080 pF1KB4 DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVEEA 1010 1020 1030 1040 1050 1060 1090 1100 1110 1120 pF1KB4 ENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA :::::::::::::::::::::::::::::::::::::::::::: CCDS53 ENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA 1070 1080 1090 1100 >>CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2 (1190 aa) initn: 2009 init1: 781 opt: 1071 Z-score: 516.0 bits: 107.4 E(32554): 2e-22 Smith-Waterman score: 2812; 45.1% identity (70.0% similar) in 1151 aa overlap (35-1099:40-1171) 10 20 30 40 50 pF1KB4 PRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEGVP------E .::::::.:...... : : : : CCDS54 PRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQETSPASVPNHE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB4 DDLPTDQTVLPGRSSE---REGNAKNCWEDDRKEGQEILGPEAQADEAGCTVKDDE--CE .. ..:..:: . : :::.... :.... . :: . .:.:: .: . CCDS54 SSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGP---VKNANCTSDFEEYFAK 70 80 90 100 110 120 120 130 140 150 160 pF1KB4 SDAENEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDEN----GTPDAFSQL :....: ..::.::..:::.:.:::::: .: :::::.:..:: ::::::.:: CCDS54 RKLEERDGHAVSIEEYLQRSDTAIIYPEAPEELSRLGTPEANGQEENDLPPGTPDAFAQL 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB4 LTCPYCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQR ::::::::::::.:::::::::::::::.:::: ::::::::::::::::..:: : ::. CCDS54 LTCPYCDRGYKRLTSLKEHIKYRHEKNEENFSCPLCSYTFAYRTQLERHMVTHKPGTDQH 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB4 HV-TQSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHIS .. ::.. :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QMLTQGAGNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHIS 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB4 SKKCISLIPVNGRPRTGLKTSQCSSP-SLSASPGSPTRPQIRQKIEN-KPLQ--EQLSVN :::::.:: :::: :...::. ::: :.:.:: . . :.:.:.:: :::. :: .. CCDS54 SKKCIGLISVNGRMRNNIKTG--SSPNSVSSSPTNSAITQLRNKLENGKPLSMSEQTGLL 310 320 330 340 350 360 350 360 370 380 390 pF1KB4 QIKTEPVDY-EFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVL----PTV .:::::.:. ..: .... :.. ..:..:: . . .:: . : :. .: . . : . CCDS54 KIKTEPLDFNDYKVLMATHGFSGTSPFMNGGLGATSPLGVHPSAQSPMQHLGVGMEAPLL 370 380 390 400 410 420 400 410 420 430 440 450 pF1KB4 GLVSPISINLSDIQNVLKVAVDGNVIRQVLENNQ---ANLASKEQETINASPIQQGGHSV :. . .. :::..:.::.. ::..: :: .. . ..: . ... ..: .:: : CCDS54 GFPT-MNSNLSEVQKVLQI-VDNTVSRQKMDCKAEEISKLKGYHMKDPCSQPEEQGVTSP 430 440 450 460 470 480 460 470 480 490 500 510 pF1KB4 -ISAISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVK : ..::.:...:.:: ::.:.::. .. .. :.: .. .. :.::: . . CCDS54 NIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACLQSLTTDSRRQISNIKKEKLRTLIDLV 490 500 510 520 530 540 520 530 540 550 560 pF1KB4 SEKDKSFEGGVNDSTCLLCDDC----PGDINALPELKHY------DLKQPTQP-----PP .. :: .:. : :: . :. : :: : : . ..: ..: :: : CCDS54 TD-DKMIENH-NISTPFSCQFCKESFPGPI-PLHQHERYLCKMNEEIKAVLQPHENIVPN 550 560 570 580 590 570 580 590 600 610 620 pF1KB4 LPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSKIADSVNL .. ... .::. .. ... : :. .:.::::::.: .:...:: ::. .:.: CCDS54 KAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLKAYYAMNMEPNSDELLKISIAVGL 600 610 620 630 640 650 630 640 650 660 pF1KB4 PLDVVKKWFEKMQAGQISV-------QSSEPSSPE---PGKVNI----PAKNNDQPQSAN : . ::.:::. .. : : .::.: .:. : : .. :.: :. : . CCDS54 PQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSNPPTKDSLLPRSPVKPMDSITSPS 660 670 680 690 700 710 670 680 690 700 710 720 pF1KB4 ANEPQDSTVNLQSPLKMTN----SPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYLYT : ..:..: . ::..:. . . :: . :::.:::: :. .::.:... :: CCDS54 IAELHNSVTNCDPPLRLTKPSHFTNIKPV-EKLDHSRSNTPSPLNLSSTSSKNSHSSSYT 720 730 740 750 760 770 730 740 750 760 770 pF1KB4 AEG-AQEEPQVEPLDLSLPKQQGE---LLE-----RSTITSVYQNSVYSVQE---EPLNL .. ..:: :.::::::::::. : .. ... :. .::: : .: ::::: CCDS54 PNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKASSISLDHNSVSSSSENSDEPLNL 780 790 800 810 820 830 780 790 800 810 820 pF1KB4 SCAKKEPQKDSCVTD--SEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRA . ::: .... . . ..:: .. : ::.:. :.: .: :. :.:.: :: CCDS54 TFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPPQSAFPPATFMPPVQTSIPGLRP 840 850 860 870 880 890 830 840 850 860 870 880 pF1KB4 LAANKQTILIPQVAYTYSTTVSP-AVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDS . : ..:..:::: : .. : .. : . .: : : : ... .:...:..:: CCDS54 YPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQGFQGELLDGAQDYMSGLDDMTDS 900 910 920 930 940 950 890 900 910 920 930 940 pF1KB4 DSTPPKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHL :: .::..:::.:::::::::: ::::::::::::::::::::.: :::::::::::: CCDS54 DSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYEHTGKRPHQCQICKKAFKHKHHL 960 970 980 990 1000 1010 950 960 970 980 990 1000 pF1KB4 IEHMRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE--EAG--- ::: ::::::::::::::::::::::::::::::::::::::::::...:.: : : CCDS54 IEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEEREAAEREAREKGHLE 1020 1030 1040 1050 1060 1070 1010 1020 1030 1040 1050 pF1KB4 P-EILSNEHVGARASPSQG--DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKP : :.: :. .: :: ::.::::. : : .::::.:.: .. . . CCDS54 PTELLMNRAYLQSITP-QGYSDSEERESMPR--DGESEKEHEKEGEDGY-----GKLGRQ 1080 1090 1100 1110 1120 1130 1060 1070 1080 1090 1100 1110 pF1KB4 QGDEEEEEEEEEVEEEEVE-EAENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSE .:::: :::::: :.. .. . :. .: .: :: .: CCDS54 DGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKMETKSDHEEDNMEDGM 1140 1150 1160 1170 1180 1190 1120 pF1KB4 EKTNEA >>CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2 (1214 aa) initn: 2009 init1: 781 opt: 1071 Z-score: 515.9 bits: 107.4 E(32554): 2e-22 Smith-Waterman score: 2772; 45.2% identity (69.4% similar) in 1147 aa overlap (56-1099:65-1195) 30 40 50 60 70 80 pF1KB4 VVETNSDSDDEDKLHIVEEESVTDAADCEGVP--EDDLPTDQTVLPGRSSE---REGNAK :: :.. ..:..:: . : :::... CCDS21 GSETDEEDKLHIAEDDGIANPLDQETSPASVPNHESSPHVSQALLPREEEEDEIREGGVE 40 50 60 70 80 90 90 100 110 pF1KB4 NCWEDDR------------KEGQEILGPEAQADEA--GCTVKDDECESD---------AE . :.... :: . .:::: . : . :::. .: :: : CCDS21 HPWHNNEILQASVDGPEEMKEDYDTMGPEATIQTAINNGTVKNANCTSDFEEYFAKRKLE 100 110 120 130 140 150 120 130 140 150 160 170 pF1KB4 NEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDEN----GTPDAFSQLLTCP ....: ..::.::..:::.:.:::::: .: :::::.:..:: ::::::.:::::: CCDS21 ERDGHAVSIEEYLQRSDTAIIYPEAPEELSRLGTPEANGQEENDLPPGTPDAFAQLLTCP 160 170 180 190 200 210 180 190 200 210 220 230 pF1KB4 YCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-T ::::::::.:::::::::::::::.:::: ::::::::::::::::..:: : ::... : CCDS21 YCDRGYKRLTSLKEHIKYRHEKNEENFSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLT 220 230 240 250 260 270 240 250 260 270 280 290 pF1KB4 QSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKC :.. :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 QGAGNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKC 280 290 300 310 320 330 300 310 320 330 340 pF1KB4 ISLIPVNGRPRTGLKTSQCSSP-SLSASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKT :.:: :::: :...::. ::: :.:.:: . . :.:.:.:: :::. :: .. .::: CCDS21 IGLISVNGRMRNNIKTG--SSPNSVSSSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKT 340 350 360 370 380 390 350 360 370 380 390 400 pF1KB4 EPVDY-EFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVL----PTVGLVS ::.:. ..: .... :.. ..:..:: . . .:: . : :. .: . . : .:. . CCDS21 EPLDFNDYKVLMATHGFSGTSPFMNGGLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT 400 410 420 430 440 450 410 420 430 440 450 pF1KB4 PISINLSDIQNVLKVAVDGNVIRQVLENNQ---ANLASKEQETINASPIQQGGHSV-ISA .. :::..:.::.. ::..: :: .. . ..: . ... ..: .:: : : CCDS21 -MNSNLSEVQKVLQI-VDNTVSRQKMDCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPP 460 470 480 490 500 510 460 470 480 490 500 510 pF1KB4 ISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKD ..::.:...:.:: ::.:.::. .. .. :.: .. .. :.::: . . .. : CCDS21 VGLPVVSHNGATKSIIDYTLEKVNEAKACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-D 520 530 540 550 560 520 530 540 550 560 pF1KB4 KSFEGGVNDSTCLLCDDC----PGDINALPELKHY------DLKQPTQP-----PPLPAA : .:. : :: . :. : :: : : . ..: ..: :: : .. CCDS21 KMIENH-NISTPFSCQFCKESFPGPI-PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGV 570 580 590 600 610 620 570 580 590 600 610 620 pF1KB4 EAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSKIADSVNLPLDV ... .::. .. ... : :. .:.::::::.: .:...:: ::. .:.:: . CCDS21 FVDNKALLLSSVLSEKGMTSPINPYKDHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEF 630 640 650 660 670 680 630 640 650 660 670 pF1KB4 VKKWFEKMQAGQISV-------QSSEPSSPE---PGKVNI----PAKNNDQPQSANANEP ::.:::. .. : : .::.: .:. : : .. :.: :. : . : CCDS21 VKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAEL 690 700 710 720 730 740 680 690 700 710 720 pF1KB4 QDSTVNLQSPLKMTN----SPVLPVGSTTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG- ..:..: . ::..:. . . :: . :::.:::: :. .::.:... :: .. CCDS21 HNSVTNCDPPLRLTKPSHFTNIKPV-EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSF 750 760 770 780 790 800 730 740 750 760 770 pF1KB4 AQEEPQVEPLDLSLPKQQGE------LLERSTITSVY--QNSVYSVQE---EPLNLSCAK ..:: :.::::::::::. : ... .:. .::: : .: :::::. : CCDS21 SSEELQAEPLDLSLPKQMKEPKSIIATKNKTKASSISLDHNSVSSSSENSDEPLNLTFIK 810 820 830 840 850 860 780 790 800 810 820 830 pF1KB4 KEPQKDSCVTD--SEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQNSVPCLRALAAN :: .... . . ..:: .. : ::.:. :.: .: :. :.:.: :: . CCDS21 KEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGL 870 880 890 900 910 920 840 850 860 870 880 890 pF1KB4 KQTILIPQVAYTYSTTVSP-AVQEPPLKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTP : ..:..:::: : .. : .. : . .: : : : ... .:...:..:::: CCDS21 DQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCL 930 940 950 960 970 980 900 910 920 930 940 950 pF1KB4 PKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHM .::..:::.:::::::::: ::::::::::::::::::::.: ::::::::::::::: CCDS21 SRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHS 990 1000 1010 1020 1030 1040 960 970 980 990 1000 pF1KB4 RLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE--EAG---P-EI ::::::::::::::::::::::::::::::::::::::::::...:.: : : : :. CCDS21 RLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEEREAAEREAREKGHLEPTEL 1050 1060 1070 1080 1090 1100 1010 1020 1030 1040 1050 1060 pF1KB4 LSNEHVGARASPSQG--DSDERESLTREEDEDSEKEEEEEDKEMEELQEEKECEKPQGDE : :. .: :: ::.::::. : : .::::.:.: .. . . .::: CCDS21 LMNRAYLQSITP-QGYSDSEERESMPR--DGESEKEHEKEGEDGY-----GKLGRQDGDE 1110 1120 1130 1140 1150 1070 1080 1090 1100 1110 1120 pF1KB4 EEEEEEEEVEEEEVE-EAENEGEEAKTEGLMKDDRAESQASSLGQKVGESSEQVSEEKTN : :::::: :.. .. . :. .: .: :: .: CCDS21 EFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKMETKSDHEEDNMEDGM 1160 1170 1180 1190 1200 1210 pF1KB4 EA 1124 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 14:50:37 2016 done: Thu Nov 3 14:50:38 2016 Total Scan time: 6.030 Total Display time: 0.430 Function used was FASTA [36.3.4 Apr, 2011]