FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0569, 1214 aa 1>>>pF1KA0569 1214 - 1214 aa - 1214 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.4599+/-0.00126; mu= 0.0901+/- 0.075 mean_var=378.7673+/-79.817, 0's: 0 Z-trim(112.1): 767 B-trim: 678 in 1/51 Lambda= 0.065900 statistics sampled from 12016 (12894) to 12016 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.714), E-opt: 0.2 (0.396), width: 16 Scan time: 5.970 The best scores are: opt bits E(32554) CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2 (1214) 8206 795.8 0 CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2 (1190) 7315 711.0 4.2e-204 CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10 (1057) 1071 117.4 2e-25 CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10 (1104) 1071 117.4 2e-25 CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10 (1108) 1071 117.4 2e-25 CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10 (1124) 1071 117.4 2.1e-25 CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10 (1125) 1071 117.4 2.1e-25 >>CCDS2186.1 ZEB2 gene_id:9839|Hs108|chr2 (1214 aa) initn: 8206 init1: 8206 opt: 8206 Z-score: 4235.4 bits: 795.8 E(32554): 0 Smith-Waterman score: 8206; 100.0% identity (100.0% similar) in 1214 aa overlap (1-1214:1-1214) 10 20 30 40 50 60 pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA0 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA0 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA0 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA0 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA0 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA0 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA0 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA0 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KA0 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KA0 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KA0 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KA0 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KA0 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME 1150 1160 1170 1180 1190 1200 1210 pF1KA0 TKSDHEEDNMEDGM :::::::::::::: CCDS21 TKSDHEEDNMEDGM 1210 >>CCDS54403.1 ZEB2 gene_id:9839|Hs108|chr2 (1190 aa) initn: 7303 init1: 7303 opt: 7315 Z-score: 3777.7 bits: 711.0 E(32554): 4.2e-204 Smith-Waterman score: 7993; 98.0% identity (98.0% similar) in 1214 aa overlap (1-1214:1-1190) 10 20 30 40 50 60 pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGP---------- 70 80 90 100 110 130 140 150 160 170 180 pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP :::::::::::::::::::::::::::::::::::::::::::::: CCDS54 --------------VKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP 120 130 140 150 190 200 210 220 230 240 pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN 160 170 180 190 200 210 250 260 270 280 290 300 pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH 220 230 240 250 260 270 310 320 330 340 350 360 pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTGSSPNSVSSS 280 290 300 310 320 330 370 380 390 400 410 420 pF1KA0 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGL 340 350 360 370 380 390 430 440 450 460 470 480 pF1KA0 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GATSPLGVHPSAQSPMQHLGVGMEAPLLGFPTMNSNLSEVQKVLQIVDNTVSRQKMDCKA 400 410 420 430 440 450 490 500 510 520 530 540 pF1KA0 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACL 460 470 480 490 500 510 550 560 570 580 590 600 pF1KA0 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QSLTTDSRRQISNIKKEKLRTLIDLVTDDKMIENHNISTPFSCQFCKESFPGPIPLHQHE 520 530 540 550 560 570 610 620 630 640 650 660 pF1KA0 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 RYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLK 580 590 600 610 620 630 670 680 690 700 710 720 pF1KA0 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 AYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSN 640 650 660 670 680 690 730 740 750 760 770 780 pF1KA0 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPVEKLDHSRS 700 710 720 730 740 750 790 800 810 820 830 840 pF1KA0 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKAS 760 770 780 790 800 810 850 860 870 880 890 900 pF1KA0 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPP 820 830 840 850 860 870 910 920 930 940 950 960 pF1KA0 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQG 880 890 900 910 920 930 970 980 990 1000 1010 1020 pF1KA0 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 FQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYE 940 950 960 970 980 990 1030 1040 1050 1060 1070 1080 pF1KA0 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 HTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSY 1000 1010 1020 1030 1040 1050 1090 1100 1110 1120 1130 1140 pF1KA0 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 CKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITPQGYSDSEERESMPRDGESEKEH 1060 1070 1080 1090 1100 1110 1150 1160 1170 1180 1190 1200 pF1KA0 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EKEGEDGYGKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKME 1120 1130 1140 1150 1160 1170 1210 pF1KA0 TKSDHEEDNMEDGM :::::::::::::: CCDS54 TKSDHEEDNMEDGM 1180 1190 >>CCDS53507.1 ZEB1 gene_id:6935|Hs108|chr10 (1057 aa) initn: 1888 init1: 781 opt: 1071 Z-score: 570.1 bits: 117.4 E(32554): 2e-25 Smith-Waterman score: 2759; 46.2% identity (70.3% similar) in 1098 aa overlap (114-1195:21-1032) 90 100 110 120 130 140 pF1KA0 EEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTMGPEATIQTAINNGTVKNANCTSD :: . .:::: . : . :::. .: :: CCDS53 MADGPRCKRRKQANPRRNNGKEGQEILGPEAQADEA--GCTVKDDECESD 10 20 30 40 150 160 170 180 190 200 pF1KA0 FEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAPEELSRLGTPEANGQEENDLPPGT :....: ..::.::..:::.:.:::::: .: :::::.:..:: :: CCDS53 ---------AENEQNHDPNVEEFLQQQDTAVIFPEAPEEDQRQGTPEASGHDEN----GT 50 60 70 80 90 210 220 230 240 250 260 pF1KA0 PDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEENFSCPLCSYTFAYRTQLERHMVTH ::::.::::::::::::::.:::::::::::::::.:::: ::::::::::::::::..: CCDS53 PDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDNFSCSLCSYTFAYRTQLERHMTSH 100 110 120 130 140 150 270 280 290 300 310 320 pF1KA0 KPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSG : : ::... ::.. ::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEHLRIHSGEKPYECPNCKKRFSHSG 160 170 180 190 200 210 330 340 350 360 370 380 pF1KA0 SYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVSSSPTNSAITQLRNKLENGKPLSM ::::::::::::.:: :::: :...::. ::: :.:.:: . . :.:.:.:: :::. CCDS53 SYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLSASPGSPTRPQIRQKIEN-KPLQ- 220 230 240 250 260 270 390 400 410 420 430 440 pF1KA0 SEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNGGLGATSPLGVHPSAQSPMQHLGV :: .. .:::::.:. ..: .... :.. ..:..:: . . .:: . : :. .: . . CCDS53 -EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNGVFTGGGPLQATSSPQGMVQAVVL 280 290 300 310 320 450 460 470 480 490 pF1KA0 GMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKMDCKAEEISKLKGYHMKDPCSQPE : .:. . .. :::..:.::.. ::..: :: .. . ..: . ... ..: CCDS53 ----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVLENNQ---ANLASKEQETINASPI 330 340 350 360 370 380 500 510 520 530 540 550 pF1KA0 EQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEAKACLQSLTTDSRRQISNIKKEKL .:: : : ..::.:...:.:: ::.:.::. .. .. :.: .. .. :.::: CCDS53 QQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQLQVVPQNLKKENPVATNSCKSEKL 390 400 410 420 430 440 560 570 580 590 600 610 pF1KA0 RTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI-PLHQHERYLCKMNEEIKAVLQP . . .. :: .:. : :: . :. : :: : : . ..: ..: :: CCDS53 PEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDINALPELKHY------DLKQPTQP 450 460 470 480 490 620 630 640 650 660 670 pF1KA0 HENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYKDHMSVLKAYYAMNMEPNSDELLK : .. ... .::. .. ... : :. .:.::::::.: .:...:: : CCDS53 -----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLKNLLSLLKAYYALNAQPSAEELSK 500 510 520 530 540 680 690 700 710 720 730 pF1KA0 ISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSKPLAPNSNPPTKDSLLPRSPVKPM :. .:.:: . ::.:::. .. : : .::.: .:. : : .. :.: CCDS53 IADSVNLPLDVVKKWFEKMQAGQISV-------QSSEPSSPE---PGKVNI----PAKNN 550 560 570 580 590 740 750 760 770 780 790 pF1KA0 DSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV-EKLDHSRSNTPSPLNLSSTSSKN :. : . : ..:..: . ::..:. . . :: . :::.:::: :. .::.: CCDS53 DQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVGSTTNGSRSSTPSPSPLNLSSSRN 600 610 620 630 640 800 810 820 830 840 850 pF1KA0 SHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIATKNKTKASSISLDHNSVSSSSEN ... :: .. ..:: :.::::::::::. : .. ... :. .::: : .: CCDS53 TQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE-----RSTITSVYQNSVYSVQE- 650 660 670 680 690 860 870 880 890 900 910 pF1KA0 SDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAKPLYTALPPQSAFPPATFMPPVQT :::::. ::: .... . . ..:: .. : ::.:. :.: .: :. :. CCDS53 --EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSANPINIAIPTVTAQLPTIVAIADQN 700 710 720 730 740 750 920 930 940 950 960 970 pF1KA0 SIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQRRKYQRKQGFQGELLDGAQDYMSG :.: :: . : ..:..:::: : ... : .. : . .: : : : ... .:. CCDS53 SVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPPLKVIQPNGNQDERQDTSSEGVSN 760 770 780 790 800 810 980 990 1000 1010 1020 1030 pF1KA0 LDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSSSLLRHKYEHTGKRPHQCQICKKA ..:..:::: .::..:::.:::::::::: ::::::::::::::::::::.: ::::: CCDS53 VEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSSSLLRHKYEHTGKRPHECGICKKA 820 830 840 850 860 870 1040 1050 1060 1070 1080 1090 pF1KA0 FKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEEREAAEREA :::::::::: ::::::::::::::::::::::::::::::::::::::::::...:.: CCDS53 FKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQHMNHRYSYCKREAEERDSTEQE- 880 890 900 910 920 930 1100 1110 1120 1130 1140 pF1KA0 REKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMPR--DGESEKEHEKEGEDGY---- : : : :.: :. .: :: ::.::::. : : .::::.:.: .. CCDS53 -EAG---P-EILSNEHVGARASPSQG--DSDERESLTREEDEDSEKEEEEEDKEMEELQE 940 950 960 970 980 1150 1160 1170 1180 1190 1200 pF1KA0 -GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEETGDHSMDDSSEDGKMETKSDHEE . . .:::: :::::: :.. .. . :. .: .: :: .: CCDS53 EKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAKTEGLMKDDRAESQASSLGQKVGE 990 1000 1010 1020 1030 1040 1210 pF1KA0 DNMEDGM CCDS53 SSEQVSEEKTNEA 1050 >>CCDS53506.1 ZEB1 gene_id:6935|Hs108|chr10 (1104 aa) initn: 2009 init1: 781 opt: 1071 Z-score: 569.8 bits: 117.4 E(32554): 2e-25 Smith-Waterman score: 2933; 45.0% identity (69.2% similar) in 1206 aa overlap (6-1195:1-1079) 10 20 30 40 50 60 pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET :::::::::::::::::.::.::..::.:.:..:.::::::.:...... : : CCDS53 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG 10 20 30 40 50 70 80 90 100 110 120 pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM : :.. ..:..:: . : :::.... :... CCDS53 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDD-------------------- 60 70 80 130 140 150 160 170 180 pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP .:. .: :: :....: ..::.::..:::.:.:::: CCDS53 --------------IKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP 90 100 110 120 190 200 210 220 230 240 pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN :: .: :::::.:..:: ::::::.::::::::::::::.:::::::::::::::.: CCDS53 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN 130 140 150 160 170 250 260 270 280 290 300 pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH ::: ::::::::::::::::..:: : ::... ::.. :::::::::::::::::::::: CCDS53 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH 180 190 200 210 220 230 310 320 330 340 350 pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS :::::::::::::::::::::::::::::::::::.:: :::: :...::. ::: :.: CCDS53 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS 240 250 260 270 280 290 360 370 380 390 400 410 pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG .:: . . :.:.:.:: :::. :: .. .:::::.:. ..: .... :.. ..:..:: CCDS53 ASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG 300 310 320 330 340 350 420 430 440 450 460 470 pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM . . .:: . : :. .: . . : .:. . .. :::..:.::.. ::..: :: . CCDS53 VFTGGGPLQATSSPQGMVQAVVL----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL 360 370 380 390 400 480 490 500 510 520 530 pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA . . ..: . ... ..: .:: : : ..::.:...:.:: ::.:.::. .. CCDS53 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL 410 420 430 440 450 460 540 550 560 570 580 590 pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI .. :.: .. .. :.::: . . .. :: .:. : :: . :. : :: : CCDS53 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI 470 480 490 500 510 520 600 610 620 630 640 650 pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK : . ..: ..: :: : .. ... .::. .. ... : : CCDS53 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK 530 540 550 560 570 660 670 680 690 700 710 pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK . .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : : .::. CCDS53 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE 580 590 600 610 620 720 730 740 750 760 770 pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV- : .:. : : .. :.: :. : . : ..:..: . ::..:. . . :: CCDS53 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG 630 640 650 660 670 780 790 800 810 820 830 pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA . :::.:::: :. .::.:... :: .. ..:: :.::::::::::. : .. CCDS53 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE 680 690 700 710 720 840 850 860 870 880 890 pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK ... :. .::: : .: :::::. ::: .... . . ..:: .. : ::. CCDS53 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN 730 740 750 760 770 900 910 920 930 940 950 pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR :. :.: .: :. :.:.: :: . : ..:..:::: : ... : .. CCDS53 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP 780 790 800 810 820 830 960 970 980 990 1000 1010 pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS : . .: : : : ... .:...:..:::: .::..:::.:::::::::: ::::: CCDS53 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS 840 850 860 870 880 890 1020 1030 1040 1050 1060 1070 pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ :::::::::::::::.: ::::::::::::::: :::::::::::::::::::::::::: CCDS53 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ 900 910 920 930 940 950 1080 1090 1100 1110 1120 1130 pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP ::::::::::::::::...:.: : : : :.: :. .: :: ::.::::. CCDS53 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT 960 970 980 990 1000 1140 1150 1160 1170 1180 pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE : : .::::.:.: .. . . .:::: :::::: :.. .. . :. .: . CCDS53 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK 1010 1020 1030 1040 1050 1060 1190 1200 1210 pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM : :: .: CCDS53 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA 1070 1080 1090 1100 >>CCDS44370.1 ZEB1 gene_id:6935|Hs108|chr10 (1108 aa) initn: 1826 init1: 781 opt: 1071 Z-score: 569.8 bits: 117.4 E(32554): 2e-25 Smith-Waterman score: 2876; 45.1% identity (69.8% similar) in 1187 aa overlap (25-1195:3-1083) 10 20 30 40 50 60 pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET :.::..::.:.:..:.::::::.:...... : : CCDS44 MKVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG 10 20 30 70 80 90 100 110 120 pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM : :.. ..:..:: . : :::.... :... : :: . . CCDS44 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDDT-------G----KEGQEIL 40 50 60 70 130 140 150 160 170 180 pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP :::: . : . :::. .: :: :....: ..::.::..:::.:.:::: CCDS44 GPEAQADEA--GCTVKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP 80 90 100 110 120 190 200 210 220 230 240 pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN :: .: :::::.:..:: ::::::.::::::::::::::.:::::::::::::::.: CCDS44 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN 130 140 150 160 170 180 250 260 270 280 290 300 pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH ::: ::::::::::::::::..:: : ::... ::.. :::::::::::::::::::::: CCDS44 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH 190 200 210 220 230 240 310 320 330 340 350 pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS :::::::::::::::::::::::::::::::::::.:: :::: :...::. ::: :.: CCDS44 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS 250 260 270 280 290 300 360 370 380 390 400 410 pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG .:: . . :.:.:.:: ::: .:: .. .:::::.:. ..: .... :.. ..:..:: CCDS44 ASPGSPTRPQIRQKIEN-KPL--QEQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG 310 320 330 340 350 420 430 440 450 460 470 pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM . . .:: . : :. .: .. : .:. . .. :::..:.::.. ::..: :: . CCDS44 VFTGGGPLQATSSPQGMVQ----AVVLPTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL 360 370 380 390 400 410 480 490 500 510 520 530 pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA . . ..: . ... ..: .:: : : ..::.:...:.:: ::.:.::. .. CCDS44 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL 420 430 440 450 460 540 550 560 570 580 590 pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI .. :.: .. .. :.::: . . .. :: .:. : :: . :. : :: : CCDS44 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI 470 480 490 500 510 520 600 610 620 630 640 650 pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK : . ..: ..: :: : .. ... .::. .. ... : : CCDS44 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK 530 540 550 560 570 660 670 680 690 700 710 pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK . .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : : .::. CCDS44 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE 580 590 600 610 620 720 730 740 750 760 770 pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV- : .:. : : .. :.: :. : . : ..:..: . ::..:. . . :: CCDS44 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG 630 640 650 660 670 780 790 800 810 820 830 pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA . :::.:::: :. .::.:... :: .. ..:: :.::::::::::. : .. CCDS44 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE 680 690 700 710 720 730 840 850 860 870 880 890 pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK ... :. .::: : .: :::::. ::: .... . . ..:: .. : ::. CCDS44 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN 740 750 760 770 780 900 910 920 930 940 950 pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR :. :.: .: :. :.:.: :: . : ..:..:::: : ... : .. CCDS44 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP 790 800 810 820 830 840 960 970 980 990 1000 1010 pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS : . .: : : : ... .:...:..:::: .::..:::.:::::::::: ::::: CCDS44 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS 850 860 870 880 890 900 1020 1030 1040 1050 1060 1070 pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ :::::::::::::::.: ::::::::::::::: :::::::::::::::::::::::::: CCDS44 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ 910 920 930 940 950 960 1080 1090 1100 1110 1120 1130 pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP ::::::::::::::::...:.: : : : :.: :. .: :: ::.::::. CCDS44 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT 970 980 990 1000 1010 1140 1150 1160 1170 1180 pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE : : .::::.:.: .. . . .:::: :::::: :.. .. . :. .: . CCDS44 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK 1020 1030 1040 1050 1060 1070 1190 1200 1210 pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM : :: .: CCDS44 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA 1080 1090 1100 >>CCDS7169.1 ZEB1 gene_id:6935|Hs108|chr10 (1124 aa) initn: 2009 init1: 781 opt: 1071 Z-score: 569.7 bits: 117.4 E(32554): 2.1e-25 Smith-Waterman score: 3011; 45.8% identity (70.3% similar) in 1206 aa overlap (6-1195:1-1099) 10 20 30 40 50 60 pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET :::::::::::::::::.::.::..::.:.:..:.::::::.:...... : : CCDS71 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG 10 20 30 40 50 70 80 90 100 110 120 pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM : :.. ..:..:: . : :::.... :.... :: . . CCDS71 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDDR------------KEGQEIL 60 70 80 90 130 140 150 160 170 180 pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP :::: . : . :::. .: :: :....: ..::.::..:::.:.:::: CCDS71 GPEAQADEA--GCTVKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP 100 110 120 130 140 190 200 210 220 230 240 pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN :: .: :::::.:..:: ::::::.::::::::::::::.:::::::::::::::.: CCDS71 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN 150 160 170 180 190 250 260 270 280 290 300 pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH ::: ::::::::::::::::..:: : ::... ::.. :::::::::::::::::::::: CCDS71 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH 200 210 220 230 240 250 310 320 330 340 350 pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS :::::::::::::::::::::::::::::::::::.:: :::: :...::. ::: :.: CCDS71 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS 260 270 280 290 300 310 360 370 380 390 400 410 pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG .:: . . :.:.:.:: :::. :: .. .:::::.:. ..: .... :.. ..:..:: CCDS71 ASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG 320 330 340 350 360 370 420 430 440 450 460 470 pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM . . .:: . : :. .: . . : .:. . .. :::..:.::.. ::..: :: . CCDS71 VFTGGGPLQATSSPQGMVQAVVL----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL 380 390 400 410 420 480 490 500 510 520 530 pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA . . ..: . ... ..: .:: : : ..::.:...:.:: ::.:.::. .. CCDS71 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL 430 440 450 460 470 480 540 550 560 570 580 590 pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI .. :.: .. .. :.::: . . .. :: .:. : :: . :. : :: : CCDS71 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI 490 500 510 520 530 540 600 610 620 630 640 650 pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK : . ..: ..: :: : .. ... .::. .. ... : : CCDS71 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK 550 560 570 580 590 660 670 680 690 700 710 pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK . .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : : .::. CCDS71 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE 600 610 620 630 640 720 730 740 750 760 770 pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV- : .:. : : .. :.: :. : . : ..:..: . ::..:. . . :: CCDS71 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG 650 660 670 680 690 780 790 800 810 820 830 pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA . :::.:::: :. .::.:... :: .. ..:: :.::::::::::. : .. CCDS71 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE 700 710 720 730 740 840 850 860 870 880 890 pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK ... :. .::: : .: :::::. ::: .... . . ..:: .. : ::. CCDS71 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN 750 760 770 780 790 900 910 920 930 940 950 pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR :. :.: .: :. :.:.: :: . : ..:..:::: : ... : .. CCDS71 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP 800 810 820 830 840 850 960 970 980 990 1000 1010 pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS : . .: : : : ... .:...:..:::: .::..:::.:::::::::: ::::: CCDS71 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS 860 870 880 890 900 910 1020 1030 1040 1050 1060 1070 pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ :::::::::::::::.: ::::::::::::::: :::::::::::::::::::::::::: CCDS71 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ 920 930 940 950 960 970 1080 1090 1100 1110 1120 1130 pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP ::::::::::::::::...:.: : : : :.: :. .: :: ::.::::. CCDS71 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT 980 990 1000 1010 1020 1140 1150 1160 1170 1180 pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE : : .::::.:.: .. . . .:::: :::::: :.. .. . :. .: . CCDS71 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK 1030 1040 1050 1060 1070 1080 1190 1200 1210 pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM : :: .: CCDS71 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA 1090 1100 1110 1120 >>CCDS53505.1 ZEB1 gene_id:6935|Hs108|chr10 (1125 aa) initn: 2009 init1: 781 opt: 1071 Z-score: 569.7 bits: 117.4 E(32554): 2.1e-25 Smith-Waterman score: 3010; 45.9% identity (70.3% similar) in 1206 aa overlap (6-1195:1-1100) 10 20 30 40 50 60 pF1KA0 MKQPIMADGPRCKRRKQANPRRKNVVNYDNVVDTGSETDEEDKLHIAEDDGIANPLDQET :::::::::::::::::.::.::..::.:.:..:.::::::.:...... : : CCDS53 MADGPRCKRRKQANPRRNNVTNYNTVVETNSDSDDEDKLHIVEEESVTDAADCEG 10 20 30 40 50 70 80 90 100 110 120 pF1KA0 SPASVPNHESSPHVSQALLPREEEEDEIREGGVEHPWHNNEILQASVDGPEEMKEDYDTM : :.. ..:..:: . : :::.... :... : :: . . CCDS53 VP------EDDLPTDQTVLPGRSSE---REGNAKNCWEDDT-------G----KEGQEIL 60 70 80 90 130 140 150 160 170 180 pF1KA0 GPEATIQTAINNGTVKNANCTSDFEEYFAKRKLEERDGHAVSIEEYLQRSDTAIIYPEAP :::: . : . :::. .: :: :....: ..::.::..:::.:.:::: CCDS53 GPEAQADEA--GCTVKDDECESD---------AENEQNHDPNVEEFLQQQDTAVIFPEAP 100 110 120 130 140 190 200 210 220 230 240 pF1KA0 EELSRLGTPEANGQEENDLPPGTPDAFAQLLTCPYCDRGYKRLTSLKEHIKYRHEKNEEN :: .: :::::.:..:: ::::::.::::::::::::::.:::::::::::::::.: CCDS53 EEDQRQGTPEASGHDEN----GTPDAFSQLLTCPYCDRGYKRFTSLKEHIKYRHEKNEDN 150 160 170 180 190 200 250 260 270 280 290 300 pF1KA0 FSCPLCSYTFAYRTQLERHMVTHKPGTDQHQMLTQGAGNRKFKCTECGKAFKYKHHLKEH ::: ::::::::::::::::..:: : ::... ::.. :::::::::::::::::::::: CCDS53 FSCSLCSYTFAYRTQLERHMTSHKSGRDQRHV-TQSGCNRKFKCTECGKAFKYKHHLKEH 210 220 230 240 250 310 320 330 340 350 pF1KA0 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCIGLISVNGRMRNNIKTG--SSPNSVS :::::::::::::::::::::::::::::::::::.:: :::: :...::. ::: :.: CCDS53 LRIHSGEKPYECPNCKKRFSHSGSYSSHISSKKCISLIPVNGRPRTGLKTSQCSSP-SLS 260 270 280 290 300 310 360 370 380 390 400 410 pF1KA0 SSPTNSAITQLRNKLENGKPLSMSEQTGLLKIKTEPLDFNDYKVLMATHGFSGTSPFMNG .:: . . :.:.:.:: :::. :: .. .:::::.:. ..: .... :.. ..:..:: CCDS53 ASPGSPTRPQIRQKIEN-KPLQ--EQLSVNQIKTEPVDY-EFKPIVVASGINCSTPLQNG 320 330 340 350 360 370 420 430 440 450 460 470 pF1KA0 GLGATSPLGVHPSAQSPMQHLGVGMEAPLLGFPT-MNSNLSEVQKVLQI-VDNTVSRQKM . . .:: . : :. .: . . : .:. . .. :::..:.::.. ::..: :: . CCDS53 VFTGGGPLQATSSPQGMVQAVVL----PTVGLVSPISINLSDIQNVLKVAVDGNVIRQVL 380 390 400 410 420 430 480 490 500 510 520 530 pF1KA0 DCKAEEISKLKGYHMKDPCSQPEEQGVTSPNIPPVGLPVVSHNGATKSIIDYTLEKVNEA . . ..: . ... ..: .:: : : ..::.:...:.:: ::.:.::. .. CCDS53 ENNQ---ANLASKEQETINASPIQQGGHSV-ISAISLPLVDQDGTTKIIINYSLEQPSQL 440 450 460 470 480 540 550 560 570 580 590 pF1KA0 KACLQSLTTDSRRQISNIKKEKLRTLIDLVTD-DKMIENH-NISTPFSCQFCKESFPGPI .. :.: .. .. :.::: . . .. :: .:. : :: . :. : :: : CCDS53 QVVPQNLKKENPVATNSCKSEKLPEDLTVKSEKDKSFEGGVNDSTCLLCDDC----PGDI 490 500 510 520 530 540 600 610 620 630 640 650 pF1KA0 -PLHQHERYLCKMNEEIKAVLQPHENIVPNKAGVFVDNKALLLSSVLSEKGMTSPINPYK : . ..: ..: :: : .. ... .::. .. ... : : CCDS53 NALPELKHY------DLKQPTQP-----PPLPAAEAEKPESSVSSATGDGNLSPSQPPLK 550 560 570 580 590 660 670 680 690 700 710 pF1KA0 DHMSVLKAYYAMNMEPNSDELLKISIAVGLPQEFVKEWFEQRKVYQYSNSRSPSLERSSK . .:.::::::.: .:...:: ::. .:.:: . ::.:::. .. : : .::. CCDS53 NLLSLLKAYYALNAQPSAEELSKIADSVNLPLDVVKKWFEKMQAGQISV-------QSSE 600 610 620 630 640 720 730 740 750 760 770 pF1KA0 PLAPNSNPPTKDSLLPRSPVKPMDSITSPSIAELHNSVTNCDPPLRLTKPSHFTNIKPV- : .:. : : .. :.: :. : . : ..:..: . ::..:. . . :: CCDS53 PSSPE---PGKVNI----PAKNNDQPQSANANEPQDSTVNLQSPLKMTN----SPVLPVG 650 660 670 680 690 780 790 800 810 820 830 pF1KA0 EKLDHSRSNTPSPLNLSSTSSKNSHSSSYTPNSFSSEELQAEPLDLSLPKQMKEPKSIIA . :::.:::: :. .::.:... :: .. ..:: :.::::::::::. : .. CCDS53 STTNGSRSSTPSPSPLNLSSSRNTQGYLYTAEG-AQEEPQVEPLDLSLPKQQGE---LLE 700 710 720 730 740 840 850 860 870 880 890 pF1KA0 TKNKTKASSISLDHNSVSSSSENSDEPLNLTFIKKEFSNSNNLDNKSTNPVFSMNPFSAK ... :. .::: : .: :::::. ::: .... . . ..:: .. : ::. CCDS53 -----RSTITSVYQNSVYSVQE---EPLNLSCAKKEPQKDSCVTD--SEPVVNVIPPSAN 750 760 770 780 790 900 910 920 930 940 950 pF1KA0 PLYTALPPQSAFPPATFMPPVQTSIPGLRPYPGLDQMSFLPHMAYTYPTGAATFADMQQR :. :.: .: :. :.:.: :: . : ..:..:::: : ... : .. CCDS53 PINIAIPTVTAQLPTIVAIADQNSVPCLRALAANKQTILIPQVAYTYST-TVSPAVQEPP 800 810 820 830 840 850 960 970 980 990 1000 1010 pF1KA0 RKYQRKQGFQGELLDGAQDYMSGLDDMTDSDSCLSRKKIKKTESGMYACDLCDKTFQKSS : . .: : : : ... .:...:..:::: .::..:::.:::::::::: ::::: CCDS53 LKVIQPNGNQDERQDTSSEGVSNVEDQNDSDSTPPKKKMRKTENGMYACDLCDKIFQKSS 860 870 880 890 900 910 1020 1030 1040 1050 1060 1070 pF1KA0 SLLRHKYEHTGKRPHQCQICKKAFKHKHHLIEHSRLHSGEKPYQCDKCGKRFSHSGSYSQ :::::::::::::::.: ::::::::::::::: :::::::::::::::::::::::::: CCDS53 SLLRHKYEHTGKRPHECGICKKAFKHKHHLIEHMRLHSGEKPYQCDKCGKRFSHSGSYSQ 920 930 940 950 960 970 1080 1090 1100 1110 1120 1130 pF1KA0 HMNHRYSYCKREAEEREAAEREAREKGHLEPTELLMNRAYLQSITP-QGYSDSEERESMP ::::::::::::::::...:.: : : : :.: :. .: :: ::.::::. CCDS53 HMNHRYSYCKREAEERDSTEQE--EAG---P-EILSNEHVGARASPSQG--DSDERESLT 980 990 1000 1010 1020 1030 1140 1150 1160 1170 1180 pF1KA0 R--DGESEKEHEKEGEDGY-----GKLGRQDGDEEFEEEEEESENKSMDTDPETIRDEEE : : .::::.:.: .. . . .:::: :::::: :.. .. . :. .: . CCDS53 REEDEDSEKEEEEEDKEMEELQEEKECEKPQGDEEEEEEEEEVEEEEVE-EAENEGEEAK 1040 1050 1060 1070 1080 1190 1200 1210 pF1KA0 TGDHSMDDSSEDGKMETKSDHEEDNMEDGM : :: .: CCDS53 TEGLMKDDRAESQASSLGQKVGESSEQVSEEKTNEA 1090 1100 1110 1120 1214 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 00:45:18 2016 done: Fri Nov 4 00:45:19 2016 Total Scan time: 5.970 Total Display time: 0.480 Function used was FASTA [36.3.4 Apr, 2011]