FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4458, 1210 aa 1>>>pF1KB4458 1210 - 1210 aa - 1210 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.7879+/-0.00184; mu= 7.9146+/- 0.108 mean_var=459.7766+/-102.695, 0's: 0 Z-trim(107.5): 526 B-trim: 0 in 0/51 Lambda= 0.059814 statistics sampled from 9002 (9608) to 9002 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.295), width: 16 Scan time: 5.000 The best scores are: opt bits E(32554) CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 8383 740.4 6.2e-213 CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 4447 400.4 8.2e-111 CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 4443 400.0 9.9e-111 CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 3748 340.4 1.6e-92 CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 3748 340.5 1.6e-92 CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 3748 340.5 1.6e-92 CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 3698 336.0 2.9e-91 CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 3423 312.5 4.6e-84 CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 3184 291.8 7.3e-78 CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 3162 289.9 2.7e-77 CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 2815 259.2 1.5e-68 CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 1721 165.0 4.9e-40 CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 739 80.7 2.1e-14 CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 739 80.7 2.1e-14 CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 739 80.7 2.2e-14 CCDS5884.1 EPHA1 gene_id:2041|Hs108|chr7 ( 976) 717 78.7 7.6e-14 CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 706 77.8 1.5e-13 CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 698 76.8 1.9e-13 CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 702 77.4 1.9e-13 CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 698 76.8 1.9e-13 CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 695 76.9 3e-13 CCDS56557.1 PTK2 gene_id:5747|Hs108|chr8 (1065) 695 76.9 3e-13 CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 694 76.8 3.1e-13 CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 694 76.8 3.1e-13 CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 694 76.8 3.1e-13 CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 694 76.8 3.1e-13 CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 694 76.8 3.1e-13 CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 688 75.8 3.2e-13 CCDS2447.1 EPHA4 gene_id:2043|Hs108|chr2 ( 986) 693 76.7 3.2e-13 CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 692 76.6 3.4e-13 CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 691 76.6 4e-13 CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 691 76.6 4e-13 CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 691 76.6 4e-13 CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 688 76.3 4.5e-13 CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 688 76.3 4.5e-13 CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 688 76.3 4.5e-13 CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 688 76.3 4.6e-13 CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 682 75.7 6.2e-13 CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 682 75.7 6.2e-13 CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 682 75.8 6.5e-13 CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 677 75.3 8.3e-13 CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 677 75.3 8.5e-13 CCDS33255.1 ZAP70 gene_id:7535|Hs108|chr2 ( 312) 666 73.6 8.9e-13 CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 673 74.9 1.1e-12 CCDS33254.1 ZAP70 gene_id:7535|Hs108|chr2 ( 619) 666 74.0 1.3e-12 CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 667 74.5 1.6e-12 CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 667 74.5 1.7e-12 CCDS5031.1 EPHA7 gene_id:2045|Hs108|chr6 ( 998) 663 74.1 2e-12 CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 661 74.1 2.6e-12 CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 661 74.2 2.6e-12 >>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa) initn: 8383 init1: 8383 opt: 8383 Z-score: 3936.3 bits: 740.4 E(32554): 6.2e-213 Smith-Waterman score: 8383; 99.9% identity (100.0% similar) in 1210 aa overlap (1-1210:1-1210) 10 20 30 40 50 60 pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS55 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB4 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB4 ALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB4 GAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB4 CLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 CLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB4 RNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSY 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB4 GVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPK 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB4 FRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDDVVDADEYLIPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 FRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDDVVDADEYLIPQ 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB4 QGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTED 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB4 SIDDTFLPVPEYINQSVPKRPAGSVQNPVYHNQPLNPAPSRDPHYQDPHSTAVGNPEYLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SIDDTFLPVPEYINQSVPKRPAGSVQNPVYHNQPLNPAPSRDPHYQDPHSTAVGNPEYLN 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB4 TVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGSTAENAEYLRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGSTAENAEYLRV 1150 1160 1170 1180 1190 1200 1210 pF1KB4 APQSSEFIGA :::::::::: CCDS55 APQSSEFIGA 1210 >>CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 (705 aa) initn: 4443 init1: 4443 opt: 4447 Z-score: 2102.9 bits: 400.4 E(32554): 8.2e-111 Smith-Waterman score: 4447; 99.2% identity (99.4% similar) in 634 aa overlap (1-634:1-631) 10 20 30 40 50 60 pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS55 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB4 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV :::::::::::::::::::::::::: ::: : CCDS55 GENNTLVWKYADAGHVCHLCHPNCTY---GPGNESLKAMLFCLFKLSSCNQSNDGSVSHQ 610 620 630 640 650 670 680 690 700 710 720 pF1KB4 ALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGS CCDS55 SGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH 660 670 680 690 700 >>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa) initn: 4443 init1: 4443 opt: 4443 Z-score: 2101.5 bits: 400.0 E(32554): 9.9e-111 Smith-Waterman score: 4443; 99.8% identity (100.0% similar) in 627 aa overlap (1-627:1-627) 10 20 30 40 50 60 pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS55 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB4 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV ::::::::::::::::::::::::::: CCDS55 GENNTLVWKYADAGHVCHLCHPNCTYGS 610 620 >>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa) initn: 3258 init1: 1784 opt: 3748 Z-score: 1774.6 bits: 340.4 E(32554): 1.6e-92 Smith-Waterman score: 4092; 50.5% identity (72.5% similar) in 1231 aa overlap (37-1198:2-1219) 10 20 30 40 50 60 pF1KB4 AGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEVVLGNLE :: .. : :. :......:.:: :::: CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNLE 10 20 30 70 80 90 100 110 120 pF1KB4 ITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALAVLSNYD .::. : .::::. :::: :::::: : :...::. :.:.::.. .:..::::::.: : CCDS45 LTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGD 40 50 60 70 80 90 130 140 150 160 170 pF1KB4 ----------ANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNM :. ::.:: .:.: :::.:.: .. :: :: ..: :.:: .. . CCDS45 PLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLAL 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB4 SMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQC .. :. .:. :.: : .. ::: . :.::.::. .:: :. ::.: :.::::.:: CCDS45 TLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTDCCHEQC 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB4 AAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCP :::::::..::::.: .: . :. :: :. :: :.. ::::.:.:::.:: :: CCDS45 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB4 RNYVVTDHGSCVRACGADSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATN ::. :: :::. .: . :. :::...:.:: :: .:: :.:. .... .....: CCDS45 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB4 IKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRT :..: .: .: :.: .:: .: :: ..: ::.:..:....:..::::.: :.:::.. CCDS45 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB4 DLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTI :: .:.::..:::: ..: .::.. .:.:. ::::::.:...: ..: : .::...:. CCDS45 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV 400 410 420 430 440 450 480 490 500 510 520 530 pF1KB4 NWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGREC : .:: . : .:: :. : . : .:: ::. :::: : .::.: . ::.:: CCDS45 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC 460 470 480 490 500 510 540 550 560 570 580 590 pF1KB4 VDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTC :..: .:.: :::.:. .:. ::::: :: ..:: : :.:. :::: : : :: : CCDS45 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC 520 530 540 550 560 570 600 610 620 630 640 650 pF1KB4 PAGVMGENNTL-VWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SIATGMVG :.:: . . . .::. : .:. : :::..:. .:::.. : :: ...:: CCDS45 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG 580 590 600 610 620 630 660 670 680 690 700 pF1KB4 ALLLLLVVALGI--GLFMRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKE .::::.::. :....::. .:: :.:::::: :::::::::: :::: .::::: CCDS45 ---ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKE 640 650 660 670 680 710 720 730 740 750 760 pF1KB4 TEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASV ::..:.::::::::::::::.:::.::.:::::::: ::: :::::::::::::::::.: CCDS45 TELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGV 690 700 710 720 730 740 770 780 790 800 810 820 pF1KB4 DNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLE .:.: :::::::::::::.:::::.:::::.:::.. .::: :::::.::::::.::: CCDS45 GSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLE 750 760 770 780 790 800 830 840 850 860 870 880 pF1KB4 DRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHR : :::::::::::::::.:.::::::::::.:: .: ::::.:::::::::::::::.: CCDS45 DVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESILRR 810 820 830 840 850 860 890 900 910 920 930 940 pF1KB4 IYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVK .::::::::::::::::::::.:::::::: :: ..::::::::::::::::::::::: CCDS45 RFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVK 870 880 890 900 910 920 950 960 970 980 990 1000 pF1KB4 CWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDD :::::.. ::.::::. :::.:::::::..::: .: . :: ::.:::.:....:: : CCDS45 CWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLEDDDMGD 930 940 950 960 970 980 1010 1020 1030 pF1KB4 VVDADEYLIPQQGFF-----------------SSPSTS-----------------RTPLL .:::.:::.:::::: :: . : :.:: CCDS45 LVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLA 990 1000 1010 1020 1030 1040 1040 1050 1060 1070 1080 pF1KB4 SSLSATSN--NSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTEDS----IDDTFLPV : .: :. .. .. .:::: : .. : ::::: ::: : .. : : CCDS45 PSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAPLTCSPQ 1050 1060 1070 1080 1090 1100 1090 1100 1110 1120 1130 pF1KB4 PEYINQ-SVPKRPAGSVQNPVYHNQPLN-----P---APSRDPHYQD--PHSTAVGNPEY :::.:: .: .: . ..:. .: . : .:... .: . :: :::: CCDS45 PEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGAVENPEY 1110 1120 1130 1140 1150 1160 1140 1150 1160 1170 1180 1190 pF1KB4 LNTVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGS-TAENAEY : : : . . :: . ..:: : .. :... : . :::. :::: :: CCDS45 L-TPQGGAAPQPHPPPAF-------SPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEY 1170 1180 1190 1200 1210 1200 1210 pF1KB4 LRVAPQSSEFIGA : CCDS45 LGLDVPV 1220 >>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa) initn: 3288 init1: 1784 opt: 3748 Z-score: 1774.6 bits: 340.5 E(32554): 1.6e-92 Smith-Waterman score: 4123; 50.4% identity (72.4% similar) in 1245 aa overlap (23-1198:3-1234) 10 20 30 40 50 60 pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :. . .:: ::. :: .. : :. :......:.: CCDS74 MPRGSWKPQVCTGTDMKLRLPASPETHLDMLRHLYQGCQV 10 20 30 40 70 80 90 100 110 120 pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA : ::::.::. : .::::. :::: :::::: : :...::. :.:.::.. .:..:::: CCDS74 VQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALA 50 60 70 80 90 100 130 140 150 160 170 pF1KB4 VLSNYD----------ANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSS ::.: : :. ::.:: .:.: :::.:.: .. :: :: ..: :.:: . CCDS74 VLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHK 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB4 DFLSNMSMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSD . ... :. .:. :.: : .. ::: . :.::.::. .:: :. ::.: :.: CCDS74 NNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTD 170 180 190 200 210 240 250 260 270 280 290 pF1KB4 CCHNQCAAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGAT :::.:::::::::..::::.: .: . :. :: :. :: :.. ::::.:.:::. CCDS74 CCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGAS 220 230 240 250 260 270 300 310 320 330 340 pF1KB4 CVKKCPRNYVVTDHGSCVRACGADSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSL :: :: ::. :: :::. .: . :. :::...:.:: :: .:: :.:. .... CCDS74 CVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVR 280 290 300 310 320 330 350 360 370 380 390 400 pF1KB4 SINATNIKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQA .....::..: .: .: :.: .:: .: :: ..: ::.:..:....:..::::.: :.: CCDS74 AVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISA 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB4 WPENRTDLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNL ::.. :: .:.::..:::: ..: .::.. .:.:. ::::::.:...: ..: : .: CCDS74 WPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHL 400 410 420 430 440 450 470 480 490 500 510 520 pF1KB4 CYANTINWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNV :...:. : .:: . : .:: :. : . : .:: ::. :::: : .::.: . CCDS74 CFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF 460 470 480 490 500 510 530 540 550 560 570 580 pF1KB4 SRGRECVDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGP ::.:::..: .:.: :::.:. .:. ::::: :: ..:: : :.:. :::: : : CCDS74 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP 520 530 540 550 560 570 590 600 610 620 630 640 pF1KB4 HCVKTCPAGVMGENNTL-VWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SI :: ::.:: . . . .::. : .:. : :::..:. .:::.. : :: CCDS74 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSI 580 590 600 610 620 630 650 660 670 680 690 700 pF1KB4 ATGMVGALLLLLVVALGI--GLFMRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQAL ...:: .::::.::. :....::. .:: :.:::::: :::::::::: :::: CCDS74 ISAVVG---ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQ 640 650 660 670 680 690 710 720 730 740 750 760 pF1KB4 LRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEA .:::::::..:.::::::::::::::.:::.::.:::::::: ::: ::::::::::::: CCDS74 MRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEA 700 710 720 730 740 750 770 780 790 800 810 820 pF1KB4 YVMASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAK ::::.: .:.: :::::::::::::.:::::.:::::.:::.. .::: :::::.:::: CCDS74 YVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAK 760 770 780 790 800 810 830 840 850 860 870 880 pF1KB4 GMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMAL ::.:::: :::::::::::::::.:.::::::::::.:: .: ::::.::::::::::: CCDS74 GMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMAL 820 830 840 850 860 870 890 900 910 920 930 940 pF1KB4 ESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDV ::::.: .::::::::::::::::::::.:::::::: :: ..::::::::::::::::: CCDS74 ESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDV 880 890 900 910 920 930 950 960 970 980 990 1000 pF1KB4 YMIMVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMD :::::::::::.. ::.::::. :::.:::::::..::: .: . :: ::.:::.:.. CCDS74 YMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLE 940 950 960 970 980 990 1010 1020 1030 pF1KB4 EEDMDDVVDADEYLIPQQGFF-----------------SSPSTS---------------- ..:: :.:::.:::.:::::: :: . : CCDS74 DDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEA 1000 1010 1020 1030 1040 1050 1040 1050 1060 1070 1080 pF1KB4 -RTPLLSSLSATSN--NSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTEDS----ID :.:: : .: :. .. .. .:::: : .. : ::::: ::: : .. CCDS74 PRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAP 1060 1070 1080 1090 1100 1110 1090 1100 1110 1120 1130 pF1KB4 DTFLPVPEYINQ-SVPKRPAGSVQNPVYHNQPLN-----P---APSRDPHYQD--PHSTA : : :::.:: .: .: . ..:. .: . : .:... .: . : CCDS74 LTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGA 1120 1130 1140 1150 1160 1170 1140 1150 1160 1170 1180 1190 pF1KB4 VGNPEYLNTVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGS-T : ::::: : : . . :: . ..:: : .. :... : . :::. : CCDS74 VENPEYL-TPQGGAAPQPHPPPAF-------SPAFDNLYYWDQDPPERGAPPSTFKGTPT 1180 1190 1200 1210 1220 1200 1210 pF1KB4 AENAEYLRVAPQSSEFIGA ::: ::: CCDS74 AENPEYLGLDVPV 1230 1240 >>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa) initn: 3288 init1: 1784 opt: 3748 Z-score: 1774.5 bits: 340.5 E(32554): 1.6e-92 Smith-Waterman score: 4134; 50.4% identity (72.2% similar) in 1254 aa overlap (14-1198:11-1249) 10 20 30 40 50 60 pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :: :: : . : .:: ::. :: .. : :. :......:.: CCDS32 MELAALCRWGLLLALLPPGAA--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQV 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA : ::::.::. : .::::. :::: :::::: : :...::. :.:.::.. .:..:::: CCDS32 VQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALA 60 70 80 90 100 110 130 140 150 160 170 pF1KB4 VLSNYD----------ANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSS ::.: : :. ::.:: .:.: :::.:.: .. :: :: ..: :.:: . CCDS32 VLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB4 DFLSNMSMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSD . ... :. .:. :.: : .. ::: . :.::.::. .:: :. ::.: :.: CCDS32 NNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTD 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB4 CCHNQCAAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGAT :::.:::::::::..::::.: .: . :. :: :. :: :.. ::::.:.:::. CCDS32 CCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGAS 240 250 260 270 280 290 300 310 320 330 340 pF1KB4 CVKKCPRNYVVTDHGSCVRACGADSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSL :: :: ::. :: :::. .: . :. :::...:.:: :: .:: :.:. .... CCDS32 CVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVR 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB4 SINATNIKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQA .....::..: .: .: :.: .:: .: :: ..: ::.:..:....:..::::.: :.: CCDS32 AVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB4 WPENRTDLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNL ::.. :: .:.::..:::: ..: .::.. .:.:. ::::::.:...: ..: : .: CCDS32 WPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHL 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB4 CYANTINWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNV :...:. : .:: . : .:: :. : . : .:: ::. :::: : .::.: . CCDS32 CFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB4 SRGRECVDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGP ::.:::..: .:.: :::.:. .:. ::::: :: ..:: : :.:. :::: : : CCDS32 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB4 HCVKTCPAGVMGENNTL-VWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SI :: ::.:: . . . .::. : .:. : :::..:. .:::.. : :: CCDS32 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSI 600 610 620 630 640 650 650 660 670 680 690 700 pF1KB4 ATGMVGALLLLLVVALGI--GLFMRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQAL ...:: .::::.::. :....::. .:: :.:::::: :::::::::: :::: CCDS32 ISAVVG---ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQ 660 670 680 690 700 710 710 720 730 740 750 760 pF1KB4 LRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEA .:::::::..:.::::::::::::::.:::.::.:::::::: ::: ::::::::::::: CCDS32 MRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEA 720 730 740 750 760 770 770 780 790 800 810 820 pF1KB4 YVMASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAK ::::.: .:.: :::::::::::::.:::::.:::::.:::.. .::: :::::.:::: CCDS32 YVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAK 780 790 800 810 820 830 830 840 850 860 870 880 pF1KB4 GMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMAL ::.:::: :::::::::::::::.:.::::::::::.:: .: ::::.::::::::::: CCDS32 GMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMAL 840 850 860 870 880 890 890 900 910 920 930 940 pF1KB4 ESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDV ::::.: .::::::::::::::::::::.:::::::: :: ..::::::::::::::::: CCDS32 ESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDV 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KB4 YMIMVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMD :::::::::::.. ::.::::. :::.:::::::..::: .: . :: ::.:::.:.. CCDS32 YMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLE 960 970 980 990 1000 1010 1010 1020 1030 pF1KB4 EEDMDDVVDADEYLIPQQGFF-----------------SSPSTS---------------- ..:: :.:::.:::.:::::: :: . : CCDS32 DDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEA 1020 1030 1040 1050 1060 1070 1040 1050 1060 1070 1080 pF1KB4 -RTPLLSSLSATSN--NSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTEDS----ID :.:: : .: :. .. .. .:::: : .. : ::::: ::: : .. CCDS32 PRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAP 1080 1090 1100 1110 1120 1130 1090 1100 1110 1120 1130 pF1KB4 DTFLPVPEYINQ-SVPKRPAGSVQNPVYHNQPLN-----P---APSRDPHYQD--PHSTA : : :::.:: .: .: . ..:. .: . : .:... .: . : CCDS32 LTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGA 1140 1150 1160 1170 1180 1190 1140 1150 1160 1170 1180 1190 pF1KB4 VGNPEYLNTVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGS-T : ::::: : : . . :: . ..:: : .. :... : . :::. : CCDS32 VENPEYL-TPQGGAAPQPHPPPAF-------SPAFDNLYYWDQDPPERGAPPSTFKGTPT 1200 1210 1220 1230 1240 1200 1210 pF1KB4 AENAEYLRVAPQSSEFIGA ::: ::: CCDS32 AENPEYLGLDVPV 1250 >>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa) initn: 3476 init1: 1779 opt: 3698 Z-score: 1751.9 bits: 336.0 E(32554): 2.9e-91 Smith-Waterman score: 4001; 55.3% identity (78.0% similar) in 1028 aa overlap (14-1024:11-1031) 10 20 30 40 50 60 pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :: :: : . : .:: ::. :: .. : :. :......:.: CCDS77 MELAALCRWGLLLALLPPGAA--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQV 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA : ::::.::. : .::::. :::: :::::: : :...::. :.:.::.. .:..:::: CCDS77 VQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALA 60 70 80 90 100 110 130 140 150 160 170 pF1KB4 VLSNYD----------ANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSS ::.: : :. ::.:: .:.: :::.:.: .. :: :: ..: :.:: . CCDS77 VLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB4 DFLSNMSMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSD . ... :. .:. :.: : .. ::: . :.::.::. .:: :. ::.: :.: CCDS77 NNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTD 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB4 CCHNQCAAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGAT :::.:::::::::..::::.: .: . :. :: :. :: :.. ::::.:.:::. CCDS77 CCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGAS 240 250 260 270 280 290 300 310 320 330 340 pF1KB4 CVKKCPRNYVVTDHGSCVRACGADSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSL :: :: ::. :: :::. .: . :. :::...:.:: :: .:: :.:. .... CCDS77 CVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVR 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB4 SINATNIKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQA .....::..: .: .: :.: .:: .: :: ..: ::.:..:....:..::::.: :.: CCDS77 AVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB4 WPENRTDLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNL ::.. :: .:.::..:::: ..: .::.. .:.:. ::::::.:...: ..: : .: CCDS77 WPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHL 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB4 CYANTINWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNV :...:. : .:: . : .:: :. : . : .:: ::. :::: : .::.: . CCDS77 CFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB4 SRGRECVDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGP ::.:::..: .:.: :::.:. .:. ::::: :: ..:: : :.:. :::: : : CCDS77 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB4 HCVKTCPAGVMGENNTL-VWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SI :: ::.:: . . . .::. : .:. : :::..:. .:::.. : :: CCDS77 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSI 600 610 620 630 640 650 650 660 670 680 690 700 pF1KB4 ATGMVGALLLLLVVALGI--GLFMRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQAL ...:: .::::.::. :....::. .:: :.:::::: :::::::::: :::: CCDS77 ISAVVG---ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQ 660 670 680 690 700 710 710 720 730 740 750 760 pF1KB4 LRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEA .:::::::..:.::::::::::::::.:::.::.:::::::: ::: ::::::::::::: CCDS77 MRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEA 720 730 740 750 760 770 770 780 790 800 810 820 pF1KB4 YVMASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAK ::::.: .:.: :::::::::::::.:::::.:::::.:::.. .::: :::::.:::: CCDS77 YVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAK 780 790 800 810 820 830 830 840 850 860 870 880 pF1KB4 GMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMAL ::.:::: :::::::::::::::.:.::::::::::.:: .: ::::.::::::::::: CCDS77 GMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMAL 840 850 860 870 880 890 890 900 910 920 930 940 pF1KB4 ESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDV ::::.: .::::::::::::::::::::.:::::::: :: ..::::::::::::::::: CCDS77 ESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDV 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KB4 YMIMVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMD :::::::::::.. ::.::::. :::.:::::::..::: .: . :: ::.:::.:.. CCDS77 YMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLE 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 1060 pF1KB4 EEDMDDVVDADEYLIPQQGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKED ..:: :.:::.:::.:::::: CCDS77 DDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRNM 1020 1030 1040 1050 >>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa) initn: 2901 init1: 1213 opt: 3423 Z-score: 1622.7 bits: 312.5 E(32554): 4.6e-84 Smith-Waterman score: 3423; 47.3% identity (75.0% similar) in 1014 aa overlap (11-1014:9-1012) 10 20 30 40 50 60 pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV .:.:: .: .:.. . . :: :: : :. : :... .: .... ::: CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEV 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :.:::::. . .: :::::. :.::.::::.:.: .:: ::...::.. :....:. CCDS31 VMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIF 60 70 80 90 100 110 130 140 150 160 170 pF1KB4 VLSNYDANKT-GLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMD :. ::..:.. .:..: . .: ::: :.: . .: ::....:.::::: . . . CCDS31 VMLNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD---RDAEIV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB4 FQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAG ... :: : : .: ::: : :.:: ::: ::: ::.:.: : .:..:::..::.: CCDS31 VKDNGRSCPPCHEVC-KGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB4 CTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNY :.::...::..::.: : ..: :: ..:: :.:.. ::. ::..:..:: .::.:. CCDS31 CSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNF 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB4 VVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIG-EFKDSLSINATNIKH :: :. :::::: :..:....:.. :. : : : :.:.: : : .:. .....:: CCDS31 VV-DQTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQ---TVDSSNIDG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB4 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH : :::.: :.: .: ... :: . . : :::..:....::.::::.: ::.:: . .. CCDS31 FVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB4 AFENLEIIRGRTKQHGQFSLAVV-SLNITSLGLRSLKEISDGDVIISGNKNLCYANTINW .: :: : ::. . ::: .. .::.::::.::::::: : . ::.:..::: ...:: CCDS31 VFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNW 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB4 KKLF-GTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECV :.. : . .. : :: . .: : :.:: ::: ::::: : .:.:::: ::: :: CCDS31 TKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCV 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB4 DKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP .::.:.::::::....::..::::: :. . ::.: : :.: ::::. ::::::..:: CCDS31 THCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCP 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB4 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTN-----GPKIPSIATGMV ::.: .. ..:: :. . :. :: ::: :: :: :. : . : ..: .. CCDS31 HGVLGAKGP-IYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVI 600 610 620 630 640 660 670 680 690 700 710 pF1KB4 GALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETE ..:...... : :. : :.: ::..:: :.. : .::: :: : :..: ::.:::: CCDS31 AGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANKVLARIFKETE 650 660 670 680 690 700 720 730 740 750 760 770 pF1KB4 FKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDN ..:.::::::.::::.::.::::::..:::: :: ... .. .. . . :. ...:.:. CCDS31 LRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDH 710 720 730 740 750 760 780 790 800 810 820 830 pF1KB4 PHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDR :. ::::.: :..::.:: .:.: :::.::.:. .: : :::: ::::::: :::.. CCDS31 AHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEH 770 780 790 800 810 820 840 850 860 870 880 890 pF1KB4 RLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIY .:::.:::::::.:.:..:...:::.: :: ..:. .:.:::::::::: : CCDS31 GMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKY 830 840 850 860 870 880 900 910 920 930 940 950 pF1KB4 THQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCW ::::::::::::::::::::..:: :. .:. ..::::::: :: ::::::::.::::: CCDS31 THQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCW 890 900 910 920 930 940 960 970 980 990 1000 1010 pF1KB4 MIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHL-PSPTDSNFYRALMDEEDMDDV ::: . :: :.:: ::..::::: :::::. . . :.: .. ..: ... CCDS31 MIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELEPE 950 960 970 980 990 1000 1020 1030 1040 1050 1060 1070 pF1KB4 VDADEYLIPQQGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYS .: : CCDS31 LDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGNLGESCQE 1010 1020 1030 1040 1050 1060 >>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa) initn: 2954 init1: 1893 opt: 3184 Z-score: 1511.4 bits: 291.8 E(32554): 7.3e-78 Smith-Waterman score: 4325; 51.2% identity (75.3% similar) in 1253 aa overlap (1-1176:1-1246) 10 20 30 40 50 60 pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :.:. :. . ..::.: . . . ..:: :: :::..:. .:... .:.....:::: CCDS42 MKPA-TGLWVWVSLLVA-AGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS42 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA 60 70 80 90 100 110 130 140 150 160 170 pF1KB4 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS42 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB4 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS42 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB4 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS42 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB4 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS42 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB4 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS42 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB4 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS42 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB4 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDK ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS42 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB4 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA ::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. :: CCDS42 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD 540 550 560 570 580 590 600 610 620 630 640 pF1KB4 GVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGC---PTNG----P---KIPSIA :..: : ....:::: . :: :::::: ::.:: . : : .: : . : :: CCDS42 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA 600 610 620 630 640 650 650 660 670 680 690 700 pF1KB4 TGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRIL .:..:.:..:..:.: .....::. : .::.:::.: : :::::::::: ::::: :::: CCDS42 AGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL 660 670 680 690 700 710 710 720 730 740 750 760 pF1KB4 KETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMA ::::.:..::::::::::::::.:.:::: :::::::: : :.:.:::: :..::: .:: CCDS42 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA 720 730 740 750 760 770 770 780 790 800 810 820 pF1KB4 SVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNY :.:.::. ::::.::. :.::.::::: ::::.::.::::::::: :::::::::::: : CCDS42 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY 780 790 800 810 820 830 830 840 850 860 870 880 pF1KB4 LEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESIL ::.::::::::::::::::.:.::::::::::.:: ..::::.:.:::.:::::::: : CCDS42 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH 840 850 860 870 880 890 890 900 910 920 930 940 pF1KB4 HRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIM .: .::::::::::::.:::::::.:::::::. :: ..:::::::::::::::::::.: CCDS42 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KB4 VKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDM ::::::::::::::.:: :::.::::::::::::::.::.::::.::.:.. :.::::. CCDS42 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL 960 970 980 990 1000 1010 1010 1020 1030 1040 pF1KB4 DDVVDADEYLIPQ-------------------------QGFFSSPSTSRTPLLSSLSA-- .:..::.:::.:: .: :.. . .: . :. CCDS42 EDMMDAEEYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIP 1020 1030 1040 1050 1060 1070 1050 1060 1070 1080 pF1KB4 ---TSNNSTVACIDR---NGLQSCPI----KEDSFLQRYSSDPT---------GALTEDS .....:. .: :: :. .::: ::::.::: : : :.. CCDS42 EAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEG 1080 1090 1100 1110 1120 1130 1090 1100 1110 1120 pF1KB4 IDDTFLPVP--EYINQS-----VPKRPAGSVQ---NPVYHNQPLNPAPSRD-----PHYQ . : ::.: : .: :..: :: ::: .: ..: : : CCDS42 YMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLYL 1140 1150 1160 1170 1180 1190 1130 1140 1150 1160 1170 1180 pF1KB4 DPHSTAVGNPEYL-NTV--QPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKP . ....:. ::: :.. .: ....::.: .: .. . .:..::: :.. CCDS42 NTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYK 1200 1210 1220 1230 1240 1250 1190 1200 1210 pF1KB4 NGIFKGSTAENAEYLRVAPQSSEFIGA CCDS42 QNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV 1260 1270 1280 1290 >>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa) initn: 2954 init1: 1893 opt: 3162 Z-score: 1501.1 bits: 289.9 E(32554): 2.7e-77 Smith-Waterman score: 4261; 51.1% identity (74.2% similar) in 1250 aa overlap (1-1157:1-1243) 10 20 30 40 50 60 pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :.:. :. . ..::.: . . . ..:: :: :::..:. .:... .:.....:::: CCDS23 MKPA-TGLWVWVSLLVA-AGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS23 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA 60 70 80 90 100 110 130 140 150 160 170 pF1KB4 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS23 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB4 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS23 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB4 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS23 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB4 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS23 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB4 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS23 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB4 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS23 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB4 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDK ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS23 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB4 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA ::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. :: CCDS23 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD 540 550 560 570 580 590 600 610 620 630 640 pF1KB4 GVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGC---PTNG----P---KIPSIA :..: : ....:::: . :: :::::: ::.:: . : : .: : . : :: CCDS23 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA 600 610 620 630 640 650 650 660 670 680 690 700 pF1KB4 TGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRIL .:..:.:..:..:.: .....::. : .::.:::.: : :::::::::: ::::: :::: CCDS23 AGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL 660 670 680 690 700 710 710 720 730 740 750 760 pF1KB4 KETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMA ::::.:..::::::::::::::.:.:::: :::::::: : :.:.:::: :..::: .:: CCDS23 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA 720 730 740 750 760 770 770 780 790 800 810 820 pF1KB4 SVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNY :.:.::. ::::.::. :.::.::::: ::::.::.::::::::: :::::::::::: : CCDS23 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY 780 790 800 810 820 830 830 840 850 860 870 880 pF1KB4 LEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESIL ::.::::::::::::::::.:.::::::::::.:: ..::::.:.:::.:::::::: : CCDS23 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH 840 850 860 870 880 890 890 900 910 920 930 940 pF1KB4 HRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIM .: .::::::::::::.:::::::.:::::::. :: ..:::::::::::::::::::.: CCDS23 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KB4 VKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDM ::::::::::::::.:: :::.::::::::::::::.::.::::.::.:.. :.::::. CCDS23 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 pF1KB4 DDVVDADEYLIPQQGFFSSP-STSRTPLLSSLSATSNNSTVACIDRNGLQ---------- .:..::.:::.:: . : :::. . :. : ... : .: : CCDS23 EDMMDAEEYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAA 1020 1030 1040 1050 1060 1070 1060 1070 pF1KB4 -------------------------------SC-------PI----KEDSFLQRYSSDPT :: :. .::: ::::.::: CCDS23 EQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPT 1080 1090 1100 1110 1120 1130 1080 1090 1100 1110 pF1KB4 ---------GALTEDSIDDTFLPVP--EYINQS-----VPKRPAGSVQ---NPVYHNQPL : : :.. . : ::.: : .: :..: :: ::: CCDS23 VFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASN 1140 1150 1160 1170 1180 1190 1120 1130 1140 1150 1160 pF1KB4 NPAPSRD-----PHYQDPHSTAVGNPEYL-NTV--QPTCVNSTFDSPAHWAQKGSHQISL .: ..: : : . ....:. ::: :.. .: ....::.: .: CCDS23 GPPKAEDEYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTL 1200 1210 1220 1230 1240 1250 1170 1180 1190 1200 1210 pF1KB4 DNPDYQQDFFPKEAKPNGIFKGSTAENAEYLRVAPQSSEFIGA CCDS23 QHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV 1260 1270 1280 1290 1300 1210 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 23:40:51 2016 done: Sun Nov 6 23:40:52 2016 Total Scan time: 5.000 Total Display time: 0.610 Function used was FASTA [36.3.4 Apr, 2011]