FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2310, 1308 aa 1>>>pF1KE2310 1308 - 1308 aa - 1308 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.4396+/-0.00166; mu= 9.0243+/- 0.098 mean_var=391.1409+/-85.889, 0's: 0 Z-trim(108.5): 549 B-trim: 0 in 0/51 Lambda= 0.064850 statistics sampled from 9614 (10276) to 9614 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.659), E-opt: 0.2 (0.316), width: 16 Scan time: 5.010 The best scores are: opt bits E(32554) CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 9147 872.5 0 CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 7348 704.2 5.9e-202 CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 3812 373.3 2.2e-102 CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 3808 372.9 2.9e-102 CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 3798 371.9 5.1e-102 CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 3776 369.9 2.3e-101 CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 3601 353.6 2e-96 CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 3166 312.8 3.4e-84 CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 2194 221.5 5.7e-57 CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 2194 221.6 6.1e-57 CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 1655 171.0 8.4e-42 CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 1353 142.5 2.2e-33 CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 767 88.3 1.1e-16 CCDS56557.1 PTK2 gene_id:5747|Hs108|chr8 (1065) 766 88.2 1.3e-16 CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 756 87.3 2.4e-16 CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 731 84.5 8.4e-16 CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 732 85.0 1.1e-15 CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 732 85.0 1.1e-15 CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 731 84.9 1.2e-15 CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 731 84.9 1.2e-15 CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 731 84.9 1.2e-15 CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 731 84.9 1.2e-15 CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 731 84.9 1.2e-15 CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 731 85.0 1.2e-15 CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 731 85.0 1.2e-15 CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 731 85.0 1.3e-15 CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 731 85.0 1.3e-15 CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 731 85.0 1.3e-15 CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 715 83.1 2.5e-15 CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 719 83.8 2.5e-15 CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 715 83.1 2.6e-15 CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 717 83.7 3.1e-15 CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 717 83.7 3.1e-15 CCDS2447.1 EPHA4 gene_id:2043|Hs108|chr2 ( 986) 710 82.9 4.5e-15 CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 704 82.4 6.7e-15 CCDS33255.1 ZAP70 gene_id:7535|Hs108|chr2 ( 312) 687 80.0 1.1e-14 CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 695 81.5 1.2e-14 CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 695 81.5 1.2e-14 CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 695 81.5 1.2e-14 CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 695 81.6 1.2e-14 CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 695 81.6 1.2e-14 CCDS5884.1 EPHA1 gene_id:2041|Hs108|chr7 ( 976) 691 81.1 1.5e-14 CCDS33254.1 ZAP70 gene_id:7535|Hs108|chr2 ( 619) 687 80.5 1.6e-14 CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 687 80.8 2e-14 CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 687 80.8 2e-14 CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 687 80.8 2e-14 CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 687 80.8 2.1e-14 CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 685 80.8 2.8e-14 CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 685 80.8 2.8e-14 CCDS3481.1 TEC gene_id:7006|Hs108|chr4 ( 631) 678 79.6 2.8e-14 >>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa) initn: 9147 init1: 9147 opt: 9147 Z-score: 4648.8 bits: 872.5 E(32554): 0 Smith-Waterman score: 9147; 100.0% identity (100.0% similar) in 1308 aa overlap (1-1308:1-1308) 10 20 30 40 50 60 pF1KE2 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE2 EYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 EYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVP 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE2 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE2 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE2 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 pF1KE2 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV :::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV 1270 1280 1290 1300 >>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa) initn: 7328 init1: 7328 opt: 7348 Z-score: 3739.2 bits: 704.2 E(32554): 5.9e-202 Smith-Waterman score: 8988; 98.8% identity (98.8% similar) in 1308 aa overlap (1-1308:1-1292) 10 20 30 40 50 60 pF1KE2 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE2 EYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVP ::::::::::::::::::::::::: ::::::::::::::::::: CCDS42 EYLVPQAFNIPPPIYTSRARIDSNR----------------NQFVYRDGGFAAEQGVSVP 1030 1040 1050 1060 1090 1100 1110 1120 1130 1140 pF1KE2 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS 1070 1080 1090 1100 1110 1120 1150 1160 1170 1180 1190 1200 pF1KE2 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED 1130 1140 1150 1160 1170 1180 1210 1220 1230 1240 1250 1260 pF1KE2 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ 1190 1200 1210 1220 1230 1240 1270 1280 1290 1300 pF1KE2 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV :::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV 1250 1260 1270 1280 1290 >>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa) initn: 3489 init1: 1665 opt: 3812 Z-score: 1951.4 bits: 373.3 E(32554): 2.2e-102 Smith-Waterman score: 3932; 47.2% identity (70.3% similar) in 1303 aa overlap (10-1285:9-1249) 10 20 30 40 50 pF1KE2 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVV : .::.: . : . : .::.::. :: .. : . ::. :..:.:: CCDS32 MELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVV 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 MGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAI .::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::. CCDS32 QGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 FLNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNP . : .: ::.:: :..:::::.::: ...: ::: ::: :.:: .. CCDS32 LDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKN 120 130 140 150 160 170 180 190 200 210 220 pF1KE2 WPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDC :::..:: : .: : : : :::: . . ::.::::::: : .:: :: .:: CCDS32 NQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDC 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 CHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFC ::..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: : CCDS32 CHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASC 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 VKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQT : ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ... CCDS32 VTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 VDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSW : :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..: CCDS32 VTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAW 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE2 PPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLC : .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..:: CCDS32 PDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLC 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE2 YYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFS . ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .: CCDS32 FVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFL 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE2 RGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGP ::. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : CCDS32 RGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPP 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE2 NCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLP :: .::.:.. :. :.:. : . :.:: :::..: .. : : CCDS32 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------P 600 610 620 630 640 650 660 670 680 690 700 pF1KE2 QHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTP . : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: :::::::::: CCDS32 AEQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTP 650 660 670 680 690 700 710 720 730 740 750 760 pF1KE2 SGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPK ::. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.:: CCDS32 SGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPK 710 720 730 740 750 760 770 780 790 800 810 820 pF1KE2 ANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLL :: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: : CCDS32 ANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDL 770 780 790 800 810 820 830 840 850 860 870 880 pF1KE2 LNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGG ::::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.:::: CCDS32 LNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGG 830 840 850 860 870 880 890 900 910 920 930 940 pF1KE2 KMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLP :.:::::::: : :.:::::::::::::.:::::::.:::::::.:::::::::::::: CCDS32 KVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLP 890 900 910 920 930 940 950 960 970 980 990 1000 pF1KE2 QPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPND :::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: : CCDS32 QPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLD 950 960 970 980 990 1000 1010 1020 1030 1040 1050 pF1KE2 SKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPM : :...::...:. :..::::::::: .: : : . . . : . : CCDS32 STFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPA-------PGAGGMVHHRHRSSST-- 1010 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 pF1KE2 SGNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHV :.:: :. : . . : :: ..:: ...:: . :. . . . CCDS32 -------RSGGGDLTLGLE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGLQSLPT 1060 1070 1080 1090 1100 1120 1130 1140 1150 1160 1170 pF1KE2 QEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGD .. : :::: :::: : .: : ::..:. .:. ::.: . : ..: CCDS32 HDPSPLQRYSEDPTVPLP-----SETD--GYVAPLTCSPQPEYVNQPDVRPQPPSPREGP 1110 1120 1130 1140 1150 1180 1190 1200 1210 1220 1230 pF1KE2 LQALDNPEYHNASNGPPKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA----- : : : .:. ::. . : . . .:.... . ::: . . :. CCDS32 LPAA-RPA--GATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAF 1160 1170 1180 1190 1200 1210 1240 1250 1260 1270 1280 1290 pF1KE2 KKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPG . :::: ::... : :.. :. .. : ::::::: CCDS32 SPAFDNLYYWDQDPPERGA--PPSTFKGTPT--------------AENPEYLGLDVPV 1220 1230 1240 1250 1300 pF1KE2 TVLPPPPYRHRNTVV >>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa) initn: 3485 init1: 1665 opt: 3808 Z-score: 1949.5 bits: 372.9 E(32554): 2.9e-102 Smith-Waterman score: 3928; 47.3% identity (70.7% similar) in 1294 aa overlap (18-1285:4-1234) 10 20 30 40 50 60 pF1KE2 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM :. .: .::.::. :: .. : . ::. :..:.::. CCDS74 MPRGSWKP----QVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ 10 20 30 40 70 80 90 100 110 120 pF1KE2 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF ::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.. CCDS74 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL 50 60 70 80 90 100 130 140 150 160 170 pF1KE2 LNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPW : .: ::.:: :..:::::.::: ...: ::: ::: :.:: .. CCDS74 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE2 PSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCC :::..:: : .: : : : :::: . . ::.::::::: : .:: :: .::: CCDS74 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE2 HRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCV :..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: :: CCDS74 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV 230 240 250 260 270 280 300 310 320 330 340 pF1KE2 KKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQTV ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ...: CCDS74 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE2 DSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWP :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..:: CCDS74 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE2 PNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCY .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..::. CCDS74 DSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCF 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE2 YHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSR ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .: : CCDS74 VHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLR 470 480 490 500 510 520 530 540 550 560 570 580 pF1KE2 GRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPN :. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : CCDS74 GQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPPF 530 540 550 560 570 580 590 600 610 620 630 640 pF1KE2 CVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQ :: .::.:.. :. :.:. : . :.:: :::..: .. : : CCDS74 CVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------PA 590 600 610 620 650 660 670 680 690 700 pF1KE2 HAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTPS . : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: ::::::::::: CCDS74 EQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPS 630 640 650 660 670 680 710 720 730 740 750 760 pF1KE2 GTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKA :. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.::: CCDS74 GAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKA 690 700 710 720 730 740 770 780 790 800 810 820 pF1KE2 NVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLL : :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: :: CCDS74 NKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLL 750 760 770 780 790 800 830 840 850 860 870 880 pF1KE2 NWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGK :::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.::::: CCDS74 NWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGK 810 820 830 840 850 860 890 900 910 920 930 940 pF1KE2 MPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQ .:::::::: : :.:::::::::::::.:::::::.:::::::.::::::::::::::: CCDS74 VPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQ 870 880 890 900 910 920 950 960 970 980 990 1000 pF1KE2 PPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDS ::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: :: CCDS74 PPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLDS 930 940 950 960 970 980 1010 1020 1030 1040 1050 1060 pF1KE2 KFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMS :...::...:. :..::::::::: .: : : . . . : . : . CCDS74 TFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPA-------PGAGGMVHHRHRSSSTRSG 990 1000 1010 1020 1030 1040 1070 1080 1090 1100 1110 1120 pF1KE2 GNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQ :.... : .:. .:: : : :: ..:: ...:: . :. . . .. CCDS74 GGDLTL--GLEPSEE------EAPRS--PLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTH 1050 1060 1070 1080 1130 1140 1150 1160 1170 1180 pF1KE2 EDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDL . : :::: :::: : .: : ::..:. .:. ::.: . : ..: : CCDS74 DPSPLQRYSEDPTVPLP-----SETD--GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPL 1090 1100 1110 1120 1130 1140 1190 1200 1210 1220 1230 pF1KE2 QALDNPEYHNASNGPPKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA-----K : : .:. ::. . : . . .:.... . ::: . . :. . CCDS74 PAA-RPA--GATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFS 1150 1160 1170 1180 1190 1240 1250 1260 1270 1280 1290 pF1KE2 KAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGT :::: ::... : :.. :. .. : ::::::: CCDS74 PAFDNLYYWDQDPPERGA--PPSTFKGTPT--------------AENPEYLGLDVPV 1200 1210 1220 1230 1240 1300 pF1KE2 VLPPPPYRHRNTVV >>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa) initn: 3420 init1: 1665 opt: 3798 Z-score: 1945.1 bits: 371.9 E(32554): 5.1e-102 Smith-Waterman score: 3798; 52.6% identity (76.3% similar) in 1045 aa overlap (10-1033:9-1035) 10 20 30 40 50 pF1KE2 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVV : .::.: . : . : .::.::. :: .. : . ::. :..:.:: CCDS77 MELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVV 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 MGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAI .::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::. CCDS77 QGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 FLNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNP . : .: ::.:: :..:::::.::: ...: ::: ::: :.:: .. CCDS77 LDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKN 120 130 140 150 160 170 180 190 200 210 220 pF1KE2 WPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDC :::..:: : .: : : : :::: . . ::.::::::: : .:: :: .:: CCDS77 NQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDC 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 CHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFC ::..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: : CCDS77 CHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASC 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 VKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQT : ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ... CCDS77 VTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 VDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSW : :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..: CCDS77 VTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAW 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE2 PPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLC : .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..:: CCDS77 PDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLC 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE2 YYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFS . ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .: CCDS77 FVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFL 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE2 RGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGP ::. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : CCDS77 RGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPP 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE2 NCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLP :: .::.:.. :. :.:. : . :.:: :::..: .. : : CCDS77 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------P 600 610 620 630 640 650 660 670 680 690 700 pF1KE2 QHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTP . : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: :::::::::: CCDS77 AEQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTP 650 660 670 680 690 700 710 720 730 740 750 760 pF1KE2 SGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPK ::. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.:: CCDS77 SGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPK 710 720 730 740 750 760 770 780 790 800 810 820 pF1KE2 ANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLL :: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: : CCDS77 ANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDL 770 780 790 800 810 820 830 840 850 860 870 880 pF1KE2 LNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGG ::::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.:::: CCDS77 LNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGG 830 840 850 860 870 880 890 900 910 920 930 940 pF1KE2 KMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLP :.:::::::: : :.:::::::::::::.:::::::.:::::::.:::::::::::::: CCDS77 KVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLP 890 900 910 920 930 940 950 960 970 980 990 1000 pF1KE2 QPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPND :::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: : CCDS77 QPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLD 950 960 970 980 990 1000 1010 1020 1030 1040 1050 pF1KE2 SKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPM : :...::...:. :..::::::::: .: : : CCDS77 STFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRNM 1010 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 pF1KE2 SGNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHV >>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa) initn: 3454 init1: 1665 opt: 3776 Z-score: 1933.3 bits: 369.9 E(32554): 2.3e-101 Smith-Waterman score: 3896; 47.4% identity (70.4% similar) in 1269 aa overlap (43-1285:10-1219) 20 30 40 50 60 70 pF1KE2 LLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVMGNLEITSIEHNR : . ::. :..:.::.::::.: . : CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNA 10 20 30 80 90 100 110 120 pF1KE2 DLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIFLNYRKDGNF--- .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.. : .: CCDS45 SLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPV 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE2 ------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVSTNGS ::.:: :..:::::.::: ...: ::: ::: :.:: .. :::..:: : CCDS45 TGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRS 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE2 SGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSGPK .: : : : :::: . . ::.::::::: : .:: :: .::::..::.::.::: CCDS45 RACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPK 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE2 DTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFV-VDS .::.::..:: :: : .:: .:: ::. : ...::.:: :: ::.:.. .: CCDS45 HSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDV 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE2 SSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT .::. .:: ..:: :.: . :. :. : ..: :.: : ...: :.::..: .: CCDS45 GSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCK 280 290 300 310 320 330 370 380 390 400 410 420 pF1KE2 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL :: :.: :: .. ::: . ..::.:.::.:..::::.: :..:: .. :.:::.:: CCDS45 KIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNL 340 350 360 370 380 390 430 440 450 460 470 480 pF1KE2 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST .: ::.:..: : :. ::. : ..::.:...: : :..::. ::. : :: . CCDS45 QVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRN 400 410 420 430 440 450 490 500 510 520 530 540 pF1KE2 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD .: .. :: ..:..::..:..::. :::::: ::..: .: ::. :.: : . . CCDS45 PHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQ 460 470 480 490 500 510 550 560 570 580 590 600 pF1KE2 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA : ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : :: .::.:.. CCDS45 GLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPD 520 530 540 550 560 570 610 620 630 640 650 pF1KE2 NSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHAR-TPL--IAA :. :.:. : . :.:: :::..: .. : : . : .:: : . CCDS45 LSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------PAEQRASPLTSIIS 580 590 600 610 620 660 670 680 690 700 710 pF1KE2 GVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL .:.: :.. :..:..:.. ..:.. : .: ..::.: ::::::::::::. :::::.::: CCDS45 AVVGILLV-VVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRIL 630 640 650 660 670 680 720 730 740 750 760 770 pF1KE2 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA :::::..:::::::::::::::::.:.::.::::::::.: :.:.:::: :..::: .:: CCDS45 KETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMA 690 700 710 720 730 740 780 790 800 810 820 830 pF1KE2 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY .. :.. ::::.::. :.::::::::.::::..:.:.. .::: :::::.:::::: : CCDS45 GVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSY 750 760 770 780 790 800 840 850 860 870 880 890 pF1KE2 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH ::. :::::::::::::::::::::::::::::::. :: ::.:::::.:::::::: : CCDS45 LEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESIL 810 820 830 840 850 860 900 910 920 930 940 950 pF1KE2 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM :.:::::::::::::.:::::::.:::::::.:::::::::::::::::::::::::.: CCDS45 RRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIM 870 880 890 900 910 920 960 970 980 990 1000 1010 pF1KE2 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL :::::::.. ::.:.::..:::::::::::..:::..: . :: :: :...::...:. CCDS45 VKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLDSTFYRSLLEDDDM 930 940 950 960 970 980 1020 1030 1040 1050 1060 1070 pF1KE2 EDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFA :..::::::::: .: : : . . . : . : :.:: CCDS45 GDLVDAEEYLVPQQGFFCPDPA-------PGAGGMVHHRHRSSST---------RSGGGD 990 1000 1010 1020 1080 1090 1100 1110 1120 1130 pF1KE2 AEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADP :. : . . : :: ..:: ...:: . :. . . ... : :::: :: CCDS45 LTLGLE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDP 1030 1040 1050 1060 1070 1080 1140 1150 1160 1170 1180 1190 pF1KE2 TVFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNAS :: : .. .::..:. .:. ::.: . : ..: : : : .:. CCDS45 TVPLPSET-------DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAA-RPA--GAT 1090 1100 1110 1120 1130 1200 1210 1220 1230 1240 pF1KE2 NGPPKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA-----KKAFDNPDYWNHS ::. . : . . .:.... . ::: . . :. . :::: ::... CCDS45 LERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQD 1140 1150 1160 1170 1180 1190 1250 1260 1270 1280 1290 1300 pF1KE2 LPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNT : :.. :. .. : ::::::: CCDS45 PPERGA--PPSTFKGTPT--------------AENPEYLGLDVPV 1200 1210 1220 pF1KE2 VV >>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa) initn: 2971 init1: 1332 opt: 3601 Z-score: 1844.5 bits: 353.6 E(32554): 2e-96 Smith-Waterman score: 4169; 50.4% identity (72.7% similar) in 1283 aa overlap (1-1244:1-1264) 10 20 30 40 50 60 pF1KE2 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM :. .: : :. : . ..::.:: :: : :: .: :.::..: : :: ::::: CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF :::::. :: :::::. .::::::::::.:.: ::: :::..:::..:. ..:. .. CCDS31 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST ::: ... .:..: : .:::::.::::...: ::. ::: :.::::. . .:. CCDS31 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD--RDAEIVVKD 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG :: : : ::. : :::::: . :::::.:.:: ::.:.:.:: ..::: :::::::: CCDS31 NGRS-CPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD :.::::::: .:::::::: .::: .::: ::::: : ..:: ::. :: .:::::::: CCDS31 PQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVD 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE2 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT ..::::::: .::::..::.:::.:: .:::::.: :.:: . ::::::::: :.::: CCDS31 QTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRF--QTVDSSNIDGFVNCT 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE2 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL :: ::: ::.::..:::.. : :.::::::::::::::::.::::::::.: .::::::: CCDS31 KILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNL 360 370 380 390 400 410 430 440 450 460 470 pF1KE2 VTIGGRVLYS-GLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT-TLF .::::: ::. :.::::.:. ..::: :.:::::::: :::. : .:::.:..::: .: CCDS31 TTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLR 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 STINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNL . ..:. :. :: ..:.::: ::. :::: ::::::: :::::: .::: .:. ::. CCDS31 GPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNF 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 YDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQ .:: ::: . . : : :.:. :: : ::.: : :.:..:.::.:::.:: .:: :. CCDS31 LNGEPREFAHEAECFSCHPECQPME-GTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVL 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 GANSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPL-IAAGV ::.. :.:: : . ::.::: ::::::.:: .::. :. :: ..: : .: : CCDS31 GAKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCL-----GQ-TLVLIGKTHLTMALTV 600 610 620 630 640 660 670 680 690 700 710 pF1KE2 IGGLFIL-VIVGLTFAVYVRRKSIKKKRALRRFLET-ELVEPLTPSGTAPNQAQLRILKE :.:: .. ...: :: .: : . :..:::.::.:: : .::: :: : :.. ::.:: CCDS31 IAGLVVIFMMLGGTF-LYWRGRRIQNKRAMRRYLERGESIEPLDPSEKA-NKVLARIFKE 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE2 TELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASM :::...::::::.::::.::.:.::::..:::: ::.... .: .. :. : ..:. CCDS31 TELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSL 710 720 730 740 750 760 780 790 800 810 820 830 pF1KE2 DHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLE :: :.:::::.: . ..::::: .: : ::..:..:. .: :::::: :::::::.::: CCDS31 DHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLE 770 780 790 800 810 820 840 850 860 870 880 890 pF1KE2 ERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYR :. .:::.:::::::.:::..:...:::.: :: :.:. . .: :::::::: ::. CCDS31 EHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFG 830 840 850 860 870 880 900 910 920 930 940 950 pF1KE2 KFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVK :.::::::::::::.:::::::..:: :. :.:::::::::: :: :::::::::::: CCDS31 KYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVK 890 900 910 920 930 940 960 970 980 990 1000 1010 pF1KE2 CWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKL-PSPNDSKFFQNLLDEEDLE ::::: . :: ::::: ::.:::::: :::::. .. . :.:. . .. :.: .:: CCDS31 CWMIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELE 950 960 970 980 990 1000 1020 1030 1040 1050 1060 pF1KE2 DMMDAEEYLVPQAFNIPPPIYTSRARIDS---NR---SEIGHSPPPAYTPMS-GNQFVYR .: . : . :. : . :: :. :: .: ::. :: . . CCDS31 PELDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGN--LGE 1010 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 pF1KE2 DGGFAAEQGVS--VPYRAPTSTIPEAPVAQ--------GATAEIFDD-SCCNGTLRKPVA . .: .: : : . .:.. .:. :. ::. . : : . :. . CCDS31 SCQESAVSGSSERCPRPVSLHPMPRGCLASESSEGHVTGSEAELQEKVSMCRSRSRSR-S 1070 1080 1090 1100 1110 1120 1120 1130 1140 1150 1160 pF1KE2 PHVQEDSS--TQRYSADPTVFAPERSPRG--ELDEEGYMTP---MRDKP--KQEYLNPVE :. . ::. .::.: : .: :: : : : .::. : .. : .. :. : CCDS31 PRPRGDSAYHSQRHSLLTPV-TPL-SPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVG 1130 1140 1150 1160 1170 1180 1170 1180 1190 1200 1210 1220 pF1KE2 ENPFVSRRKNGD---LQALDNPEYHNASNGP-PKAEDEYVNEPLYLNT-FANTLGKAEYL . .. ... . . .. . :. . : :.. .: : . ... .. .::... CCDS31 LSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEELGYEYMDVGSDLSASLGSTQSC 1190 1200 1210 1220 1230 1240 1230 1240 1250 1260 1270 1280 pF1KE2 K-NNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAEN . . :: . .. .: : CCDS31 PLHPVPIMPTAGTTPDEDYEYMNRQRDGGGPGGDYAAMGACPASEQGYEEMRAFQGPGHQ 1250 1260 1270 1280 1290 1300 >>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa) initn: 2953 init1: 1893 opt: 3166 Z-score: 1625.0 bits: 312.8 E(32554): 3.4e-84 Smith-Waterman score: 4332; 50.6% identity (73.8% similar) in 1292 aa overlap (1-1285:1-1198) 10 20 30 40 50 pF1KE2 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV :.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....:::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD ::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. :: CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA :..: : ....:::: . :: :::::: ::.:: . : : .: : . : :: CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGC---PTNG----P---KIPSIA 600 610 620 630 640 660 670 680 690 700 710 pF1KE2 AGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL .:..:.:..:..:.: .....::. : .::.:::.: : :::::::::: ::::: :::: CCDS55 TGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRIL 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE2 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA ::::.:..::::::::::::::.:.:::: :::::::: : :.:.:::: :..::: .:: CCDS55 KETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMA 710 720 730 740 750 760 780 790 800 810 820 830 pF1KE2 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY :.:.::. ::::.::. :.::.::::: ::::.::.::::::::: :::::::::::: : CCDS55 SVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNY 770 780 790 800 810 820 840 850 860 870 880 890 pF1KE2 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH ::.::::::::::::::::.:.::::::::::.:: ..::::.:.:::.:::::::: : CCDS55 LEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESIL 830 840 850 860 870 880 900 910 920 930 940 950 pF1KE2 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM .: .::::::::::::.:::::::.:::::::. :: ..:::::::::::::::::::.: CCDS55 HRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIM 890 900 910 920 930 940 960 970 980 990 1000 1010 pF1KE2 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL ::::::::::::::.:: :::.::::::::::::::.::.::::.::.:.. :.::::. CCDS55 VKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDM 950 960 970 980 990 1000 1020 1030 1040 1050 1060 1070 pF1KE2 EDMMDAEEYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAA .:..::.:::.:: . : :::. . :. : ... : .: : CCDS55 DDVVDADEYLIPQQGFFSSP-STSRTPLLSSLSATSNNSTVACIDRNGLQ---------- 1010 1020 1030 1040 1050 1080 1090 1100 1110 1120 1130 pF1KE2 EQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPT :: :. .::: ::::.::: CCDS55 -------------------------------SC-------PI----KEDSFLQRYSSDPT 1060 1070 1140 1150 1160 1170 1180 1190 pF1KE2 VFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASN : : :.. . : ::.: : .: :..: :: ::: CCDS55 ---------GALTEDSIDDTFLPVP--EYINQS-----VPKRPAGSVQ---NPVYHNQPL 1080 1090 1100 1110 1200 1210 1220 1230 1240 1250 pF1KE2 GPPKAEDEYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTL .: ..: : : . ....:. ::: :.. .: ....::.: .: .. . .: CCDS55 NPAPSRD-----PHYQDPHSTAVGNPEYL-NTV--QPTCVNSTFDSPAHWAQKGSHQISL 1120 1130 1140 1150 1160 1260 1270 1280 1290 1300 pF1KE2 QHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV ..::: :.. : : :: .. .::: ::: CCDS55 DNPDYQQDFFPKE-AKPNGIFKGSTAENAEYLRVAPQSSEFIGA 1170 1180 1190 1200 1210 >>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa) initn: 1727 init1: 966 opt: 2194 Z-score: 1136.3 bits: 221.5 E(32554): 5.7e-57 Smith-Waterman score: 2194; 47.5% identity (76.0% similar) in 630 aa overlap (1-624:1-627) 10 20 30 40 50 pF1KE2 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV :.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....:::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD ::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. :: CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA :..: : ....:::: . :: :::::: : CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGS 600 610 620 >>CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 (705 aa) initn: 1727 init1: 966 opt: 2194 Z-score: 1135.8 bits: 221.6 E(32554): 6.1e-57 Smith-Waterman score: 2194; 47.5% identity (76.0% similar) in 630 aa overlap (1-624:1-627) 10 20 30 40 50 pF1KE2 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV :.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....:::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD ::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. :: CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA :..: : ....:::: . :: :::::: : CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSHQ 600 610 620 630 640 650 1308 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 18:04:16 2016 done: Sun Nov 6 18:04:17 2016 Total Scan time: 5.010 Total Display time: 0.640 Function used was FASTA [36.3.4 Apr, 2011]