FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9893, 1292 aa 1>>>pF1KB9893 1292 - 1292 aa - 1292 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.2615+/-0.00173; mu= 9.7295+/- 0.102 mean_var=397.3722+/-87.328, 0's: 0 Z-trim(108.0): 554 B-trim: 0 in 0/51 Lambda= 0.064339 statistics sampled from 9265 (9924) to 9265 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.649), E-opt: 0.2 (0.305), width: 16 Scan time: 4.470 The best scores are: opt bits E(32554) CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 9030 855.0 0 CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 7348 698.9 2.3e-200 CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 3921 380.8 1.3e-104 CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 3917 380.4 1.6e-104 CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 3885 377.4 1.3e-103 CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 3802 369.6 2.4e-101 CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 3589 350.0 2.5e-95 CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 3188 312.7 3.8e-84 CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 2194 220.0 1.6e-56 CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 2194 220.1 1.7e-56 CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 1655 169.9 1.8e-41 CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 1353 141.6 4e-33 CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 749 86.2 5e-16 CCDS56557.1 PTK2 gene_id:5747|Hs108|chr8 (1065) 749 86.2 5e-16 CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 731 84.1 1.1e-15 CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 732 84.6 1.4e-15 CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 732 84.6 1.4e-15 CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 732 84.6 1.4e-15 CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 731 84.5 1.6e-15 CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 731 84.5 1.6e-15 CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 731 84.5 1.6e-15 CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 731 84.5 1.6e-15 CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 731 84.5 1.6e-15 CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 731 84.6 1.6e-15 CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 731 84.6 1.6e-15 CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 731 84.6 1.7e-15 CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 731 84.6 1.7e-15 CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 731 84.6 1.7e-15 CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 719 83.4 3.3e-15 CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 715 82.7 3.3e-15 CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 715 82.7 3.4e-15 CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 717 83.3 4e-15 CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 717 83.3 4.1e-15 CCDS2447.1 EPHA4 gene_id:2043|Hs108|chr2 ( 986) 710 82.5 5.9e-15 CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 704 82.0 8.7e-15 CCDS33255.1 ZAP70 gene_id:7535|Hs108|chr2 ( 312) 687 79.6 1.4e-14 CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 695 81.2 1.6e-14 CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 695 81.2 1.6e-14 CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 695 81.2 1.6e-14 CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 695 81.2 1.6e-14 CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 695 81.2 1.6e-14 CCDS5884.1 EPHA1 gene_id:2041|Hs108|chr7 ( 976) 691 80.8 2e-14 CCDS33254.1 ZAP70 gene_id:7535|Hs108|chr2 ( 619) 687 80.1 2e-14 CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 687 80.4 2.6e-14 CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 687 80.4 2.6e-14 CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 687 80.4 2.6e-14 CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 687 80.5 2.7e-14 CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 685 80.5 3.5e-14 CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 685 80.5 3.6e-14 CCDS3481.1 TEC gene_id:7006|Hs108|chr4 ( 631) 678 79.3 3.6e-14 >>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa) initn: 9030 init1: 9030 opt: 9030 Z-score: 4554.6 bits: 855.0 E(32554): 0 Smith-Waterman score: 9030; 100.0% identity (100.0% similar) in 1292 aa overlap (1-1292:1-1292) 10 20 30 40 50 60 pF1KB9 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB9 EYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 EYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB9 ATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 ATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRD 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB9 KPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLYLNTFANTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 KPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLYLNTFANTL 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB9 GKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRP 1210 1220 1230 1240 1250 1260 1270 1280 1290 pF1KB9 IVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV :::::::::::::::::::::::::::::::: CCDS42 IVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV 1270 1280 1290 >>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa) initn: 7328 init1: 7328 opt: 7348 Z-score: 3710.8 bits: 698.9 E(32554): 2.3e-200 Smith-Waterman score: 8988; 98.8% identity (98.8% similar) in 1308 aa overlap (1-1292:1-1308) 10 20 30 40 50 60 pF1KB9 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE 970 980 990 1000 1010 1020 1030 1040 1050 1060 pF1KB9 EYLVPQAFNIPPPIYTSRARIDSNR----------------NQFVYRDGGFAAEQGVSVP ::::::::::::::::::::::::: ::::::::::::::::::: CCDS23 EYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVP 1030 1040 1050 1060 1070 1080 1070 1080 1090 1100 1110 1120 pF1KB9 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS 1090 1100 1110 1120 1130 1140 1130 1140 1150 1160 1170 1180 pF1KB9 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED 1150 1160 1170 1180 1190 1200 1190 1200 1210 1220 1230 1240 pF1KB9 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ 1210 1220 1230 1240 1250 1260 1250 1260 1270 1280 1290 pF1KB9 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV :::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV 1270 1280 1290 1300 >>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa) initn: 3387 init1: 1682 opt: 3921 Z-score: 1991.8 bits: 380.8 E(32554): 1.3e-104 Smith-Waterman score: 3966; 47.6% identity (71.1% similar) in 1287 aa overlap (10-1269:9-1249) 10 20 30 40 50 pF1KB9 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVV : .::.: . : . : .::.::. :: .. : . ::. :..:.:: CCDS32 MELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVV 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 MGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAI .::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::. CCDS32 QGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 FLNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNP . : .: ::.:: :..:::::.::: ...: ::: ::: :.:: .. CCDS32 LDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKN 120 130 140 150 160 170 180 190 200 210 220 pF1KB9 WPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDC :::..:: : .: : : : :::: . . ::.::::::: : .:: :: .:: CCDS32 NQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDC 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB9 CHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFC ::..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: : CCDS32 CHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASC 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB9 VKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQT : ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ... CCDS32 VTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB9 VDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSW : :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..: CCDS32 VTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAW 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB9 PPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLC : .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..:: CCDS32 PDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLC 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB9 YYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFS . ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .: CCDS32 FVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFL 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB9 RGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGP ::. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : CCDS32 RGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPP 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB9 NCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLP :: .::.:.. :. :.:. : . :.:: :::..: .. : : CCDS32 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------P 600 610 620 630 640 650 660 670 680 690 700 pF1KB9 QHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTP . : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: :::::::::: CCDS32 AEQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTP 650 660 670 680 690 700 710 720 730 740 750 760 pF1KB9 SGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPK ::. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.:: CCDS32 SGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPK 710 720 730 740 750 760 770 780 790 800 810 820 pF1KB9 ANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLL :: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: : CCDS32 ANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDL 770 780 790 800 810 820 830 840 850 860 870 880 pF1KB9 LNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGG ::::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.:::: CCDS32 LNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGG 830 840 850 860 870 880 890 900 910 920 930 940 pF1KB9 KMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLP :.:::::::: : :.:::::::::::::.:::::::.:::::::.:::::::::::::: CCDS32 KVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLP 890 900 910 920 930 940 950 960 970 980 990 1000 pF1KB9 QPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPND :::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: : CCDS32 QPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLD 950 960 970 980 990 1000 1010 1020 1030 1040 1050 pF1KB9 SKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQ : :...::...:. :..::::::::: .: : : . . . . . :.:: CCDS32 STFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTL 1010 1020 1030 1040 1050 1060 1060 1070 1080 1090 1100 1110 pF1KB9 GVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVF :. : . . : :: ..:: ...:: . :. . . ... : :::: :::: CCDS32 GLE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVP 1070 1080 1090 1100 1110 1120 1130 1140 1150 1160 1170 pF1KB9 APERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGP : .: : ::..:. .:. ::.: . : ..: : : : .:. CCDS32 LP-----SETD--GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAA-RPA--GATLER 1120 1130 1140 1150 1160 1180 1190 1200 1210 1220 1230 pF1KB9 PKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA-----KKAFDNPDYWNHSLPP ::. . : . . .:.... . ::: . . :. . :::: ::... : CCDS32 PKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPE 1170 1180 1190 1200 1210 1220 1240 1250 1260 1270 1280 1290 pF1KB9 RSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV :.. :. .. : ::::::: CCDS32 RGA--PPSTFKGTPT--------------AENPEYLGLDVPV 1230 1240 1250 >>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa) initn: 3383 init1: 1682 opt: 3917 Z-score: 1989.8 bits: 380.4 E(32554): 1.6e-104 Smith-Waterman score: 3962; 47.6% identity (71.0% similar) in 1278 aa overlap (18-1269:4-1234) 10 20 30 40 50 60 pF1KB9 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM :. .: .::.::. :: .. : . ::. :..:.::. CCDS74 MPRGSWKP----QVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ 10 20 30 40 70 80 90 100 110 120 pF1KB9 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF ::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.. CCDS74 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL 50 60 70 80 90 100 130 140 150 160 170 pF1KB9 LNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPW : .: ::.:: :..:::::.::: ...: ::: ::: :.:: .. CCDS74 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB9 PSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCC :::..:: : .: : : : :::: . . ::.::::::: : .:: :: .::: CCDS74 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB9 HRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCV :..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: :: CCDS74 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV 230 240 250 260 270 280 300 310 320 330 340 pF1KB9 KKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQTV ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ...: CCDS74 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV 290 300 310 320 330 340 350 360 370 380 390 400 pF1KB9 DSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWP :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..:: CCDS74 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP 350 360 370 380 390 400 410 420 430 440 450 460 pF1KB9 PNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCY .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..::. CCDS74 DSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCF 410 420 430 440 450 460 470 480 490 500 510 520 pF1KB9 YHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSR ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .: : CCDS74 VHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLR 470 480 490 500 510 520 530 540 550 560 570 580 pF1KB9 GRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPN :. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : CCDS74 GQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPPF 530 540 550 560 570 580 590 600 610 620 630 640 pF1KB9 CVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQ :: .::.:.. :. :.:. : . :.:: :::..: .. : : CCDS74 CVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------PA 590 600 610 620 650 660 670 680 690 700 pF1KB9 HAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTPS . : .:: : ..:.: :.. :..:..:.. ..:.. : .: ..::.: ::::::::::: CCDS74 EQRASPLTSIISAVVGILLV-VVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPS 630 640 650 660 670 680 710 720 730 740 750 760 pF1KB9 GTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKA :. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.::: CCDS74 GAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKA 690 700 710 720 730 740 770 780 790 800 810 820 pF1KB9 NVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLL : :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: :: CCDS74 NKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLL 750 760 770 780 790 800 830 840 850 860 870 880 pF1KB9 NWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGK :::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.::::: CCDS74 NWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGK 810 820 830 840 850 860 890 900 910 920 930 940 pF1KB9 MPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQ .:::::::: : :.:::::::::::::.:::::::.:::::::.::::::::::::::: CCDS74 VPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQ 870 880 890 900 910 920 950 960 970 980 990 1000 pF1KB9 PPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDS ::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: :: CCDS74 PPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLDS 930 940 950 960 970 980 1010 1020 1030 1040 1050 1060 pF1KB9 KFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQG :...::...:. :..::::::::: .: : : . . . . . :.:: : CCDS74 TFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLG 990 1000 1010 1020 1030 1040 1070 1080 1090 1100 1110 1120 pF1KB9 VSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFA . : . . : :: ..:: ...:: . :. . . ... : :::: :::: CCDS74 LE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPL 1050 1060 1070 1080 1090 1100 1130 1140 1150 1160 1170 1180 pF1KB9 PERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPP : .. .::..:. .:. ::.: . : ..: : : : .:. : CCDS74 PSET-------DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAA-RPA--GATLERP 1110 1120 1130 1140 1150 1190 1200 1210 1220 1230 pF1KB9 KAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA-----KKAFDNPDYWNHSLPPR :. . : . . .:.... . ::: . . :. . :::: ::... : : CCDS74 KTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPER 1160 1170 1180 1190 1200 1210 1240 1250 1260 1270 1280 1290 pF1KB9 STLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV .. :. .. : ::::::: CCDS74 GA--PPSTFKGTPT--------------AENPEYLGLDVPV 1220 1230 1240 >>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa) initn: 3352 init1: 1682 opt: 3885 Z-score: 1973.8 bits: 377.4 E(32554): 1.3e-103 Smith-Waterman score: 3930; 47.8% identity (71.3% similar) in 1253 aa overlap (43-1269:10-1219) 20 30 40 50 60 70 pF1KB9 LLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVMGNLEITSIEHNR : . ::. :..:.::.::::.: . : CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNA 10 20 30 80 90 100 110 120 pF1KB9 DLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIFLNYRKDGNF--- .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.. : .: CCDS45 SLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPV 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB9 ------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVSTNGS ::.:: :..:::::.::: ...: ::: ::: :.:: .. :::..:: : CCDS45 TGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRS 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB9 SGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSGPK .: : : : :::: . . ::.::::::: : .:: :: .::::..::.::.::: CCDS45 RACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPK 160 170 180 190 200 210 250 260 270 280 290 300 pF1KB9 DTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFV-VDS .::.::..:: :: : .:: .:: ::. : ...::.:: :: ::.:.. .: CCDS45 HSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDV 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB9 SSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT .::. .:: ..:: :.: . :. :. : ..: :.: : ...: :.::..: .: CCDS45 GSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCK 280 290 300 310 320 330 370 380 390 400 410 420 pF1KB9 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL :: :.: :: .. ::: . ..::.:.::.:..::::.: :..:: .. :.:::.:: CCDS45 KIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNL 340 350 360 370 380 390 430 440 450 460 470 480 pF1KB9 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST .: ::.:..: : :. ::. : ..::.:...: : :..::. ::. : :: . CCDS45 QVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRN 400 410 420 430 440 450 490 500 510 520 530 540 pF1KB9 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD .: .. :: ..:..::..:..::. :::::: ::..: .: ::. :.: : . . CCDS45 PHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQ 460 470 480 490 500 510 550 560 570 580 590 600 pF1KB9 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA : ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : :: .::.:.. CCDS45 GLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPD 520 530 540 550 560 570 610 620 630 640 650 pF1KB9 NSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHAR-TPL--IAA :. :.:. : . :.:: :::..: .. : : . : .:: : . CCDS45 LSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------PAEQRASPLTSIIS 580 590 600 610 620 660 670 680 690 700 710 pF1KB9 GVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL .:.: ....:..:..:.. ..:.. : .: ..::.: ::::::::::::. :::::.::: CCDS45 AVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRIL 630 640 650 660 670 680 720 730 740 750 760 770 pF1KB9 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA :::::..:::::::::::::::::.:.::.::::::::.: :.:.:::: :..::: .:: CCDS45 KETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMA 690 700 710 720 730 740 780 790 800 810 820 830 pF1KB9 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY .. :.. ::::.::. :.::::::::.::::..:.:.. .::: :::::.:::::: : CCDS45 GVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSY 750 760 770 780 790 800 840 850 860 870 880 890 pF1KB9 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH ::. :::::::::::::::::::::::::::::::. :: ::.:::::.:::::::: : CCDS45 LEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESIL 810 820 830 840 850 860 900 910 920 930 940 950 pF1KB9 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM :.:::::::::::::.:::::::.:::::::.:::::::::::::::::::::::::.: CCDS45 RRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIM 870 880 890 900 910 920 960 970 980 990 1000 1010 pF1KB9 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL :::::::.. ::.:.::..:::::::::::..:::..: . :: :: :...::...:. CCDS45 VKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLDSTFYRSLLEDDDM 930 940 950 960 970 980 1020 1030 1040 1050 1060 1070 pF1KB9 EDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTI :..::::::::: .: : : . . . . . :.:: :. : . . CCDS45 GDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLE-PSEEEAPRS 990 1000 1010 1020 1030 1040 1080 1090 1100 1110 1120 1130 pF1KB9 PEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEE : :: ..:: ...:: . :. . . ... : :::: :::: : .. . CCDS45 PLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSET-------D 1050 1060 1070 1080 1090 1140 1150 1160 1170 1180 1190 pF1KB9 GYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLY ::..:. .:. ::.: . : ..: : : : .:. ::. . : . CCDS45 GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAA-RPA--GATLERPKTLSPGKNGVVK 1100 1110 1120 1130 1140 1150 1200 1210 1220 1230 1240 pF1KB9 -LNTFANTLGKAEYLKNNILSMPEKA-----KKAFDNPDYWNHSLPPRSTLQHPDYLQEY . .:.... . ::: . . :. . :::: ::... : :.. :. .. CCDS45 DVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGA--PPSTFKGT 1160 1170 1180 1190 1200 1210 1250 1260 1270 1280 1290 pF1KB9 STKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV : ::::::: CCDS45 PT--------------AENPEYLGLDVPV 1220 >>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa) initn: 3420 init1: 1665 opt: 3802 Z-score: 1932.8 bits: 369.6 E(32554): 2.4e-101 Smith-Waterman score: 3802; 52.2% identity (75.7% similar) in 1064 aa overlap (10-1046:9-1054) 10 20 30 40 50 pF1KB9 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVV : .::.: . : . : .::.::. :: .. : . ::. :..:.:: CCDS77 MELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVV 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 MGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAI .::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::. CCDS77 QGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 FLNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNP . : .: ::.:: :..:::::.::: ...: ::: ::: :.:: .. CCDS77 LDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKN 120 130 140 150 160 170 180 190 200 210 220 pF1KB9 WPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDC :::..:: : .: : : : :::: . . ::.::::::: : .:: :: .:: CCDS77 NQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDC 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB9 CHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFC ::..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: : CCDS77 CHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASC 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB9 VKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQT : ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ... CCDS77 VTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB9 VDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSW : :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..: CCDS77 VTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAW 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB9 PPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLC : .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..:: CCDS77 PDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLC 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB9 YYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFS . ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .: CCDS77 FVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFL 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB9 RGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGP ::. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : CCDS77 RGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPP 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB9 NCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLP :: .::.:.. :. :.:. : . :.:: :::..: .. : : CCDS77 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------P 600 610 620 630 640 650 660 670 680 690 700 pF1KB9 QHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTP . : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: :::::::::: CCDS77 AEQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTP 650 660 670 680 690 700 710 720 730 740 750 760 pF1KB9 SGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPK ::. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.:: CCDS77 SGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPK 710 720 730 740 750 760 770 780 790 800 810 820 pF1KB9 ANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLL :: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: : CCDS77 ANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDL 770 780 790 800 810 820 830 840 850 860 870 880 pF1KB9 LNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGG ::::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.:::: CCDS77 LNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGG 830 840 850 860 870 880 890 900 910 920 930 940 pF1KB9 KMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLP :.:::::::: : :.:::::::::::::.:::::::.:::::::.:::::::::::::: CCDS77 KVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLP 890 900 910 920 930 940 950 960 970 980 990 1000 pF1KB9 QPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPND :::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: : CCDS77 QPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLD 950 960 970 980 990 1000 1010 1020 1030 1040 1050 pF1KB9 SKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPP------IYTSRARIDSNRNQFVYRDG : :...::...:. :..::::::::: .: : : . : : .:.:: CCDS77 STFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRNM 1010 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 pF1KB9 GFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYS >>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa) initn: 2971 init1: 1332 opt: 3589 Z-score: 1825.0 bits: 350.0 E(32554): 2.5e-95 Smith-Waterman score: 4157; 52.4% identity (73.9% similar) in 1197 aa overlap (1-1188:1-1157) 10 20 30 40 50 60 pF1KB9 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM :. .: : :. : . ..::.:: :: : :: .: :.::..: : :: ::::: CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF :::::. :: :::::. .::::::::::.:.: ::: :::..:::..:. ..:. .. CCDS31 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST ::: ... .:..: : .:::::.::::...: ::. ::: :.::::. . .:. CCDS31 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDR--DAEIVVKD 130 140 150 160 170 190 200 210 220 230 240 pF1KB9 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG :: : : ::. : :::::: . :::::.:.:: ::.:.:.:: ..::: :::::::: CCDS31 NGRS-CPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB9 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD :.::::::: .:::::::: .::: .::: ::::: : ..:: ::. :: .:::::::: CCDS31 PQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVD 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB9 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT ..::::::: .::::..::.:::.:: .:::::.: :.:: . ::::::::: :.::: CCDS31 QTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRF--QTVDSSNIDGFVNCT 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB9 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL :: ::: ::.::..:::.. : :.::::::::::::::::.::::::::.: .::::::: CCDS31 KILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNL 360 370 380 390 400 410 430 440 450 460 470 pF1KB9 VTIGGRVLYS-GLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT-TLF .::::: ::. :.::::.:. ..::: :.:::::::: :::. : .:::.:..::: .: CCDS31 TTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLR 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB9 STINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNL . ..:. :. :: ..:.::: ::. :::: ::::::: :::::: .::: .:. ::. CCDS31 GPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNF 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB9 YDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQ .:: ::: . . : : :.:. :: : ::.: : :.:..:.::.:::.:: .:: :. CCDS31 LNGEPREFAHEAECFSCHPECQPME-GTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVL 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB9 GANSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPL-IAAGV ::.. :.:: : . ::.::: ::::::.:: .::. :. :: ..: : .: : CCDS31 GAKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCL-----GQ-TLVLIGKTHLTMALTV 600 610 620 630 640 660 670 680 690 700 710 pF1KB9 IGGLFIL-VIVGLTFAVYVRRKSIKKKRALRRFLET-ELVEPLTPSGTAPNQAQLRILKE :.:: .. ...: :: .: : . :..:::.::.:: : .::: :: : :.. ::.:: CCDS31 IAGLVVIFMMLGGTF-LYWRGRRIQNKRAMRRYLERGESIEPLDPSEKA-NKVLARIFKE 650 660 670 680 690 700 720 730 740 750 760 770 pF1KB9 TELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASM :::...::::::.::::.::.:.::::..:::: ::.... .: .. :. : ..:. CCDS31 TELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSL 710 720 730 740 750 760 780 790 800 810 820 830 pF1KB9 DHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLE :: :.:::::.: . ..::::: .: : ::..:..:. .: :::::: :::::::.::: CCDS31 DHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLE 770 780 790 800 810 820 840 850 860 870 880 890 pF1KB9 ERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYR :. .:::.:::::::.:::..:...:::.: :: :.:. . .: :::::::: ::. CCDS31 EHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFG 830 840 850 860 870 880 900 910 920 930 940 950 pF1KB9 KFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVK :.::::::::::::.:::::::..:: :. :.:::::::::: :: :::::::::::: CCDS31 KYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVK 890 900 910 920 930 940 960 970 980 990 1000 1010 pF1KB9 CWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKL-PSPNDSKFFQNLLDEEDLE ::::: . :: ::::: ::.:::::: :::::. .. . :.:. . .. :.: .:: CCDS31 CWMIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELE 950 960 970 980 990 1000 1020 1030 1040 1050 1060 1070 pF1KB9 DMMDAEEYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPE .: . : . :. : . : . .: : .:.: CCDS31 PELDLDLDLEAEEDNLATTTLGSALSLPV---------GTLNRPRG-SQSLLSPSSGY-- 1010 1020 1030 1040 1050 1080 1090 1100 1110 1120 1130 pF1KB9 APVAQGATAEIFDDSCCNGTLRK---PVAPHVQEDSSTQRYSADPTVFAPERSPRGELDE :. :: .: ..: .:. .. ::. : . . :.. : . : .::.: CCDS31 MPMNQGNLGESCQESAVSGSSERCPRPVSLHPMPRGCLASESSEGHVTGSE----AELQE 1060 1070 1080 1090 1100 1110 1140 1150 1160 1170 1180 1190 pF1KB9 EGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPL . : :.. ... : .. . :.: ..: .: . .:: :.: :: CCDS31 KVSMC--RSRSRSRSPRPRGDSAYHSQR-----HSLLTP---VTPLSPPGLEEEDVNGYV 1120 1130 1140 1150 1160 1200 1210 1220 1230 1240 1250 pF1KB9 YLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYF CCDS31 MPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEEL 1170 1180 1190 1200 1210 1220 >>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa) initn: 2953 init1: 1893 opt: 3188 Z-score: 1624.2 bits: 312.7 E(32554): 3.8e-84 Smith-Waterman score: 4360; 51.1% identity (75.1% similar) in 1277 aa overlap (1-1269:1-1198) 10 20 30 40 50 pF1KB9 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV :.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....:::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB9 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB9 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM 130 140 150 160 170 180 190 200 210 220 230 pF1KB9 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB9 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB9 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB9 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB9 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB9 CNLYDGEFREFENGSICVECDPQCEKMEDGL-LTCHGPGPDNCTKCSHFKDGPNCVEKCP ::: .:: ::: ..: :..: :.: . ... .:: : ::::: .:.:. :::.::. :: CCDS55 CNLLEGEPREFVENSECIQCHPEC--LPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB9 DGLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLI :..: : ....:::: . :: :::::: ::.:: . : : .: : . : : CCDS55 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGC---PTNG----P---KIPSI 600 610 620 630 640 660 670 680 690 700 710 pF1KB9 AAGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFL-ETELVEPLTPSGTAPNQAQLRI :.:..:.:..:..:.: .....::. : .::.:::.: : :::::::::: ::::: ::: CCDS55 ATGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRI 650 660 670 680 690 700 720 730 740 750 760 770 pF1KB9 LKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIM :::::.:..::::::::::::::.:.:::: :::::::: : :.:.:::: :..::: .: CCDS55 LKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVM 710 720 730 740 750 760 780 790 800 810 820 830 pF1KB9 ASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMM ::.:.::. ::::.::. :.::.::::: ::::.::.::::::::: :::::::::::: CCDS55 ASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMN 770 780 790 800 810 820 840 850 860 870 880 890 pF1KB9 YLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECI :::.::::::::::::::::.:.::::::::::.:: ..::::.:.:::.:::::::: : CCDS55 YLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESI 830 840 850 860 870 880 900 910 920 930 940 950 pF1KB9 HYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMV .: .::::::::::::.:::::::.:::::::. :: ..:::::::::::::::::::. CCDS55 LHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMI 890 900 910 920 930 940 960 970 980 990 1000 1010 pF1KB9 MVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEED :::::::::::::::.:: :::.::::::::::::::.::.::::.::.:.. :.:::: CCDS55 MVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEED 950 960 970 980 990 1000 1020 1030 1040 1050 1060 1070 pF1KB9 LEDMMDAEEYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTI ..:..::.:::.:: :: . ..: :.: . CCDS55 MDDVVDADEYLIPQQ--------------------------GFFSSPSTS---RTPLLSS 1010 1020 1030 1080 1090 1100 1110 1120 1130 pF1KB9 PEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEE : .....:. .: :: :. .::: ::::.::: : : :. CCDS55 LSA-TSNNSTVACIDR---NGLQSCPI----KEDSFLQRYSSDPT---------GALTED 1040 1050 1060 1070 1080 1140 1150 1160 1170 1180 1190 pF1KB9 GYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLY . . : ::.: : .: :..: :: ::: .: ..: : : CCDS55 SIDDTFL--PVPEYINQS-----VPKRPAGSVQ---NPVYHNQPLNPAPSRD-----PHY 1090 1100 1110 1120 1200 1210 1220 1230 1240 1250 pF1KB9 LNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFY . ....:. ::: :.. .: ....::.: .: .. . .:..::: :.. : CCDS55 QDPHSTAVGNPEYL-NTV--QPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKE-A 1130 1140 1150 1160 1170 1180 1260 1270 1280 1290 pF1KB9 KQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV : :: .. .::: ::: CCDS55 KPNGIFKGSTAENAEYLRVAPQSSEFIGA 1190 1200 1210 >>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa) initn: 1727 init1: 966 opt: 2194 Z-score: 1128.3 bits: 220.0 E(32554): 1.6e-56 Smith-Waterman score: 2194; 47.5% identity (76.0% similar) in 630 aa overlap (1-624:1-627) 10 20 30 40 50 pF1KB9 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV :.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....:::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB9 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB9 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM 130 140 150 160 170 180 190 200 210 220 230 pF1KB9 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB9 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB9 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB9 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB9 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB9 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD ::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. :: CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB9 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA :..: : ....:::: . :: :::::: : CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGS 600 610 620 >>CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 (705 aa) initn: 1727 init1: 966 opt: 2194 Z-score: 1127.8 bits: 220.1 E(32554): 1.7e-56 Smith-Waterman score: 2194; 47.5% identity (76.0% similar) in 630 aa overlap (1-624:1-627) 10 20 30 40 50 pF1KB9 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV :.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....:::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB9 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB9 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM 130 140 150 160 170 180 190 200 210 220 230 pF1KB9 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB9 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB9 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB9 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB9 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB9 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD ::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. :: CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB9 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA :..: : ....:::: . :: :::::: : CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSHQ 600 610 620 630 640 650 1292 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 18:03:13 2016 done: Sun Nov 6 18:03:14 2016 Total Scan time: 4.470 Total Display time: 0.650 Function used was FASTA [36.3.4 Apr, 2011]