FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9893, 1292 aa
1>>>pF1KB9893 1292 - 1292 aa - 1292 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.2615+/-0.00173; mu= 9.7295+/- 0.102
mean_var=397.3722+/-87.328, 0's: 0 Z-trim(108.0): 554 B-trim: 0 in 0/51
Lambda= 0.064339
statistics sampled from 9265 (9924) to 9265 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.649), E-opt: 0.2 (0.305), width: 16
Scan time: 4.470
The best scores are: opt bits E(32554)
CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 9030 855.0 0
CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 7348 698.9 2.3e-200
CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 3921 380.8 1.3e-104
CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 3917 380.4 1.6e-104
CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 3885 377.4 1.3e-103
CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 3802 369.6 2.4e-101
CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 3589 350.0 2.5e-95
CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 3188 312.7 3.8e-84
CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 2194 220.0 1.6e-56
CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 2194 220.1 1.7e-56
CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 1655 169.9 1.8e-41
CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 1353 141.6 4e-33
CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 749 86.2 5e-16
CCDS56557.1 PTK2 gene_id:5747|Hs108|chr8 (1065) 749 86.2 5e-16
CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 731 84.1 1.1e-15
CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 732 84.6 1.4e-15
CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 732 84.6 1.4e-15
CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 732 84.6 1.4e-15
CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 731 84.5 1.6e-15
CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 731 84.5 1.6e-15
CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 731 84.5 1.6e-15
CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 731 84.5 1.6e-15
CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 731 84.5 1.6e-15
CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 731 84.6 1.6e-15
CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 731 84.6 1.6e-15
CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 731 84.6 1.7e-15
CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 731 84.6 1.7e-15
CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 731 84.6 1.7e-15
CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 719 83.4 3.3e-15
CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 715 82.7 3.3e-15
CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 715 82.7 3.4e-15
CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 717 83.3 4e-15
CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 717 83.3 4.1e-15
CCDS2447.1 EPHA4 gene_id:2043|Hs108|chr2 ( 986) 710 82.5 5.9e-15
CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 704 82.0 8.7e-15
CCDS33255.1 ZAP70 gene_id:7535|Hs108|chr2 ( 312) 687 79.6 1.4e-14
CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 695 81.2 1.6e-14
CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 695 81.2 1.6e-14
CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 695 81.2 1.6e-14
CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 695 81.2 1.6e-14
CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 695 81.2 1.6e-14
CCDS5884.1 EPHA1 gene_id:2041|Hs108|chr7 ( 976) 691 80.8 2e-14
CCDS33254.1 ZAP70 gene_id:7535|Hs108|chr2 ( 619) 687 80.1 2e-14
CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 687 80.4 2.6e-14
CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 687 80.4 2.6e-14
CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 687 80.4 2.6e-14
CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 687 80.5 2.7e-14
CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 685 80.5 3.5e-14
CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 685 80.5 3.6e-14
CCDS3481.1 TEC gene_id:7006|Hs108|chr4 ( 631) 678 79.3 3.6e-14
>>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa)
initn: 9030 init1: 9030 opt: 9030 Z-score: 4554.6 bits: 855.0 E(32554): 0
Smith-Waterman score: 9030; 100.0% identity (100.0% similar) in 1292 aa overlap (1-1292:1-1292)
10 20 30 40 50 60
pF1KB9 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB9 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB9 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB9 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB9 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB9 EYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQG
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB9 ATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 ATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRD
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB9 KPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLYLNTFANTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 KPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLYLNTFANTL
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB9 GKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRP
1210 1220 1230 1240 1250 1260
1270 1280 1290
pF1KB9 IVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
::::::::::::::::::::::::::::::::
CCDS42 IVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
1270 1280 1290
>>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa)
initn: 7328 init1: 7328 opt: 7348 Z-score: 3710.8 bits: 698.9 E(32554): 2.3e-200
Smith-Waterman score: 8988; 98.8% identity (98.8% similar) in 1308 aa overlap (1-1292:1-1308)
10 20 30 40 50 60
pF1KB9 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB9 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB9 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB9 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB9 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE
970 980 990 1000 1010 1020
1030 1040 1050 1060
pF1KB9 EYLVPQAFNIPPPIYTSRARIDSNR----------------NQFVYRDGGFAAEQGVSVP
::::::::::::::::::::::::: :::::::::::::::::::
CCDS23 EYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVP
1030 1040 1050 1060 1070 1080
1070 1080 1090 1100 1110 1120
pF1KB9 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS
1090 1100 1110 1120 1130 1140
1130 1140 1150 1160 1170 1180
pF1KB9 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED
1150 1160 1170 1180 1190 1200
1190 1200 1210 1220 1230 1240
pF1KB9 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ
1210 1220 1230 1240 1250 1260
1250 1260 1270 1280 1290
pF1KB9 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
1270 1280 1290 1300
>>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa)
initn: 3387 init1: 1682 opt: 3921 Z-score: 1991.8 bits: 380.8 E(32554): 1.3e-104
Smith-Waterman score: 3966; 47.6% identity (71.1% similar) in 1287 aa overlap (10-1269:9-1249)
10 20 30 40 50
pF1KB9 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVV
: .::.: . : . : .::.::. :: .. : . ::. :..:.::
CCDS32 MELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVV
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 MGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAI
.::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.
CCDS32 QGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 FLNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNP
. : .: ::.:: :..:::::.::: ...: ::: ::: :.:: ..
CCDS32 LDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKN
120 130 140 150 160 170
180 190 200 210 220
pF1KB9 WPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDC
:::..:: : .: : : : :::: . . ::.::::::: : .:: :: .::
CCDS32 NQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDC
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB9 CHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFC
::..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: :
CCDS32 CHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASC
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB9 VKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQT
: ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ...
CCDS32 VTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRA
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB9 VDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSW
: :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..:
CCDS32 VTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAW
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB9 PPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLC
: .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..::
CCDS32 PDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLC
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB9 YYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFS
. ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .:
CCDS32 FVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFL
480 490 500 510 520 530
530 540 550 560 570 580
pF1KB9 RGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGP
::. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: :
CCDS32 RGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPP
540 550 560 570 580 590
590 600 610 620 630 640
pF1KB9 NCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLP
:: .::.:.. :. :.:. : . :.:: :::..: .. : :
CCDS32 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------P
600 610 620 630 640
650 660 670 680 690 700
pF1KB9 QHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTP
. : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: ::::::::::
CCDS32 AEQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTP
650 660 670 680 690 700
710 720 730 740 750 760
pF1KB9 SGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPK
::. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.::
CCDS32 SGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPK
710 720 730 740 750 760
770 780 790 800 810 820
pF1KB9 ANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLL
:: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: :
CCDS32 ANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDL
770 780 790 800 810 820
830 840 850 860 870 880
pF1KB9 LNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGG
::::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.::::
CCDS32 LNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGG
830 840 850 860 870 880
890 900 910 920 930 940
pF1KB9 KMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLP
:.:::::::: : :.:::::::::::::.:::::::.:::::::.::::::::::::::
CCDS32 KVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLP
890 900 910 920 930 940
950 960 970 980 990 1000
pF1KB9 QPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPND
:::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: :
CCDS32 QPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLD
950 960 970 980 990 1000
1010 1020 1030 1040 1050
pF1KB9 SKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQ
: :...::...:. :..::::::::: .: : : . . . . . :.::
CCDS32 STFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTL
1010 1020 1030 1040 1050 1060
1060 1070 1080 1090 1100 1110
pF1KB9 GVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVF
:. : . . : :: ..:: ...:: . :. . . ... : :::: ::::
CCDS32 GLE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVP
1070 1080 1090 1100 1110
1120 1130 1140 1150 1160 1170
pF1KB9 APERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGP
: .: : ::..:. .:. ::.: . : ..: : : : .:.
CCDS32 LP-----SETD--GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAA-RPA--GATLER
1120 1130 1140 1150 1160
1180 1190 1200 1210 1220 1230
pF1KB9 PKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA-----KKAFDNPDYWNHSLPP
::. . : . . .:.... . ::: . . :. . :::: ::... :
CCDS32 PKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPE
1170 1180 1190 1200 1210 1220
1240 1250 1260 1270 1280 1290
pF1KB9 RSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
:.. :. .. : :::::::
CCDS32 RGA--PPSTFKGTPT--------------AENPEYLGLDVPV
1230 1240 1250
>>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa)
initn: 3383 init1: 1682 opt: 3917 Z-score: 1989.8 bits: 380.4 E(32554): 1.6e-104
Smith-Waterman score: 3962; 47.6% identity (71.0% similar) in 1278 aa overlap (18-1269:4-1234)
10 20 30 40 50 60
pF1KB9 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
:. .: .::.::. :: .. : . ::. :..:.::.
CCDS74 MPRGSWKP----QVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ
10 20 30 40
70 80 90 100 110 120
pF1KB9 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::..
CCDS74 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL
50 60 70 80 90 100
130 140 150 160 170
pF1KB9 LNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPW
: .: ::.:: :..:::::.::: ...: ::: ::: :.:: ..
CCDS74 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB9 PSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCC
:::..:: : .: : : : :::: . . ::.::::::: : .:: :: .:::
CCDS74 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB9 HRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCV
:..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: ::
CCDS74 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV
230 240 250 260 270 280
300 310 320 330 340
pF1KB9 KKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQTV
::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ...:
CCDS74 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV
290 300 310 320 330 340
350 360 370 380 390 400
pF1KB9 DSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWP
:.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..::
CCDS74 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP
350 360 370 380 390 400
410 420 430 440 450 460
pF1KB9 PNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCY
.. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..::.
CCDS74 DSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCF
410 420 430 440 450 460
470 480 490 500 510 520
pF1KB9 YHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSR
::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .: :
CCDS74 VHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLR
470 480 490 500 510 520
530 540 550 560 570 580
pF1KB9 GRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPN
:. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: :
CCDS74 GQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPPF
530 540 550 560 570 580
590 600 610 620 630 640
pF1KB9 CVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQ
:: .::.:.. :. :.:. : . :.:: :::..: .. : :
CCDS74 CVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------PA
590 600 610 620
650 660 670 680 690 700
pF1KB9 HAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTPS
. : .:: : ..:.: :.. :..:..:.. ..:.. : .: ..::.: :::::::::::
CCDS74 EQRASPLTSIISAVVGILLV-VVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPS
630 640 650 660 670 680
710 720 730 740 750 760
pF1KB9 GTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKA
:. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.:::
CCDS74 GAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKA
690 700 710 720 730 740
770 780 790 800 810 820
pF1KB9 NVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLL
: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: ::
CCDS74 NKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLL
750 760 770 780 790 800
830 840 850 860 870 880
pF1KB9 NWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGK
:::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.:::::
CCDS74 NWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGK
810 820 830 840 850 860
890 900 910 920 930 940
pF1KB9 MPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQ
.:::::::: : :.:::::::::::::.:::::::.:::::::.:::::::::::::::
CCDS74 VPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQ
870 880 890 900 910 920
950 960 970 980 990 1000
pF1KB9 PPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDS
::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: ::
CCDS74 PPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLDS
930 940 950 960 970 980
1010 1020 1030 1040 1050 1060
pF1KB9 KFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQG
:...::...:. :..::::::::: .: : : . . . . . :.:: :
CCDS74 TFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLG
990 1000 1010 1020 1030 1040
1070 1080 1090 1100 1110 1120
pF1KB9 VSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFA
. : . . : :: ..:: ...:: . :. . . ... : :::: ::::
CCDS74 LE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPL
1050 1060 1070 1080 1090 1100
1130 1140 1150 1160 1170 1180
pF1KB9 PERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPP
: .. .::..:. .:. ::.: . : ..: : : : .:. :
CCDS74 PSET-------DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAA-RPA--GATLERP
1110 1120 1130 1140 1150
1190 1200 1210 1220 1230
pF1KB9 KAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA-----KKAFDNPDYWNHSLPPR
:. . : . . .:.... . ::: . . :. . :::: ::... : :
CCDS74 KTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPER
1160 1170 1180 1190 1200 1210
1240 1250 1260 1270 1280 1290
pF1KB9 STLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
.. :. .. : :::::::
CCDS74 GA--PPSTFKGTPT--------------AENPEYLGLDVPV
1220 1230 1240
>>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa)
initn: 3352 init1: 1682 opt: 3885 Z-score: 1973.8 bits: 377.4 E(32554): 1.3e-103
Smith-Waterman score: 3930; 47.8% identity (71.3% similar) in 1253 aa overlap (43-1269:10-1219)
20 30 40 50 60 70
pF1KB9 LLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVMGNLEITSIEHNR
: . ::. :..:.::.::::.: . :
CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNA
10 20 30
80 90 100 110 120
pF1KB9 DLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIFLNYRKDGNF---
.::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.. : .:
CCDS45 SLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPV
40 50 60 70 80 90
130 140 150 160 170 180
pF1KB9 ------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVSTNGS
::.:: :..:::::.::: ...: ::: ::: :.:: .. :::..:: :
CCDS45 TGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRS
100 110 120 130 140 150
190 200 210 220 230 240
pF1KB9 SGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSGPK
.: : : : :::: . . ::.::::::: : .:: :: .::::..::.::.:::
CCDS45 RACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPK
160 170 180 190 200 210
250 260 270 280 290 300
pF1KB9 DTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFV-VDS
.::.::..:: :: : .:: .:: ::. : ...::.:: :: ::.:.. .:
CCDS45 HSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDV
220 230 240 250 260 270
310 320 330 340 350 360
pF1KB9 SSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
.::. .:: ..:: :.: . :. :. : ..: :.: : ...: :.::..: .:
CCDS45 GSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCK
280 290 300 310 320 330
370 380 390 400 410 420
pF1KB9 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
:: :.: :: .. ::: . ..::.:.::.:..::::.: :..:: .. :.:::.::
CCDS45 KIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNL
340 350 360 370 380 390
430 440 450 460 470 480
pF1KB9 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
.: ::.:..: : :. ::. : ..::.:...: : :..::. ::. : :: .
CCDS45 QVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRN
400 410 420 430 440 450
490 500 510 520 530 540
pF1KB9 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
.: .. :: ..:..::..:..::. :::::: ::..: .: ::. :.: : . .
CCDS45 PHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQ
460 470 480 490 500 510
550 560 570 580 590 600
pF1KB9 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : :: .::.:..
CCDS45 GLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPD
520 530 540 550 560 570
610 620 630 640 650
pF1KB9 NSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHAR-TPL--IAA
:. :.:. : . :.:: :::..: .. : : . : .:: : .
CCDS45 LSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------PAEQRASPLTSIIS
580 590 600 610 620
660 670 680 690 700 710
pF1KB9 GVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL
.:.: ....:..:..:.. ..:.. : .: ..::.: ::::::::::::. :::::.:::
CCDS45 AVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRIL
630 640 650 660 670 680
720 730 740 750 760 770
pF1KB9 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA
:::::..:::::::::::::::::.:.::.::::::::.: :.:.:::: :..::: .::
CCDS45 KETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMA
690 700 710 720 730 740
780 790 800 810 820 830
pF1KB9 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY
.. :.. ::::.::. :.::::::::.::::..:.:.. .::: :::::.:::::: :
CCDS45 GVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSY
750 760 770 780 790 800
840 850 860 870 880 890
pF1KB9 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH
::. :::::::::::::::::::::::::::::::. :: ::.:::::.:::::::: :
CCDS45 LEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESIL
810 820 830 840 850 860
900 910 920 930 940 950
pF1KB9 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM
:.:::::::::::::.:::::::.:::::::.:::::::::::::::::::::::::.:
CCDS45 RRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIM
870 880 890 900 910 920
960 970 980 990 1000 1010
pF1KB9 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL
:::::::.. ::.:.::..:::::::::::..:::..: . :: :: :...::...:.
CCDS45 VKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLDSTFYRSLLEDDDM
930 940 950 960 970 980
1020 1030 1040 1050 1060 1070
pF1KB9 EDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTI
:..::::::::: .: : : . . . . . :.:: :. : . .
CCDS45 GDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLE-PSEEEAPRS
990 1000 1010 1020 1030 1040
1080 1090 1100 1110 1120 1130
pF1KB9 PEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEE
: :: ..:: ...:: . :. . . ... : :::: :::: : .. .
CCDS45 PLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSET-------D
1050 1060 1070 1080 1090
1140 1150 1160 1170 1180 1190
pF1KB9 GYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLY
::..:. .:. ::.: . : ..: : : : .:. ::. . : .
CCDS45 GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAA-RPA--GATLERPKTLSPGKNGVVK
1100 1110 1120 1130 1140 1150
1200 1210 1220 1230 1240
pF1KB9 -LNTFANTLGKAEYLKNNILSMPEKA-----KKAFDNPDYWNHSLPPRSTLQHPDYLQEY
. .:.... . ::: . . :. . :::: ::... : :.. :. ..
CCDS45 DVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGA--PPSTFKGT
1160 1170 1180 1190 1200 1210
1250 1260 1270 1280 1290
pF1KB9 STKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
: :::::::
CCDS45 PT--------------AENPEYLGLDVPV
1220
>>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa)
initn: 3420 init1: 1665 opt: 3802 Z-score: 1932.8 bits: 369.6 E(32554): 2.4e-101
Smith-Waterman score: 3802; 52.2% identity (75.7% similar) in 1064 aa overlap (10-1046:9-1054)
10 20 30 40 50
pF1KB9 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVV
: .::.: . : . : .::.::. :: .. : . ::. :..:.::
CCDS77 MELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVV
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 MGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAI
.::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.
CCDS77 QGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 FLNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNP
. : .: ::.:: :..:::::.::: ...: ::: ::: :.:: ..
CCDS77 LDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKN
120 130 140 150 160 170
180 190 200 210 220
pF1KB9 WPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDC
:::..:: : .: : : : :::: . . ::.::::::: : .:: :: .::
CCDS77 NQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDC
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB9 CHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFC
::..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: :
CCDS77 CHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASC
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB9 VKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQT
: ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ...
CCDS77 VTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRA
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB9 VDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSW
: :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..:
CCDS77 VTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAW
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB9 PPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLC
: .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..::
CCDS77 PDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLC
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB9 YYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFS
. ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .:
CCDS77 FVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFL
480 490 500 510 520 530
530 540 550 560 570 580
pF1KB9 RGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGP
::. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: :
CCDS77 RGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPP
540 550 560 570 580 590
590 600 610 620 630 640
pF1KB9 NCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLP
:: .::.:.. :. :.:. : . :.:: :::..: .. : :
CCDS77 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------P
600 610 620 630 640
650 660 670 680 690 700
pF1KB9 QHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTP
. : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: ::::::::::
CCDS77 AEQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTP
650 660 670 680 690 700
710 720 730 740 750 760
pF1KB9 SGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPK
::. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.::
CCDS77 SGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPK
710 720 730 740 750 760
770 780 790 800 810 820
pF1KB9 ANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLL
:: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: :
CCDS77 ANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDL
770 780 790 800 810 820
830 840 850 860 870 880
pF1KB9 LNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGG
::::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.::::
CCDS77 LNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGG
830 840 850 860 870 880
890 900 910 920 930 940
pF1KB9 KMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLP
:.:::::::: : :.:::::::::::::.:::::::.:::::::.::::::::::::::
CCDS77 KVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLP
890 900 910 920 930 940
950 960 970 980 990 1000
pF1KB9 QPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPND
:::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: :
CCDS77 QPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLD
950 960 970 980 990 1000
1010 1020 1030 1040 1050
pF1KB9 SKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPP------IYTSRARIDSNRNQFVYRDG
: :...::...:. :..::::::::: .: : : . : : .:.::
CCDS77 STFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRNM
1010 1020 1030 1040 1050
1060 1070 1080 1090 1100 1110
pF1KB9 GFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYS
>>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa)
initn: 2971 init1: 1332 opt: 3589 Z-score: 1825.0 bits: 350.0 E(32554): 2.5e-95
Smith-Waterman score: 4157; 52.4% identity (73.9% similar) in 1197 aa overlap (1-1188:1-1157)
10 20 30 40 50 60
pF1KB9 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
:. .: : :. : . ..::.:: :: : :: .: :.::..: : :: :::::
CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
:::::. :: :::::. .::::::::::.:.: ::: :::..:::..:. ..:. ..
CCDS31 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
::: ... .:..: : .:::::.::::...: ::. ::: :.::::. . .:.
CCDS31 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDR--DAEIVVKD
130 140 150 160 170
190 200 210 220 230 240
pF1KB9 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
:: : : ::. : :::::: . :::::.:.:: ::.:.:.:: ..::: ::::::::
CCDS31 NGRS-CPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSG
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB9 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
:.::::::: .:::::::: .::: .::: ::::: : ..:: ::. :: .::::::::
CCDS31 PQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVD
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB9 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
..::::::: .::::..::.:::.:: .:::::.: :.:: . ::::::::: :.:::
CCDS31 QTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRF--QTVDSSNIDGFVNCT
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB9 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
:: ::: ::.::..:::.. : :.::::::::::::::::.::::::::.: .:::::::
CCDS31 KILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNL
360 370 380 390 400 410
430 440 450 460 470
pF1KB9 VTIGGRVLYS-GLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT-TLF
.::::: ::. :.::::.:. ..::: :.:::::::: :::. : .:::.:..::: .:
CCDS31 TTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLR
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB9 STINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNL
. ..:. :. :: ..:.::: ::. :::: ::::::: :::::: .::: .:. ::.
CCDS31 GPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNF
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB9 YDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQ
.:: ::: . . : : :.:. :: : ::.: : :.:..:.::.:::.:: .:: :.
CCDS31 LNGEPREFAHEAECFSCHPECQPME-GTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVL
540 550 560 570 580 590
600 610 620 630 640 650
pF1KB9 GANSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPL-IAAGV
::.. :.:: : . ::.::: ::::::.:: .::. :. :: ..: : .: :
CCDS31 GAKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCL-----GQ-TLVLIGKTHLTMALTV
600 610 620 630 640
660 670 680 690 700 710
pF1KB9 IGGLFIL-VIVGLTFAVYVRRKSIKKKRALRRFLET-ELVEPLTPSGTAPNQAQLRILKE
:.:: .. ...: :: .: : . :..:::.::.:: : .::: :: : :.. ::.::
CCDS31 IAGLVVIFMMLGGTF-LYWRGRRIQNKRAMRRYLERGESIEPLDPSEKA-NKVLARIFKE
650 660 670 680 690 700
720 730 740 750 760 770
pF1KB9 TELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASM
:::...::::::.::::.::.:.::::..:::: ::.... .: .. :. : ..:.
CCDS31 TELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSL
710 720 730 740 750 760
780 790 800 810 820 830
pF1KB9 DHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLE
:: :.:::::.: . ..::::: .: : ::..:..:. .: :::::: :::::::.:::
CCDS31 DHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLE
770 780 790 800 810 820
840 850 860 870 880 890
pF1KB9 ERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYR
:. .:::.:::::::.:::..:...:::.: :: :.:. . .: :::::::: ::.
CCDS31 EHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFG
830 840 850 860 870 880
900 910 920 930 940 950
pF1KB9 KFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVK
:.::::::::::::.:::::::..:: :. :.:::::::::: :: ::::::::::::
CCDS31 KYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVK
890 900 910 920 930 940
960 970 980 990 1000 1010
pF1KB9 CWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKL-PSPNDSKFFQNLLDEEDLE
::::: . :: ::::: ::.:::::: :::::. .. . :.:. . .. :.: .::
CCDS31 CWMIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELE
950 960 970 980 990 1000
1020 1030 1040 1050 1060 1070
pF1KB9 DMMDAEEYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPE
.: . : . :. : . : . .: : .:.:
CCDS31 PELDLDLDLEAEEDNLATTTLGSALSLPV---------GTLNRPRG-SQSLLSPSSGY--
1010 1020 1030 1040 1050
1080 1090 1100 1110 1120 1130
pF1KB9 APVAQGATAEIFDDSCCNGTLRK---PVAPHVQEDSSTQRYSADPTVFAPERSPRGELDE
:. :: .: ..: .:. .. ::. : . . :.. : . : .::.:
CCDS31 MPMNQGNLGESCQESAVSGSSERCPRPVSLHPMPRGCLASESSEGHVTGSE----AELQE
1060 1070 1080 1090 1100 1110
1140 1150 1160 1170 1180 1190
pF1KB9 EGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPL
. : :.. ... : .. . :.: ..: .: . .:: :.: ::
CCDS31 KVSMC--RSRSRSRSPRPRGDSAYHSQR-----HSLLTP---VTPLSPPGLEEEDVNGYV
1120 1130 1140 1150 1160
1200 1210 1220 1230 1240 1250
pF1KB9 YLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYF
CCDS31 MPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEEL
1170 1180 1190 1200 1210 1220
>>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa)
initn: 2953 init1: 1893 opt: 3188 Z-score: 1624.2 bits: 312.7 E(32554): 3.8e-84
Smith-Waterman score: 4360; 51.1% identity (75.1% similar) in 1277 aa overlap (1-1269:1-1198)
10 20 30 40 50
pF1KB9 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV
:.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....::::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB9 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA
:.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. ::::
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB9 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL
.. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::...
CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM
130 140 150 160 170
180 190 200 210 220 230
pF1KB9 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG
: ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::.
CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB9 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN
::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.:
CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB9 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK
.:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: .
CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB9 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS
: :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::.
CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB9 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT
.: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .::::
CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB9 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES
::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :...
CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB9 CNLYDGEFREFENGSICVECDPQCEKMEDGL-LTCHGPGPDNCTKCSHFKDGPNCVEKCP
::: .:: ::: ..: :..: :.: . ... .:: : ::::: .:.:. :::.::. ::
CCDS55 CNLLEGEPREFVENSECIQCHPEC--LPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP
540 550 560 570 580 590
600 610 620 630 640 650
pF1KB9 DGLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLI
:..: : ....:::: . :: :::::: ::.:: . : : .: : . : :
CCDS55 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGC---PTNG----P---KIPSI
600 610 620 630 640
660 670 680 690 700 710
pF1KB9 AAGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFL-ETELVEPLTPSGTAPNQAQLRI
:.:..:.:..:..:.: .....::. : .::.:::.: : :::::::::: ::::: :::
CCDS55 ATGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRI
650 660 670 680 690 700
720 730 740 750 760 770
pF1KB9 LKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIM
:::::.:..::::::::::::::.:.:::: :::::::: : :.:.:::: :..::: .:
CCDS55 LKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVM
710 720 730 740 750 760
780 790 800 810 820 830
pF1KB9 ASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMM
::.:.::. ::::.::. :.::.::::: ::::.::.::::::::: ::::::::::::
CCDS55 ASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMN
770 780 790 800 810 820
840 850 860 870 880 890
pF1KB9 YLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECI
:::.::::::::::::::::.:.::::::::::.:: ..::::.:.:::.:::::::: :
CCDS55 YLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESI
830 840 850 860 870 880
900 910 920 930 940 950
pF1KB9 HYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMV
.: .::::::::::::.:::::::.:::::::. :: ..:::::::::::::::::::.
CCDS55 LHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMI
890 900 910 920 930 940
960 970 980 990 1000 1010
pF1KB9 MVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEED
:::::::::::::::.:: :::.::::::::::::::.::.::::.::.:.. :.::::
CCDS55 MVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEED
950 960 970 980 990 1000
1020 1030 1040 1050 1060 1070
pF1KB9 LEDMMDAEEYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTI
..:..::.:::.:: :: . ..: :.: .
CCDS55 MDDVVDADEYLIPQQ--------------------------GFFSSPSTS---RTPLLSS
1010 1020 1030
1080 1090 1100 1110 1120 1130
pF1KB9 PEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEE
: .....:. .: :: :. .::: ::::.::: : : :.
CCDS55 LSA-TSNNSTVACIDR---NGLQSCPI----KEDSFLQRYSSDPT---------GALTED
1040 1050 1060 1070 1080
1140 1150 1160 1170 1180 1190
pF1KB9 GYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLY
. . : ::.: : .: :..: :: ::: .: ..: : :
CCDS55 SIDDTFL--PVPEYINQS-----VPKRPAGSVQ---NPVYHNQPLNPAPSRD-----PHY
1090 1100 1110 1120
1200 1210 1220 1230 1240 1250
pF1KB9 LNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFY
. ....:. ::: :.. .: ....::.: .: .. . .:..::: :.. :
CCDS55 QDPHSTAVGNPEYL-NTV--QPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKE-A
1130 1140 1150 1160 1170 1180
1260 1270 1280 1290
pF1KB9 KQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
: :: .. .::: :::
CCDS55 KPNGIFKGSTAENAEYLRVAPQSSEFIGA
1190 1200 1210
>>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa)
initn: 1727 init1: 966 opt: 2194 Z-score: 1128.3 bits: 220.0 E(32554): 1.6e-56
Smith-Waterman score: 2194; 47.5% identity (76.0% similar) in 630 aa overlap (1-624:1-627)
10 20 30 40 50
pF1KB9 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV
:.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....::::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB9 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA
:.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. ::::
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB9 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL
.. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::...
CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM
130 140 150 160 170
180 190 200 210 220 230
pF1KB9 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG
: ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::.
CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB9 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN
::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.:
CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB9 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK
.:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: .
CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB9 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS
: :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::.
CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB9 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT
.: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .::::
CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB9 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES
::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :...
CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB9 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD
::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. ::
CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA
540 550 560 570 580 590
600 610 620 630 640 650
pF1KB9 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA
:..: : ....:::: . :: :::::: :
CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGS
600 610 620
>>CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 (705 aa)
initn: 1727 init1: 966 opt: 2194 Z-score: 1127.8 bits: 220.1 E(32554): 1.7e-56
Smith-Waterman score: 2194; 47.5% identity (76.0% similar) in 630 aa overlap (1-624:1-627)
10 20 30 40 50
pF1KB9 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV
:.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....::::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB9 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA
:.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. ::::
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB9 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL
.. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::...
CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM
130 140 150 160 170
180 190 200 210 220 230
pF1KB9 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG
: ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::.
CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB9 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN
::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.:
CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB9 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK
.:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: .
CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB9 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS
: :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::.
CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB9 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT
.: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .::::
CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB9 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES
::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :...
CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB9 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD
::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. ::
CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA
540 550 560 570 580 590
600 610 620 630 640 650
pF1KB9 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA
:..: : ....:::: . :: :::::: :
CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSHQ
600 610 620 630 640 650
1292 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 18:03:13 2016 done: Sun Nov 6 18:03:14 2016
Total Scan time: 4.470 Total Display time: 0.650
Function used was FASTA [36.3.4 Apr, 2011]