FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3024, 1352 aa 1>>>pF1KB3024 1352 - 1352 aa - 1352 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.6462+/-0.00127; mu= 12.9761+/- 0.076 mean_var=469.1342+/-102.548, 0's: 0 Z-trim(113.1): 435 B-trim: 777 in 1/52 Lambda= 0.059214 statistics sampled from 13279 (13779) to 13279 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.739), E-opt: 0.2 (0.423), width: 16 Scan time: 5.420 The best scores are: opt bits E(32554) CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 8835 771.1 0 CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 8696 759.3 1.5e-218 CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 8630 753.6 7.4e-217 CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 7402 648.6 2.6e-185 CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 4364 388.7 2.6e-107 CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 3921 351.4 9.6e-96 CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 3812 342.1 6.1e-93 CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 3748 336.5 2.6e-91 CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 2998 272.5 5.3e-72 CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 1721 162.9 2.5e-39 CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 1721 163.0 2.6e-39 CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 948 96.6 1.5e-19 CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 743 79.7 4.4e-14 CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 727 78.3 1.1e-13 CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 724 78.1 1.4e-13 CCDS2447.1 EPHA4 gene_id:2043|Hs108|chr2 ( 986) 718 77.6 2e-13 CCDS56557.1 PTK2 gene_id:5747|Hs108|chr8 (1065) 718 77.6 2e-13 CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 709 76.8 3.4e-13 CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 709 76.8 3.4e-13 CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 709 76.8 3.4e-13 CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 709 76.8 3.4e-13 CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 709 76.8 3.4e-13 CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 705 76.4 4.2e-13 CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 705 76.5 4.3e-13 CCDS3268.1 EPHB3 gene_id:2049|Hs108|chr3 ( 998) 704 76.4 4.5e-13 CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 703 76.3 4.7e-13 CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 703 76.3 4.7e-13 CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 703 76.3 4.9e-13 CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 700 76.1 5.8e-13 CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 700 76.1 5.8e-13 CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 700 76.1 6e-13 CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 696 75.7 7.1e-13 CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 686 74.4 9.6e-13 CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 690 75.2 1e-12 CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 688 75.0 1.2e-12 CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 688 75.0 1.2e-12 CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 688 75.0 1.2e-12 CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 688 75.1 1.2e-12 CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 688 75.1 1.3e-12 CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 688 75.1 1.3e-12 CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 688 75.1 1.3e-12 CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 671 73.2 2.5e-12 CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 671 73.2 2.5e-12 CCDS5031.1 EPHA7 gene_id:2045|Hs108|chr6 ( 998) 674 73.8 2.7e-12 CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 670 73.6 3.6e-12 CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 670 73.6 3.6e-12 CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 666 73.4 5.1e-12 CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 666 73.4 5.1e-12 CCDS5884.1 EPHA1 gene_id:2041|Hs108|chr7 ( 976) 658 72.4 6.8e-12 CCDS82777.1 MST1R gene_id:4486|Hs108|chr3 (1294) 660 72.8 7e-12 >>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa) initn: 8835 init1: 8835 opt: 8835 Z-score: 4101.3 bits: 771.1 E(32554): 0 Smith-Waterman score: 8835; 100.0% identity (100.0% similar) in 1255 aa overlap (98-1352:1-1255) 70 80 90 100 110 120 pF1KB3 PGPHPSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGAASTQVCTGTD :::::::::::::::::::::::::::::: CCDS32 MELAALCRWGLLLALLPPGAASTQVCTGTD 10 20 30 130 140 150 160 170 180 pF1KB3 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQ 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB3 VRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILK 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB3 GGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSE 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB3 DCQSLTRTVCAGGCARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DCQSLTRTVCAGGCARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPA 220 230 240 250 260 270 370 380 390 400 410 420 pF1KB3 LVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQR 280 290 300 310 320 330 430 440 450 460 470 480 pF1KB3 CEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTA 340 350 360 370 380 390 490 500 510 520 530 540 pF1KB3 PLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGI 400 410 420 430 440 450 550 560 570 580 590 600 pF1KB3 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLA 460 470 480 490 500 510 610 620 630 640 650 660 pF1KB3 CHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQ 520 530 540 550 560 570 670 680 690 700 710 720 pF1KB3 NGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 NGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINC 580 590 600 610 620 630 730 740 750 760 770 780 pF1KB3 THSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 THSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRL 640 650 660 670 680 690 790 800 810 820 830 840 pF1KB3 LQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPV 700 710 720 730 740 750 850 860 870 880 890 900 pF1KB3 AIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 AIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHV 760 770 780 790 800 810 910 920 930 940 950 960 pF1KB3 RENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLL 820 830 840 850 860 870 970 980 990 1000 1010 1020 pF1KB3 DIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPARE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPARE 880 890 900 910 920 930 1030 1040 1050 1060 1070 1080 pF1KB3 IPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ 940 950 960 970 980 990 1090 1100 1110 1120 1130 1140 pF1KB3 NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSS 1000 1010 1020 1030 1040 1050 1150 1160 1170 1180 1190 1200 pF1KB3 STRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 STRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQ 1060 1070 1080 1090 1100 1110 1210 1220 1230 1240 1250 1260 pF1KB3 RYSEDPTVPLPSETDGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RYSEDPTVPLPSETDGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERP 1120 1130 1140 1150 1160 1170 1270 1280 1290 1300 1310 1320 pF1KB3 KTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPER 1180 1190 1200 1210 1220 1230 1330 1340 1350 pF1KB3 GAPPSTFKGTPTAENPEYLGLDVPV ::::::::::::::::::::::::: CCDS32 GAPPSTFKGTPTAENPEYLGLDVPV 1240 1250 >>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa) initn: 8696 init1: 8696 opt: 8696 Z-score: 4037.1 bits: 759.3 E(32554): 1.5e-218 Smith-Waterman score: 8696; 99.5% identity (99.8% similar) in 1240 aa overlap (113-1352:1-1240) 90 100 110 120 130 140 pF1KB3 AGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGAASTQVCTGTDMKLRLPASPETHLDM .: :. . :::::::::::::::::::::: CCDS74 MPRGSWKPQVCTGTDMKLRLPASPETHLDM 10 20 30 150 160 170 180 190 200 pF1KB3 LRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 LRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGT 40 50 60 70 80 90 210 220 230 240 250 260 pF1KB3 QLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 QLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQD 100 110 120 130 140 150 270 280 290 300 310 320 pF1KB3 TILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 TILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA 160 170 180 190 200 210 330 340 350 360 370 380 pF1KB3 RCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 RCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNP 220 230 240 250 260 270 390 400 410 420 430 440 pF1KB3 EGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 EGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGL 280 290 300 310 320 330 450 460 470 480 490 500 pF1KB3 GMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 GMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEE 340 350 360 370 380 390 510 520 530 540 550 560 pF1KB3 ITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 ITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGL 400 410 420 430 440 450 570 580 590 600 610 620 pF1KB3 ALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 ALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGP 460 470 480 490 500 510 630 640 650 660 670 680 pF1KB3 TQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 TQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCV 520 530 540 550 560 570 690 700 710 720 730 740 pF1KB3 ACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 ACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAE 580 590 600 610 620 630 750 760 770 780 790 800 pF1KB3 QRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 QRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGA 640 650 660 670 680 690 810 820 830 840 850 860 pF1KB3 MPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 MPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANK 700 710 720 730 740 750 870 880 890 900 910 920 pF1KB3 EILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 EILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNW 760 770 780 790 800 810 930 940 950 960 970 980 pF1KB3 CMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 CMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVP 820 830 840 850 860 870 990 1000 1010 1020 1030 1040 pF1KB3 IKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 IKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPP 880 890 900 910 920 930 1050 1060 1070 1080 1090 1100 pF1KB3 ICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 ICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFY 940 950 960 970 980 990 1110 1120 1130 1140 1150 1160 pF1KB3 RSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 RSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEP 1000 1010 1020 1030 1040 1050 1170 1180 1190 1200 1210 1220 pF1KB3 SEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 SEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETD 1060 1070 1080 1090 1100 1110 1230 1240 1250 1260 1270 1280 pF1KB3 GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVF 1120 1130 1140 1150 1160 1170 1290 1300 1310 1320 1330 1340 pF1KB3 AFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 AFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAEN 1180 1190 1200 1210 1220 1230 1350 pF1KB3 PEYLGLDVPV :::::::::: CCDS74 PEYLGLDVPV 1240 >>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa) initn: 8630 init1: 8630 opt: 8630 Z-score: 4006.7 bits: 753.6 E(32554): 7.4e-217 Smith-Waterman score: 8630; 100.0% identity (100.0% similar) in 1225 aa overlap (128-1352:1-1225) 100 110 120 130 140 150 pF1KB3 MELAALCRWGLLLALLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNL :::::::::::::::::::::::::::::: CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNL 10 20 30 160 170 180 190 200 210 pF1KB3 ELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNG 40 50 60 70 80 90 220 230 240 250 260 270 pF1KB3 DPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 DPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLA 100 110 120 130 140 150 280 290 300 310 320 330 pF1KB3 LTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQC 160 170 180 190 200 210 340 350 360 370 380 390 pF1KB3 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP 220 230 240 250 260 270 400 410 420 430 440 450 pF1KB3 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN 280 290 300 310 320 330 460 470 480 490 500 510 pF1KB3 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP 340 350 360 370 380 390 520 530 540 550 560 570 pF1KB3 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV 400 410 420 430 440 450 580 590 600 610 620 630 pF1KB3 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC 460 470 480 490 500 510 640 650 660 670 680 690 pF1KB3 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC 520 530 540 550 560 570 700 710 720 730 740 750 pF1KB3 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG 580 590 600 610 620 630 760 770 780 790 800 810 pF1KB3 ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETEL 640 650 660 670 680 690 820 830 840 850 860 870 pF1KB3 RKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSP 700 710 720 730 740 750 880 890 900 910 920 930 pF1KB3 YVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 YVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVR 760 770 780 790 800 810 940 950 960 970 980 990 pF1KB3 LVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFT 820 830 840 850 860 870 1000 1010 1020 1030 1040 1050 pF1KB3 HQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 HQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWM 880 890 900 910 920 930 1060 1070 1080 1090 1100 1110 pF1KB3 IDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFYRSLLEDDDMGDLVDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 IDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFYRSLLEDDDMGDLVDA 940 950 960 970 980 990 1120 1130 1140 1150 1160 1170 pF1KB3 EEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLAPSEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLAPSEG 1000 1010 1020 1030 1040 1050 1180 1190 1200 1210 1220 1230 pF1KB3 AGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAPLTCSPQPEYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 AGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAPLTCSPQPEYV 1060 1070 1080 1090 1100 1110 1240 1250 1260 1270 1280 1290 pF1KB3 NQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 NQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQ 1120 1130 1140 1150 1160 1170 1300 1310 1320 1330 1340 1350 pF1KB3 GGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEYLGLDVPV ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEYLGLDVPV 1180 1190 1200 1210 1220 >>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa) initn: 7591 init1: 7402 opt: 7402 Z-score: 3440.4 bits: 648.6 E(32554): 2.6e-185 Smith-Waterman score: 7402; 99.9% identity (100.0% similar) in 1054 aa overlap (98-1151:1-1054) 70 80 90 100 110 120 pF1KB3 PGPHPSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGAASTQVCTGTD :::::::::::::::::::::::::::::: CCDS77 MELAALCRWGLLLALLPPGAASTQVCTGTD 10 20 30 130 140 150 160 170 180 pF1KB3 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQ 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB3 VRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 VRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILK 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB3 GGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 GGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSE 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB3 DCQSLTRTVCAGGCARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DCQSLTRTVCAGGCARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPA 220 230 240 250 260 270 370 380 390 400 410 420 pF1KB3 LVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQR 280 290 300 310 320 330 430 440 450 460 470 480 pF1KB3 CEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 CEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTA 340 350 360 370 380 390 490 500 510 520 530 540 pF1KB3 PLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 PLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGI 400 410 420 430 440 450 550 560 570 580 590 600 pF1KB3 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLA 460 470 480 490 500 510 610 620 630 640 650 660 pF1KB3 CHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 CHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQ 520 530 540 550 560 570 670 680 690 700 710 720 pF1KB3 NGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 NGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINC 580 590 600 610 620 630 730 740 750 760 770 780 pF1KB3 THSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 THSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRL 640 650 660 670 680 690 790 800 810 820 830 840 pF1KB3 LQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPV 700 710 720 730 740 750 850 860 870 880 890 900 pF1KB3 AIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 AIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHV 760 770 780 790 800 810 910 920 930 940 950 960 pF1KB3 RENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 RENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLL 820 830 840 850 860 870 970 980 990 1000 1010 1020 pF1KB3 DIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPARE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPARE 880 890 900 910 920 930 1030 1040 1050 1060 1070 1080 pF1KB3 IPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 IPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ 940 950 960 970 980 990 1090 1100 1110 1120 1130 1140 pF1KB3 NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSS 1000 1010 1020 1030 1040 1050 1150 1160 1170 1180 1190 1200 pF1KB3 STRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQ :::. CCDS77 STRNM >>CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 (603 aa) initn: 4364 init1: 4364 opt: 4364 Z-score: 2040.0 bits: 388.7 E(32554): 2.6e-107 Smith-Waterman score: 4364; 100.0% identity (100.0% similar) in 603 aa overlap (128-730:1-603) 100 110 120 130 140 150 pF1KB3 MELAALCRWGLLLALLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNL :::::::::::::::::::::::::::::: CCDS77 MKLRLPASPETHLDMLRHLYQGCQVVQGNL 10 20 30 160 170 180 190 200 210 pF1KB3 ELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNG 40 50 60 70 80 90 220 230 240 250 260 270 pF1KB3 DPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLA 100 110 120 130 140 150 280 290 300 310 320 330 pF1KB3 LTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQC 160 170 180 190 200 210 340 350 360 370 380 390 pF1KB3 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP 220 230 240 250 260 270 400 410 420 430 440 450 pF1KB3 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN 280 290 300 310 320 330 460 470 480 490 500 510 pF1KB3 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP 340 350 360 370 380 390 520 530 540 550 560 570 pF1KB3 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV 400 410 420 430 440 450 580 590 600 610 620 630 pF1KB3 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC 460 470 480 490 500 510 640 650 660 670 680 690 pF1KB3 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC 520 530 540 550 560 570 700 710 720 730 740 750 pF1KB3 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG ::::::::::::::::::::::::::::::::: CCDS77 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHS 580 590 600 760 770 780 790 800 810 pF1KB3 ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETEL >>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa) initn: 3387 init1: 1682 opt: 3921 Z-score: 1832.4 bits: 351.4 E(32554): 9.6e-96 Smith-Waterman score: 3966; 47.6% identity (71.0% similar) in 1287 aa overlap (106-1346:10-1269) 80 90 100 110 120 130 pF1KB3 PAPRALPAGSSRSHGAGAAVSTMELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRL : .::.: . : . : .::.::. :: CCDS42 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSS 10 20 30 140 150 160 170 180 190 pF1KB3 PASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVP .. : . ::. :..:.::.::::.: . : .::::....:: ::::.: :: : .: CCDS42 LSDLEQQYRALRKYYENCEVVMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLP 40 50 60 70 80 90 200 210 220 230 240 250 pF1KB3 LQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLI :. :::.:::.:.:: ::::.. : .: ::.:: :..:::::.::: . CCDS42 LENLRIIRGTKLYEDRYALAIFLNYRKDGNF---------GLQELGLKNLTEILNGGVYV 100 110 120 130 140 260 270 280 290 300 310 pF1KB3 QRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSL ..: ::: ::: :.:: .. :::..:: : .: : : : :::: . . ::.: CCDS42 DQNKFLCYADTIHWQDIVRNPWPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTL 150 160 170 180 190 200 320 330 340 350 360 370 pF1KB3 TRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTY :::::: : .:: :: .::::..::.::.::: .::.::..:: :: : .:: .: CCDS42 TRTVCAEQCDGRCYGPYVSDCCHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVY 210 220 230 240 250 260 380 390 400 410 420 430 pF1KB3 NTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKC : ::. : ...::.:: :: ::.:.. .: .::. .:: ..:: :.: . :. : CCDS42 NPTTFQLEHNFNAKYTYGAFCVKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPC 270 280 290 300 310 320 440 450 460 470 480 490 pF1KB3 SKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQP . : ..: :.: : ...: :.::..: .: :: :.: :: .. ::: . ..: CCDS42 TDICPKACDGIGTGSLMSAQTVDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDP 330 340 350 360 370 380 500 510 520 530 540 550 pF1KB3 EQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLG :.:.::.:..::::.: :..:: .. :.:::.:: .: ::.:..: : :. ::. : CCDS42 EKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQ 390 400 410 420 430 440 560 570 580 590 600 610 pF1KB3 LRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQL ..::.:...: : :..::. ::. : :: . .: .. :: ..:..::..:..: CCDS42 FQSLKEISAGNIYITDNSNLCYYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHL 450 460 470 480 490 500 620 630 640 650 660 670 pF1KB3 CARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGS :. :::::: ::..: .: ::. :.: : . .: ::. :. :. : :.:. ..: CCDS42 CSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGL 510 520 530 540 550 560 680 690 700 710 720 730 pF1KB3 VTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHS .:: :: :.:. :.:.:: : :: .::.:.. :. :.:. : . :.:: :::.. CCDS42 LTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQG 570 580 590 600 610 620 740 750 760 770 pF1KB3 CVDLDDKGC-----------PAEQRASPLTSIISAVVGILLV-VVLGVVFGILIKRRQQK : .. : : . : .:: : ..:.: :.. :..:..:.. ..:.. : CCDS42 CNGPTSHDCIYYPWTGHSTLPQHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK 630 640 650 660 670 680 780 790 800 810 820 830 pF1KB3 IRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIP .: ..::.: ::::::::::::. :::::.::::::::..:::::::::::::::::.: CCDS42 -KKRALRRFL-ETELVEPLTPSGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVP 690 700 710 720 730 840 850 860 870 880 890 pF1KB3 DGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLM .::.::::::::.: :.:.:::: :..::: .::.. :.. ::::.::. :.::::::: CCDS42 EGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLM 740 750 760 770 780 790 900 910 920 930 940 950 pF1KB3 PYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKI :.::::..:.:.. .::: :::::.:::::: :::. :::::::::::::::::::::: CCDS42 PHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKI 800 810 820 830 840 850 960 970 980 990 1000 1010 pF1KB3 TDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAK :::::::::. :: ::.:::::.:::::::: : :.:::::::::::::.:::::::.: CCDS42 TDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGK 860 870 880 890 900 910 1020 1030 1040 1050 1060 1070 pF1KB3 PYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMAR ::::::.:::::::::::::::::::::::::.::::::::.. ::.:.::..::::::: CCDS42 PYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMAR 920 930 940 950 960 970 1080 1090 1100 1110 1120 1130 pF1KB3 DPQRFVVIQNED-LGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAG ::::..:::..: . :: :: :...::...:. :..::::::::: .: : : . CCDS42 DPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSR 980 990 1000 1010 1020 1030 1140 1150 1160 1170 1180 1190 pF1KB3 GMVHHRHRSSSTRSGGGDLTLGLE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGL . . . . :.:: :. : . . : :: ..:: ...:: . :. . CCDS42 ARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKP 1040 1050 1060 1070 1080 1090 1200 1210 1220 1230 1240 pF1KB3 QSLPTHDPSPLQRYSEDPTVPLPSET-------DGYVAPLTCSPQPEYVNQPDVRPQPPS . ... : :::: :::: : .. .::..:. .:. ::.: . : CCDS42 VAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSR 1100 1110 1120 1130 1140 1150 1250 1260 1270 1280 1290 1300 pF1KB3 PREGPLPAA-RPA--GATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPH ..: : : : .:. ::. . : . . .:.... . ::: . . :. CCDS42 RKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA 1160 1170 1180 1190 1200 1210 1310 1320 1330 1340 pF1KB3 PPPAFSPAFDNLYYWDQDPPERGA--PPSTFKGTPT--------------AENPEYLGLD . :::: ::... : :.. :. .. : ::::::: CCDS42 -----KKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEF 1220 1230 1240 1250 1260 1270 1350 pF1KB3 VPV CCDS42 SLKPGTVLPPPPYRHRNTVV 1280 1290 >>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa) initn: 3489 init1: 1665 opt: 3812 Z-score: 1782.0 bits: 342.1 E(32554): 6.1e-93 Smith-Waterman score: 3932; 47.2% identity (70.6% similar) in 1303 aa overlap (106-1346:10-1285) 80 90 100 110 120 130 pF1KB3 PAPRALPAGSSRSHGAGAAVSTMELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRL : .::.: . : . : .::.::. :: CCDS23 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSS 10 20 30 140 150 160 170 180 190 pF1KB3 PASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVP .. : . ::. :..:.::.::::.: . : .::::....:: ::::.: :: : .: CCDS23 LSDLEQQYRALRKYYENCEVVMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLP 40 50 60 70 80 90 200 210 220 230 240 250 pF1KB3 LQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLI :. :::.:::.:.:: ::::.. : .: ::.:: :..:::::.::: . CCDS23 LENLRIIRGTKLYEDRYALAIFLNYRKDGNF---------GLQELGLKNLTEILNGGVYV 100 110 120 130 140 260 270 280 290 300 310 pF1KB3 QRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSL ..: ::: ::: :.:: .. :::..:: : .: : : : :::: . . ::.: CCDS23 DQNKFLCYADTIHWQDIVRNPWPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTL 150 160 170 180 190 200 320 330 340 350 360 370 pF1KB3 TRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTY :::::: : .:: :: .::::..::.::.::: .::.::..:: :: : .:: .: CCDS23 TRTVCAEQCDGRCYGPYVSDCCHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVY 210 220 230 240 250 260 380 390 400 410 420 430 pF1KB3 NTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKC : ::. : ...::.:: :: ::.:.. .: .::. .:: ..:: :.: . :. : CCDS23 NPTTFQLEHNFNAKYTYGAFCVKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPC 270 280 290 300 310 320 440 450 460 470 480 490 pF1KB3 SKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQP . : ..: :.: : ...: :.::..: .: :: :.: :: .. ::: . ..: CCDS23 TDICPKACDGIGTGSLMSAQTVDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDP 330 340 350 360 370 380 500 510 520 530 540 550 pF1KB3 EQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLG :.:.::.:..::::.: :..:: .. :.:::.:: .: ::.:..: : :. ::. : CCDS23 EKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQ 390 400 410 420 430 440 560 570 580 590 600 610 pF1KB3 LRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQL ..::.:...: : :..::. ::. : :: . .: .. :: ..:..::..:..: CCDS23 FQSLKEISAGNIYITDNSNLCYYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHL 450 460 470 480 490 500 620 630 640 650 660 670 pF1KB3 CARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGS :. :::::: ::..: .: ::. :.: : . .: ::. :. :. : :.:. ..: CCDS23 CSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGL 510 520 530 540 550 560 680 690 700 710 720 730 pF1KB3 VTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHS .:: :: :.:. :.:.:: : :: .::.:.. :. :.:. : . :.:: :::.. CCDS23 LTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQG 570 580 590 600 610 620 740 750 760 770 pF1KB3 CVDLDDKGC-----------PAEQRASPLTSIISAVVGILLV-VVLGVVFGILIKRRQQK : .. : : . : .:: : ..:.: :.. :..:..:.. ..:.. : CCDS23 CNGPTSHDCIYYPWTGHSTLPQHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK 630 640 650 660 670 680 780 790 800 810 820 830 pF1KB3 IRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIP .: ..::.: ::::::::::::. :::::.::::::::..:::::::::::::::::.: CCDS23 -KKRALRRFL-ETELVEPLTPSGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVP 690 700 710 720 730 840 850 860 870 880 890 pF1KB3 DGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLM .::.::::::::.: :.:.:::: :..::: .::.. :.. ::::.::. :.::::::: CCDS23 EGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLM 740 750 760 770 780 790 900 910 920 930 940 950 pF1KB3 PYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKI :.::::..:.:.. .::: :::::.:::::: :::. :::::::::::::::::::::: CCDS23 PHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKI 800 810 820 830 840 850 960 970 980 990 1000 1010 pF1KB3 TDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAK :::::::::. :: ::.:::::.:::::::: : :.:::::::::::::.:::::::.: CCDS23 TDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGK 860 870 880 890 900 910 1020 1030 1040 1050 1060 1070 pF1KB3 PYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMAR ::::::.:::::::::::::::::::::::::.::::::::.. ::.:.::..::::::: CCDS23 PYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMAR 920 930 940 950 960 970 1080 1090 1100 1110 1120 1130 pF1KB3 DPQRFVVIQNED-LGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPA---- ::::..:::..: . :: :: :...::...:. :..::::::::: .: : : CCDS23 DPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSR 980 990 1000 1010 1020 1030 1140 1150 1160 1170 pF1KB3 ---PGAGGMVHHRHRSSSTRSGGGDLTL--GLEPSEE------EAPRS--PLAP-SEGAG . . . : . : .:.... : .:. .:: : : :: ..:: CCDS23 ARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGAT 1040 1050 1060 1070 1080 1090 1180 1190 1200 1210 1220 1230 pF1KB3 SDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSET-------DGYVAPLTCSP ...:: . :. . . ... : :::: :::: : .. .::..:. .: CCDS23 AEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRDKP 1100 1110 1120 1130 1140 1150 1240 1250 1260 1270 1280 pF1KB3 QPEYVNQPDVRPQPPSPREGPLPAA-RPA--GATLERPKTLSPGKNGVVKDVFAFGGAVE . ::.: . : ..: : : : .:. ::. . : . . .:.... CCDS23 KQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLY-LNTFANTLG 1160 1170 1180 1190 1200 1210 1290 1300 1310 1320 1330 pF1KB3 NPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGA--PPSTFKGTPT-------- . ::: . . :. . :::: ::... : :.. :. .. : CCDS23 KAEYLKNNILSMPEKA-----KKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNG 1220 1230 1240 1250 1260 1270 1340 1350 pF1KB3 ------AENPEYLGLDVPV ::::::: CCDS23 RIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV 1280 1290 1300 >>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa) initn: 3288 init1: 1784 opt: 3748 Z-score: 1752.8 bits: 336.5 E(32554): 2.6e-91 Smith-Waterman score: 4136; 50.1% identity (71.8% similar) in 1274 aa overlap (88-1346:4-1198) 60 70 80 90 100 110 pF1KB3 FPRGPLLRRAPGPHPSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGA : ::::. .. ::::: : . CCDS55 MRPSGTAGAALLAL-LAALC---------PASR 10 20 120 130 140 150 160 170 pF1KB3 A--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQ : .:: ::. :: .. : :. :......:.:: ::::.::. : .::::. :: CCDS55 ALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEVVLGNLEITYVQRNYDLSFLKTIQ 30 40 50 60 70 80 180 190 200 210 220 230 pF1KB3 EVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLR :: :::::: : :...::. :.:.::.. .:..::::::.: : :. ::. CCDS55 EVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALAVLSNYD----------ANKTGLK 90 100 110 120 130 240 250 260 270 280 290 pF1KB3 ELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPM :: .:.: :::.:.: .. :: :: ..: :.:: .. ... :. .:. :.: CCDS55 ELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDFQNHLGSCQKCDPS 140 150 160 170 180 190 300 310 320 330 340 350 pF1KB3 CKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTDCCHEQCAAGCTGPKHSDCLACLH : .. ::: . :.::.::. .:: :. ::.: :.::::.:::::::::..::::.: . CCDS55 CPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGCTGPRESDCLVCRK 200 210 220 230 240 250 360 370 380 390 400 410 pF1KB3 FNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPL : . :. :: :. :: :.. ::::.:.:::.:: :: ::. :: :::. .: CCDS55 FRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYVVTDHGSCVRACGA 260 270 280 290 300 310 420 430 440 450 460 470 pF1KB3 HNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFL . :. :::...:.:: :: .:: :.:. .... .....::..: .: .: :.: .: CCDS55 DSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFKNCTSISGDLHIL 320 330 340 350 360 370 480 490 500 510 520 530 pF1KB3 PESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILH : .: :: ..: ::.:..:....:..::::.: :.:::.. :: .:.::..:::: . CCDS55 PVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAFENLEIIRGRTKQ 380 390 400 410 420 430 540 550 560 570 580 590 pF1KB3 NGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTA .: .::.. .:.:. ::::::.:...: ..: : .::...:. : .:: . : . CCDS55 HGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKLFGTSGQKTKIIS 440 450 460 470 480 490 600 610 620 630 640 650 pF1KB3 NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNA :: :. : . : .:: ::. :::: : .::.: . ::.:::..: .:.: :::.:. CCDS55 NRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCNLLEGEPREFVEN 500 510 520 530 540 550 660 670 680 690 700 710 pF1KB3 RHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFP .:. ::::: :: ..:: : :.:. :::: : : :: ::.:: . . . .::. CCDS55 SECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVMGENNTL-VWKYA 560 570 580 590 600 610 720 730 740 750 760 770 pF1KB3 DEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG---ILLVVVLGVVFGIL : .:. : :::..:. .:::.. : :: ...:: .::::.::. :.. CCDS55 DAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SIATGMVGALLLLLVVALGI--GLF 620 630 640 650 660 780 790 800 810 820 830 pF1KB3 IKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTV ..::. .:: :.:::::: :::::::::: :::: .:::::::..:.::::::::::: CCDS55 MRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGSGAFGTV 670 680 690 700 710 720 840 850 860 870 880 890 pF1KB3 YKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTV :::.:::.::.:::::::: ::: :::::::::::::::::.: .:.: ::::::::::: CCDS55 YKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTSTV 730 740 750 760 770 780 900 910 920 930 940 950 pF1KB3 QLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVK ::.:::::.:::::.:::.. .::: :::::.::::::.:::: ::::::::::::::: CCDS55 QLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAARNVLVK 790 800 810 820 830 840 960 970 980 990 1000 1010 pF1KB3 SPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWE .:.::::::::::.:: .: ::::.:::::::::::::::.: .::::::::::::::: CCDS55 TPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWE 850 860 870 880 890 900 1020 1030 1040 1050 1060 1070 pF1KB3 LMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVS :::::.:::::::: :: ..::::::::::::::::::::::::::::.. ::.::::. CCDS55 LMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPKFRELII 910 920 930 940 950 960 1080 1090 1100 1110 1120 1130 pF1KB3 EFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCP :::.:::::::..::: .: . :: ::.:::.:....:: :.:::.:::.:::::: CCDS55 EFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDDVVDADEYLIPQQGFF-- 970 980 990 1000 1010 1020 1140 1150 1160 1170 1180 1190 pF1KB3 DPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMG :: . : :.:: : .: :. .. .. CCDS55 ---------------SSPSTS-----------------RTPLLSSLSATSN--NSTVACI 1030 1040 1050 1200 1210 1220 1230 1240 1250 pF1KB3 AAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAPLTCSPQPEYVNQPDVRPQPPSPR .:::: : .. : ::::: ::: : .. : : :::.:: .: .: . CCDS55 DRNGLQSCPIKEDSFLQRYSSDPTGALTEDS----IDDTFLPVPEYINQ-SVPKRPAGSV 1060 1070 1080 1090 1100 1260 1270 1280 1290 1300 pF1KB3 EGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGAVENPEYL-TPQGGAAPQPHPPPA ..:. .: . : .:... .: . :: ::::: : : . . :: CCDS55 QNPVYHNQPLN-----P---APSRDPHYQD--PHSTAVGNPEYLNTVQPTCVNSTFDSPA 1110 1120 1130 1140 1150 1310 1320 1330 1340 1350 pF1KB3 F-------SPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEYLGLDVPV . ..:: : .. :... : . :::. :::: ::: CCDS55 HWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGS-TAENAEYLRVAPQSSEFIGA 1160 1170 1180 1190 1200 1210 >>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa) initn: 2546 init1: 1647 opt: 2998 Z-score: 1406.1 bits: 272.5 E(32554): 5.3e-72 Smith-Waterman score: 3259; 43.6% identity (69.3% similar) in 1187 aa overlap (102-1272:6-1148) 80 90 100 110 120 pF1KB3 PSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGAA--STQVCTGTDMK :: :::..: . . : :: :: CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNG 10 20 30 130 140 150 160 170 180 pF1KB3 LRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVR : . .. :.. . : .::. :.::.::::.. ::.::::: :.:: ::::.: :. CCDS31 LSVTGDAENQYQTLYKLYERCEVVMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFS 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB3 QVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGG .:: ::.:::::... ..:. :. :: .: : .::.:.: .:::::.:: CCDS31 TLPLPNLRVVRGTQVYDGKFAIFVM-----LNYNT----NSSHALRQLRLTQLTEILSGG 100 110 120 130 140 250 260 270 280 290 300 pF1KB3 VLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDC : :..: .::..::: :.:: .. . ... :..:: : :: .::: :::: .:::: CCDS31 VYIEKNDKLCHMDTIDWRDIV-RDRDAEIVVKDNGRS--CPPCHEVCKG-RCWGPGSEDC 150 160 170 180 190 200 310 320 330 340 350 360 pF1KB3 QSLTRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPAL :.::.:.:: : ..: :: :..:::..::.::.::. .::.:: ::: :: : .:: CCDS31 QTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSGPQDTDCFACRHFNDSGACVPRCPQP 210 220 230 240 250 260 370 380 390 400 410 420 pF1KB3 VTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRC ..:: ::. :::. .: .:. ::..::.:.. .: ::. .:: ..:: ..: . : CCDS31 LVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFV-VDQTSCVRACPPDKMEVD-KNGLKMC 270 280 290 300 310 320 430 440 450 460 470 480 pF1KB3 EKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAP : :. : ..: : : . ..: :.::. :..: ::.:.: :: ...::: . CCDS31 EPCGGLCPKACEGTGSG--SRFQTVDSSNIDGFVNCTKILGNLDFLITGLNGDPWHKIPA 330 340 350 360 370 490 500 510 520 530 540 pF1KB3 LQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLT-LQGLGI :.::.:.::.:..:::::: :..:: . ..:::.:: .: :: :.: ..:: ...:.. CCDS31 LDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNLTTIGGRSLYNRGFSLLIMKNLNV 380 390 400 410 420 430 550 560 570 580 590 600 pF1KB3 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTA-NRPEDECVGEGL . ::.:::.:...: : : .::. :.. : ...:.: . : :::. .::.:: CCDS31 TSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLRGPTEERLDIKHNRPRRDCVAEGK 440 450 460 470 480 490 610 620 630 640 650 660 pF1KB3 ACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQP .: ::. : :::::: ::..: .. :: :: .: :.: :::... .:. ::::::: CCDS31 VCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNFLNGEPREFAHEAECFSCHPECQP 500 510 520 530 540 550 670 680 690 700 710 720 pF1KB3 QNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPIN ..:..:: : .: :. :::..: : ::. :: :: . ::.:.:: .. :.:: : CCDS31 MEGTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVLG--AKGPIYKYPDVQNECRPCHEN 560 570 580 590 600 610 730 740 750 760 770 780 pF1KB3 CTHSCVDLDDKGCPAEQRA----SPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIR-K ::..: . . : .. . . :: .....: :::.. .. : .. : ..:. : CCDS31 CTQGCKGPELQDCLGQTLVLIGKTHLTMALTVIAG--LVVIFMMLGGTFLYWRGRRIQNK 620 630 640 650 660 670 790 800 810 820 830 840 pF1KB3 YTMRRLLQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGE .::: :.. : .::: :: :.. ::.:::::::.::::::.::::.::.:::.:: CCDS31 RAMRRYLERGESIEPLDPS-EKANKVLARIFKETELRKLKVLGSGVFGTVHKGVWIPEGE 680 690 700 710 720 730 850 860 870 880 890 900 pF1KB3 NVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYG ..:::: :::...... .. . . :. ..... .. ::::.: :..::::: .: : CCDS31 SIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDHAHIVRLLGLCPGSSLQLVTQYLPLG 740 750 760 770 780 790 910 920 930 940 950 960 pF1KB3 CLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDF ::::::..:: :: : :::: .:::::: :::. .:::.:::::::.:::..:...:: CCDS31 SLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEHGMVHRNLAARNVLLKSPSQVQVADF 800 810 820 830 840 850 970 980 990 1000 1010 1020 pF1KB3 GLARLLDIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYD :.: :: :. . . .:.:::::::::: ..:::::::::::::::::::::.:: CCDS31 GVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKYTHQSDVWSYGVTVWELMTFGAEPYA 860 870 880 890 900 910 1030 1040 1050 1060 1070 1080 pF1KB3 GIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQ :. :.:::::::::: :: ::::::::.:::::::: . :: :.::..::.:::::: CCDS31 GLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCWMIDENIRPTFKELANEFTRMARDPP 920 930 940 950 960 970 1090 1100 1110 1120 1130 pF1KB3 RFVVIQNEDLGPA---SPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGG :..::. :. ::. .: . . ::. .. .: . : .. CCDS31 RYLVIKRES-GPGIAPGPEPHGLTNKKLEEVELEPELDLDLDLEAEED------------ 980 990 1000 1010 1020 1140 1150 1160 1170 1180 1190 pF1KB3 MVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSL . ...: ... .: .: .. .. .: :.:: : . .:.:: . .. : CCDS31 -----NLATTTLGSALSLPVGTL-NRPRGSQSLLSPSSGY-MPMNQGNLGESCQESAVSG 1030 1040 1050 1060 1070 1200 1210 1220 1230 1240 1250 pF1KB3 PTHD-PSPLQRYSEDPTVPLPSET-DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPA .. : :.. . : : ::. .:.:. : : :.. : . ::: : CCDS31 SSERCPRPVSLHPM-PRGCLASESSEGHVTGSEAELQ-EKVSMCRSRSRSRSPRPRGDSA 1080 1090 1100 1110 1120 1130 1260 1270 1280 1290 1300 1310 pF1KB3 ARPAGATLERPKT-LSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFD . .: : : ::: CCDS31 YHSQRHSLLTPVTPLSPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEE 1140 1150 1160 1170 1180 1190 >>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa) initn: 1444 init1: 1137 opt: 1721 Z-score: 819.6 bits: 162.9 E(32554): 2.5e-39 Smith-Waterman score: 2026; 43.6% identity (70.4% similar) in 645 aa overlap (88-729:4-626) 60 70 80 90 100 110 pF1KB3 FPRGPLLRRAPGPHPSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGA : ::::. .. ::::: : . CCDS55 MRPSGTAGAALLAL-LAALC---------PASR 10 20 120 130 140 150 160 170 pF1KB3 A--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQ : .:: ::. :: .. : :. :......:.:: ::::.::. : .::::. :: CCDS55 ALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEVVLGNLEITYVQRNYDLSFLKTIQ 30 40 50 60 70 80 180 190 200 210 220 230 pF1KB3 EVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLR :: :::::: : :...::. :.:.::.. .:..::::::.: : :. ::. CCDS55 EVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALAVLSNYD----------ANKTGLK 90 100 110 120 130 240 250 260 270 280 290 pF1KB3 ELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPM :: .:.: :::.:.: .. :: :: ..: :.:: .. ... :. .:. :.: CCDS55 ELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDFQNHLGSCQKCDPS 140 150 160 170 180 190 300 310 320 330 340 350 pF1KB3 CKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTDCCHEQCAAGCTGPKHSDCLACLH : .. ::: . :.::.::. .:: :. ::.: :.::::.:::::::::..::::.: . CCDS55 CPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGCTGPRESDCLVCRK 200 210 220 230 240 250 360 370 380 390 400 410 pF1KB3 FNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPL : . :. :: :. :: :.. ::::.:.:::.:: :: ::. :: :::. .: CCDS55 FRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYVVTDHGSCVRACGA 260 270 280 290 300 310 420 430 440 450 460 470 pF1KB3 HNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFL . :. :::...:.:: :: .:: :.:. .... .....::..: .: .: :.: .: CCDS55 DSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFKNCTSISGDLHIL 320 330 340 350 360 370 480 490 500 510 520 530 pF1KB3 PESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILH : .: :: ..: ::.:..:....:..::::.: :.:::.. :: .:.::..:::: . CCDS55 PVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAFENLEIIRGRTKQ 380 390 400 410 420 430 540 550 560 570 580 590 pF1KB3 NGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTA .: .::.. .:.:. ::::::.:...: ..: : .::...:. : .:: . : . CCDS55 HGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKLFGTSGQKTKIIS 440 450 460 470 480 490 600 610 620 630 640 650 pF1KB3 NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNA :: :. : . : .:: ::. :::: : .::.: . ::.:::..: .:.: :::.:. CCDS55 NRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCNLLEGEPREFVEN 500 510 520 530 540 550 660 670 680 690 700 710 pF1KB3 RHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFP .:. ::::: :: ..:: : :.:. :::: : : :: ::.:: . . . .::. CCDS55 SECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVMGENNTL-VWKYA 560 570 580 590 600 610 720 730 740 750 760 770 pF1KB3 DEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKR : .:. : :::. CCDS55 DAGHVCHLCHPNCTYGS 620 1352 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 20:48:54 2016 done: Sat Nov 5 20:48:55 2016 Total Scan time: 5.420 Total Display time: 0.660 Function used was FASTA [36.3.4 Apr, 2011]