FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3300, 2555 aa
1>>>pF1KE3300 2555 - 2555 aa - 2555 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.8361+/-0.00166; mu= -2.1274+/- 0.100
mean_var=571.3297+/-113.296, 0's: 0 Z-trim(111.9): 261 B-trim: 0 in 0/53
Lambda= 0.053658
statistics sampled from 12497 (12745) to 12497 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.692), E-opt: 0.2 (0.392), width: 16
Scan time: 7.150
The best scores are: opt bits E(32554)
CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555) 18971 1486.4 0
CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471) 6853 548.3 1.8e-154
CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321) 5428 437.9 2.8e-121
CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003) 2659 223.5 8.7e-57
CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144) 1663 146.6 1.9e-33
CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165) 1663 146.6 1.9e-33
CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218) 1509 134.2 4e-30
CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 1494 133.5 1.5e-29
CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200) 1259 114.9 2.6e-24
CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238) 1247 114.0 5.1e-24
CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 ( 870) 1091 101.7 1.8e-20
CCDS1390.1 CRB1 gene_id:23418|Hs108|chr1 (1406) 1091 101.9 2.4e-20
CCDS33390.1 DNER gene_id:92737|Hs108|chr2 ( 737) 1013 95.6 1e-18
CCDS58053.1 CRB1 gene_id:23418|Hs108|chr1 (1382) 1014 96.0 1.5e-18
CCDS5313.1 DLL1 gene_id:28514|Hs108|chr6 ( 723) 1001 94.6 2e-18
CCDS45232.1 DLL4 gene_id:54567|Hs108|chr15 ( 685) 945 90.3 3.8e-17
CCDS48004.1 SVEP1 gene_id:79987|Hs108|chr9 (3571) 959 92.2 5.2e-17
CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 896 87.2 1.3e-15
CCDS6852.2 CRB2 gene_id:286204|Hs108|chr9 (1285) 885 85.9 1.4e-15
CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 857 83.9 7.3e-15
CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 857 83.9 7.4e-15
CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 857 83.9 7.5e-15
CCDS7453.1 SLIT1 gene_id:6585|Hs108|chr10 (1534) 776 77.6 5.6e-13
CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044) 760 76.2 1e-12
CCDS64311.1 SLIT3 gene_id:6586|Hs108|chr5 (1530) 740 74.8 3.8e-12
CCDS46562.1 SNED1 gene_id:25992|Hs108|chr2 (1413) 739 74.7 3.8e-12
CCDS75111.1 SLIT2 gene_id:9353|Hs108|chr4 (1521) 731 74.1 6.2e-12
CCDS75110.1 SLIT2 gene_id:9353|Hs108|chr4 (1525) 731 74.1 6.2e-12
CCDS3426.1 SLIT2 gene_id:9353|Hs108|chr4 (1529) 731 74.1 6.2e-12
CCDS53454.1 CRB1 gene_id:23418|Hs108|chr1 (1294) 728 73.8 6.6e-12
CCDS4369.1 SLIT3 gene_id:6586|Hs108|chr5 (1523) 723 73.5 9.5e-12
CCDS12537.1 DLL3 gene_id:10683|Hs108|chr19 ( 587) 678 69.5 5.8e-11
CCDS12538.1 DLL3 gene_id:10683|Hs108|chr19 ( 618) 678 69.5 6e-11
CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809) 693 71.5 7e-11
>>CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555 aa)
initn: 18971 init1: 18971 opt: 18971 Z-score: 7956.2 bits: 1486.4 E(32554): 0
Smith-Waterman score: 18971; 100.0% identity (100.0% similar) in 2555 aa overlap (1-2555:1-2555)
10 20 30 40 50 60
pF1KE3 MPPLLAPLLCLALLPALAARGPRCSQPGETCLNGGKCEAANGTEACVCGGAFVGPRCQDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MPPLLAPLLCLALLPALAARGPRCSQPGETCLNGGKCEAANGTEACVCGGAFVGPRCQDP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 NPCLSTPCKNAGTCHVVDRRGVADYACSCALGFSGPLCLTPLDNACLTNPCRNGGTCDLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NPCLSTPCKNAGTCHVVDRRGVADYACSCALGFSGPLCLTPLDNACLTNPCRNGGTCDLL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 TLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYICHCPPSFHGPTCRQDVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYICHCPPSFHGPTCRQDVN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 ECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 HECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 LMPNACQNGGTCHNTHGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LMPNACQNGGTCHNTHGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 CPHGRTGLLCHLNDACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CPHGRTGLLCHLNDACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 NPCEHAGKCINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NPCEHAGKCINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 GYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 AKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRPGYTGHHC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRPGYTGHHC
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 ETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSGTCLDKID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSGTCLDKID
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 GYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNEC
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 NSNPCVHGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMTSGYVCTCR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NSNPCVHGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMTSGYVCTCR
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 EGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRN
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 GGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRCHCQAGYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRCHCQAGYS
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 GRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANC
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 TDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSYCQH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSYCQH
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 DVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQ
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 YRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 YRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE3 YCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGTCLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 YCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGTCLD
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE3 LPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFV
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE3 GERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECRAGHTGRRCESVINGCKGKPCKNGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECRAGHTGRRCESVINGCKGKPCKNGG
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE3 TCAVASNTARGFICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TCAVASNTARGFICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTG
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE3 PECQFPASSPCLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PECQFPASSPCLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDI
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE3 PPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQSLQCWKYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQSLQCWKYF
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE3 SDGHCDSQCNSAGCLFDGFDCQRAEGQCNPLYDQYCKDHFSDGHCDQGCNSAECEWDGLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SDGHCDSQCNSAGCLFDGFDCQRAEGQCNPLYDQYCKDHFSDGHCDQGCNSAECEWDGLD
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE3 CAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQQMIFPYY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQQMIFPYY
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE3 GREEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVRGSIVYLEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GREEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVRGSIVYLEI
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE3 DNRQCVQASSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPAQLHFMYVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DNRQCVQASSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPAQLHFMYVA
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE3 AAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVSEASKKKRREPLGEDSVGLKPLKNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVSEASKKKRREPLGEDSVGLKPLKNA
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE3 SDGALMDDNQNEWGDEDLETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAADLRMSAMAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SDGALMDDNQNEWGDEDLETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAADLRMSAMAP
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE3 TPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEEEDAPAVISDFIYQGASL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEEEDAPAVISDFIYQGASL
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE3 HNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPLHAAVSADAQGVFQIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPLHAAVSADAQGVFQIL
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE3 IRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVDDLGKSALHWAAAVNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVDDLGKSALHWAAAVNN
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE3 VDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFANRDITDHMDRLPRDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFANRDITDHMDRLPRDI
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE3 AQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLGSLKPGVQGKKVRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLGSLKPGVQGKKVRK
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE3 PSSKGLACGSKEAKDLKARRKKSQDGKGCLLDSSGMLSPVDSLESPHGYLSDVASPPLLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PSSKGLACGSKEAKDLKARRKKSQDGKGCLLDSSGMLSPVDSLESPHGYLSDVASPPLLP
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE3 SPFQQSPSVPLNHLPGMPDTHLGIGHLNVAAKPEMAALGGGGRLAFETGPPRLSHLPVAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SPFQQSPSVPLNHLPGMPDTHLGIGHLNVAAKPEMAALGGGGRLAFETGPPRLSHLPVAS
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE3 GTSTVLGSSSGGALNFTVGGSTSLNGQCEWLSRLQSGMVPNQYNPLRGSVAPGPLSTQAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GTSTVLGSSSGGALNFTVGGSTSLNGQCEWLSRLQSGMVPNQYNPLRGSVAPGPLSTQAP
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE3 SLQHGMVGPLHSSLAASALSQMMSYQGLPSTRLATQPHLVQTQQVQPQNLQMQQQNLQPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLQHGMVGPLHSSLAASALSQMMSYQGLPSTRLATQPHLVQTQQVQPQNLQMQQQNLQPA
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE3 NIQQQQSLQPPPPPPQPHLGVSSAASGHLGRSFLSGEPSQADVQPLGPSSLAVHTILPQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NIQQQQSLQPPPPPPQPHLGVSSAASGHLGRSFLSGEPSQADVQPLGPSSLAVHTILPQE
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KE3 SPALPTSLPSSLVPPVTAAQFLTPPSQHSYSSPVDNTPSHQLQVPEHPFLTPSPESPDQW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SPALPTSLPSSLVPPVTAAQFLTPPSQHSYSSPVDNTPSHQLQVPEHPFLTPSPESPDQW
2470 2480 2490 2500 2510 2520
2530 2540 2550
pF1KE3 SSSSPHSNVSDWSEGVSSPPTSMQSQIARIPEAFK
:::::::::::::::::::::::::::::::::::
CCDS43 SSSSPHSNVSDWSEGVSSPPTSMQSQIARIPEAFK
2530 2540 2550
>>CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471 aa)
initn: 7358 init1: 4384 opt: 6853 Z-score: 2886.6 bits: 548.3 E(32554): 1.8e-154
Smith-Waterman score: 10140; 54.0% identity (74.7% similar) in 2564 aa overlap (2-2539:6-2443)
10 20 30 40 50
pF1KE3 MPPLLAPLLCLALLPALAARGPRCSQPGETCLNGGKCEAA-NGTEACVCGGAFVGP
: :: :: : : : :.. .: . : :.: : : . ::: : : .:.:
CCDS90 MPALRPALLWALLALWLCCAAPAHALQCRDGYEPCVNEGMCVTYHNGTGYCKCPEGFLGE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 RCQDPNPCLSTPCKNAGTCHVVDRRGVADYACSCALGFSGPLCLTPLDNACLTN-PCRNG
:: .:: .. :.:.::: : . .. .: :: ::.: : .. :... :: ::
CCDS90 YCQHRDPCEKNRCQNGGTC--VAQAMLGKATCRCASGFTGEDCQYSTSHPCFVSRPCLNG
70 80 90 100 110
120 130 140 150 160 170
pF1KE3 GTCDLLTLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYICHCPPSFHGPT
::: .:. :.: : :..:: :: .: : :.:::::. : .. :.: .: :
CCDS90 GTCHMLSRDTYECTCQVGFTGKECQWTDACLSHPCANGSTCTTVANQFSCKCLTGFTGQK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE3 CRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCR
:. ::::: . :: :.::::: : :::.: : :: :. ::::.:::: ::::::
CCDS90 CETDVNEC-DIPGHCQHGGTCLNLPGSYQCQCPQGFTGQYCDSLYVPCAPSPCVNGGTCR
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 PTGDVTHECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTE
::: : :: ::::: :..::.::::::.. :.:::.::::::::::::::.::::.:::
CCDS90 QTGDFTFECNCLPGFEGSTCERNIDDCPNHRCQNGGVCVDGVNTYNCRCPPQWTGQFCTE
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 DVDECQLMPNACQNGGTCHNTHGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRV
::::: :.:::::::::: : .:::.:::::::.:.:::::::::: :.: :.:: :::
CCDS90 DVDECLLQPNACQNGGTCANRNGGYGCVCVNGWSGDDCSENIDDCAFASCTPGSTCIDRV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE3 ASFYCECPHGRTGLLCHLNDACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVD
::: : ::.:..::::::.::::::::..:. :::::.::. :::::.:: : :..:::
CCDS90 ASFSCMCPEGKAGLLCHLDDACISNPCHKGALCDTNPLNGQYICTCPQGYKGADCTEDVD
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE3 ECSLG-ANPCEHAGKCINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGE
::... .:::::::::.:: :.:.:.::.::.:::::.:.::: :.::::::::::.::
CCDS90 ECAMANSNPCEHAGKCVNTDGAFHCECLKGYAGPRCEMDINECHSDPCQNDATCLDKIGG
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE3 FQCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECA
: :.::::..:::::.. .:: :.::..::.:.::.:.::: :: :::: .:: :.:.:.
CCDS90 FTCLCMPGFKGVHCELEINECQSNPCVNNGQCVDKVNRFQCLCPPGFTGPVCQIDIDDCS
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE3 STPCKNGAKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRP
:::: :::::.: :: : : :. :.::. :: .::.:::::::.:.:.::. ..::.: :
CCDS90 STPCLNGAKCIDHPNGYECQCATGFTGVLCEENIDNCDPDPCHHGQCQDGIDSYTCICNP
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE3 GYTGHHCETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSG
:: : : .:.:: :.:: . : : : :.: : : ::.: :::::.:::::.:: :
CCDS90 GYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQCNCQPGTSGVNCEINFDDCASNPCIHG
600 610 620 630 640 650
660 670 680 690 700 710
pF1KE3 TCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTC
:.: :. : :.: ::.::. :::.:::::.:::..:.:: .:.::: : :::: : :.:
CCDS90 ICMDGINRYSCVCSPGFTGQRCNIDIDECASNPCRKGATCINGVNGFRCICPEGPHHPSC
660 670 680 690 700 710
720 730 740 750 760 770
pF1KE3 LSEVNECNSNPCVHGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMTS
:.:::: ::::.:: : .:.:::: :: :: : ::....::: :::: ::::: ....
CCDS90 YSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVGINCEVDKNECLSNPCQNGGTCDNLVN
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE3 GYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPC
:: :::..::.: :::.::.:::::::::::::.::..:: :.:.::::: .:..:::::
CCDS90 GYRCTCKKGFKGYNCQVNIDECASNPCLNQGTCFDDISGYTCHCVLPYTGKNCQTVLAPC
780 790 800 810 820 830
840 850 860 870 880 890
pF1KE3 APSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRC
.:.::.:.. :..: ..::..:.: ::::: : .::.::. .:: . . :.::.:.: :
CCDS90 SPNPCENAAVCKESPNFESYTCLCAPGWQGQRCTIDIDECISKPCMNHGLCHNTQGSYMC
840 850 860 870 880 890
900 910 920 930 940 950
pF1KE3 HCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDP
.: :.:: .:: ::::: :::.::::: ::.:: : ::::: : :. :.::: :.:
CCDS90 ECPPGFSGMDCEEDIDDCLANPCQNGGSCMDGVNTFSCLCLPGFTGDKCQTDMNECLSEP
900 910 920 930 940 950
960 970 980 990 1000 1010
pF1KE3 CRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGF
:.::..:.: :.:::: : :::.:.::::: .:::::::::::::::::::.:::: ::
CCDS90 CKNGGTCSDYVNSYTCKCQAGFDGVHCENNINECTESSCFNGGTCVDGINSFSCLCPVGF
960 970 980 990 1000 1010
1020 1030 1040 1050 1060 1070
pF1KE3 TGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGK
:::.: :..:::.:.:::. ::: :: :.:::.:: :::: :::.::. :. ::::: :
CCDS90 TGSFCLHEINECSSHPCLNEGTCVDGLGTYRCSCPLGYTGKNCQTLVNLCSRSPCKNKGT
1020 1030 1040 1050 1060 1070
1080 1090 1100 1110 1120 1130
pF1KE3 CWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRC
: : ... .: :::::.: :::::.:::..::.:.:: : .::::.:.:..:::::.:.:
CCDS90 CVQKKAESQCLCPSGWAGAYCDVPNVSCDIAASRRGVLVEHLCQHSGVCINAGNTHYCQC
1080 1090 1100 1110 1120 1130
1140 1150 1160 1170 1180 1190
pF1KE3 QAGYTGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQ
::::::::. .:::. .:::.::::.:..::: :.:: ::.:::: :.::: ..:::
CCDS90 PLGYTGSYCEEQLDECASNPCQHGATCSDFIGGYRCECVPGYQGVNCEYEVDECQNQPCQ
1140 1150 1160 1170 1180 1190
1200 1210 1220 1230 1240 1250
pF1KE3 NGGTCLDLPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSC
:::::.:: : .::::: ::.:. :: :.::: .:.:.:.:.: :.:..:::::
CCDS90 NGGTCIDLVNHFKCSCPPGTRGLLCEENIDDC-------ARGPHCLNGGQCMDRIGGYSC
1200 1210 1220 1230 1240 1250
1260 1270 1280 1290 1300 1310
pF1KE3 TCPPGFVGERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECRAGHTGRRCESVINGCKG
: :::.:::::::.::::::::...:. .:.: .::. : ::.. :::.::. .. :
CCDS90 RCLPGFAGERCEGDINECLSNPCSSEGSLDCIQLTNDYLCVCRSAFTGRHCETFVDVCPQ
1260 1270 1280 1290 1300 1310
1320 1330 1340 1350 1360 1370
pF1KE3 KPCKNGGTCAVASNTARGFICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCL
:: :::::::::: ::::.:: :: :: :.. .::...: .: :. .: :.
CCDS90 MPCLNGGTCAVASNMPDGFICRCPPGFSGARCQS---SCGQVKCRKGEQCVHTASGPRCF
1320 1330 1340 1350 1360
1380 1390 1400 1410 1420 1430
pF1KE3 CLGPFTGPECQFPASSPCLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFG
: .: .:. : : ...:: . :.:.: . :.: : : :.: :.. :.
CCDS90 CPSPR---DCE----SGC-ASSPCQHGGSCHPQRQPPYYSCQCAPPFSGSRCEL--YT--
1370 1380 1390 1400 1410
1440 1450 1460 1470 1480 1490
pF1KE3 GGAGRDIPPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQS
:: .: : . : . ::. ::.::: ::::::::....:: ::..
CCDS90 ------APPSTPPATCLSQYCADKARDGVCDEACNSHACQWDGGDCSLTMENPWANCSSP
1420 1430 1440 1450 1460
1500 1510 1520 1530 1540 1550
pF1KE3 LQCWKYFSDGHCDSQCNSAGCLFDGFDCQRAEGQCNPLYDQYCKDHFSDGHCDQGCNSAE
: :: :... .:: ::.. ::::.:.:: :. ::.:: :::.:.:::::::: :
CCDS90 LPCWDYINN-QCDELCNTVECLFDNFECQGNSKTCK--YDKYCADHFKDNHCDQGCNSEE
1470 1480 1490 1500 1510 1520
1560 1570 1580 1590 1600 1610
pF1KE3 CEWDGLDCAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQ
: ::::::: :: :: ::::.::::::::: ... ::: :. .::::. .:::..:.
CCDS90 CGWDGLDCAADQPENLAEGTLVIVVLMPPEQLLQDARSFLRALGTLLHTNLRIKRDSQGE
1530 1540 1550 1560 1570 1580
1620 1630 1640 1650 1660 1670
pF1KE3 QMIFPYYG-REEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVR
:..:::: . ..:. . : . ::: .: ..:
CCDS90 LMVYPYYGEKSAAMKKQRMTRRS-----------------LPGEQE----------QEVA
1590 1600 1610
1680 1690 1700 1710 1720 1730
pF1KE3 GSIVYLEIDNRQCVQASSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPA
:: :.:::::::::: :..::... .::.:.. : :.:. : . .: ::.. : .
CCDS90 GSKVFLEIDNRQCVQDSDHCFKNTDAAAALLASHAIQGTLSYP--LVSVVSESLTPER-T
1620 1630 1640 1650 1660 1670
1740 1750 1760 1770 1780 1790
pF1KE3 QLHFMYVAAAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVS-EASKKKRREPLGEDS
:: .. .:.:. ..::.. ::... ::.:.::.::.:::: . .::..:::::.:.:.
CCDS90 QLLYL-LAVAVVIILFIILLGVIMA-KRKRKHGSLWLPEGFTLRRDASNHKRREPVGQDA
1680 1690 1700 1710 1720 1730
1800 1810 1820 1830 1840
pF1KE3 VGLKPLK-NASDGALMDDNQNE-W-GDEDLETKKFRFEEPVVLPDLDDQTDHRQWTQQHL
:::: :. ..:.. :. . .: : :: . :: . :. ..: . :: :.: ::::::
CCDS90 VGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDRRPWTQQHL
1740 1750 1760 1770 1780 1790
1850 1860 1870 1880 1890 1900
pF1KE3 DAADLRMS-AMAPTPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEE-EDA
.:::.: . ..: ::::.: ..: .::::::::: ::::.:: ::. . .. .:. ::.
CCDS90 EAADIRRTPSLALTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSDLSDEDEDAEDS
1800 1810 1820 1830 1840 1850
1910 1920 1930 1940 1950 1960
pF1KE3 PA-VISDFIYQGASLHNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPL
: .:.:..::::::. ::::::: ::::::::::.:::::::.:.:::: :::::: ::
CCDS90 SANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANAQDNMGRCPL
1860 1870 1880 1890 1900 1910
1970 1980 1990 2000 2010 2020
pF1KE3 HAAVSADAQGVFQILIRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVD
::::.::::::::::::::.:::::::.:::::::::::::::::. .::: .:::::::
CCDS90 HAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELINCQADVNAVD
1920 1930 1940 1950 1960 1970
2030 2040 2050 2060 2070 2080
pF1KE3 DLGKSALHWAAAVNNVDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFA
: ::::::::::::::.:...:::::::.:::.:.:::::::::::::::.::.::::::
CCDS90 DHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEAAKILLDHFA
1980 1990 2000 2010 2020 2030
2090 2100 2110 2120 2130 2140
pF1KE3 NRDITDHMDRLPRDIAQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGY
::::::::::::::.:..::::::::::::::.. :: :. : : .::: .:.::
CCDS90 NRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPP--GTVL--TSALSPVICGPNRS
2040 2050 2060 2070 2080 2090
2150 2160 2170 2180 2190
pF1KE3 LGSLKPGVQGKKVRKPSSKG-----LACGSKEAKDLK-ARRKKSQDGKGCLLDSSGMLSP
. ::: .::: :.::.:. : .::::: : .::::: . : : .:: :::
CCDS90 FLSLKHTPMGKKSRRPSAKSTMPTSLPNLAKEAKDAKGSRRKKSLSEKVQLSESSVTLSP
2100 2110 2120 2130 2140 2150
2200 2210 2220 2230 2240 2250
pF1KE3 VDSLESPHGYLSDVASPPLLPSP--FQQSPSVPLNHLPGMPDTHLGIGH-LNVAAKPEMA
:::::::: :.::..: :.. :: .: ::. :. . : . . : :. . ::
CCDS90 VDSLESPHTYVSDTTSSPMITSPGILQASPN-PM-LATAAPPAPVHAQHALSFSNLHEMQ
2160 2170 2180 2190 2200
2260 2270 2280 2290 2300 2310
pF1KE3 ALGGGGRLAFETGPPRLSHLPVASGTSTVLGSSSGGALNFTVGGSTSLNGQCEWLSRLQS
:. :. .. . ::: ..: ::.:.:.:. . .:..:..
CCDS90 PLAHGASTVLPSVSQLLSHHHIVSP-----GSGSAGSLSRL----HPVPVPADWMNRMEV
2210 2220 2230 2240 2250
2320 2330 2340 2350 2360 2370
pF1KE3 GMVPNQYNPLRGSVAPGPLSTQAPSLQHGMVGPLHSSLAASALSQMMSYQGLPSTRLATQ
. .::: . : : ::. .: : ..: :..:
CCDS90 N--ETQYNEMFGMVL-------APA--EG----THPGIA-------------PQSRPPEG
2260 2270 2280 2290
2380 2390 2400 2410 2420 2430
pF1KE3 PHLVQTQQVQPQNLQMQQQNLQPANIQQQQSLQPPPPPPQPHLGVSSAASGHLGRSFLSG
:.. .. : . .: : : . :. : :::. :..: :
CCDS90 KHITTPREPLPPIVTFQ---LIP-----KGSIAQPAGAPQPQSTCPPAVAGPL-------
2300 2310 2320 2330
2440 2450 2460 2470 2480 2490
pF1KE3 EPSQADVQPLG--PSSLAVHTILPQESPALP-TSLPSSLVPPVTAAQFLTPPSQHSYSSP
:.. .. .. :: ...::.. . : ::. :...... ::::::::.:
CCDS90 -PTMYQIPEMARLPSVAFPTAMMPQQDGQVAQTILPAYHPFPASVGKYPTPPSQHSYASS
2340 2350 2360 2370 2380 2390
2500 2510 2520 2530 2540 2550
pF1KE3 --VDNTPSHQLQVP-EHPFLTPSPESPDQWSSSSPHSNVSDWSEGVSSPPTSMQSQIARI
.. ::::. .. :::.:::::::::::::::::: .::::. ..::
CCDS90 NAAERTPSHSGHLQGEHPYLTPSPESPDQWSSSSPHS-ASDWSDVTTSPTPGGAGGGQRG
2400 2410 2420 2430 2440 2450
pF1KE3 PEAFK
CCDS90 PGTHMSEPPHNNMQVYA
2460 2470
>>CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321 aa)
initn: 5566 init1: 3565 opt: 5428 Z-score: 2290.7 bits: 437.9 E(32554): 2.8e-121
Smith-Waterman score: 8821; 50.9% identity (72.0% similar) in 2400 aa overlap (52-2385:33-2319)
30 40 50 60 70 80
pF1KE3 PRCSQPGETCLNGGKCEAANGTEACVCGGAFVGPRCQDPNPCLS-TPCKNAGTCHVVDRR
..:: : :::. .:: :.: : . :
CCDS12 PGARGRRRRRRPMSPPPPPPPVRALPLLLLLAGPGAAAP-PCLDGSPCANGGRCTQLPSR
10 20 30 40 50 60
90 100 110 120 130
pF1KE3 GVADYACSCALGFSGPLCLTPLDNACLTNPCRNGGTCD---LLTLTEYKCRCPPGWSGKS
. :: : :. : : :.. : ..:: . :.:. . ....:::: :. : .
CCDS12 ---EAACLCPPGWVGERC--QLEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPD
70 80 90 100 110
140 150 160 170 180 190
pF1KE3 CQQADPCASNPCANGGQC-LPFEASYICHCPPSFHGPTCRQDVNECG-QKPGLCRHGGTC
:. ::: :.:::.:..: . .. ..: :::...: .::.::.:: .: :::::::
CCDS12 CSLPDPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGEP--CRHGGTC
120 130 140 150 160 170
200 210 220 230 240 250
pF1KE3 HNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTGQNCE
: ::.:: : : .::: :: : :::.::::.:::::: .::.:..::::::: :::::
CCDS12 LNTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNCE
180 190 200 210 220 230
260 270 280 290 300 310
pF1KE3 ENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHNT
:.:::::. : :::.::::::::::.::::::::.::::::::::.::::.::::: ::
CCDS12 VNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNT
240 250 260 270 280 290
320 330 340 350 360 370
pF1KE3 HGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCECPHGRTGLLCHLNDA
::..::::::::::.::.::::::.:.:::::::::::::::: :: :.:::::::.::
CCDS12 LGGHSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDA
300 310 320 330 340 350
380 390 400 410 420 430
pF1KE3 CISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGANPCEHAGKCINTLGS
:.::::.: . ::::::::.:::::: :.:: ::.:::::::.::::::: :.:.:: ::
CCDS12 CVSNPCHEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGS
360 370 380 390 400 410
440 450 460 470 480 490
pF1KE3 FECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGVHCEVNTDECA
: ::: .:::::::: :::::.:.::.:.:::::.::.: :::: :. :..:::. :::
CCDS12 FLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQ
420 430 440 450 460 470
500 510 520 530 540 550
pF1KE3 SSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNGAKCLDGPNTYTCVCT
::::...: : :..: :.: ::.::.: :: ::::::::::.:::::.: :. : : :.
CCDS12 SSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCA
480 490 500 510 520 530
560 570 580 590 600 610
pF1KE3 EGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRPGYTGHHCETNINECSSQPCRHG
::. :: :. ..:.:.:::::.: : ::.:.:.: : ::::: .::....:: :::::::
CCDS12 EGFEGTLCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRHG
540 550 560 570 580 590
620 630 640 650 660 670
pF1KE3 GTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSGTCLDKIDGYECACEPGYTGSMC
: : : . ::: : .:::: :::.:.:::::.:: :.: : :. :.:.:.::.:: .:
CCDS12 GKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPLC
600 610 620 630 640 650
680 690 700 710 720 730
pF1KE3 NINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNECNSNPCVHGACRDSLN
:..:.:::..:: .::.: :: ::: : :: : : :: . : .:: :: : :. .
CCDS12 NVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPG
660 670 680 690 700 710
740 750 760 770 780 790
pF1KE3 GYKCDCDPGWSGTNCD--INNNECESNPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNIN
:..: :.::::: :. . . :::.:: ::::.. :. ::: : .: .:.
CCDS12 GFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCE----
720 730 740 750 760 770
800 810 820 830 840 850
pF1KE3 ECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRNGGECRQSEDYESF
.:.::.:.::..::.: .: .
CCDS12 -----------------------------------LLSPCTPNPCEHGGRC-ESAPGQLP
780 790
860 870 880 890 900 910
pF1KE3 SCVCPTGWQGQTCEVDINECVL-SPCRHGASCQNTHGGYRCHCQAGYSGRNCETDIDDCR
: :: :::: :. :..::. .:: . : : :.. : :..::.: .:. ::.::
CCDS12 VCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDCD
800 810 820 830 840 850
920 930 940 950 960 970
pF1KE3 PNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANCTDCVDSYTCTCP
:::: ::::: ::... :.::::: : : .:..:: :.:: :. ::: : :.:::::
CCDS12 PNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGPGT-CTDHVASFTCTCP
860 870 880 890 900 910
980 990 1000 1010 1020 1030
pF1KE3 AGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSYCQHDVNECDSQPCLH
:..:.:::.. :::. ::::::::::::.:::.::: ::.::..:::... : :.::::
CCDS12 PGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPCLH
920 930 940 950 960 970
1040 1050 1060 1070 1080 1090
pF1KE3 GGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWTGL
::.:. . ..:::: ...:::.::.:: ::. .::.:::.: :: . : :: ::.:
CCDS12 GGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGA--YCLCPPGWSGR
980 990 1000 1010 1020 1030
1100 1110 1120 1130 1140 1150
pF1KE3 YCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECSPS
::. :. :. :: . :: . .::: :: ::: ..:.: : : :::.::. :: : .
CCDS12 LCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCLAQ
1040 1050 1060 1070 1080 1090
1160 1170 1180 1190 1200 1210
pF1KE3 PCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGTCLDLPNTYKCSCPRG
:::.:.:: :.::: :.:. ::.: :: ...::: :.:::.::.:.:: : :::: :
CCDS12 PCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDLVARYLCSCPPG
1100 1110 1120 1130 1140 1150
1220 1230 1240 1250 1260 1270
pF1KE3 TQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFVGERCEGDVNECL
: :: :::: :::.: :.. .:.:..:::::: :::. ::::::..: :::.:.:::
CCDS12 TLGVLCEINEDDCGPG-PPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGLRCEADINECR
1160 1170 1180 1190 1200 1210
1280 1290 1300 1310 1320 1330
pF1KE3 SNPCDARGTQNCVQRVND-FHCECRAGHTGRRCESVINGCKGKPCKNGGTCAVASNTARG
:. : : :..:.: . :.: :.:: .: ::..:.. :...::..:: : . . . :
CCDS12 SGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQCRPSPGPGGG
1220 1230 1240 1250 1260 1270
1340 1350 1360 1370 1380
pF1KE3 --FICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTGPECQ-FPAS
: :.: : : :: ::.: :.: : : . ::.: : : ..:: :. ::.:
CCDS12 LTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLSGPSCRSFPGS
1280 1290 1300 1310 1320 1330
1390 1400 1410 1420 1430 1440
pF1KE3 SP------CLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDIPP
: : .. :: . :.:.:. .::.:: : ..: :. : :
CCDS12 PPGASNASC-AAAPCLHGGSCRPAPLAPFFRCACAQGWTGPRCE---------APAAAPE
1340 1350 1360 1370 1380
1450 1460 1470 1480 1490 1500
pF1KE3 PLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQSLQCWKYFSD
: : :: :.. :. .::. .::::::::::. .:::..: ..::::. :..
CCDS12 VSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLSVGDPWRQC-EALQCWRLFNN
1390 1400 1410 1420 1430
1510 1520 1530 1540 1550 1560
pF1KE3 GHCDSQCNSAGCLFDGFDCQRA--EGQCNPLYDQYCKDHFSDGHCDQGCNSAECEWDGLD
..:: :.: .::.:.:::. . : :::.:..:: :::.::.::::::. :: :::::
CCDS12 SRCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDGLD
1440 1450 1460 1470 1480 1490
1570 1580 1590 1600 1610 1620
pF1KE3 CAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQQMIFPYY
:: .:: :: :.::..::.:::.: :: ::..:: .:.:.. :. ::::: :.:::.
CCDS12 CASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFPYH
1500 1510 1520 1530 1540 1550
1630 1640 1650 1660 1670 1680
pF1KE3 GREEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVRGSIVYLEI
: : ::: : :::: : .: ::.:.:::
CCDS12 ------RPSP-------------------------GSEP-RARRELAP-EVIGSVVMLEI
1560 1570 1580
1690 1700 1710 1720 1730
pF1KE3 DNRQCVQA--SSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPAQLHFMY
::: :.:. ...:: .: ..: .::::... :..:: .. :..: .::: :. .
CCDS12 DNRLCLQSPENDHCFPDAQSAADYLGALSAVERLDFPYPLRDVRGEPLEPPEPSVPLLPL
1590 1600 1610 1620 1630 1640
1740 1750 1760 1770 1780 1790
pF1KE3 VAAAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVSE---ASKKKRREPLGEDSVGLK
..:.: .:: .. ::...: :.:.:. :::::::.. . ...: ::::.:.:..:.:
CCDS12 LVAGAVLLLVILVLGVMVAR-RKREHSTLWFPEGFSLHKDVASGHKGRREPVGQDALGMK
1650 1660 1670 1680 1690 1700
1800 1810 1820 1830 1840 1850
pF1KE3 PLKNASDGALMDDNQNEWGDEDL-ETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAADLR
. :. .:: . ..: : . :.:... ::: . .. .: :::::.:: :::.:
CCDS12 NM--AKGESLMGEVATDWMDTECPEAKRLKVEEPGM--GAEEAVDCRQWTQHHLVAADIR
1710 1720 1730 1740 1750 1760
1860 1870 1880 1890 1900 1910
pF1KE3 MS-AMAPTPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEEE--DAPA-VI
.. ::: :::::..::: :::::::::::::::.:: ::.:: .::.: :. : .:
CCDS12 VAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMPTEEDEADDTSASII
1770 1780 1790 1800 1810 1820
1920 1930 1940 1950 1960 1970
pF1KE3 SDFIYQGASLHNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPLHAAVS
::.: :::.: .:::::::::::::::.:.:::::::.:.::.: ::. ::::::.::.
CCDS12 SDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNAQDHSGRTPLHTAVT
1830 1840 1850 1860 1870 1880
1980 1990 2000 2010 2020 2030
pF1KE3 ADAQGVFQILIRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVDDLGKS
::::::::::::::.::::::: ::.: ::::::::::::.:.:: :::::::::.::::
CCDS12 ADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIASHADVNAVDELGKS
1890 1900 1910 1920 1930 1940
2040 2050 2060 2070 2080 2090
pF1KE3 ALHWAAAVNNVDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFANRDIT
:::::::::::.:...:::::::::::...:::::::::::::::.::.::::::::.::
CCDS12 ALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEAAKLLLDHFANREIT
1950 1960 1970 1980 1990 2000
2100 2110 2120 2130 2140 2150
pF1KE3 DHMDRLPRDIAQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLGSLK
::.::::::.::::.:.:::::::. . ::: .: : :.: :: :...: .::
CCDS12 DHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPP---GPHG----LGPLLCPPGAFLPGLK
2010 2020 2030 2040 2050
2160 2170 2180 2190 2200
pF1KE3 PGVQG-KKVRKPSSK-GLACGSKEAKDLKARRKKSQDGKGCLLDSSGMLSPVDSLESPHG
. .: :: :.: .: ::. . ... .: . : : ::: :::::::.::.
CCDS12 AAQSGSKKSRRPPGKAGLGPQGPRGRG----KKLTLACPGPLADSSVTLSPVDSLDSPRP
2060 2070 2080 2090 2100 2110
2210 2220 2230 2240 2250
pF1KE3 YLSDVASPPLLP--SPFQQSPS--VPLNHLPGMPDTHLG----------IGHLNVAAKP-
. . ::: .: .:. . . : : .: : . :: .: :: .: :
CCDS12 FGGPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQPPGGCVLSLGLLNPVAVPL
2120 2130 2140 2150 2160 2170
2260 2270 2280 2290 2300
pF1KE3 EMAAL------GGGGRLAFETGPPRLSH-LPVASGTSTV-LGSSSGGALNFTVGGSTSLN
. : : : . : . :: :. ::. . : . .. ..:. :
CCDS12 DWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEEYPAAGAHSSP
2180 2190 2200 2210 2220 2230
2310 2320 2330 2340 2350
pF1KE3 GQCEWLSRLQSG---MVPNQYNPLR-GSVAPGPLS-----TQAPSLQHGMVGPLHSSLAA
. ..: :. : ..:. .: . .: .: :: : .:. : .. ..: :
CCDS12 PKARFL-RVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTPSPATATGAMATTTGALPA
2240 2250 2260 2270 2280
2360 2370 2380 2390 2400 2410
pF1KE3 SALS-QMMSYQGLPSTRLATQPHLVQTQQVQPQNLQMQQQNLQPANIQQQQSLQPPPPPP
. : .. : . .:.:. ::... .::
CCDS12 QPLPLSVPSSLAQAQTQLGPQPEVTPKRQVLA
2290 2300 2310 2320
>>CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003 aa)
initn: 2706 init1: 819 opt: 2659 Z-score: 1133.0 bits: 223.5 E(32554): 8.7e-57
Smith-Waterman score: 5389; 37.1% identity (57.4% similar) in 2345 aa overlap (2-2281:3-1998)
10 20 30 40 50
pF1KE3 MPPLLAPLLCLALLPALAARGPR---CSQPGETCLNGGKCEAAN-GTEACVCGGAFVGP
:: : :: : :: ... :: :.. : : ::: : . . : .: :. .:.:
CCDS34 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGE
10 20 30 40 50 60
60 70 80 90 100
pF1KE3 RCQDPNPCLSTP-CKNAGTCHVVDRRGVA----------DYACSCALGFSGPLCLTPLDN
:: :.:: .. :.:.:.:... .. .. :.: ::.: : . :..
CCDS34 TCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAKLED
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE3 ACLTNPCRNGGTCDLLTLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYIC
: . : . : : . . . .: : :::.:..:: : :..:::.::: :: . :
CCDS34 PCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQIQC
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE3 HCPPSFHGPTCRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSP
::::.:.: .:..::::: : :: : .: .::: .::..:.: . . :: :: :: :
CCDS34 HCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPP
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE3 SPCQNGGTCR--PTGDVT-HECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNC
:.:::::. : : : : : : ::: : .:: : :.: ...:.:::.: ::..::.:
CCDS34 RGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTC
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE3 RCPPEWTGQYCTEDVDECQLM-PNACQNGGTCHNTHGGYNCVCVNGWTGEDCSENIDDCA
:: ::: :.::::::. . : :.:::::.:. :...::::.:: : .: ::.:::
CCDS34 LCPETWTGWDCSEDVDECETQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCI
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE3 SAACFHGATCHDRVASFYCECPHGRTGLLCHLNDACISNPCNEGSNCDTNPVNGKAICTC
.:.: :.:: :::.:: : :: :::::::::.: :.:.::. ..:.:::..:...: :
CCDS34 AATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLEDMCLSQPCHGDAQCSTNPLTGSTLCLC
370 380 390 400 410 420
410 420 430 440 450
pF1KE3 PSGYTGPACSQDVDECSL---GANPCEHAGKCINTLGSFECQCLQGYTGPRCEIDVNECV
::.::.: ::.::: . : .::::.:.:.:: :::.: : :::: ::: : :::.
CCDS34 QPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECL
430 440 450 460 470 480
460 470 480 490 500 510
pF1KE3 SNPCQNDATCLDQIGEFQCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECP
:.::. .:::: .. :.:.: :: :: :::.:.::::.:::... : : .: ::: :
CCDS34 SQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICL
490 500 510 520 530 540
520 530 540 550 560 570
pF1KE3 TGFTGHLCQYDVDECASTPCKNGAKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHY
::.: :. :.::: :.:: ::..: : :... ::.
CCDS34 PGFSGTRCEEDIDECRSSPCANGGQCQDQPGAF-----------HCK-------------
550 560 570
580 590 600 610 620 630
pF1KE3 GSCKDGVATFTCLCRPGYTGHHCETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPN
: ::. : .:.:...:: :.:: :..: : .:..:.: .: ::
CCDS34 -------------CLPGFEGPRCQTEVDECLSDPCPVGASCLDLPGAFFCLCPSGFTGQL
580 590 600 610 620
640 650 660 670 680 690
pF1KE3 CEINLDDCASSPCDSGTCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGI
::. : :: : :. :.:
CCDS34 CEVPL---------------------------------------CAPNLCQPKQICKDQK
630 640
700 710 720 730 740 750
pF1KE3 NGFTCRCPEGYHDPTCLSEVNECNSNPCVHGACRDSLNGYKCDCDPGWSGTNCDINNNEC
. .: ::.: .: : ..:. : :: :. : .: :: ::.: .:. . . :
CCDS34 DKANCLCPDG--SPGCAPPEDNCT---CHHGHCQRS----SCVCDVGWTGPECEAELGGC
650 660 670 680 690
760 770 780 790 800 810
pF1KE3 ESNPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNC
: ::..:::: . ::: ::: :..::.:. ... : :.:::: :.:
CCDS34 ISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEMTACHSGPCLNGGSC-----------
700 710 720 730 740
820 830 840 850 860 870
pF1KE3 LLPYTGATCEVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSP
:::
CCDS34 ----------------NPSP----------------------------------------
880 890 900 910 920 930
pF1KE3 CRHGASCQNTHGGYRCHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGF
::: : : ...: .:.:. : : :: :::.: .: ::
CCDS34 -----------GGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGGTC---VNR------PG-
750 760 770 780
940 950 960 970 980 990
pF1KE3 RGTFCEEDINECASDPCRNGANCTDCVDSYTCTCPAGFSGIHCENNT-PDCTESSCFNGG
...: : ::.: .::.. :.:..: : : .
CCDS34 ----------------------------TFSCLCAMGFQGPRCEGKLRPSCADSPCRNRA
790 800 810
1000 1010 1020 1030 1040 1050
pF1KE3 TCVDGINSFTCLCPPGFTGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNC
:: :. : : : :: :: :::: .:
CCDS34 TCQDS--------PQG----------------P--------------RCLCPTGYTGGSC
820 830 840
1060 1070 1080 1090 1100 1110
pF1KE3 QNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLC
:.:. : ..:: ...: :: ...: : .:::: :..: ::. :: ::.::. ::
CCDS34 QTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSLC
850 860 870 880 890 900
1120 1130 1140 1150 1160 1170
pF1KE3 QHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYH
..::::::.: .. :.: :. :: :.: :. : :::::::: .:: :.:. ::
CCDS34 HNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGYD
910 920 930 940 950 960
1180 1190 1200 1210 1220 1230
pF1KE3 GVNCSEEIDECLSHPCQNGGTCLDLPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSP
: :::.:.: : :.::.: ::: :
CCDS34 GQNCSKELDACQSQPCHNHGTCTPKP----------------------------------
970 980
1240 1250 1260 1270 1280 1290
pF1KE3 KCFNNGTCVDQVGGYSCTCPPGFVGERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECR
::. :.::::::: ::::::.:::..:: :: : . .: :.:.:
CCDS34 ------------GGFHCACPPGFVGLRCEGDVDECLDQPCHPTGTAACHSLANAFYCQCL
990 1000 1010 1020 1030
1300 1310 1320 1330 1340 1350
pF1KE3 AGHTGRRCESVINGCKGKPCKNGGTCAVASNTARGFICKCPAGFEGATCENDARTCGSLR
::::. :: :. :...:: .:::: ..... ::::.:: :::: :: . : .:: .
CCDS34 PGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFEGPTCSHRAPSCGFHH
1040 1050 1060 1070 1080 1090
1360 1370 1380 1390 1400 1410
pF1KE3 CLNGGTCISGPRS---PTCLCLGPFTGPECQFP-ASSPCLGGNPCYNQGTCEPTSE--SP
: .:: :. .:. : : ::. . ::.: : : . : .:: .:.: :. .:
CCDS34 CHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPCLYNGSCSETTGLGGP
1100 1110 1120 1130 1140 1150
1420 1430 1440 1450 1460 1470
pF1KE3 FYRCLCPAKFNGLLCHILDYSFGGGAGRDIPPPLIEEACELPECQEDAGNKVCSLQCNNH
.:: :: . : :. :. : :. .:. .:. :..
CCDS34 GFRCSCPHSSPGPRCQK-----PGAKG----------------CEGRSGDGACDAGCSGP
1160 1170 1180 1190
1480 1490 1500 1510 1520 1530
pF1KE3 ACGWDGGDCSLNFNDPWKNCTQSLQCWKYFSDGHCDSQCNSAGCLFDGFDCQRAEGQCNP
. .::::::::. ::::.: . .:: : ::.: ::.: :::::.::. . :.:
CCDS34 GGNWDGGDCSLGVPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPPA-CTP
1200 1210 1220 1230 1240 1250
1540 1550 1560 1570 1580 1590
pF1KE3 LYDQYCKDHFSDGHCDQGCNSAECEWDGLDCAEHVPERLAAGTLVVVVLMPPEQLRNSSF
:::::.::: .:::..:::.::: ::: :: . . . .:...:.. : : .. :
CCDS34 AYDQYCHDHFHNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLF
1260 1270 1280 1290 1300 1310
1600 1610 1620 1630 1640 1650
pF1KE3 HFLRELSRVLHTNVVFKRDAHGQQMIFPYYGREEELRKHPIKRAAEGWAAPDALLGQVKA
. : :: .:.... ..: :..:..:: : :: : .. : .:
CCDS34 ALARVLSLTLRVGLWVRKDRDGRDMVYPY----------PGARAEEKLGGTRDPTYQERA
1320 1330 1340 1350 1360
1660 1670 1680 1690 1700
pF1KE3 SLLPGGSEGGRRRRELDPMDVRGSIVYLEIDNRQCV--QASSQCFQSATDVAAFLGALAS
. : . :. : : ... : .: . .: .: . .:.: . . ::.:.:.
CCDS34 A--PQTQPLGK---ETDSLSA-GFVVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAA
1370 1380 1390 1400 1410
1710 1720 1730 1740 1750 1760
pF1KE3 LGSLN--IPYKIEAVQSETVEPPPPAQLHF-MYVAAAAFVLLFFVGCGVLLS--RKRRRQ
.:.:. .: . ::. .. :: :: . . . .: :.:. .: ..:. :.:::.
CCDS34 VGALEPLLPGPLLAVHPHAGTAPPANQLPWPVLCSPVAGVILLALGALLVLQLIRRRRRE
1420 1430 1440 1450 1460 1470
1770 1780 1790 1800 1810
pF1KE3 HGQLWFPEGFKV---SEASKKKRREPLGEDSVGLKPLKNAS----DGALMDDNQNEWGDE
:: ::.: :: .... ..:: ::::::.::: :: . ::..: .. .: :.:
CCDS34 HGALWLPPGFTRRPRTQSAPHRRRPPLGEDSIGLKALKPKAEVDEDGVVMCSGPEE-GEE
1480 1490 1500 1510 1520 1530
1820 1830 1840 1850 1860 1870
pF1KE3 DLETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAADLRMSAMAPTPPQGEVDADCMDVNV
... . . . :. . .: : ..:: :::: : . . :...
CCDS34 VGQAE-----------ETGPPSTCQLWSLSGGCGA-LPQAAML-TPPQ-ESEMEAPDLDT
1540 1550 1560 1570 1580
1880 1890 1900 1910 1920 1930
pF1KE3 RGPDGFTPLMIASCSGGGLETGNSEEEE-DAPAVISDFIYQGASLHNQTDRTGETALHLA
::::: :::: : : : ...:. . : .. :: . .: :::: ::::
CCDS34 RGPDGVTPLMSAVCCGE-VQSGTFQGAWLGCPEPWEPLLDGGACPQAHTVGTGETPLHLA
1590 1600 1610 1620 1630 1640
1940 1950 1960 1970 1980 1990
pF1KE3 ARYSRSDAAKRLLEASADANIQDNMGRTPLHAAVSADAQGVFQILIRNRATDLDARMHDG
::.:: ::.:::::.:. : : :::::::::.:::. : :.:.:.: : .::: .::
CCDS34 ARFSRPTAARRLLEAGANPNQPDRAGRTPLHAAVAADAREVCQLLLRSRQTAVDARTEDG
1650 1660 1670 1680 1690 1700
2000 2010 2020 2030 2040 2050
pF1KE3 TTPLILAARLAVEGMLEDLINSHADVNAVDDLGKSALHWAAAVNNVDAAVVLLKNGANKD
::::.:::::::: ..:.:: ..:::.: : ::.::::::::::. :: ::. ::.::
CCDS34 TTPLMLAARLAVEDLVEELIAAQADVGARDKWGKTALHWAAAVNNARAARSLLQAGADKD
1710 1720 1730 1740 1750 1760
2060 2070 2080 2090 2100 2110
pF1KE3 MQNNREETPLFLAAREGSYETAKVLLDHFANRDITDHMDRLPRDIAQERMHHDIVRLLD-
:.:::.::::::::::. :.:..:: : :.. :. : :.:..: : :.. ::.
CCDS34 AQDNREQTPLFLAAREGAVEVAQLLLGLGAARELRDQAGLAPADVAHQRNHWDLLTLLEG
1770 1780 1790 1800 1810 1820
2120 2130 2140 2150 2160 2170
pF1KE3 ----EYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLGSLKPGVQGKKVRKPSSKGLACGS
: .: ...:. . :.: . :.: :. : . .. : :: .
CCDS34 AGPPEARHKATPGREAGPFPRARTVSVSV-PPHG--GGALPRCRTLSAGAGPRGGGACLQ
1830 1840 1850 1860 1870
2180 2190 2200 2210 2220
pF1KE3 KE--AKDLKARRKKSQDGKGCLLDSSGMLSPVDSL--ESPHG--YLSDVASPPLLPSPFQ
. . :: :: : : . :: : . .:.: . . . .: :. ..
CCDS34 ARTWSVDLAAR------GGGAYSHCRS-LSGVGAGGGPTPRGRRFSAGMRGPRPNPAIMR
1880 1890 1900 1910 1920 1930
2230 2240 2250 2260 2270
pF1KE3 QSPSVPLNH-----LPGMPDTHLGIGHLNVAAK-----PEMAALGGGGRLAFETGPPRLS
.: .. : ...: . :.. : .. : .. ::: :.
CCDS34 GRYGVAAGRGGRVSTDDWPCDWVALGACGSASNIPIPPPCLTPSPERGSPQLDCGPPALQ
1940 1950 1960 1970 1980 1990
2280 2290 2300 2310 2320 2330
pF1KE3 HLPVASGTSTVLGSSSGGALNFTVGGSTSLNGQCEWLSRLQSGMVPNQYNPLRGSVAPGP
..:. .:
CCDS34 EMPINQGGEGKK
2000
>>CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144 aa)
initn: 998 init1: 998 opt: 1663 Z-score: 714.1 bits: 146.6 E(32554): 1.9e-33
Smith-Waterman score: 2016; 34.9% identity (56.2% similar) in 875 aa overlap (231-1060:467-1270)
210 220 230 240 250
pF1KE3 SYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTG---QNCEEN
: :. : . : . ::.: ..:.
CCDS47 IPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVWQLGFAGSEGEKCQGV
440 450 460 470 480 490
260 270 280 290 300 310
pF1KE3 IDD--CPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHNT
:: . :: . .. :. . : : : . :... : :: .: .
CCDS47 IDAYFFLAANCTEDATYVNDPEDNNSSC---WFPHEGTKEI---------CANGCSCLSE
500 510 520 530 540
320 330 340 350 360 370
pF1KE3 HGG--YNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCECPHGRTGLLCHLN
. . : .: :.:. :: : : : :.:.:.. : : . : :: .:
CCDS47 EDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPRCSCSLSYIGRLCVVN
550 560 570 580 590 600
380 390 400 410 420
pF1KE3 -DACISNPC-NEGSNCDTNPVNGKAICTCPSG---YTGPACSQDVDECSLGANPCEHAGK
: :..: . . : . : :.: :: : : :...:. . :...
CCDS47 VDYCLGNHSISVHGLCLALSHN----CNC-SGLQRYERNICEIDTEDCK--SASCKNGTT
610 620 630 640 650
430 440 450 460 470
pF1KE3 CINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGE--------------F
. : : .:. :. : .::::..::.:.::.: :::.:: :. :
CCDS47 STHLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQPGNYFCQCVPPFKVVDGF
660 670 680 690 700 710
480 490 500 510 520 530
pF1KE3 QCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECAS
.:.: ::: :..:: . :.: . : ::. : : .:: : . . :..:. . .::
CCDS47 SCLCNPGYVGIRCEQDIDDCILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKM
720 730 740 750 760 770
540 550 560 570 580 590
pF1KE3 TPCKNGAKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGS-CKDGV--ATFTCLC
.::::.. : : ..: : :: :.:: .: .:.::: ::: :. :.... . :.:::
CCDS47 NPCKNNSTCTDLYKSYRCECTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLC
780 790 800 810 820 830
600 610 620 630 640
pF1KE3 RPGYTGHHCETNINECS--SQPCRHGGTCQDR-DNAYLCFCLKGTTGPNCEINLDDCASS
: :::. :. : :. .:::...:: : :.: . : ::::.. ::
CCDS47 PPLYTGQFCHQRYNLCDLLHNPCRNNSTCLALVDANQHCICREEFEGKNCEIDVKDCLFL
840 850 860 870 880 890
650 660 670 680 690 700
pF1KE3 PC-DSGTCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEG
: : : : : .....: :.::..::.:.:.:.::...::.:.::: : : : : :
CCDS47 SCQDYGDCEDMVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRFFCNCEPE
900 910 920 930 940 950
710 720 730 740 750 760
pF1KE3 YHDPTCLSEVNECNSNPCV-HGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGG
:: : : .::.:. .::. . : .::.: : ::..: ::.:: .:: :.::.. :
CCDS47 YHGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINLDECLSEPCLHDG
960 970 980 990 1000 1010
770 780 790 800 810 820
pF1KE3 TCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATC
.: : . :.: :. :: : .:.:: :.: :::::. : : . . : :.: :.. :
CCDS47 VCIDGINHYTCDCKSGFFGTHCETNANDCLSNPCLH-GRCTELINEYPCSCDADGTSTQC
1020 1030 1040 1050 1060 1070
830 840 850 860 870 880
pF1KE3 EVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQN
.. . :. :: : : :..: ..:.:.:: :. : :: .:..:.
CCDS47 KIKINDCTSIPCMNEGFCQKSA--HGFTCICPRGYTGAYCEKSIDNCA------------
1080 1090 1100 1110 1120
890 900 910 920 930 940
pF1KE3 THGGYRCHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAF-CDCLPGFRGTFCEED
: .... : ::: :.:: . .: : ::::: : ::: .
CCDS47 ------------------EPELNSV---ICLNGGICVDGPGHTFDCRCLPGFSGQFCEIN
1130 1140 1150 1160
950 960 970 980 990 1000
pF1KE3 INECASDPCRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSF
::::.:.:: .::.: : ...:.: : :.:: ::::. .: .:: . :... .
CCDS47 INECSSSPCLHGADCEDHINGYVCKCQPGWSGHHCENEL-ECIPNSCVHE-LCMENEPGS
1170 1180 1190 1200 1210
1010 1020 1030 1040 1050
pF1KE3 TCLCPPGFTGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCP----------QGYTGPN
:::: ::: . : : : : : : : :: :
CCDS47 TCLCTPGF--------------MTCSIGLLCGDEIRRITCLTPIFQRTDPISTQTYTIPP
1220 1230 1240 1250 1260
1060 1070 1080 1090 1100 1110
pF1KE3 CQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARL
..::
CCDS47 SETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIVKHDILPTTGLATLRISTPLESYLLQ
1270 1280 1290 1300 1310 1320
>>CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165 aa)
initn: 998 init1: 998 opt: 1663 Z-score: 714.0 bits: 146.6 E(32554): 1.9e-33
Smith-Waterman score: 2016; 34.9% identity (56.2% similar) in 875 aa overlap (231-1060:467-1270)
210 220 230 240 250
pF1KE3 SYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTG---QNCEEN
: :. : . : . ::.: ..:.
CCDS78 IPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVWQLGFAGSEGEKCQGV
440 450 460 470 480 490
260 270 280 290 300 310
pF1KE3 IDD--CPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHNT
:: . :: . .. :. . : : : . :... : :: .: .
CCDS78 IDAYFFLAANCTEDATYVNDPEDNNSSC---WFPHEGTKEI---------CANGCSCLSE
500 510 520 530 540
320 330 340 350 360 370
pF1KE3 HGG--YNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCECPHGRTGLLCHLN
. . : .: :.:. :: : : : :.:.:.. : : . : :: .:
CCDS78 EDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPRCSCSLSYIGRLCVVN
550 560 570 580 590 600
380 390 400 410 420
pF1KE3 -DACISNPC-NEGSNCDTNPVNGKAICTCPSG---YTGPACSQDVDECSLGANPCEHAGK
: :..: . . : . : :.: :: : : :...:. . :...
CCDS78 VDYCLGNHSISVHGLCLALSHN----CNC-SGLQRYERNICEIDTEDCK--SASCKNGTT
610 620 630 640 650
430 440 450 460 470
pF1KE3 CINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGE--------------F
. : : .:. :. : .::::..::.:.::.: :::.:: :. :
CCDS78 STHLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQPGNYFCQCVPPFKVVDGF
660 670 680 690 700 710
480 490 500 510 520 530
pF1KE3 QCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECAS
.:.: ::: :..:: . :.: . : ::. : : .:: : . . :..:. . .::
CCDS78 SCLCNPGYVGIRCEQDIDDCILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKM
720 730 740 750 760 770
540 550 560 570 580 590
pF1KE3 TPCKNGAKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGS-CKDGV--ATFTCLC
.::::.. : : ..: : :: :.:: .: .:.::: ::: :. :.... . :.:::
CCDS78 NPCKNNSTCTDLYKSYRCECTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLC
780 790 800 810 820 830
600 610 620 630 640
pF1KE3 RPGYTGHHCETNINECS--SQPCRHGGTCQDR-DNAYLCFCLKGTTGPNCEINLDDCASS
: :::. :. : :. .:::...:: : :.: . : ::::.. ::
CCDS78 PPLYTGQFCHQRYNLCDLLHNPCRNNSTCLALVDANQHCICREEFEGKNCEIDVKDCLFL
840 850 860 870 880 890
650 660 670 680 690 700
pF1KE3 PC-DSGTCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEG
: : : : : .....: :.::..::.:.:.:.::...::.:.::: : : : : :
CCDS78 SCQDYGDCEDMVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRFFCNCEPE
900 910 920 930 940 950
710 720 730 740 750 760
pF1KE3 YHDPTCLSEVNECNSNPCV-HGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGG
:: : : .::.:. .::. . : .::.: : ::..: ::.:: .:: :.::.. :
CCDS78 YHGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINLDECLSEPCLHDG
960 970 980 990 1000 1010
770 780 790 800 810 820
pF1KE3 TCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATC
.: : . :.: :. :: : .:.:: :.: :::::. : : . . : :.: :.. :
CCDS78 VCIDGINHYTCDCKSGFFGTHCETNANDCLSNPCLH-GRCTELINEYPCSCDADGTSTQC
1020 1030 1040 1050 1060 1070
830 840 850 860 870 880
pF1KE3 EVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQN
.. . :. :: : : :..: ..:.:.:: :. : :: .:..:.
CCDS78 KIKINDCTSIPCMNEGFCQKSA--HGFTCICPRGYTGAYCEKSIDNCA------------
1080 1090 1100 1110 1120
890 900 910 920 930 940
pF1KE3 THGGYRCHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAF-CDCLPGFRGTFCEED
: .... : ::: :.:: . .: : ::::: : ::: .
CCDS78 ------------------EPELNSV---ICLNGGICVDGPGHTFDCRCLPGFSGQFCEIN
1130 1140 1150 1160
950 960 970 980 990 1000
pF1KE3 INECASDPCRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSF
::::.:.:: .::.: : ...:.: : :.:: ::::. .: .:: . :... .
CCDS78 INECSSSPCLHGADCEDHINGYVCKCQPGWSGHHCENEL-ECIPNSCVHE-LCMENEPGS
1170 1180 1190 1200 1210
1010 1020 1030 1040 1050
pF1KE3 TCLCPPGFTGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCP----------QGYTGPN
:::: ::: . : : : : : : : :: :
CCDS78 TCLCTPGF--------------MTCSIGLLCGDEIRRITCLTPIFQRTDPISTQTYTIPP
1220 1230 1240 1250 1260
1060 1070 1080 1090 1100 1110
pF1KE3 CQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARL
..::
CCDS78 SETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIVKHDILPTTGLATLRISTPLESYLLQ
1270 1280 1290 1300 1310 1320
>>CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218 aa)
initn: 2254 init1: 765 opt: 1509 Z-score: 654.3 bits: 134.2 E(32554): 4e-30
Smith-Waterman score: 2103; 35.6% identity (59.1% similar) in 824 aa overlap (399-1208:186-949)
370 380 390 400 410 420
pF1KE3 LCHLNDACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQ---DVDECSLGANPCEH
:: . : : .:.. :. .: :..
CCDS13 SHSGMINPSRQWQTLKQNTGVAHFEYQIRVTCDDYYYGFGCNKFCRPRDDF-FGHYACDQ
160 170 180 190 200 210
430 440 450 460 470 480
pF1KE3 AGKCINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGV
:. :..:. ::.:. . : .. . ..: :. : :. :..:.
CCDS13 NGNKT---------CMEGWMGPECNRAI--CRQGCSPKHGSC-KLPGD--CRCQYGWQGL
220 230 240 250 260
490 500 510 520 530 540
pF1KE3 HCEVNTDECASSP-CLHNGRCLDKINE-FQCECPTGFTGHLCQYDVDECAS-TPCKNGAK
.: :.: : :.: : : :: .:: : :.. :.::. :.. :.. :: ::.
CCDS13 YC----DKCIPHPGCVH-GIC----NEPWQCLCETNWGGQLCDKDLNYCGTHQPCLNGGT
270 280 290 300 310
550 560 570 580 590 600
pF1KE3 CLD-GPNTYTCVCTEGYTGTHCEVDIDECDPDPCH-YGSCKDGVATFTCLCRPGYTGHHC
: . ::. : : : :::.: .::. : :::: ::::. : : : ::.:: :
CCDS13 CSNTGPDKYQCSCPEGYSGPNCEIAEHACLSDPCHNRGSCKETSLGFECECSPGWTGPTC
320 330 340 350 360 370
610 620 630 640 650
pF1KE3 ETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPC-DSGTCLDKI
:::..:: . : ::::::: :.. : : :: .:... ..: ..:: .. .: . :
CCDS13 STNIDDCSPNNCSHGGTCQDLVNGFKCVCPPQWTGKTCQLDANECEAKPCVNAKSCKNLI
380 390 400 410 420 430
660 670 680 690 700 710
pF1KE3 DGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNE
.: : : ::. :. :.:::..: :. :.: ..:.: .::. : :: :: : ...:
CCDS13 ASYYCDCLPGWMGQNCDININDCLGQ-CQNDASCRDLVNGYRCICPPGYAGDHCERDIDE
440 450 460 470 480 490
720 730 740 750 760 770
pF1KE3 CNSNPCVHGA-CRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMTSGYVCT
: ::::..:. :.. .: ..: : :.::. :... . :: ::: ::. : . .: : :
CCDS13 CASNPCLNGGHCQNEINRFQCLCPTGFSGNLCQLDIDYCEPNPCQNGAQCYNRASDYFCK
500 510 520 530 540 550
780 790 800 810 820 830
pF1KE3 CREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPC
: : . : ::. ..: ..:: .: .:. . : ... :.:
CCDS13 CPEDYEGKNCSHLKDHCRTTPCEVIDSCTVAMASNDTPEGVRYISSNV------CGPH--
560 570 580 590 600
840 850 860 870 880 890
pF1KE3 RNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRCHCQAG
:.:. :.. .:.: : :. : :. .::.: .:::.:..: . ..:.: :. :
CCDS13 ---GKCK-SQSGGKFTCDCNKGFTGTYCHENINDCESNPCRNGGTCIDGVNSYKCICSDG
610 620 630 640 650
900 910 920 930 940 950
pF1KE3 YSGRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGA
. : :::.:.:: :::::::.: : .: .::: :..: :. ..: : ::.
CCDS13 WEGAYCETNINDCSQNPCHNGGTCRDLVNDFYCDCKNGWKGKTCHSRDSQCDEATCNNGG
660 670 680 690 700 710
960 970 980 990 1000 1010
pF1KE3 NCTDCVDSYTCTCPAGFSGIHCE-NNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSY
.: : :.. : ::.:. : :. . .: . : :::::: . .::::.: :. :
CCDS13 TCYDEGDAFKCMCPGGWEGTTCNIARNSSCLPNPCHNGGTCVVNGESFTCVCKEGWEGPI
720 730 740 750 760 770
1020 1030 1040 1050 1060 1070
pF1KE3 CQHDVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQT
: ...:.:. .:: ..::: :: . ::: : :..::.:. .. :.:::: :. : .
CCDS13 CAQNTNDCSPHPCYNSGTCVDGDNWYRCECAPGFAGPDCRININECQSSPCAFGATCVDE
780 790 800 810 820 830
1080 1090 1100 1110 1120 1130
pF1KE3 HTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGY
. ::: :: : .: :. ::.. : . .. . :. : :: :.: :
CCDS13 INGYRCVCPPGHSGAKCQ------EVSG-RPCITMGSVIPDGAKWDDDCNT--CQCLNGR
840 850 860 870 880
1140 1150 1160 1170 1180 1190
pF1KE3 TGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGT
. : . :.: :: .. .: :: . :.:. ::: . :
CCDS13 IA--CSKV--WCGPRPCLLHKGHSECPSGQSCIPILD----------DQCFVHPCTGVGE
890 900 910 920 930
1200 1210 1220 1230 1240 1250
pF1KE3 CLD---LPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCT
: . : ::.
CCDS13 CRSSSLQPVKTKCTSDSYYQDNCANITFTFNKEMMSPGLTTEHICSELRNLNILKNVSAE
940 950 960 970 980 990
>>CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912 aa)
initn: 442 init1: 164 opt: 1494 Z-score: 643.7 bits: 133.5 E(32554): 1.5e-29
Smith-Waterman score: 2333; 30.8% identity (52.4% similar) in 1619 aa overlap (24-1417:1204-2722)
10 20 30 40 50
pF1KE3 MPPLLAPLLCLALLPALAARGPRCSQPGETCLNGGKCEAANGTEACVCGGAF-
:: . : :: :: :: : :. ..
CCDS34 CVNTEGSFQCDCPLGHELSPSREDCVDINECSLSDNLCRNG-KCVNMIGTYQCSCNPGYQ
1180 1190 1200 1210 1220 1230
60 70 80 90 100
pF1KE3 VGPR---CQDPNPCLSTPCKNAGTCHVVDRRGVADYACSCALGFS----GPLCLTPLDNA
. : : : . :. : : . . ..: :::. :.. : : . .:.
CCDS34 ATPDRQGCTDIDECMIM----NGGCDTQCTNSEGSYECSCSEGYALMPDGRSC-ADIDE-
1240 1250 1260 1270 1280
110 120 130 140 150
pF1KE3 CLTNP--CRNGGTCDLLTLTEYKCRCPPGWSG----KSCQQADPC--ASNPCANGGQCLP
: .:: : .:: : . ::.: : :. . :.: ... : :: : : .:
CCDS34 CENNPDIC-DGGQCTNIP-GEYRCLCYDGFMASMDMKTCIDVNECDLNSNICMFG-ECEN
1290 1300 1310 1320 1330 1340
160 170 180 190 200 210
pF1KE3 FEASYICHCPPSF---HGPTCRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRA--THTG
..:.:::: .. .: : ::.:: : ..: : ::..: :: .:
CCDS34 TKGSFICHCQLGYSVKKGTTGCTDVDECEIGAHNCDMHASCLNIPGSFKCSCREGWIGNG
1350 1360 1370 1380 1390 1400
220 230 240 250 260
pF1KE3 PNCERPYVPCSPSP--CQNGGTCRPTGDVTHECACLPGFTGQN--CEENIDDCPGNN--C
.: :: . :. .. : : ...::: ::::.. : . .:.: : :
CCDS34 IKCI-DLDECSNGTHQCSINAQCVNTPG-SYRCACSEGFTGDGFTCSD-VDECAENINLC
1410 1420 1430 1440 1450 1460
270 280 290 300 310 320
pF1KE3 KNGGACVDGVNTYNCRCP----PEWTGQYCTEDVDECQLMPNACQNGGTCHNTHGGYNCV
.:: :.. ..: :.: : .. : .:.:::... : : : ::.: : ..:.
CCDS34 ENG-QCLNVPGAYRCECEMGFTPASDSRSC-QDIDECSFQ-NICVFG-TCNNLPGMFHCI
1470 1480 1490 1500 1510
330 340 350 360 370
pF1KE3 CVNGW----TGEDCSENIDDCASAA-CFHGATCHDRVASFYCECPH----GRTGLLCHLN
: .:. :: .:.. ::.::. : .: : . . . :.:: . ::. : :
CCDS34 CDDGYELDRTGGNCTD-IDECADPINCVNG-LCVNTPGRYECNCPPDFQLNPTGVGCVDN
1520 1530 1540 1550 1560 1570
380 390 400
pF1KE3 DA--CI---------SNPCNE-------------------GSNCDTNP-VNGKAICT-CP
. : : :: :. :.: : ::. : ::
CCDS34 RVGNCYLKFGPRGDGSLSCNTEIGVGVSRSSCCCSLGKAWGNPCETCPPVNSTEYYTLCP
1580 1590 1600 1610 1620 1630
410 420 430 440 450
pF1KE3 SG---YTGPACS--QDVDECSLGANPCEHAGKCINTLGSFECQCLQGY---TGPR-CEID
.: .: .:.:::. . :. .:.::::.:::.:.: ::: : :: :
CCDS34 GGEGFRPNPITIILEDIDECQELPGLCQ-GGNCINTFGSFQCECPQGYYLSEDTRICE-D
1640 1650 1660 1670 1680 1690
460 470 480 490 500 510
pF1KE3 VNECVSNP--CQNDATCLDQIGEFQCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKIN
..:: ..: : . .:: . .:.. ::: : : :. : : . .... : . :
CCDS34 IDECFAHPGVC-GPGTCYNTLGNYTCICPPEYMQVNGGHN---CMD---MRKSFCYRSYN
1700 1710 1720 1730 1740
520 530 540 550 560
pF1KE3 EFQCEC--PTGFTGHLC--QYDVDECASTPCKNGAKC-LDGPNTYTCVCTE--GYT---G
:: : . : ..: :.: . . ::. : : . .: . :.:
CCDS34 GTTCENELPFNVTKRMCCCTYNVGKAWNKPCE---PCPTPGTADFKTICGNIPGFTFDIH
1750 1760 1770 1780 1790 1800
570 580 590 600 610
pF1KE3 THCEVDIDECD--PDPCHYGSCKDGVATFTCLCRPGYTGHH----CETNINECSSQP--C
: :::::: : : : : . ...: : : :.. . :: .:.:::. :
CCDS34 TGKAVDIDECKEIPGICANGVCINQIGSFRCECPTGFSYNDLLLVCE-DIDECSNGDNLC
1810 1820 1830 1840 1850 1860
620 630 640 650 660
pF1KE3 RHGGTCQDRDNAYLCFCLKG-TTGPN--CEINLDDCASSP--CDSGTCLDKIDGYECACE
.... : . ..: : : : .:: : .. ..: : :. : :.: .:.: :.
CCDS34 QRNADCINSPGSYRCECAAGFKLSPNGAC-VDRNECLEIPNVCSHGLCVDLQGSYQCICH
1870 1880 1890 1900 1910 1920
670 680 690 700 710 720
pF1KE3 PGYTGS----MCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGY---HDPTCLSEVNEC
:. .: :: ...::: .:: :: ::.. .....: : :. :. :: ...::
CCDS34 NGFKASQDQTMC-MDVDECERHPCGNG-TCKNTVGSYNCLCYPGFELTHNNDCL-DIDEC
1930 1940 1950 1960 1970
730 740 750 760 770
pF1KE3 NS---NPCVHGACRDSLNGYKCDCDPGW----SGTNCDINNNECESNP--CVNGGTCKDM
.: . : .: : . ....:: :. :. .: :: :..::: . : : . :::...
CCDS34 SSFFGQVCRNGRCFNEIGSFKCLCNEGYELTPDGKNC-IDTNECVALPGSC-SPGTCQNL
1980 1990 2000 2010 2020 2030
780 790 800 810 820
pF1KE3 TSGYVCTCREGF--SGPNCQTNINECASNP--CLNQGTCIDDVAGYKCNC----LLPYTG
... : : :. .. :: .:::: .: :: :.: . .:..: : .: .:
CCDS34 EGSFRCICPPGYEVKSENC-IDINECDEDPNICLF-GSCTNTPGGFQCLCPPGFVLSDNG
2040 2050 2060 2070 2080 2090
830 840 850 860
pF1KE3 ATC-EVVLAPCAPSPCRNGGECRQSEDYESFS--CVC---P-TGWQGQTCEV--------
: .. . : . ..:.: . ... . : : : :: :. ::.
CCDS34 RRCFDTRQSFCFTN--FENGKCSVPKAFNTTKAKCCCSKMPGEGW-GDPCELCPKDDEVA
2100 2110 2120 2130 2140 2150
870 880 890 900
pF1KE3 --------------------DINECVLSP--CRHGASCQNTHGGYRCHCQAGY----SGR
:.:::. :: : .: .: :: :..::.: :: .:
CCDS34 FQDLCPYGHGTVPSLHDTREDVNECLESPGICSNG-QCINTDGSFRCECPMGYNLDYTGV
2160 2170 2180 2190 2200
910 920 930 940 950
pF1KE3 NCETDIDDCR-PNPCHNGGSCTDGINTAFCDCLPGFR-GTF--CEEDINECASDPCRNGA
: .: :.: ::: :: .::. :.. :.: ::. : . :: ::::::..: .
CCDS34 RC-VDTDECSIGNPCGNG-TCTNVIGSFECNCNEGFEPGPMMNCE-DINECAQNPLLCAF
2210 2220 2230 2240 2250 2260
960 970 980 990 1000 1010
pF1KE3 NCTDCVDSYTCTCPAGFS----GIHCENNTPDCTES--SCFNGGT-CVDGINSFTCLCPP
: . :: :::: :.. :.. .:.:. .: . : : . :..: :.:::
CCDS34 RCMNTFGSYECTCPIGYALREDQKMCKD-LDECAEGLHDCESRGMMCKNLIGTFMCICPP
2270 2280 2290 2300 2310 2320
1020 1030 1040 1050 1060
pF1KE3 GFT----GSYCQHDVNECDSQP--CLHGGTCQDGCGSYRCTCPQGY----TGPNC-QNLV
:.. : : : ::: ..: : ..: : . ::::: : .:. .: .: .:
CCDS34 GMARRPDGEGCV-DENECRTKPGIC-ENGRCVNIIGSYRCECNEGFQSSSSGTECLDNRQ
2330 2340 2350 2360 2370 2380
1070 1080 1090 1100 1110
pF1KE3 HWCDS----SPCKNGGKCWQTHTQYRCECPSG--WTGLYCDVPSVSCEVAAQRQGVDVAR
: . . :. ... . :. .: : .: : : :.. : . . : .
CCDS34 GLCFAEVLQTICQMASSSRNLVTKSECCCDGGRGW-GHQCEL----CPLPGTAQ---YKK
2390 2400 2410 2420 2430
1120 1130 1140 1150 1160 1170
pF1KE3 LCQHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECS--PSPCQNGATCTDYLGGYSCKCV
.: :: ::: . .: .:::. :. : :: : . .:.. : :
CCDS34 ICPHG---------------PGYT-TDGRD-IDECKVMPNLCTNGQ-CINTMGSFRCFCK
2440 2450 2460 2470
1180 1190 1200 1210 1220
pF1KE3 AGY----HGVNCSEEIDECLSHPCQNGGTCLDLPNTYKCSCPRG----TQGVHCEINVDD
.:: :..: . .::: . : . : . ..:.:::::: .: :. ..:.
CCDS34 VGYTTDISGTSCID-LDECSQSPKPCNYICKNTEGSYQCSCPRGYVLQEDGKTCK-DLDE
2480 2490 2500 2510 2520 2530
1230 1240 1250 1260 1270 1280
pF1KE3 CNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFVGER--CEGDVNECLSNP--CDARG
:. ... .: . ::. .::..: :::::. .. : : ::: :.: : :.:
CCDS34 CQ------TKQHNC--QFLCVNTLGGFTCKCPPGFTQHHTACI-DNNECGSQPSLCGAKG
2540 2550 2560 2570 2580
1290 1300 1310 1320 1330
pF1KE3 TQNCVQRVNDFHCECRAGH----TGRRCESVINGCKGKP-CKNGGTCAVASNTARGFICK
: . ..: :::. : :: ::.: . : :. :..: : .: :. :
CCDS34 I--CQNTPGSFSCECQRGFSLDATGLNCEDV-DECDGNHRCQHG--C---QNILGGYRCG
2590 2600 2610 2620 2630
1340 1350 1360 1370 1380 1390
pF1KE3 CPAGF----EGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTGPECQFPASSPC
:: :. . : : :.. ....: . : : : . :. :: :: :
CCDS34 CPQGYIQHYQWNQCV-DENECSNPNACGSASCYNTLGSYKCACPSGFSFD--QF--SSAC
2640 2650 2660 2670 2680 2690
1400 1410 1420 1430 1440
pF1KE3 LGGNPCYN-QGTCEP--TSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDIPPPLIEEA
: : . .. :. .. : : ::
CCDS34 HDVNECSSSKNPCNYGCSNTEGGYLCGCPPGYYRVGQGHCVSGMGFNKGQYLSLDTEVDE
2700 2710 2720 2730 2740 2750
>--
initn: 327 init1: 164 opt: 1446 Z-score: 623.7 bits: 129.8 E(32554): 2e-28
Smith-Waterman score: 1539; 29.4% identity (50.6% similar) in 1174 aa overlap (61-1088:108-1188)
40 50 60 70 80 90
pF1KE3 CLNGGKCEAANGTEACVCGGAFVGPRCQDPNPCLSTPCKNAGTCHVVDRRGVADYACSCA
: :. :.: .: : :.:.
CCDS34 GQQDVLRGPNVCGSRFHSYCCPGWKTLPGGNQCIVPICRN--SCG--DGFCSRPNMCTCS
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE3 LGFSGPLCLTPLDNACLTNPCRNGGTCDLLTLTEYKCRCPPGWSGKSCQQADPCASNPCA
: . : . . : . : ::::: .. .:.: :. : : : : : :
CCDS34 SGQISSTCGSKSIQQC-SVRCMNGGTC-----ADDHCQCQKGYIGTYCGQ--PVCENGCQ
140 150 160 170 180
160 170 180 190 200
pF1KE3 NGGQCLPFEASYICHCPPSFHGPTCRQDVNECGQKPGLCR---HGGTCHNEVGSYRC---
:::.:. . : : .: :: :..: . : : .. :.... . :
CCDS34 NGGRCI---GPNRCACVYGFTGPQCERDY-----RTGPCFTQVNNQMCQGQLTGIVCTKT
190 200 210 220 230
210 220 230 240 250 260
pF1KE3 VCRAT---HTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTGQNCEENIDDC
.: :: : :: . : .:.::. : .:.. :.. .:.:
CCDS34 LCCATIGRAWGHPCE--MCPAQPQPCRRG--------------FIPNIRTGACQD-VDEC
240 250 260 270 280
270 280 290 300 310
pF1KE3 ---PGNNCKNGGACVDGVNTYNCRCPP----EWTGQYCTEDVDECQLMPNACQNGGTCHN
:: :. :: :.. :....:::: : : : ::.:::...:. :..: : :
CCDS34 QAIPGI-CQ-GGNCINTVGSFECRCPAGHKQSETTQKC-EDIDECSIIPGICETG-ECSN
290 300 310 320 330
320 330 340 350 360
pF1KE3 THGGYNCVCVNGW-TGEDCSENIDDCASAACFHG---ATCHD----RVASFYCECPHGRT
: :.: ::: :. :. : :. ::. .. :: : . : . :.... : : ::
CCDS34 TVGSYFCVCPRGYVTSTDGSRCIDQ-RTGMCFSGLVNGRCAQELPGRMTKMQCCCEPGRC
340 350 360 370 380 390
370 380 390 400
pF1KE3 GLLCHLNDACI-------------------------SNPCNEGSNCDTNPVNGKAICTCP
. . .:: : : . :.: . ::..
CCDS34 WGIGTIPEACPVRGSEEYRRLCMDGLPMGGIPGSAGSRPGGTGGNGFAPSGNGNGYGPGG
400 410 420 430 440 450
410 420 430
pF1KE3 SGYT----------------------GPACS------QDVDECSLGANPCEHAGKCINTL
.:. :: . : .: :. :: : . :.:: :.
CCDS34 TGFIPIPGGNGFSPGVGGAGVGAGGQGPIITGLTILNQTIDICKHHANLCLN-GRCIPTV
460 470 480 490 500 510
440 450 460 470 480
pF1KE3 GSFECQCLQGY---TGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGVHCE--
.:..:.: .:: .. : :::.::.:::: : . :.. : . : : :.. . .
CCDS34 SSYRCECNMGYKQDANGDC-IDVDECTSNPCTN-GDCVNTPGSYYCKCHAGFQRTPTKQA
520 530 540 550 560 570
490 500 510 520 530 540
pF1KE3 -VNTDECASSPCL-HNGRCLDKINEFQCECPTGFT----GHLCQYDVDECASTP-CKNGA
.. ::: .. : .::::.. . ::: : .:: :. : : :::..: : ::
CCDS34 CIDIDECIQNGVLCKNGRCVNTDGSFQCICNAGFELTTDGKNC-VDHDECTTTNMCLNGM
580 590 600 610 620 630
550 560 570 580 590
pF1KE3 KCLDGPNTYTCVCTEGYT----GTHCEVDIDECD-PDPCHYGSCKDGVATFTCLCRPGYT
:.. ... :.: :.. : .: .:.:::. : : : : .. ..: : : :: .
CCDS34 -CINEDGSFKCICKPGFVLAPNGRYC-TDVDECQTPGICMNGHCINSEGSFRCDCPPGLA
640 650 660 670 680
600 610 620 630 640 650
pF1KE3 -GHHCETNINECSSQPCRHG---GTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDS
: .. .. . : : :.: : : : . : : : . ::.
CCDS34 VGMDGRVCVDTHMRSTCYGGIKKGVCV-RP-----FPGAVTKSECCCANPDYGFGEPCQP
690 700 710 720 730 740
660 670 680 690 700
pF1KE3 GTCLDKIDG-YECACEPGYTGSMCNINIDECAGNP--CHNGGTCEDGINGFTCRCPEGYH
: : .. .. : : .. . .:.::: .: : :: ::. ... : : ::.
CCDS34 --CPAKNSAEFHGLCSSGVGITVDGRDINECALDPDICANG-ICENLRGSYRCNCNSGYE
750 760 770 780 790 800
710 720 730 740 750
pF1KE3 -DPT---CLSEVNECNSNP--CVHGACRDSLNGYKCDCDPGW----SGTNCDINNNECES
: . :. ...:: : : .: ::.. ..:.: : ::. .:. . :::::
CCDS34 PDASGRNCI-DIDECLVNRLLCDNGLCRNTPGSYSCTCPPGYVFRTETETCE-DINECES
810 820 830 840 850
760 770 780 790 800 810
pF1KE3 NPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLL
::::::. :.. ... : : : . .:.. : .. .::: .. .:. .
CCDS34 NPCVNGA-CRNNLGSFNCECSPG--SKLSSTGLI-CIDSL---KGTCWLNIQDSRCE--V
860 870 880 890 900
820 830 840 850 860 870
pF1KE3 PYTGATCEVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGW---QGQTCEVDINECVLS
.::: . :: :. :.. : .. .:: : .: ::: :.::: .
CCDS34 NINGATLKS--ECCATLGAAWGSPCERCE----LDTACPRGLARIKGVTCE-DVNECEVF
910 920 930 940 950 960
880 890 900 910 920 930
pF1KE3 P--CRHGASCQNTHGGYRCHCQAGYS----GRNCETDIDDCRPNPCHNGGSCTDGINTAF
: : .: : :..:...:.: : . :: : : : . :. . . :.
CCDS34 PGVCPNG-RCVNSKGSFHCECPEGLTLDGTGRVCL----DIRMEQCYLKWDEDECIHP--
970 980 990 1000 1010
940 950 960 970 980
pF1KE3 CDCLPG-FRGTFCEEDINECASDPCRNGANCTDC----VDSYTCTCP--AGFSGI-HCEN
.:: :: : : . :..: .: . : :: :::.. .
CCDS34 ---VPGKFRMDAC------CCAVGAAWGTECEECPKPGTKEYETLCPRGAGFANRGDVLT
1020 1030 1040 1050 1060
990 1000 1010 1020 1030
pF1KE3 NTP---DCTESSCFNG----GTCVDGINSFTCLCPPGFTGSYCQH---DVNECDSQPCLH
. : : .: . : : : : . :.:: : : ::. .. .. :..:: .: :
CCDS34 GRPFYKDINECKAFPGMCTYGKCRNTIGSFKCRCNSGFALDMEERNCTDIDECRISPDLC
1070 1080 1090 1100 1110 1120
1040 1050 1060 1070 1080
pF1KE3 G-GTCQDGCGSYRCTCPQGY-TG----PNCQNLVHWCDSSP--CKNGGKCWQTHTQYRCE
: : : . ::..: : .:: .: ::.. . :. .: :. :: : .:. ...:.
CCDS34 GSGICVNTPGSFECECFEGYESGFMMMKNCMD-IDECERNPLLCR-GGTCVNTEGSFQCD
1130 1140 1150 1160 1170 1180
1090 1100 1110 1120 1130 1140
pF1KE3 CPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGSYCED
:: :
CCDS34 CPLGHELSPSREDCVDINECSLSDNLCRNGKCVNMIGTYQCSCNPGYQATPDRQGCTDID
1190 1200 1210 1220 1230 1240
>>CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200 aa)
initn: 1095 init1: 658 opt: 1259 Z-score: 549.8 bits: 114.9 E(32554): 2.6e-24
Smith-Waterman score: 1921; 33.0% identity (55.5% similar) in 904 aa overlap (179-1064:172-977)
150 160 170 180 190 200
pF1KE3 CANGGQCLPFEASYICHCPPSFHGPTCRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRA
.: . .: : . : :. . : :
CCDS99 FTLIVEAWDWDNDTTPNEELLIERVSHAGMINPEDRWKSLHFSGHVAHLEL-QIRVRCDE
150 160 170 180 190 200
210 220 230 240 250 260
pF1KE3 THTGPNCERPYVPCSPSPCQNGG-TCRPTGDVTHECACLPGFTGQNCEENIDDCP-GNNC
.. . .:.. : : : :: :. ::. :. :..:.: . : : :
CCDS99 NYYSATCNKF---CRPRNDFFGHYTCDQYGNK----ACMDGWMGKECKEAV--CKQGCNL
210 220 230 240 250
270 280 290 300 310 320
pF1KE3 KNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHNTHGGYNCVCVNG
.:: : : .::: : :..: ::: .:. : .: .: . ..: : ..
CCDS99 LHGGCTVPG----ECRCSYGWQGRFC----DECVPYPG-CVHG-SCVEP---WQCNCETN
260 270 280 290
330 340 350 360 370 380
pF1KE3 WTGEDCSENIDDCASA-ACFHGATC-HDRVASFYCECPHGRTGLLCHLND-ACISNPCNE
: : :..... :.: : .:.:: . . .. : :: : .: :. . :: :::: .
CCDS99 WGGLLCDKDLNYCGSHHPCTNGGTCINAEPDQYRCTCPDGYSGRNCEKAEHACTSNPCAN
300 310 320 330 340 350
390 400 410 420 430 440
pF1KE3 GSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGANPCEHAGKCINTLGSFECQCLQG
:..: : . . : ::::..::.:. :.:::. .::: .: :.. . .::: : .
CCDS99 GGSCHEVPSGFE--CHCPSGWSGPTCALDIDECA--SNPCAAGGTCVDQVDGFECICPEQ
360 370 380 390 400 410
450 460 470 480 490 500
pF1KE3 YTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGVHCEVNTDECASSPCLHNG
..: :..:::.: . ::. .:: : .. .::.: :. : :::.. :::::::: .:
CCDS99 WVGATCQLDVNDC-RGQCQHGGTCKDLVNGYQCVCPRGFGGRHCELERDECASSPCHSGG
420 430 440 450 460 470
510 520 530 540 550 560
pF1KE3 RCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNGAKCLDGPNTYTCVCTEGYTGTHC
: : . :.:.:: ::.: ::. ::: : .::.:::.: . . : :.: . . : .:
CCDS99 LCEDLADGFHCHCPQGFSGPLCEVDVDLCEPSPCRNGARCYNLEGDYYCACPDDFGGKNC
480 490 500 510 520 530
570 580 590 600 610 620
pF1KE3 EVDIDECDP-DPCHYGSCK--DGVATFTCLCRPGYTGHHCETNINECSSQPCRHGGTCQD
: : .:: :.:. :: .. . :: .. ..: ::: ::.
CCDS99 SV------PREPCPGGACRVIDGCGSDAGPGMPGTAASGVCGPHGRCVSQP---GGN---
540 550 560 570 580
630 640 650 660 670
pF1KE3 RDNAYLCFCLKGTTGPNCEINLDDCASSPC-DSGTCLDKIDGYECACEPGYTGSMCNINI
. :.: .: :: :. :.::: ..:: ..:::.:..:...: : :. : .:. :
CCDS99 ----FSCICDSGFTGTYCHENIDDCLGQPCRNGGTCIDEVDAFRCFCPSGWEGELCDTNP
590 600 610 620 630
680 690 700 710 720 730
pF1KE3 DECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNECNSNPCVHGA-CRDSLNGYK
..: .:::. : : : .: : : : .:.. :: :. .:.. : .:. : :: . ..
CCDS99 NDCLPDPCHSRGRCYDLVNDFYCACDDGWKGKTCHSREFQCDAYTCSNGGTCYDSGDTFR
640 650 660 670 680 690
740 750 760 770 780 790
pF1KE3 CDCDPGWSGTNCDI-NNNECESNPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNINECAS
: : :::.:..: . .:. : ::::::::: ... : ::.:. : .: : :.:
CCDS99 CACPPGWKGSTCAVAKNSSCLPNPCVNGGTCVGSGASFSCICRDGWEGRTCTHNTNDCNP
700 710 720 730 740 750
800 810 820 830 840 850
pF1KE3 NPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRNGGECRQSEDYESFSCVC
:: : : :.: : ..:.: ::
CCDS99 LPCYNGGICVDGVNWFRCEC----------------AP----------------------
760 770
860 870 880 890 900 910
pF1KE3 PTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRCHCQAGYSGRNCETDID---DC--R
:. : :...:.:: ::: .::.: . .:::: : : .: :. : .: :
CCDS99 --GFAGPDCRINIDECQSSPCAYGATCVDEINGYRCSCPPGRAGPRCQEVIGFGRSCWSR
780 790 800 810 820 830
920 930 940 950 960 970
pF1KE3 PNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANCTDCVDSYTCTCP
.: .:.: .. :. : :: : : : . :. :: ... .. . ::
CCDS99 GTPFPHGSSWVEDCNS--CRCLDGRRD--CSK--VWCGWKPCLLAGQ----PEALSAQCP
840 850 860 870 880
980 990 1000 1010 1020 1030
pF1KE3 AGFSGIHCENNTP-DCTESSCFNGGTC-VDGINSFTCLCPPGFTGSYCQHDVNECDSQPC
: .: ...: .: . : : : .. : :: : . : . . . . .
CCDS99 LG---QRCLEKAPGQCLRPPCEAWGECGAEEPPSTPCLPRSGHLDNNCARLTLHFNRDHV
890 900 910 920 930 940
1040 1050 1060 1070 1080 1090
pF1KE3 LHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWT
.: : :.. : . : . . :: ::
CCDS99 PQGTTVGAICSGIR-SLPATRAVARDRLLVLLCDRASSGASAVEVAVSFSPARDLPDSSL
950 960 970 980 990 1000
1100 1110 1120 1130 1140 1150
pF1KE3 GLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECS
CCDS99 IQGAAHAIVAAITQRGNSSLLLAVTEVKVETVVTGGSSTGLLVPVLCGAFSVLWLACVVL
1010 1020 1030 1040 1050 1060
>>CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238 aa)
initn: 1435 init1: 768 opt: 1247 Z-score: 544.6 bits: 114.0 E(32554): 5.1e-24
Smith-Waterman score: 2047; 35.4% identity (57.6% similar) in 891 aa overlap (510-1366:208-1044)
480 490 500 510 520 530
pF1KE3 PGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHL-C-QYD----VD---
:.: :. . : :: : :: .:
CCDS99 WKSLHFSGHVAHLELQIRVRCDENYYSATCNKF-CRPRNDFFGHYTCDQYGNKACMDGWM
180 190 200 210 220 230
540 550 560 570 580
pF1KE3 --ECASTPCKNGAKCLDGPNTYT--CVCTEGYTGTHCEVDIDECDPDP-CHYGSCKDGVA
:: . ::.: . : : : : :. :. : : ::: : : : .::: :
CCDS99 GKECKEAVCKQGCNLLHGGCTVPGECRCSYGWQGRFC----DECVPYPGCVHGSC---VE
240 250 260 270 280
590 600 610 620 630 640
pF1KE3 TFTCLCRPGYTGHHCETNINECSSQ-PCRHGGTCQDRD-NAYLCFCLKGTTGPNCEINLD
. : :. .. : :. ..: :.:. :: .:::: . . . : : : : .: :::
CCDS99 PWQCNCETNWGGLLCDKDLNYCGSHHPCTNGGTCINAEPDQYRCTCPDGYSGRNCEKAEH
290 300 310 320 330 340
650 660 670 680 690 700
pF1KE3 DCASSPC-DSGTCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTC
:.:.:: ..:.: . .:.:: : :..: : ..:::::.::: :::: : ..:: :
CCDS99 ACTSNPCANGGSCHEVPSGFECHCPSGWSGPTCALDIDECASNPCAAGGTCVDQVDGFEC
350 360 370 380 390 400
710 720 730 740 750 760
pF1KE3 RCPEGYHDPTCLSEVNECNSNPCVHG-ACRDSLNGYKCDCDPGWSGTNCDINNNECESNP
::: . :: ..:::...::... .:.. ..:: ::: :::.: :: :: :.:...
CCDS99 ICPEQWVGATCQLDANECEGKPCLNAFSCKNLIGGYYCDCIPGWKGINCHINVNDCRGQ-
410 420 430 440 450 460
770 780 790 800 810 820
pF1KE3 CVNGGTCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPY
: .::::::...:: :.: .::.: .:. . .::::.:: . : : : . :..:.: .
CCDS99 CQHGGTCKDLVNGYQCVCPRGFGGRHCELERDECASSPCHSGGLCEDLADGFHCHCPQGF
470 480 490 500 510 520
830 840 850 860 870 880
pF1KE3 TGATCEVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHG
.: ::: . : :::::::..: . : .. :.:: . :..: : . :: :
CCDS99 SGPLCEVDVDLCEPSPCRNGARCYNLEG--DYYCACPDDFGGKNCSVPRE-----PCPGG
530 540 550 560 570 580
890 900 910 920 930 940
pF1KE3 ASCQNTHGGYRCHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAF-CDCLPGFRGT
: :. : : .:: : . : :. : :.. . : : : :: ::
CCDS99 A-CRVIDG---CGSDAG-PGMPGTAASGVCGPH-----GRCVSQPGGNFSCICDSGFTGT
590 600 610 620 630
950 960 970 980 990 1000
pF1KE3 FCEEDINECASDPCRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVD
.:.:.:..: ..:::::..: : ::.. : ::.:. : :..: :: . : . : : :
CCDS99 YCHENIDDCLGQPCRNGGTCIDEVDAFRCFCPSGWEGELCDTNPNDCLPDPCHSRGRCYD
640 650 660 670 680 690
1010 1020 1030 1040 1050 1060
pF1KE3 GINSFTCLCPPGFTGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLV
.:.: : : :. :. :. .::. : .:::: :. ..::.:: :. : .:
CCDS99 LVNDFYCACDDGWKGKTCHSREFQCDAYTCSNGGTCYDSGDTFRCACPPGWKGSTCAVAK
700 710 720 730 740 750
1070 1080 1090 1100 1110
pF1KE3 HW-CDSSPCKNGGKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHG
. : .:: ::: : . ... : : .:: : : . .:. : .:
CCDS99 NSSCLPNPCVNGGTCVGSGASFSCICRDGWEGRTCTHNTNDCNPLP----------CYNG
760 770 780 790 800
1120 1130 1140 1150 1160 1170
pF1KE3 GLCVDAGNTHHCRCQAGYTGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVN
:.:::. : .:.: :..: :. .:::. ::: ::::.: ..:: :.: : :
CCDS99 GICVDGVNWFRCECAPGFAGPDCRINIDECQSSPCAYGATCVDEINGYRCSCPPGRAGPR
810 820 830 840 850 860
1180 1190 1200 1210 1220 1230
pF1KE3 CSEEIDECLSHPCQNGGTCLDLPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCF
:.: : ... : . :: . ... .: .. .: . ::. . .: :.
CCDS99 CQEVIG--FGRSCWSRGTPFPHGSSWVEDC----NSCRCLDGRRDCSKVW--CGWKP-CL
870 880 890 900 910
1240 1250 1260 1270 1280 1290
pF1KE3 NNGTCVDQVGGYSCTCPPGFVGERC-EGDVNECLSNPCDARGTQNC-VQRVNDFHCECRA
: : . : :: .:.:: : ..:: ::.: : .: ... . : :.
CCDS99 LAG----QPEALSAQCP---LGQRCLEKAPGQCLRPPCEAWG--ECGAEEPPSTPCLPRS
920 930 940 950 960
1300 1310 1320 1330 1340
pF1KE3 GHTGRRC---------ESVINGCK-GKPCKNGGTCAVASNTARG--FICKCPAGFEGATC
:: : . : .: : :.. . .. .:: .. : . ::.
CCDS99 GHLDNNCARLTLHFNRDHVPQGTTVGAICSGIRSLPATRAVARDRLLVLLCDRASSGASA
970 980 990 1000 1010 1020
1350 1360 1370 1380 1390 1400
pF1KE3 ENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTGPECQFPASSPCLGGNPCYNQGTCEP
. : . . : : .. :.:
CCDS99 VEVAVSFSPARDLPDSSLIQGAAHAIVAAITQRGNSSLLLAVTEVKVETVVTGGSSTGLL
1030 1040 1050 1060 1070 1080
2555 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 17:23:26 2016 done: Tue Nov 8 17:23:28 2016
Total Scan time: 7.150 Total Display time: 1.610
Function used was FASTA [36.3.4 Apr, 2011]