FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3300, 2555 aa 1>>>pF1KE3300 2555 - 2555 aa - 2555 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.8361+/-0.00166; mu= -2.1274+/- 0.100 mean_var=571.3297+/-113.296, 0's: 0 Z-trim(111.9): 261 B-trim: 0 in 0/53 Lambda= 0.053658 statistics sampled from 12497 (12745) to 12497 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.692), E-opt: 0.2 (0.392), width: 16 Scan time: 7.150 The best scores are: opt bits E(32554) CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555) 18971 1486.4 0 CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471) 6853 548.3 1.8e-154 CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321) 5428 437.9 2.8e-121 CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003) 2659 223.5 8.7e-57 CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144) 1663 146.6 1.9e-33 CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165) 1663 146.6 1.9e-33 CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218) 1509 134.2 4e-30 CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 1494 133.5 1.5e-29 CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200) 1259 114.9 2.6e-24 CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238) 1247 114.0 5.1e-24 CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 ( 870) 1091 101.7 1.8e-20 CCDS1390.1 CRB1 gene_id:23418|Hs108|chr1 (1406) 1091 101.9 2.4e-20 CCDS33390.1 DNER gene_id:92737|Hs108|chr2 ( 737) 1013 95.6 1e-18 CCDS58053.1 CRB1 gene_id:23418|Hs108|chr1 (1382) 1014 96.0 1.5e-18 CCDS5313.1 DLL1 gene_id:28514|Hs108|chr6 ( 723) 1001 94.6 2e-18 CCDS45232.1 DLL4 gene_id:54567|Hs108|chr15 ( 685) 945 90.3 3.8e-17 CCDS48004.1 SVEP1 gene_id:79987|Hs108|chr9 (3571) 959 92.2 5.2e-17 CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 896 87.2 1.3e-15 CCDS6852.2 CRB2 gene_id:286204|Hs108|chr9 (1285) 885 85.9 1.4e-15 CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 857 83.9 7.3e-15 CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 857 83.9 7.4e-15 CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 857 83.9 7.5e-15 CCDS7453.1 SLIT1 gene_id:6585|Hs108|chr10 (1534) 776 77.6 5.6e-13 CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044) 760 76.2 1e-12 CCDS64311.1 SLIT3 gene_id:6586|Hs108|chr5 (1530) 740 74.8 3.8e-12 CCDS46562.1 SNED1 gene_id:25992|Hs108|chr2 (1413) 739 74.7 3.8e-12 CCDS75111.1 SLIT2 gene_id:9353|Hs108|chr4 (1521) 731 74.1 6.2e-12 CCDS75110.1 SLIT2 gene_id:9353|Hs108|chr4 (1525) 731 74.1 6.2e-12 CCDS3426.1 SLIT2 gene_id:9353|Hs108|chr4 (1529) 731 74.1 6.2e-12 CCDS53454.1 CRB1 gene_id:23418|Hs108|chr1 (1294) 728 73.8 6.6e-12 CCDS4369.1 SLIT3 gene_id:6586|Hs108|chr5 (1523) 723 73.5 9.5e-12 CCDS12537.1 DLL3 gene_id:10683|Hs108|chr19 ( 587) 678 69.5 5.8e-11 CCDS12538.1 DLL3 gene_id:10683|Hs108|chr19 ( 618) 678 69.5 6e-11 CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809) 693 71.5 7e-11 >>CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555 aa) initn: 18971 init1: 18971 opt: 18971 Z-score: 7956.2 bits: 1486.4 E(32554): 0 Smith-Waterman score: 18971; 100.0% identity (100.0% similar) in 2555 aa overlap (1-2555:1-2555) 10 20 30 40 50 60 pF1KE3 MPPLLAPLLCLALLPALAARGPRCSQPGETCLNGGKCEAANGTEACVCGGAFVGPRCQDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MPPLLAPLLCLALLPALAARGPRCSQPGETCLNGGKCEAANGTEACVCGGAFVGPRCQDP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 NPCLSTPCKNAGTCHVVDRRGVADYACSCALGFSGPLCLTPLDNACLTNPCRNGGTCDLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NPCLSTPCKNAGTCHVVDRRGVADYACSCALGFSGPLCLTPLDNACLTNPCRNGGTCDLL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 TLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYICHCPPSFHGPTCRQDVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYICHCPPSFHGPTCRQDVN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 ECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 HECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 HECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 LMPNACQNGGTCHNTHGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LMPNACQNGGTCHNTHGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 CPHGRTGLLCHLNDACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 CPHGRTGLLCHLNDACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 NPCEHAGKCINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NPCEHAGKCINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 GYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 AKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRPGYTGHHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRPGYTGHHC 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 ETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSGTCLDKID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSGTCLDKID 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 GYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNEC 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 NSNPCVHGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMTSGYVCTCR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NSNPCVHGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMTSGYVCTCR 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 EGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRN 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 GGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRCHCQAGYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRCHCQAGYS 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 GRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANC 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 TDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSYCQH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSYCQH 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 DVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQ 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE3 YRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 YRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE3 YCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGTCLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 YCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGTCLD 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE3 LPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFV 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE3 GERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECRAGHTGRRCESVINGCKGKPCKNGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECRAGHTGRRCESVINGCKGKPCKNGG 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE3 TCAVASNTARGFICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TCAVASNTARGFICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTG 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE3 PECQFPASSPCLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PECQFPASSPCLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDI 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE3 PPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQSLQCWKYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQSLQCWKYF 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE3 SDGHCDSQCNSAGCLFDGFDCQRAEGQCNPLYDQYCKDHFSDGHCDQGCNSAECEWDGLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SDGHCDSQCNSAGCLFDGFDCQRAEGQCNPLYDQYCKDHFSDGHCDQGCNSAECEWDGLD 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE3 CAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQQMIFPYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 CAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQQMIFPYY 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE3 GREEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVRGSIVYLEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GREEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVRGSIVYLEI 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE3 DNRQCVQASSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPAQLHFMYVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DNRQCVQASSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPAQLHFMYVA 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE3 AAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVSEASKKKRREPLGEDSVGLKPLKNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVSEASKKKRREPLGEDSVGLKPLKNA 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE3 SDGALMDDNQNEWGDEDLETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAADLRMSAMAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SDGALMDDNQNEWGDEDLETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAADLRMSAMAP 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE3 TPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEEEDAPAVISDFIYQGASL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEEEDAPAVISDFIYQGASL 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE3 HNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPLHAAVSADAQGVFQIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 HNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPLHAAVSADAQGVFQIL 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE3 IRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVDDLGKSALHWAAAVNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVDDLGKSALHWAAAVNN 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE3 VDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFANRDITDHMDRLPRDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFANRDITDHMDRLPRDI 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE3 AQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLGSLKPGVQGKKVRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLGSLKPGVQGKKVRK 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE3 PSSKGLACGSKEAKDLKARRKKSQDGKGCLLDSSGMLSPVDSLESPHGYLSDVASPPLLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PSSKGLACGSKEAKDLKARRKKSQDGKGCLLDSSGMLSPVDSLESPHGYLSDVASPPLLP 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KE3 SPFQQSPSVPLNHLPGMPDTHLGIGHLNVAAKPEMAALGGGGRLAFETGPPRLSHLPVAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SPFQQSPSVPLNHLPGMPDTHLGIGHLNVAAKPEMAALGGGGRLAFETGPPRLSHLPVAS 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KE3 GTSTVLGSSSGGALNFTVGGSTSLNGQCEWLSRLQSGMVPNQYNPLRGSVAPGPLSTQAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GTSTVLGSSSGGALNFTVGGSTSLNGQCEWLSRLQSGMVPNQYNPLRGSVAPGPLSTQAP 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 2400 pF1KE3 SLQHGMVGPLHSSLAASALSQMMSYQGLPSTRLATQPHLVQTQQVQPQNLQMQQQNLQPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SLQHGMVGPLHSSLAASALSQMMSYQGLPSTRLATQPHLVQTQQVQPQNLQMQQQNLQPA 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 2450 2460 pF1KE3 NIQQQQSLQPPPPPPQPHLGVSSAASGHLGRSFLSGEPSQADVQPLGPSSLAVHTILPQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NIQQQQSLQPPPPPPQPHLGVSSAASGHLGRSFLSGEPSQADVQPLGPSSLAVHTILPQE 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500 2510 2520 pF1KE3 SPALPTSLPSSLVPPVTAAQFLTPPSQHSYSSPVDNTPSHQLQVPEHPFLTPSPESPDQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SPALPTSLPSSLVPPVTAAQFLTPPSQHSYSSPVDNTPSHQLQVPEHPFLTPSPESPDQW 2470 2480 2490 2500 2510 2520 2530 2540 2550 pF1KE3 SSSSPHSNVSDWSEGVSSPPTSMQSQIARIPEAFK ::::::::::::::::::::::::::::::::::: CCDS43 SSSSPHSNVSDWSEGVSSPPTSMQSQIARIPEAFK 2530 2540 2550 >>CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471 aa) initn: 7358 init1: 4384 opt: 6853 Z-score: 2886.6 bits: 548.3 E(32554): 1.8e-154 Smith-Waterman score: 10140; 54.0% identity (74.7% similar) in 2564 aa overlap (2-2539:6-2443) 10 20 30 40 50 pF1KE3 MPPLLAPLLCLALLPALAARGPRCSQPGETCLNGGKCEAA-NGTEACVCGGAFVGP : :: :: : : : :.. .: . : :.: : : . ::: : : .:.: CCDS90 MPALRPALLWALLALWLCCAAPAHALQCRDGYEPCVNEGMCVTYHNGTGYCKCPEGFLGE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 RCQDPNPCLSTPCKNAGTCHVVDRRGVADYACSCALGFSGPLCLTPLDNACLTN-PCRNG :: .:: .. :.:.::: : . .. .: :: ::.: : .. :... :: :: CCDS90 YCQHRDPCEKNRCQNGGTC--VAQAMLGKATCRCASGFTGEDCQYSTSHPCFVSRPCLNG 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 GTCDLLTLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYICHCPPSFHGPT ::: .:. :.: : :..:: :: .: : :.:::::. : .. :.: .: : CCDS90 GTCHMLSRDTYECTCQVGFTGKECQWTDACLSHPCANGSTCTTVANQFSCKCLTGFTGQK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 CRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCR :. ::::: . :: :.::::: : :::.: : :: :. ::::.:::: :::::: CCDS90 CETDVNEC-DIPGHCQHGGTCLNLPGSYQCQCPQGFTGQYCDSLYVPCAPSPCVNGGTCR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE3 PTGDVTHECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTE ::: : :: ::::: :..::.::::::.. :.:::.::::::::::::::.::::.::: CCDS90 QTGDFTFECNCLPGFEGSTCERNIDDCPNHRCQNGGVCVDGVNTYNCRCPPQWTGQFCTE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE3 DVDECQLMPNACQNGGTCHNTHGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRV ::::: :.:::::::::: : .:::.:::::::.:.:::::::::: :.: :.:: ::: CCDS90 DVDECLLQPNACQNGGTCANRNGGYGCVCVNGWSGDDCSENIDDCAFASCTPGSTCIDRV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE3 ASFYCECPHGRTGLLCHLNDACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVD ::: : ::.:..::::::.::::::::..:. :::::.::. :::::.:: : :..::: CCDS90 ASFSCMCPEGKAGLLCHLDDACISNPCHKGALCDTNPLNGQYICTCPQGYKGADCTEDVD 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE3 ECSLG-ANPCEHAGKCINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGE ::... .:::::::::.:: :.:.:.::.::.:::::.:.::: :.::::::::::.:: CCDS90 ECAMANSNPCEHAGKCVNTDGAFHCECLKGYAGPRCEMDINECHSDPCQNDATCLDKIGG 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE3 FQCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECA : :.::::..:::::.. .:: :.::..::.:.::.:.::: :: :::: .:: :.:.:. CCDS90 FTCLCMPGFKGVHCELEINECQSNPCVNNGQCVDKVNRFQCLCPPGFTGPVCQIDIDDCS 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE3 STPCKNGAKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRP :::: :::::.: :: : : :. :.::. :: .::.:::::::.:.:.::. ..::.: : CCDS90 STPCLNGAKCIDHPNGYECQCATGFTGVLCEENIDNCDPDPCHHGQCQDGIDSYTCICNP 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE3 GYTGHHCETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSG :: : : .:.:: :.:: . : : : :.: : : ::.: :::::.:::::.:: : CCDS90 GYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQCNCQPGTSGVNCEINFDDCASNPCIHG 600 610 620 630 640 650 660 670 680 690 700 710 pF1KE3 TCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTC :.: :. : :.: ::.::. :::.:::::.:::..:.:: .:.::: : :::: : :.: CCDS90 ICMDGINRYSCVCSPGFTGQRCNIDIDECASNPCRKGATCINGVNGFRCICPEGPHHPSC 660 670 680 690 700 710 720 730 740 750 760 770 pF1KE3 LSEVNECNSNPCVHGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMTS :.:::: ::::.:: : .:.:::: :: :: : ::....::: :::: ::::: .... CCDS90 YSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVGINCEVDKNECLSNPCQNGGTCDNLVN 720 730 740 750 760 770 780 790 800 810 820 830 pF1KE3 GYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPC :: :::..::.: :::.::.:::::::::::::.::..:: :.:.::::: .:..::::: CCDS90 GYRCTCKKGFKGYNCQVNIDECASNPCLNQGTCFDDISGYTCHCVLPYTGKNCQTVLAPC 780 790 800 810 820 830 840 850 860 870 880 890 pF1KE3 APSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRC .:.::.:.. :..: ..::..:.: ::::: : .::.::. .:: . . :.::.:.: : CCDS90 SPNPCENAAVCKESPNFESYTCLCAPGWQGQRCTIDIDECISKPCMNHGLCHNTQGSYMC 840 850 860 870 880 890 900 910 920 930 940 950 pF1KE3 HCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDP .: :.:: .:: ::::: :::.::::: ::.:: : ::::: : :. :.::: :.: CCDS90 ECPPGFSGMDCEEDIDDCLANPCQNGGSCMDGVNTFSCLCLPGFTGDKCQTDMNECLSEP 900 910 920 930 940 950 960 970 980 990 1000 1010 pF1KE3 CRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGF :.::..:.: :.:::: : :::.:.::::: .:::::::::::::::::::.:::: :: CCDS90 CKNGGTCSDYVNSYTCKCQAGFDGVHCENNINECTESSCFNGGTCVDGINSFSCLCPVGF 960 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 pF1KE3 TGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGK :::.: :..:::.:.:::. ::: :: :.:::.:: :::: :::.::. :. ::::: : CCDS90 TGSFCLHEINECSSHPCLNEGTCVDGLGTYRCSCPLGYTGKNCQTLVNLCSRSPCKNKGT 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 pF1KE3 CWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRC : : ... .: :::::.: :::::.:::..::.:.:: : .::::.:.:..:::::.:.: CCDS90 CVQKKAESQCLCPSGWAGAYCDVPNVSCDIAASRRGVLVEHLCQHSGVCINAGNTHYCQC 1080 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 pF1KE3 QAGYTGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQ ::::::::. .:::. .:::.::::.:..::: :.:: ::.:::: :.::: ..::: CCDS90 PLGYTGSYCEEQLDECASNPCQHGATCSDFIGGYRCECVPGYQGVNCEYEVDECQNQPCQ 1140 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 pF1KE3 NGGTCLDLPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSC :::::.:: : .::::: ::.:. :: :.::: .:.:.:.:.: :.:..::::: CCDS90 NGGTCIDLVNHFKCSCPPGTRGLLCEENIDDC-------ARGPHCLNGGQCMDRIGGYSC 1200 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 pF1KE3 TCPPGFVGERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECRAGHTGRRCESVINGCKG : :::.:::::::.::::::::...:. .:.: .::. : ::.. :::.::. .. : CCDS90 RCLPGFAGERCEGDINECLSNPCSSEGSLDCIQLTNDYLCVCRSAFTGRHCETFVDVCPQ 1260 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 pF1KE3 KPCKNGGTCAVASNTARGFICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCL :: :::::::::: ::::.:: :: :: :.. .::...: .: :. .: :. CCDS90 MPCLNGGTCAVASNMPDGFICRCPPGFSGARCQS---SCGQVKCRKGEQCVHTASGPRCF 1320 1330 1340 1350 1360 1380 1390 1400 1410 1420 1430 pF1KE3 CLGPFTGPECQFPASSPCLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFG : .: .:. : : ...:: . :.:.: . :.: : : :.: :.. :. CCDS90 CPSPR---DCE----SGC-ASSPCQHGGSCHPQRQPPYYSCQCAPPFSGSRCEL--YT-- 1370 1380 1390 1400 1410 1440 1450 1460 1470 1480 1490 pF1KE3 GGAGRDIPPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQS :: .: : . : . ::. ::.::: ::::::::....:: ::.. CCDS90 ------APPSTPPATCLSQYCADKARDGVCDEACNSHACQWDGGDCSLTMENPWANCSSP 1420 1430 1440 1450 1460 1500 1510 1520 1530 1540 1550 pF1KE3 LQCWKYFSDGHCDSQCNSAGCLFDGFDCQRAEGQCNPLYDQYCKDHFSDGHCDQGCNSAE : :: :... .:: ::.. ::::.:.:: :. ::.:: :::.:.:::::::: : CCDS90 LPCWDYINN-QCDELCNTVECLFDNFECQGNSKTCK--YDKYCADHFKDNHCDQGCNSEE 1470 1480 1490 1500 1510 1520 1560 1570 1580 1590 1600 1610 pF1KE3 CEWDGLDCAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQ : ::::::: :: :: ::::.::::::::: ... ::: :. .::::. .:::..:. CCDS90 CGWDGLDCAADQPENLAEGTLVIVVLMPPEQLLQDARSFLRALGTLLHTNLRIKRDSQGE 1530 1540 1550 1560 1570 1580 1620 1630 1640 1650 1660 1670 pF1KE3 QMIFPYYG-REEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVR :..:::: . ..:. . : . ::: .: ..: CCDS90 LMVYPYYGEKSAAMKKQRMTRRS-----------------LPGEQE----------QEVA 1590 1600 1610 1680 1690 1700 1710 1720 1730 pF1KE3 GSIVYLEIDNRQCVQASSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPA :: :.:::::::::: :..::... .::.:.. : :.:. : . .: ::.. : . CCDS90 GSKVFLEIDNRQCVQDSDHCFKNTDAAAALLASHAIQGTLSYP--LVSVVSESLTPER-T 1620 1630 1640 1650 1660 1670 1740 1750 1760 1770 1780 1790 pF1KE3 QLHFMYVAAAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVS-EASKKKRREPLGEDS :: .. .:.:. ..::.. ::... ::.:.::.::.:::: . .::..:::::.:.:. CCDS90 QLLYL-LAVAVVIILFIILLGVIMA-KRKRKHGSLWLPEGFTLRRDASNHKRREPVGQDA 1680 1690 1700 1710 1720 1730 1800 1810 1820 1830 1840 pF1KE3 VGLKPLK-NASDGALMDDNQNE-W-GDEDLETKKFRFEEPVVLPDLDDQTDHRQWTQQHL :::: :. ..:.. :. . .: : :: . :: . :. ..: . :: :.: :::::: CCDS90 VGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDRRPWTQQHL 1740 1750 1760 1770 1780 1790 1850 1860 1870 1880 1890 1900 pF1KE3 DAADLRMS-AMAPTPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEE-EDA .:::.: . ..: ::::.: ..: .::::::::: ::::.:: ::. . .. .:. ::. CCDS90 EAADIRRTPSLALTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSDLSDEDEDAEDS 1800 1810 1820 1830 1840 1850 1910 1920 1930 1940 1950 1960 pF1KE3 PA-VISDFIYQGASLHNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPL : .:.:..::::::. ::::::: ::::::::::.:::::::.:.:::: :::::: :: CCDS90 SANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANAQDNMGRCPL 1860 1870 1880 1890 1900 1910 1970 1980 1990 2000 2010 2020 pF1KE3 HAAVSADAQGVFQILIRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVD ::::.::::::::::::::.:::::::.:::::::::::::::::. .::: .::::::: CCDS90 HAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELINCQADVNAVD 1920 1930 1940 1950 1960 1970 2030 2040 2050 2060 2070 2080 pF1KE3 DLGKSALHWAAAVNNVDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFA : ::::::::::::::.:...:::::::.:::.:.:::::::::::::::.::.:::::: CCDS90 DHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEAAKILLDHFA 1980 1990 2000 2010 2020 2030 2090 2100 2110 2120 2130 2140 pF1KE3 NRDITDHMDRLPRDIAQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGY ::::::::::::::.:..::::::::::::::.. :: :. : : .::: .:.:: CCDS90 NRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPP--GTVL--TSALSPVICGPNRS 2040 2050 2060 2070 2080 2090 2150 2160 2170 2180 2190 pF1KE3 LGSLKPGVQGKKVRKPSSKG-----LACGSKEAKDLK-ARRKKSQDGKGCLLDSSGMLSP . ::: .::: :.::.:. : .::::: : .::::: . : : .:: ::: CCDS90 FLSLKHTPMGKKSRRPSAKSTMPTSLPNLAKEAKDAKGSRRKKSLSEKVQLSESSVTLSP 2100 2110 2120 2130 2140 2150 2200 2210 2220 2230 2240 2250 pF1KE3 VDSLESPHGYLSDVASPPLLPSP--FQQSPSVPLNHLPGMPDTHLGIGH-LNVAAKPEMA :::::::: :.::..: :.. :: .: ::. :. . : . . : :. . :: CCDS90 VDSLESPHTYVSDTTSSPMITSPGILQASPN-PM-LATAAPPAPVHAQHALSFSNLHEMQ 2160 2170 2180 2190 2200 2260 2270 2280 2290 2300 2310 pF1KE3 ALGGGGRLAFETGPPRLSHLPVASGTSTVLGSSSGGALNFTVGGSTSLNGQCEWLSRLQS :. :. .. . ::: ..: ::.:.:.:. . .:..:.. CCDS90 PLAHGASTVLPSVSQLLSHHHIVSP-----GSGSAGSLSRL----HPVPVPADWMNRMEV 2210 2220 2230 2240 2250 2320 2330 2340 2350 2360 2370 pF1KE3 GMVPNQYNPLRGSVAPGPLSTQAPSLQHGMVGPLHSSLAASALSQMMSYQGLPSTRLATQ . .::: . : : ::. .: : ..: :..: CCDS90 N--ETQYNEMFGMVL-------APA--EG----THPGIA-------------PQSRPPEG 2260 2270 2280 2290 2380 2390 2400 2410 2420 2430 pF1KE3 PHLVQTQQVQPQNLQMQQQNLQPANIQQQQSLQPPPPPPQPHLGVSSAASGHLGRSFLSG :.. .. : . .: : : . :. : :::. :..: : CCDS90 KHITTPREPLPPIVTFQ---LIP-----KGSIAQPAGAPQPQSTCPPAVAGPL------- 2300 2310 2320 2330 2440 2450 2460 2470 2480 2490 pF1KE3 EPSQADVQPLG--PSSLAVHTILPQESPALP-TSLPSSLVPPVTAAQFLTPPSQHSYSSP :.. .. .. :: ...::.. . : ::. :...... ::::::::.: CCDS90 -PTMYQIPEMARLPSVAFPTAMMPQQDGQVAQTILPAYHPFPASVGKYPTPPSQHSYASS 2340 2350 2360 2370 2380 2390 2500 2510 2520 2530 2540 2550 pF1KE3 --VDNTPSHQLQVP-EHPFLTPSPESPDQWSSSSPHSNVSDWSEGVSSPPTSMQSQIARI .. ::::. .. :::.:::::::::::::::::: .::::. ..:: CCDS90 NAAERTPSHSGHLQGEHPYLTPSPESPDQWSSSSPHS-ASDWSDVTTSPTPGGAGGGQRG 2400 2410 2420 2430 2440 2450 pF1KE3 PEAFK CCDS90 PGTHMSEPPHNNMQVYA 2460 2470 >>CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321 aa) initn: 5566 init1: 3565 opt: 5428 Z-score: 2290.7 bits: 437.9 E(32554): 2.8e-121 Smith-Waterman score: 8821; 50.9% identity (72.0% similar) in 2400 aa overlap (52-2385:33-2319) 30 40 50 60 70 80 pF1KE3 PRCSQPGETCLNGGKCEAANGTEACVCGGAFVGPRCQDPNPCLS-TPCKNAGTCHVVDRR ..:: : :::. .:: :.: : . : CCDS12 PGARGRRRRRRPMSPPPPPPPVRALPLLLLLAGPGAAAP-PCLDGSPCANGGRCTQLPSR 10 20 30 40 50 60 90 100 110 120 130 pF1KE3 GVADYACSCALGFSGPLCLTPLDNACLTNPCRNGGTCD---LLTLTEYKCRCPPGWSGKS . :: : :. : : :.. : ..:: . :.:. . ....:::: :. : . CCDS12 ---EAACLCPPGWVGERC--QLEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPD 70 80 90 100 110 140 150 160 170 180 190 pF1KE3 CQQADPCASNPCANGGQC-LPFEASYICHCPPSFHGPTCRQDVNECG-QKPGLCRHGGTC :. ::: :.:::.:..: . .. ..: :::...: .::.::.:: .: ::::::: CCDS12 CSLPDPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGEP--CRHGGTC 120 130 140 150 160 170 200 210 220 230 240 250 pF1KE3 HNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTGQNCE : ::.:: : : .::: :: : :::.::::.:::::: .::.:..::::::: ::::: CCDS12 LNTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNCE 180 190 200 210 220 230 260 270 280 290 300 310 pF1KE3 ENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHNT :.:::::. : :::.::::::::::.::::::::.::::::::::.::::.::::: :: CCDS12 VNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNT 240 250 260 270 280 290 320 330 340 350 360 370 pF1KE3 HGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCECPHGRTGLLCHLNDA ::..::::::::::.::.::::::.:.:::::::::::::::: :: :.:::::::.:: CCDS12 LGGHSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDA 300 310 320 330 340 350 380 390 400 410 420 430 pF1KE3 CISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGANPCEHAGKCINTLGS :.::::.: . ::::::::.:::::: :.:: ::.:::::::.::::::: :.:.:: :: CCDS12 CVSNPCHEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGS 360 370 380 390 400 410 440 450 460 470 480 490 pF1KE3 FECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGVHCEVNTDECA : ::: .:::::::: :::::.:.::.:.:::::.::.: :::: :. :..:::. ::: CCDS12 FLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQ 420 430 440 450 460 470 500 510 520 530 540 550 pF1KE3 SSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNGAKCLDGPNTYTCVCT ::::...: : :..: :.: ::.::.: :: ::::::::::.:::::.: :. : : :. CCDS12 SSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCA 480 490 500 510 520 530 560 570 580 590 600 610 pF1KE3 EGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRPGYTGHHCETNINECSSQPCRHG ::. :: :. ..:.:.:::::.: : ::.:.:.: : ::::: .::....:: ::::::: CCDS12 EGFEGTLCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRHG 540 550 560 570 580 590 620 630 640 650 660 670 pF1KE3 GTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSGTCLDKIDGYECACEPGYTGSMC : : : . ::: : .:::: :::.:.:::::.:: :.: : :. :.:.:.::.:: .: CCDS12 GKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPLC 600 610 620 630 640 650 680 690 700 710 720 730 pF1KE3 NINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNECNSNPCVHGACRDSLN :..:.:::..:: .::.: :: ::: : :: : : :: . : .:: :: : :. . CCDS12 NVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPG 660 670 680 690 700 710 740 750 760 770 780 790 pF1KE3 GYKCDCDPGWSGTNCD--INNNECESNPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNIN :..: :.::::: :. . . :::.:: ::::.. :. ::: : .: .:. CCDS12 GFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCE---- 720 730 740 750 760 770 800 810 820 830 840 850 pF1KE3 ECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRNGGECRQSEDYESF .:.::.:.::..::.: .: . CCDS12 -----------------------------------LLSPCTPNPCEHGGRC-ESAPGQLP 780 790 860 870 880 890 900 910 pF1KE3 SCVCPTGWQGQTCEVDINECVL-SPCRHGASCQNTHGGYRCHCQAGYSGRNCETDIDDCR : :: :::: :. :..::. .:: . : : :.. : :..::.: .:. ::.:: CCDS12 VCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDCD 800 810 820 830 840 850 920 930 940 950 960 970 pF1KE3 PNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANCTDCVDSYTCTCP :::: ::::: ::... :.::::: : : .:..:: :.:: :. ::: : :.::::: CCDS12 PNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGPGT-CTDHVASFTCTCP 860 870 880 890 900 910 980 990 1000 1010 1020 1030 pF1KE3 AGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSYCQHDVNECDSQPCLH :..:.:::.. :::. ::::::::::::.:::.::: ::.::..:::... : :.:::: CCDS12 PGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPCLH 920 930 940 950 960 970 1040 1050 1060 1070 1080 1090 pF1KE3 GGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWTGL ::.:. . ..:::: ...:::.::.:: ::. .::.:::.: :: . : :: ::.: CCDS12 GGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGA--YCLCPPGWSGR 980 990 1000 1010 1020 1030 1100 1110 1120 1130 1140 1150 pF1KE3 YCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECSPS ::. :. :. :: . :: . .::: :: ::: ..:.: : : :::.::. :: : . CCDS12 LCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCLAQ 1040 1050 1060 1070 1080 1090 1160 1170 1180 1190 1200 1210 pF1KE3 PCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGTCLDLPNTYKCSCPRG :::.:.:: :.::: :.:. ::.: :: ...::: :.:::.::.:.:: : :::: : CCDS12 PCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDLVARYLCSCPPG 1100 1110 1120 1130 1140 1150 1220 1230 1240 1250 1260 1270 pF1KE3 TQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFVGERCEGDVNECL : :: :::: :::.: :.. .:.:..:::::: :::. ::::::..: :::.:.::: CCDS12 TLGVLCEINEDDCGPG-PPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGLRCEADINECR 1160 1170 1180 1190 1200 1210 1280 1290 1300 1310 1320 1330 pF1KE3 SNPCDARGTQNCVQRVND-FHCECRAGHTGRRCESVINGCKGKPCKNGGTCAVASNTARG :. : : :..:.: . :.: :.:: .: ::..:.. :...::..:: : . . . : CCDS12 SGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQCRPSPGPGGG 1220 1230 1240 1250 1260 1270 1340 1350 1360 1370 1380 pF1KE3 --FICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTGPECQ-FPAS : :.: : : :: ::.: :.: : : . ::.: : : ..:: :. ::.: CCDS12 LTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLSGPSCRSFPGS 1280 1290 1300 1310 1320 1330 1390 1400 1410 1420 1430 1440 pF1KE3 SP------CLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDIPP : : .. :: . :.:.:. .::.:: : ..: :. : : CCDS12 PPGASNASC-AAAPCLHGGSCRPAPLAPFFRCACAQGWTGPRCE---------APAAAPE 1340 1350 1360 1370 1380 1450 1460 1470 1480 1490 1500 pF1KE3 PLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQSLQCWKYFSD : : :: :.. :. .::. .::::::::::. .:::..: ..::::. :.. CCDS12 VSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLSVGDPWRQC-EALQCWRLFNN 1390 1400 1410 1420 1430 1510 1520 1530 1540 1550 1560 pF1KE3 GHCDSQCNSAGCLFDGFDCQRA--EGQCNPLYDQYCKDHFSDGHCDQGCNSAECEWDGLD ..:: :.: .::.:.:::. . : :::.:..:: :::.::.::::::. :: ::::: CCDS12 SRCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDGLD 1440 1450 1460 1470 1480 1490 1570 1580 1590 1600 1610 1620 pF1KE3 CAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQQMIFPYY :: .:: :: :.::..::.:::.: :: ::..:: .:.:.. :. ::::: :.:::. CCDS12 CASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFPYH 1500 1510 1520 1530 1540 1550 1630 1640 1650 1660 1670 1680 pF1KE3 GREEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVRGSIVYLEI : : ::: : :::: : .: ::.:.::: CCDS12 ------RPSP-------------------------GSEP-RARRELAP-EVIGSVVMLEI 1560 1570 1580 1690 1700 1710 1720 1730 pF1KE3 DNRQCVQA--SSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPAQLHFMY ::: :.:. ...:: .: ..: .::::... :..:: .. :..: .::: :. . CCDS12 DNRLCLQSPENDHCFPDAQSAADYLGALSAVERLDFPYPLRDVRGEPLEPPEPSVPLLPL 1590 1600 1610 1620 1630 1640 1740 1750 1760 1770 1780 1790 pF1KE3 VAAAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVSE---ASKKKRREPLGEDSVGLK ..:.: .:: .. ::...: :.:.:. :::::::.. . ...: ::::.:.:..:.: CCDS12 LVAGAVLLLVILVLGVMVAR-RKREHSTLWFPEGFSLHKDVASGHKGRREPVGQDALGMK 1650 1660 1670 1680 1690 1700 1800 1810 1820 1830 1840 1850 pF1KE3 PLKNASDGALMDDNQNEWGDEDL-ETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAADLR . :. .:: . ..: : . :.:... ::: . .. .: :::::.:: :::.: CCDS12 NM--AKGESLMGEVATDWMDTECPEAKRLKVEEPGM--GAEEAVDCRQWTQHHLVAADIR 1710 1720 1730 1740 1750 1760 1860 1870 1880 1890 1900 1910 pF1KE3 MS-AMAPTPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEEE--DAPA-VI .. ::: :::::..::: :::::::::::::::.:: ::.:: .::.: :. : .: CCDS12 VAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMPTEEDEADDTSASII 1770 1780 1790 1800 1810 1820 1920 1930 1940 1950 1960 1970 pF1KE3 SDFIYQGASLHNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPLHAAVS ::.: :::.: .:::::::::::::::.:.:::::::.:.::.: ::. ::::::.::. CCDS12 SDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNAQDHSGRTPLHTAVT 1830 1840 1850 1860 1870 1880 1980 1990 2000 2010 2020 2030 pF1KE3 ADAQGVFQILIRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVDDLGKS ::::::::::::::.::::::: ::.: ::::::::::::.:.:: :::::::::.:::: CCDS12 ADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIASHADVNAVDELGKS 1890 1900 1910 1920 1930 1940 2040 2050 2060 2070 2080 2090 pF1KE3 ALHWAAAVNNVDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFANRDIT :::::::::::.:...:::::::::::...:::::::::::::::.::.::::::::.:: CCDS12 ALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEAAKLLLDHFANREIT 1950 1960 1970 1980 1990 2000 2100 2110 2120 2130 2140 2150 pF1KE3 DHMDRLPRDIAQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLGSLK ::.::::::.::::.:.:::::::. . ::: .: : :.: :: :...: .:: CCDS12 DHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPP---GPHG----LGPLLCPPGAFLPGLK 2010 2020 2030 2040 2050 2160 2170 2180 2190 2200 pF1KE3 PGVQG-KKVRKPSSK-GLACGSKEAKDLKARRKKSQDGKGCLLDSSGMLSPVDSLESPHG . .: :: :.: .: ::. . ... .: . : : ::: :::::::.::. CCDS12 AAQSGSKKSRRPPGKAGLGPQGPRGRG----KKLTLACPGPLADSSVTLSPVDSLDSPRP 2060 2070 2080 2090 2100 2110 2210 2220 2230 2240 2250 pF1KE3 YLSDVASPPLLP--SPFQQSPS--VPLNHLPGMPDTHLG----------IGHLNVAAKP- . . ::: .: .:. . . : : .: : . :: .: :: .: : CCDS12 FGGPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQPPGGCVLSLGLLNPVAVPL 2120 2130 2140 2150 2160 2170 2260 2270 2280 2290 2300 pF1KE3 EMAAL------GGGGRLAFETGPPRLSH-LPVASGTSTV-LGSSSGGALNFTVGGSTSLN . : : : . : . :: :. ::. . : . .. ..:. : CCDS12 DWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEEYPAAGAHSSP 2180 2190 2200 2210 2220 2230 2310 2320 2330 2340 2350 pF1KE3 GQCEWLSRLQSG---MVPNQYNPLR-GSVAPGPLS-----TQAPSLQHGMVGPLHSSLAA . ..: :. : ..:. .: . .: .: :: : .:. : .. ..: : CCDS12 PKARFL-RVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTPSPATATGAMATTTGALPA 2240 2250 2260 2270 2280 2360 2370 2380 2390 2400 2410 pF1KE3 SALS-QMMSYQGLPSTRLATQPHLVQTQQVQPQNLQMQQQNLQPANIQQQQSLQPPPPPP . : .. : . .:.:. ::... .:: CCDS12 QPLPLSVPSSLAQAQTQLGPQPEVTPKRQVLA 2290 2300 2310 2320 >>CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003 aa) initn: 2706 init1: 819 opt: 2659 Z-score: 1133.0 bits: 223.5 E(32554): 8.7e-57 Smith-Waterman score: 5389; 37.1% identity (57.4% similar) in 2345 aa overlap (2-2281:3-1998) 10 20 30 40 50 pF1KE3 MPPLLAPLLCLALLPALAARGPR---CSQPGETCLNGGKCEAAN-GTEACVCGGAFVGP :: : :: : :: ... :: :.. : : ::: : . . : .: :. .:.: CCDS34 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGE 10 20 30 40 50 60 60 70 80 90 100 pF1KE3 RCQDPNPCLSTP-CKNAGTCHVVDRRGVA----------DYACSCALGFSGPLCLTPLDN :: :.:: .. :.:.:.:... .. .. :.: ::.: : . :.. CCDS34 TCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAKLED 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE3 ACLTNPCRNGGTCDLLTLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYIC : . : . : : . . . .: : :::.:..:: : :..:::.::: :: . : CCDS34 PCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQIQC 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE3 HCPPSFHGPTCRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSP ::::.:.: .:..::::: : :: : .: .::: .::..:.: . . :: :: :: : CCDS34 HCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPP 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE3 SPCQNGGTCR--PTGDVT-HECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNC :.:::::. : : : : : : ::: : .:: : :.: ...:.:::.: ::..::.: CCDS34 RGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTC 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE3 RCPPEWTGQYCTEDVDECQLM-PNACQNGGTCHNTHGGYNCVCVNGWTGEDCSENIDDCA :: ::: :.::::::. . : :.:::::.:. :...::::.:: : .: ::.::: CCDS34 LCPETWTGWDCSEDVDECETQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCI 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE3 SAACFHGATCHDRVASFYCECPHGRTGLLCHLNDACISNPCNEGSNCDTNPVNGKAICTC .:.: :.:: :::.:: : :: :::::::::.: :.:.::. ..:.:::..:...: : CCDS34 AATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLEDMCLSQPCHGDAQCSTNPLTGSTLCLC 370 380 390 400 410 420 410 420 430 440 450 pF1KE3 PSGYTGPACSQDVDECSL---GANPCEHAGKCINTLGSFECQCLQGYTGPRCEIDVNECV ::.::.: ::.::: . : .::::.:.:.:: :::.: : :::: ::: : :::. CCDS34 QPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECL 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE3 SNPCQNDATCLDQIGEFQCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECP :.::. .:::: .. :.:.: :: :: :::.:.::::.:::... : : .: ::: : CCDS34 SQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICL 490 500 510 520 530 540 520 530 540 550 560 570 pF1KE3 TGFTGHLCQYDVDECASTPCKNGAKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHY ::.: :. :.::: :.:: ::..: : :... ::. CCDS34 PGFSGTRCEEDIDECRSSPCANGGQCQDQPGAF-----------HCK------------- 550 560 570 580 590 600 610 620 630 pF1KE3 GSCKDGVATFTCLCRPGYTGHHCETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPN : ::. : .:.:...:: :.:: :..: : .:..:.: .: :: CCDS34 -------------CLPGFEGPRCQTEVDECLSDPCPVGASCLDLPGAFFCLCPSGFTGQL 580 590 600 610 620 640 650 660 670 680 690 pF1KE3 CEINLDDCASSPCDSGTCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGI ::. : :: : :. :.: CCDS34 CEVPL---------------------------------------CAPNLCQPKQICKDQK 630 640 700 710 720 730 740 750 pF1KE3 NGFTCRCPEGYHDPTCLSEVNECNSNPCVHGACRDSLNGYKCDCDPGWSGTNCDINNNEC . .: ::.: .: : ..:. : :: :. : .: :: ::.: .:. . . : CCDS34 DKANCLCPDG--SPGCAPPEDNCT---CHHGHCQRS----SCVCDVGWTGPECEAELGGC 650 660 670 680 690 760 770 780 790 800 810 pF1KE3 ESNPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNC : ::..:::: . ::: ::: :..::.:. ... : :.:::: :.: CCDS34 ISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEMTACHSGPCLNGGSC----------- 700 710 720 730 740 820 830 840 850 860 870 pF1KE3 LLPYTGATCEVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSP ::: CCDS34 ----------------NPSP---------------------------------------- 880 890 900 910 920 930 pF1KE3 CRHGASCQNTHGGYRCHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGF ::: : : ...: .:.:. : : :: :::.: .: :: CCDS34 -----------GGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGGTC---VNR------PG- 750 760 770 780 940 950 960 970 980 990 pF1KE3 RGTFCEEDINECASDPCRNGANCTDCVDSYTCTCPAGFSGIHCENNT-PDCTESSCFNGG ...: : ::.: .::.. :.:..: : : . CCDS34 ----------------------------TFSCLCAMGFQGPRCEGKLRPSCADSPCRNRA 790 800 810 1000 1010 1020 1030 1040 1050 pF1KE3 TCVDGINSFTCLCPPGFTGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNC :: :. : : : :: :: :::: .: CCDS34 TCQDS--------PQG----------------P--------------RCLCPTGYTGGSC 820 830 840 1060 1070 1080 1090 1100 1110 pF1KE3 QNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLC :.:. : ..:: ...: :: ...: : .:::: :..: ::. :: ::.::. :: CCDS34 QTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSLC 850 860 870 880 890 900 1120 1130 1140 1150 1160 1170 pF1KE3 QHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYH ..::::::.: .. :.: :. :: :.: :. : :::::::: .:: :.:. :: CCDS34 HNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGYD 910 920 930 940 950 960 1180 1190 1200 1210 1220 1230 pF1KE3 GVNCSEEIDECLSHPCQNGGTCLDLPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSP : :::.:.: : :.::.: ::: : CCDS34 GQNCSKELDACQSQPCHNHGTCTPKP---------------------------------- 970 980 1240 1250 1260 1270 1280 1290 pF1KE3 KCFNNGTCVDQVGGYSCTCPPGFVGERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECR ::. :.::::::: ::::::.:::..:: :: : . .: :.:.: CCDS34 ------------GGFHCACPPGFVGLRCEGDVDECLDQPCHPTGTAACHSLANAFYCQCL 990 1000 1010 1020 1030 1300 1310 1320 1330 1340 1350 pF1KE3 AGHTGRRCESVINGCKGKPCKNGGTCAVASNTARGFICKCPAGFEGATCENDARTCGSLR ::::. :: :. :...:: .:::: ..... ::::.:: :::: :: . : .:: . CCDS34 PGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFEGPTCSHRAPSCGFHH 1040 1050 1060 1070 1080 1090 1360 1370 1380 1390 1400 1410 pF1KE3 CLNGGTCISGPRS---PTCLCLGPFTGPECQFP-ASSPCLGGNPCYNQGTCEPTSE--SP : .:: :. .:. : : ::. . ::.: : : . : .:: .:.: :. .: CCDS34 CHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPCLYNGSCSETTGLGGP 1100 1110 1120 1130 1140 1150 1420 1430 1440 1450 1460 1470 pF1KE3 FYRCLCPAKFNGLLCHILDYSFGGGAGRDIPPPLIEEACELPECQEDAGNKVCSLQCNNH .:: :: . : :. :. : :. .:. .:. :.. CCDS34 GFRCSCPHSSPGPRCQK-----PGAKG----------------CEGRSGDGACDAGCSGP 1160 1170 1180 1190 1480 1490 1500 1510 1520 1530 pF1KE3 ACGWDGGDCSLNFNDPWKNCTQSLQCWKYFSDGHCDSQCNSAGCLFDGFDCQRAEGQCNP . .::::::::. ::::.: . .:: : ::.: ::.: :::::.::. . :.: CCDS34 GGNWDGGDCSLGVPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPPA-CTP 1200 1210 1220 1230 1240 1250 1540 1550 1560 1570 1580 1590 pF1KE3 LYDQYCKDHFSDGHCDQGCNSAECEWDGLDCAEHVPERLAAGTLVVVVLMPPEQLRNSSF :::::.::: .:::..:::.::: ::: :: . . . .:...:.. : : .. : CCDS34 AYDQYCHDHFHNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLF 1260 1270 1280 1290 1300 1310 1600 1610 1620 1630 1640 1650 pF1KE3 HFLRELSRVLHTNVVFKRDAHGQQMIFPYYGREEELRKHPIKRAAEGWAAPDALLGQVKA . : :: .:.... ..: :..:..:: : :: : .. : .: CCDS34 ALARVLSLTLRVGLWVRKDRDGRDMVYPY----------PGARAEEKLGGTRDPTYQERA 1320 1330 1340 1350 1360 1660 1670 1680 1690 1700 pF1KE3 SLLPGGSEGGRRRRELDPMDVRGSIVYLEIDNRQCV--QASSQCFQSATDVAAFLGALAS . : . :. : : ... : .: . .: .: . .:.: . . ::.:.:. CCDS34 A--PQTQPLGK---ETDSLSA-GFVVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAA 1370 1380 1390 1400 1410 1710 1720 1730 1740 1750 1760 pF1KE3 LGSLN--IPYKIEAVQSETVEPPPPAQLHF-MYVAAAAFVLLFFVGCGVLLS--RKRRRQ .:.:. .: . ::. .. :: :: . . . .: :.:. .: ..:. :.:::. CCDS34 VGALEPLLPGPLLAVHPHAGTAPPANQLPWPVLCSPVAGVILLALGALLVLQLIRRRRRE 1420 1430 1440 1450 1460 1470 1770 1780 1790 1800 1810 pF1KE3 HGQLWFPEGFKV---SEASKKKRREPLGEDSVGLKPLKNAS----DGALMDDNQNEWGDE :: ::.: :: .... ..:: ::::::.::: :: . ::..: .. .: :.: CCDS34 HGALWLPPGFTRRPRTQSAPHRRRPPLGEDSIGLKALKPKAEVDEDGVVMCSGPEE-GEE 1480 1490 1500 1510 1520 1530 1820 1830 1840 1850 1860 1870 pF1KE3 DLETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAADLRMSAMAPTPPQGEVDADCMDVNV ... . . . :. . .: : ..:: :::: : . . :... CCDS34 VGQAE-----------ETGPPSTCQLWSLSGGCGA-LPQAAML-TPPQ-ESEMEAPDLDT 1540 1550 1560 1570 1580 1880 1890 1900 1910 1920 1930 pF1KE3 RGPDGFTPLMIASCSGGGLETGNSEEEE-DAPAVISDFIYQGASLHNQTDRTGETALHLA ::::: :::: : : : ...:. . : .. :: . .: :::: :::: CCDS34 RGPDGVTPLMSAVCCGE-VQSGTFQGAWLGCPEPWEPLLDGGACPQAHTVGTGETPLHLA 1590 1600 1610 1620 1630 1640 1940 1950 1960 1970 1980 1990 pF1KE3 ARYSRSDAAKRLLEASADANIQDNMGRTPLHAAVSADAQGVFQILIRNRATDLDARMHDG ::.:: ::.:::::.:. : : :::::::::.:::. : :.:.:.: : .::: .:: CCDS34 ARFSRPTAARRLLEAGANPNQPDRAGRTPLHAAVAADAREVCQLLLRSRQTAVDARTEDG 1650 1660 1670 1680 1690 1700 2000 2010 2020 2030 2040 2050 pF1KE3 TTPLILAARLAVEGMLEDLINSHADVNAVDDLGKSALHWAAAVNNVDAAVVLLKNGANKD ::::.:::::::: ..:.:: ..:::.: : ::.::::::::::. :: ::. ::.:: CCDS34 TTPLMLAARLAVEDLVEELIAAQADVGARDKWGKTALHWAAAVNNARAARSLLQAGADKD 1710 1720 1730 1740 1750 1760 2060 2070 2080 2090 2100 2110 pF1KE3 MQNNREETPLFLAAREGSYETAKVLLDHFANRDITDHMDRLPRDIAQERMHHDIVRLLD- :.:::.::::::::::. :.:..:: : :.. :. : :.:..: : :.. ::. CCDS34 AQDNREQTPLFLAAREGAVEVAQLLLGLGAARELRDQAGLAPADVAHQRNHWDLLTLLEG 1770 1780 1790 1800 1810 1820 2120 2130 2140 2150 2160 2170 pF1KE3 ----EYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLGSLKPGVQGKKVRKPSSKGLACGS : .: ...:. . :.: . :.: :. : . .. : :: . CCDS34 AGPPEARHKATPGREAGPFPRARTVSVSV-PPHG--GGALPRCRTLSAGAGPRGGGACLQ 1830 1840 1850 1860 1870 2180 2190 2200 2210 2220 pF1KE3 KE--AKDLKARRKKSQDGKGCLLDSSGMLSPVDSL--ESPHG--YLSDVASPPLLPSPFQ . . :: :: : : . :: : . .:.: . . . .: :. .. CCDS34 ARTWSVDLAAR------GGGAYSHCRS-LSGVGAGGGPTPRGRRFSAGMRGPRPNPAIMR 1880 1890 1900 1910 1920 1930 2230 2240 2250 2260 2270 pF1KE3 QSPSVPLNH-----LPGMPDTHLGIGHLNVAAK-----PEMAALGGGGRLAFETGPPRLS .: .. : ...: . :.. : .. : .. ::: :. CCDS34 GRYGVAAGRGGRVSTDDWPCDWVALGACGSASNIPIPPPCLTPSPERGSPQLDCGPPALQ 1940 1950 1960 1970 1980 1990 2280 2290 2300 2310 2320 2330 pF1KE3 HLPVASGTSTVLGSSSGGALNFTVGGSTSLNGQCEWLSRLQSGMVPNQYNPLRGSVAPGP ..:. .: CCDS34 EMPINQGGEGKK 2000 >>CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144 aa) initn: 998 init1: 998 opt: 1663 Z-score: 714.1 bits: 146.6 E(32554): 1.9e-33 Smith-Waterman score: 2016; 34.9% identity (56.2% similar) in 875 aa overlap (231-1060:467-1270) 210 220 230 240 250 pF1KE3 SYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTG---QNCEEN : :. : . : . ::.: ..:. CCDS47 IPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVWQLGFAGSEGEKCQGV 440 450 460 470 480 490 260 270 280 290 300 310 pF1KE3 IDD--CPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHNT :: . :: . .. :. . : : : . :... : :: .: . CCDS47 IDAYFFLAANCTEDATYVNDPEDNNSSC---WFPHEGTKEI---------CANGCSCLSE 500 510 520 530 540 320 330 340 350 360 370 pF1KE3 HGG--YNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCECPHGRTGLLCHLN . . : .: :.:. :: : : : :.:.:.. : : . : :: .: CCDS47 EDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPRCSCSLSYIGRLCVVN 550 560 570 580 590 600 380 390 400 410 420 pF1KE3 -DACISNPC-NEGSNCDTNPVNGKAICTCPSG---YTGPACSQDVDECSLGANPCEHAGK : :..: . . : . : :.: :: : : :...:. . :... CCDS47 VDYCLGNHSISVHGLCLALSHN----CNC-SGLQRYERNICEIDTEDCK--SASCKNGTT 610 620 630 640 650 430 440 450 460 470 pF1KE3 CINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGE--------------F . : : .:. :. : .::::..::.:.::.: :::.:: :. : CCDS47 STHLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQPGNYFCQCVPPFKVVDGF 660 670 680 690 700 710 480 490 500 510 520 530 pF1KE3 QCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECAS .:.: ::: :..:: . :.: . : ::. : : .:: : . . :..:. . .:: CCDS47 SCLCNPGYVGIRCEQDIDDCILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKM 720 730 740 750 760 770 540 550 560 570 580 590 pF1KE3 TPCKNGAKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGS-CKDGV--ATFTCLC .::::.. : : ..: : :: :.:: .: .:.::: ::: :. :.... . :.::: CCDS47 NPCKNNSTCTDLYKSYRCECTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLC 780 790 800 810 820 830 600 610 620 630 640 pF1KE3 RPGYTGHHCETNINECS--SQPCRHGGTCQDR-DNAYLCFCLKGTTGPNCEINLDDCASS : :::. :. : :. .:::...:: : :.: . : ::::.. :: CCDS47 PPLYTGQFCHQRYNLCDLLHNPCRNNSTCLALVDANQHCICREEFEGKNCEIDVKDCLFL 840 850 860 870 880 890 650 660 670 680 690 700 pF1KE3 PC-DSGTCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEG : : : : : .....: :.::..::.:.:.:.::...::.:.::: : : : : : CCDS47 SCQDYGDCEDMVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRFFCNCEPE 900 910 920 930 940 950 710 720 730 740 750 760 pF1KE3 YHDPTCLSEVNECNSNPCV-HGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGG :: : : .::.:. .::. . : .::.: : ::..: ::.:: .:: :.::.. : CCDS47 YHGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINLDECLSEPCLHDG 960 970 980 990 1000 1010 770 780 790 800 810 820 pF1KE3 TCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATC .: : . :.: :. :: : .:.:: :.: :::::. : : . . : :.: :.. : CCDS47 VCIDGINHYTCDCKSGFFGTHCETNANDCLSNPCLH-GRCTELINEYPCSCDADGTSTQC 1020 1030 1040 1050 1060 1070 830 840 850 860 870 880 pF1KE3 EVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQN .. . :. :: : : :..: ..:.:.:: :. : :: .:..:. CCDS47 KIKINDCTSIPCMNEGFCQKSA--HGFTCICPRGYTGAYCEKSIDNCA------------ 1080 1090 1100 1110 1120 890 900 910 920 930 940 pF1KE3 THGGYRCHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAF-CDCLPGFRGTFCEED : .... : ::: :.:: . .: : ::::: : ::: . CCDS47 ------------------EPELNSV---ICLNGGICVDGPGHTFDCRCLPGFSGQFCEIN 1130 1140 1150 1160 950 960 970 980 990 1000 pF1KE3 INECASDPCRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSF ::::.:.:: .::.: : ...:.: : :.:: ::::. .: .:: . :... . CCDS47 INECSSSPCLHGADCEDHINGYVCKCQPGWSGHHCENEL-ECIPNSCVHE-LCMENEPGS 1170 1180 1190 1200 1210 1010 1020 1030 1040 1050 pF1KE3 TCLCPPGFTGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCP----------QGYTGPN :::: ::: . : : : : : : : :: : CCDS47 TCLCTPGF--------------MTCSIGLLCGDEIRRITCLTPIFQRTDPISTQTYTIPP 1220 1230 1240 1250 1260 1060 1070 1080 1090 1100 1110 pF1KE3 CQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARL ..:: CCDS47 SETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIVKHDILPTTGLATLRISTPLESYLLQ 1270 1280 1290 1300 1310 1320 >>CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165 aa) initn: 998 init1: 998 opt: 1663 Z-score: 714.0 bits: 146.6 E(32554): 1.9e-33 Smith-Waterman score: 2016; 34.9% identity (56.2% similar) in 875 aa overlap (231-1060:467-1270) 210 220 230 240 250 pF1KE3 SYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTG---QNCEEN : :. : . : . ::.: ..:. CCDS78 IPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVWQLGFAGSEGEKCQGV 440 450 460 470 480 490 260 270 280 290 300 310 pF1KE3 IDD--CPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHNT :: . :: . .. :. . : : : . :... : :: .: . CCDS78 IDAYFFLAANCTEDATYVNDPEDNNSSC---WFPHEGTKEI---------CANGCSCLSE 500 510 520 530 540 320 330 340 350 360 370 pF1KE3 HGG--YNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCECPHGRTGLLCHLN . . : .: :.:. :: : : : :.:.:.. : : . : :: .: CCDS78 EDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPRCSCSLSYIGRLCVVN 550 560 570 580 590 600 380 390 400 410 420 pF1KE3 -DACISNPC-NEGSNCDTNPVNGKAICTCPSG---YTGPACSQDVDECSLGANPCEHAGK : :..: . . : . : :.: :: : : :...:. . :... CCDS78 VDYCLGNHSISVHGLCLALSHN----CNC-SGLQRYERNICEIDTEDCK--SASCKNGTT 610 620 630 640 650 430 440 450 460 470 pF1KE3 CINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGE--------------F . : : .:. :. : .::::..::.:.::.: :::.:: :. : CCDS78 STHLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQPGNYFCQCVPPFKVVDGF 660 670 680 690 700 710 480 490 500 510 520 530 pF1KE3 QCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECAS .:.: ::: :..:: . :.: . : ::. : : .:: : . . :..:. . .:: CCDS78 SCLCNPGYVGIRCEQDIDDCILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKM 720 730 740 750 760 770 540 550 560 570 580 590 pF1KE3 TPCKNGAKCLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGS-CKDGV--ATFTCLC .::::.. : : ..: : :: :.:: .: .:.::: ::: :. :.... . :.::: CCDS78 NPCKNNSTCTDLYKSYRCECTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLC 780 790 800 810 820 830 600 610 620 630 640 pF1KE3 RPGYTGHHCETNINECS--SQPCRHGGTCQDR-DNAYLCFCLKGTTGPNCEINLDDCASS : :::. :. : :. .:::...:: : :.: . : ::::.. :: CCDS78 PPLYTGQFCHQRYNLCDLLHNPCRNNSTCLALVDANQHCICREEFEGKNCEIDVKDCLFL 840 850 860 870 880 890 650 660 670 680 690 700 pF1KE3 PC-DSGTCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEG : : : : : .....: :.::..::.:.:.:.::...::.:.::: : : : : : CCDS78 SCQDYGDCEDMVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRFFCNCEPE 900 910 920 930 940 950 710 720 730 740 750 760 pF1KE3 YHDPTCLSEVNECNSNPCV-HGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGG :: : : .::.:. .::. . : .::.: : ::..: ::.:: .:: :.::.. : CCDS78 YHGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINLDECLSEPCLHDG 960 970 980 990 1000 1010 770 780 790 800 810 820 pF1KE3 TCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATC .: : . :.: :. :: : .:.:: :.: :::::. : : . . : :.: :.. : CCDS78 VCIDGINHYTCDCKSGFFGTHCETNANDCLSNPCLH-GRCTELINEYPCSCDADGTSTQC 1020 1030 1040 1050 1060 1070 830 840 850 860 870 880 pF1KE3 EVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQN .. . :. :: : : :..: ..:.:.:: :. : :: .:..:. CCDS78 KIKINDCTSIPCMNEGFCQKSA--HGFTCICPRGYTGAYCEKSIDNCA------------ 1080 1090 1100 1110 1120 890 900 910 920 930 940 pF1KE3 THGGYRCHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAF-CDCLPGFRGTFCEED : .... : ::: :.:: . .: : ::::: : ::: . CCDS78 ------------------EPELNSV---ICLNGGICVDGPGHTFDCRCLPGFSGQFCEIN 1130 1140 1150 1160 950 960 970 980 990 1000 pF1KE3 INECASDPCRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSF ::::.:.:: .::.: : ...:.: : :.:: ::::. .: .:: . :... . CCDS78 INECSSSPCLHGADCEDHINGYVCKCQPGWSGHHCENEL-ECIPNSCVHE-LCMENEPGS 1170 1180 1190 1200 1210 1010 1020 1030 1040 1050 pF1KE3 TCLCPPGFTGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCP----------QGYTGPN :::: ::: . : : : : : : : :: : CCDS78 TCLCTPGF--------------MTCSIGLLCGDEIRRITCLTPIFQRTDPISTQTYTIPP 1220 1230 1240 1250 1260 1060 1070 1080 1090 1100 1110 pF1KE3 CQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARL ..:: CCDS78 SETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIVKHDILPTTGLATLRISTPLESYLLQ 1270 1280 1290 1300 1310 1320 >>CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218 aa) initn: 2254 init1: 765 opt: 1509 Z-score: 654.3 bits: 134.2 E(32554): 4e-30 Smith-Waterman score: 2103; 35.6% identity (59.1% similar) in 824 aa overlap (399-1208:186-949) 370 380 390 400 410 420 pF1KE3 LCHLNDACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQ---DVDECSLGANPCEH :: . : : .:.. :. .: :.. CCDS13 SHSGMINPSRQWQTLKQNTGVAHFEYQIRVTCDDYYYGFGCNKFCRPRDDF-FGHYACDQ 160 170 180 190 200 210 430 440 450 460 470 480 pF1KE3 AGKCINTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGV :. :..:. ::.:. . : .. . ..: :. : :. :..:. CCDS13 NGNKT---------CMEGWMGPECNRAI--CRQGCSPKHGSC-KLPGD--CRCQYGWQGL 220 230 240 250 260 490 500 510 520 530 540 pF1KE3 HCEVNTDECASSP-CLHNGRCLDKINE-FQCECPTGFTGHLCQYDVDECAS-TPCKNGAK .: :.: : :.: : : :: .:: : :.. :.::. :.. :.. :: ::. CCDS13 YC----DKCIPHPGCVH-GIC----NEPWQCLCETNWGGQLCDKDLNYCGTHQPCLNGGT 270 280 290 300 310 550 560 570 580 590 600 pF1KE3 CLD-GPNTYTCVCTEGYTGTHCEVDIDECDPDPCH-YGSCKDGVATFTCLCRPGYTGHHC : . ::. : : : :::.: .::. : :::: ::::. : : : ::.:: : CCDS13 CSNTGPDKYQCSCPEGYSGPNCEIAEHACLSDPCHNRGSCKETSLGFECECSPGWTGPTC 320 330 340 350 360 370 610 620 630 640 650 pF1KE3 ETNINECSSQPCRHGGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPC-DSGTCLDKI :::..:: . : ::::::: :.. : : :: .:... ..: ..:: .. .: . : CCDS13 STNIDDCSPNNCSHGGTCQDLVNGFKCVCPPQWTGKTCQLDANECEAKPCVNAKSCKNLI 380 390 400 410 420 430 660 670 680 690 700 710 pF1KE3 DGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNE .: : : ::. :. :.:::..: :. :.: ..:.: .::. : :: :: : ...: CCDS13 ASYYCDCLPGWMGQNCDININDCLGQ-CQNDASCRDLVNGYRCICPPGYAGDHCERDIDE 440 450 460 470 480 490 720 730 740 750 760 770 pF1KE3 CNSNPCVHGA-CRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMTSGYVCT : ::::..:. :.. .: ..: : :.::. :... . :: ::: ::. : . .: : : CCDS13 CASNPCLNGGHCQNEINRFQCLCPTGFSGNLCQLDIDYCEPNPCQNGAQCYNRASDYFCK 500 510 520 530 540 550 780 790 800 810 820 830 pF1KE3 CREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPC : : . : ::. ..: ..:: .: .:. . : ... :.: CCDS13 CPEDYEGKNCSHLKDHCRTTPCEVIDSCTVAMASNDTPEGVRYISSNV------CGPH-- 560 570 580 590 600 840 850 860 870 880 890 pF1KE3 RNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRCHCQAG :.:. :.. .:.: : :. : :. .::.: .:::.:..: . ..:.: :. : CCDS13 ---GKCK-SQSGGKFTCDCNKGFTGTYCHENINDCESNPCRNGGTCIDGVNSYKCICSDG 610 620 630 640 650 900 910 920 930 940 950 pF1KE3 YSGRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGA . : :::.:.:: :::::::.: : .: .::: :..: :. ..: : ::. CCDS13 WEGAYCETNINDCSQNPCHNGGTCRDLVNDFYCDCKNGWKGKTCHSRDSQCDEATCNNGG 660 670 680 690 700 710 960 970 980 990 1000 1010 pF1KE3 NCTDCVDSYTCTCPAGFSGIHCE-NNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSY .: : :.. : ::.:. : :. . .: . : :::::: . .::::.: :. : CCDS13 TCYDEGDAFKCMCPGGWEGTTCNIARNSSCLPNPCHNGGTCVVNGESFTCVCKEGWEGPI 720 730 740 750 760 770 1020 1030 1040 1050 1060 1070 pF1KE3 CQHDVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQT : ...:.:. .:: ..::: :: . ::: : :..::.:. .. :.:::: :. : . CCDS13 CAQNTNDCSPHPCYNSGTCVDGDNWYRCECAPGFAGPDCRININECQSSPCAFGATCVDE 780 790 800 810 820 830 1080 1090 1100 1110 1120 1130 pF1KE3 HTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGY . ::: :: : .: :. ::.. : . .. . :. : :: :.: : CCDS13 INGYRCVCPPGHSGAKCQ------EVSG-RPCITMGSVIPDGAKWDDDCNT--CQCLNGR 840 850 860 870 880 1140 1150 1160 1170 1180 1190 pF1KE3 TGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGT . : . :.: :: .. .: :: . :.:. ::: . : CCDS13 IA--CSKV--WCGPRPCLLHKGHSECPSGQSCIPILD----------DQCFVHPCTGVGE 890 900 910 920 930 1200 1210 1220 1230 1240 1250 pF1KE3 CLD---LPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCT : . : ::. CCDS13 CRSSSLQPVKTKCTSDSYYQDNCANITFTFNKEMMSPGLTTEHICSELRNLNILKNVSAE 940 950 960 970 980 990 >>CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912 aa) initn: 442 init1: 164 opt: 1494 Z-score: 643.7 bits: 133.5 E(32554): 1.5e-29 Smith-Waterman score: 2333; 30.8% identity (52.4% similar) in 1619 aa overlap (24-1417:1204-2722) 10 20 30 40 50 pF1KE3 MPPLLAPLLCLALLPALAARGPRCSQPGETCLNGGKCEAANGTEACVCGGAF- :: . : :: :: :: : :. .. CCDS34 CVNTEGSFQCDCPLGHELSPSREDCVDINECSLSDNLCRNG-KCVNMIGTYQCSCNPGYQ 1180 1190 1200 1210 1220 1230 60 70 80 90 100 pF1KE3 VGPR---CQDPNPCLSTPCKNAGTCHVVDRRGVADYACSCALGFS----GPLCLTPLDNA . : : : . :. : : . . ..: :::. :.. : : . .:. CCDS34 ATPDRQGCTDIDECMIM----NGGCDTQCTNSEGSYECSCSEGYALMPDGRSC-ADIDE- 1240 1250 1260 1270 1280 110 120 130 140 150 pF1KE3 CLTNP--CRNGGTCDLLTLTEYKCRCPPGWSG----KSCQQADPC--ASNPCANGGQCLP : .:: : .:: : . ::.: : :. . :.: ... : :: : : .: CCDS34 CENNPDIC-DGGQCTNIP-GEYRCLCYDGFMASMDMKTCIDVNECDLNSNICMFG-ECEN 1290 1300 1310 1320 1330 1340 160 170 180 190 200 210 pF1KE3 FEASYICHCPPSF---HGPTCRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRA--THTG ..:.:::: .. .: : ::.:: : ..: : ::..: :: .: CCDS34 TKGSFICHCQLGYSVKKGTTGCTDVDECEIGAHNCDMHASCLNIPGSFKCSCREGWIGNG 1350 1360 1370 1380 1390 1400 220 230 240 250 260 pF1KE3 PNCERPYVPCSPSP--CQNGGTCRPTGDVTHECACLPGFTGQN--CEENIDDCPGNN--C .: :: . :. .. : : ...::: ::::.. : . .:.: : : CCDS34 IKCI-DLDECSNGTHQCSINAQCVNTPG-SYRCACSEGFTGDGFTCSD-VDECAENINLC 1410 1420 1430 1440 1450 1460 270 280 290 300 310 320 pF1KE3 KNGGACVDGVNTYNCRCP----PEWTGQYCTEDVDECQLMPNACQNGGTCHNTHGGYNCV .:: :.. ..: :.: : .. : .:.:::... : : : ::.: : ..:. CCDS34 ENG-QCLNVPGAYRCECEMGFTPASDSRSC-QDIDECSFQ-NICVFG-TCNNLPGMFHCI 1470 1480 1490 1500 1510 330 340 350 360 370 pF1KE3 CVNGW----TGEDCSENIDDCASAA-CFHGATCHDRVASFYCECPH----GRTGLLCHLN : .:. :: .:.. ::.::. : .: : . . . :.:: . ::. : : CCDS34 CDDGYELDRTGGNCTD-IDECADPINCVNG-LCVNTPGRYECNCPPDFQLNPTGVGCVDN 1520 1530 1540 1550 1560 1570 380 390 400 pF1KE3 DA--CI---------SNPCNE-------------------GSNCDTNP-VNGKAICT-CP . : : :: :. :.: : ::. : :: CCDS34 RVGNCYLKFGPRGDGSLSCNTEIGVGVSRSSCCCSLGKAWGNPCETCPPVNSTEYYTLCP 1580 1590 1600 1610 1620 1630 410 420 430 440 450 pF1KE3 SG---YTGPACS--QDVDECSLGANPCEHAGKCINTLGSFECQCLQGY---TGPR-CEID .: .: .:.:::. . :. .:.::::.:::.:.: ::: : :: : CCDS34 GGEGFRPNPITIILEDIDECQELPGLCQ-GGNCINTFGSFQCECPQGYYLSEDTRICE-D 1640 1650 1660 1670 1680 1690 460 470 480 490 500 510 pF1KE3 VNECVSNP--CQNDATCLDQIGEFQCICMPGYEGVHCEVNTDECASSPCLHNGRCLDKIN ..:: ..: : . .:: . .:.. ::: : : :. : : . .... : . : CCDS34 IDECFAHPGVC-GPGTCYNTLGNYTCICPPEYMQVNGGHN---CMD---MRKSFCYRSYN 1700 1710 1720 1730 1740 520 530 540 550 560 pF1KE3 EFQCEC--PTGFTGHLC--QYDVDECASTPCKNGAKC-LDGPNTYTCVCTE--GYT---G :: : . : ..: :.: . . ::. : : . .: . :.: CCDS34 GTTCENELPFNVTKRMCCCTYNVGKAWNKPCE---PCPTPGTADFKTICGNIPGFTFDIH 1750 1760 1770 1780 1790 1800 570 580 590 600 610 pF1KE3 THCEVDIDECD--PDPCHYGSCKDGVATFTCLCRPGYTGHH----CETNINECSSQP--C : :::::: : : : : . ...: : : :.. . :: .:.:::. : CCDS34 TGKAVDIDECKEIPGICANGVCINQIGSFRCECPTGFSYNDLLLVCE-DIDECSNGDNLC 1810 1820 1830 1840 1850 1860 620 630 640 650 660 pF1KE3 RHGGTCQDRDNAYLCFCLKG-TTGPN--CEINLDDCASSP--CDSGTCLDKIDGYECACE .... : . ..: : : : .:: : .. ..: : :. : :.: .:.: :. CCDS34 QRNADCINSPGSYRCECAAGFKLSPNGAC-VDRNECLEIPNVCSHGLCVDLQGSYQCICH 1870 1880 1890 1900 1910 1920 670 680 690 700 710 720 pF1KE3 PGYTGS----MCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGY---HDPTCLSEVNEC :. .: :: ...::: .:: :: ::.. .....: : :. :. :: ...:: CCDS34 NGFKASQDQTMC-MDVDECERHPCGNG-TCKNTVGSYNCLCYPGFELTHNNDCL-DIDEC 1930 1940 1950 1960 1970 730 740 750 760 770 pF1KE3 NS---NPCVHGACRDSLNGYKCDCDPGW----SGTNCDINNNECESNP--CVNGGTCKDM .: . : .: : . ....:: :. :. .: :: :..::: . : : . :::... CCDS34 SSFFGQVCRNGRCFNEIGSFKCLCNEGYELTPDGKNC-IDTNECVALPGSC-SPGTCQNL 1980 1990 2000 2010 2020 2030 780 790 800 810 820 pF1KE3 TSGYVCTCREGF--SGPNCQTNINECASNP--CLNQGTCIDDVAGYKCNC----LLPYTG ... : : :. .. :: .:::: .: :: :.: . .:..: : .: .: CCDS34 EGSFRCICPPGYEVKSENC-IDINECDEDPNICLF-GSCTNTPGGFQCLCPPGFVLSDNG 2040 2050 2060 2070 2080 2090 830 840 850 860 pF1KE3 ATC-EVVLAPCAPSPCRNGGECRQSEDYESFS--CVC---P-TGWQGQTCEV-------- : .. . : . ..:.: . ... . : : : :: :. ::. CCDS34 RRCFDTRQSFCFTN--FENGKCSVPKAFNTTKAKCCCSKMPGEGW-GDPCELCPKDDEVA 2100 2110 2120 2130 2140 2150 870 880 890 900 pF1KE3 --------------------DINECVLSP--CRHGASCQNTHGGYRCHCQAGY----SGR :.:::. :: : .: .: :: :..::.: :: .: CCDS34 FQDLCPYGHGTVPSLHDTREDVNECLESPGICSNG-QCINTDGSFRCECPMGYNLDYTGV 2160 2170 2180 2190 2200 910 920 930 940 950 pF1KE3 NCETDIDDCR-PNPCHNGGSCTDGINTAFCDCLPGFR-GTF--CEEDINECASDPCRNGA : .: :.: ::: :: .::. :.. :.: ::. : . :: ::::::..: . CCDS34 RC-VDTDECSIGNPCGNG-TCTNVIGSFECNCNEGFEPGPMMNCE-DINECAQNPLLCAF 2210 2220 2230 2240 2250 2260 960 970 980 990 1000 1010 pF1KE3 NCTDCVDSYTCTCPAGFS----GIHCENNTPDCTES--SCFNGGT-CVDGINSFTCLCPP : . :: :::: :.. :.. .:.:. .: . : : . :..: :.::: CCDS34 RCMNTFGSYECTCPIGYALREDQKMCKD-LDECAEGLHDCESRGMMCKNLIGTFMCICPP 2270 2280 2290 2300 2310 2320 1020 1030 1040 1050 1060 pF1KE3 GFT----GSYCQHDVNECDSQP--CLHGGTCQDGCGSYRCTCPQGY----TGPNC-QNLV :.. : : : ::: ..: : ..: : . ::::: : .:. .: .: .: CCDS34 GMARRPDGEGCV-DENECRTKPGIC-ENGRCVNIIGSYRCECNEGFQSSSSGTECLDNRQ 2330 2340 2350 2360 2370 2380 1070 1080 1090 1100 1110 pF1KE3 HWCDS----SPCKNGGKCWQTHTQYRCECPSG--WTGLYCDVPSVSCEVAAQRQGVDVAR : . . :. ... . :. .: : .: : : :.. : . . : . CCDS34 GLCFAEVLQTICQMASSSRNLVTKSECCCDGGRGW-GHQCEL----CPLPGTAQ---YKK 2390 2400 2410 2420 2430 1120 1130 1140 1150 1160 1170 pF1KE3 LCQHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECS--PSPCQNGATCTDYLGGYSCKCV .: :: ::: . .: .:::. :. : :: : . .:.. : : CCDS34 ICPHG---------------PGYT-TDGRD-IDECKVMPNLCTNGQ-CINTMGSFRCFCK 2440 2450 2460 2470 1180 1190 1200 1210 1220 pF1KE3 AGY----HGVNCSEEIDECLSHPCQNGGTCLDLPNTYKCSCPRG----TQGVHCEINVDD .:: :..: . .::: . : . : . ..:.:::::: .: :. ..:. CCDS34 VGYTTDISGTSCID-LDECSQSPKPCNYICKNTEGSYQCSCPRGYVLQEDGKTCK-DLDE 2480 2490 2500 2510 2520 2530 1230 1240 1250 1260 1270 1280 pF1KE3 CNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFVGER--CEGDVNECLSNP--CDARG :. ... .: . ::. .::..: :::::. .. : : ::: :.: : :.: CCDS34 CQ------TKQHNC--QFLCVNTLGGFTCKCPPGFTQHHTACI-DNNECGSQPSLCGAKG 2540 2550 2560 2570 2580 1290 1300 1310 1320 1330 pF1KE3 TQNCVQRVNDFHCECRAGH----TGRRCESVINGCKGKP-CKNGGTCAVASNTARGFICK : . ..: :::. : :: ::.: . : :. :..: : .: :. : CCDS34 I--CQNTPGSFSCECQRGFSLDATGLNCEDV-DECDGNHRCQHG--C---QNILGGYRCG 2590 2600 2610 2620 2630 1340 1350 1360 1370 1380 1390 pF1KE3 CPAGF----EGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTGPECQFPASSPC :: :. . : : :.. ....: . : : : . :. :: :: : CCDS34 CPQGYIQHYQWNQCV-DENECSNPNACGSASCYNTLGSYKCACPSGFSFD--QF--SSAC 2640 2650 2660 2670 2680 2690 1400 1410 1420 1430 1440 pF1KE3 LGGNPCYN-QGTCEP--TSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDIPPPLIEEA : : . .. :. .. : : :: CCDS34 HDVNECSSSKNPCNYGCSNTEGGYLCGCPPGYYRVGQGHCVSGMGFNKGQYLSLDTEVDE 2700 2710 2720 2730 2740 2750 >-- initn: 327 init1: 164 opt: 1446 Z-score: 623.7 bits: 129.8 E(32554): 2e-28 Smith-Waterman score: 1539; 29.4% identity (50.6% similar) in 1174 aa overlap (61-1088:108-1188) 40 50 60 70 80 90 pF1KE3 CLNGGKCEAANGTEACVCGGAFVGPRCQDPNPCLSTPCKNAGTCHVVDRRGVADYACSCA : :. :.: .: : :.:. CCDS34 GQQDVLRGPNVCGSRFHSYCCPGWKTLPGGNQCIVPICRN--SCG--DGFCSRPNMCTCS 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE3 LGFSGPLCLTPLDNACLTNPCRNGGTCDLLTLTEYKCRCPPGWSGKSCQQADPCASNPCA : . : . . : . : ::::: .. .:.: :. : : : : : : CCDS34 SGQISSTCGSKSIQQC-SVRCMNGGTC-----ADDHCQCQKGYIGTYCGQ--PVCENGCQ 140 150 160 170 180 160 170 180 190 200 pF1KE3 NGGQCLPFEASYICHCPPSFHGPTCRQDVNECGQKPGLCR---HGGTCHNEVGSYRC--- :::.:. . : : .: :: :..: . : : .. :.... . : CCDS34 NGGRCI---GPNRCACVYGFTGPQCERDY-----RTGPCFTQVNNQMCQGQLTGIVCTKT 190 200 210 220 230 210 220 230 240 250 260 pF1KE3 VCRAT---HTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTGQNCEENIDDC .: :: : :: . : .:.::. : .:.. :.. .:.: CCDS34 LCCATIGRAWGHPCE--MCPAQPQPCRRG--------------FIPNIRTGACQD-VDEC 240 250 260 270 280 270 280 290 300 310 pF1KE3 ---PGNNCKNGGACVDGVNTYNCRCPP----EWTGQYCTEDVDECQLMPNACQNGGTCHN :: :. :: :.. :....:::: : : : ::.:::...:. :..: : : CCDS34 QAIPGI-CQ-GGNCINTVGSFECRCPAGHKQSETTQKC-EDIDECSIIPGICETG-ECSN 290 300 310 320 330 320 330 340 350 360 pF1KE3 THGGYNCVCVNGW-TGEDCSENIDDCASAACFHG---ATCHD----RVASFYCECPHGRT : :.: ::: :. :. : :. ::. .. :: : . : . :.... : : :: CCDS34 TVGSYFCVCPRGYVTSTDGSRCIDQ-RTGMCFSGLVNGRCAQELPGRMTKMQCCCEPGRC 340 350 360 370 380 390 370 380 390 400 pF1KE3 GLLCHLNDACI-------------------------SNPCNEGSNCDTNPVNGKAICTCP . . .:: : : . :.: . ::.. CCDS34 WGIGTIPEACPVRGSEEYRRLCMDGLPMGGIPGSAGSRPGGTGGNGFAPSGNGNGYGPGG 400 410 420 430 440 450 410 420 430 pF1KE3 SGYT----------------------GPACS------QDVDECSLGANPCEHAGKCINTL .:. :: . : .: :. :: : . :.:: :. CCDS34 TGFIPIPGGNGFSPGVGGAGVGAGGQGPIITGLTILNQTIDICKHHANLCLN-GRCIPTV 460 470 480 490 500 510 440 450 460 470 480 pF1KE3 GSFECQCLQGY---TGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGVHCE-- .:..:.: .:: .. : :::.::.:::: : . :.. : . : : :.. . . CCDS34 SSYRCECNMGYKQDANGDC-IDVDECTSNPCTN-GDCVNTPGSYYCKCHAGFQRTPTKQA 520 530 540 550 560 570 490 500 510 520 530 540 pF1KE3 -VNTDECASSPCL-HNGRCLDKINEFQCECPTGFT----GHLCQYDVDECASTP-CKNGA .. ::: .. : .::::.. . ::: : .:: :. : : :::..: : :: CCDS34 CIDIDECIQNGVLCKNGRCVNTDGSFQCICNAGFELTTDGKNC-VDHDECTTTNMCLNGM 580 590 600 610 620 630 550 560 570 580 590 pF1KE3 KCLDGPNTYTCVCTEGYT----GTHCEVDIDECD-PDPCHYGSCKDGVATFTCLCRPGYT :.. ... :.: :.. : .: .:.:::. : : : : .. ..: : : :: . CCDS34 -CINEDGSFKCICKPGFVLAPNGRYC-TDVDECQTPGICMNGHCINSEGSFRCDCPPGLA 640 650 660 670 680 600 610 620 630 640 650 pF1KE3 -GHHCETNINECSSQPCRHG---GTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDS : .. .. . : : :.: : : : . : : : . ::. CCDS34 VGMDGRVCVDTHMRSTCYGGIKKGVCV-RP-----FPGAVTKSECCCANPDYGFGEPCQP 690 700 710 720 730 740 660 670 680 690 700 pF1KE3 GTCLDKIDG-YECACEPGYTGSMCNINIDECAGNP--CHNGGTCEDGINGFTCRCPEGYH : : .. .. : : .. . .:.::: .: : :: ::. ... : : ::. CCDS34 --CPAKNSAEFHGLCSSGVGITVDGRDINECALDPDICANG-ICENLRGSYRCNCNSGYE 750 760 770 780 790 800 710 720 730 740 750 pF1KE3 -DPT---CLSEVNECNSNP--CVHGACRDSLNGYKCDCDPGW----SGTNCDINNNECES : . :. ...:: : : .: ::.. ..:.: : ::. .:. . ::::: CCDS34 PDASGRNCI-DIDECLVNRLLCDNGLCRNTPGSYSCTCPPGYVFRTETETCE-DINECES 810 820 830 840 850 760 770 780 790 800 810 pF1KE3 NPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLL ::::::. :.. ... : : : . .:.. : .. .::: .. .:. . CCDS34 NPCVNGA-CRNNLGSFNCECSPG--SKLSSTGLI-CIDSL---KGTCWLNIQDSRCE--V 860 870 880 890 900 820 830 840 850 860 870 pF1KE3 PYTGATCEVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGW---QGQTCEVDINECVLS .::: . :: :. :.. : .. .:: : .: ::: :.::: . CCDS34 NINGATLKS--ECCATLGAAWGSPCERCE----LDTACPRGLARIKGVTCE-DVNECEVF 910 920 930 940 950 960 880 890 900 910 920 930 pF1KE3 P--CRHGASCQNTHGGYRCHCQAGYS----GRNCETDIDDCRPNPCHNGGSCTDGINTAF : : .: : :..:...:.: : . :: : : : . :. . . :. CCDS34 PGVCPNG-RCVNSKGSFHCECPEGLTLDGTGRVCL----DIRMEQCYLKWDEDECIHP-- 970 980 990 1000 1010 940 950 960 970 980 pF1KE3 CDCLPG-FRGTFCEEDINECASDPCRNGANCTDC----VDSYTCTCP--AGFSGI-HCEN .:: :: : : . :..: .: . : :: :::.. . CCDS34 ---VPGKFRMDAC------CCAVGAAWGTECEECPKPGTKEYETLCPRGAGFANRGDVLT 1020 1030 1040 1050 1060 990 1000 1010 1020 1030 pF1KE3 NTP---DCTESSCFNG----GTCVDGINSFTCLCPPGFTGSYCQH---DVNECDSQPCLH . : : .: . : : : : . :.:: : : ::. .. .. :..:: .: : CCDS34 GRPFYKDINECKAFPGMCTYGKCRNTIGSFKCRCNSGFALDMEERNCTDIDECRISPDLC 1070 1080 1090 1100 1110 1120 1040 1050 1060 1070 1080 pF1KE3 G-GTCQDGCGSYRCTCPQGY-TG----PNCQNLVHWCDSSP--CKNGGKCWQTHTQYRCE : : : . ::..: : .:: .: ::.. . :. .: :. :: : .:. ...:. CCDS34 GSGICVNTPGSFECECFEGYESGFMMMKNCMD-IDECERNPLLCR-GGTCVNTEGSFQCD 1130 1140 1150 1160 1170 1180 1090 1100 1110 1120 1130 1140 pF1KE3 CPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGSYCED :: : CCDS34 CPLGHELSPSREDCVDINECSLSDNLCRNGKCVNMIGTYQCSCNPGYQATPDRQGCTDID 1190 1200 1210 1220 1230 1240 >>CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200 aa) initn: 1095 init1: 658 opt: 1259 Z-score: 549.8 bits: 114.9 E(32554): 2.6e-24 Smith-Waterman score: 1921; 33.0% identity (55.5% similar) in 904 aa overlap (179-1064:172-977) 150 160 170 180 190 200 pF1KE3 CANGGQCLPFEASYICHCPPSFHGPTCRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRA .: . .: : . : :. . : : CCDS99 FTLIVEAWDWDNDTTPNEELLIERVSHAGMINPEDRWKSLHFSGHVAHLEL-QIRVRCDE 150 160 170 180 190 200 210 220 230 240 250 260 pF1KE3 THTGPNCERPYVPCSPSPCQNGG-TCRPTGDVTHECACLPGFTGQNCEENIDDCP-GNNC .. . .:.. : : : :: :. ::. :. :..:.: . : : : CCDS99 NYYSATCNKF---CRPRNDFFGHYTCDQYGNK----ACMDGWMGKECKEAV--CKQGCNL 210 220 230 240 250 270 280 290 300 310 320 pF1KE3 KNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHNTHGGYNCVCVNG .:: : : .::: : :..: ::: .:. : .: .: . ..: : .. CCDS99 LHGGCTVPG----ECRCSYGWQGRFC----DECVPYPG-CVHG-SCVEP---WQCNCETN 260 270 280 290 330 340 350 360 370 380 pF1KE3 WTGEDCSENIDDCASA-ACFHGATC-HDRVASFYCECPHGRTGLLCHLND-ACISNPCNE : : :..... :.: : .:.:: . . .. : :: : .: :. . :: :::: . CCDS99 WGGLLCDKDLNYCGSHHPCTNGGTCINAEPDQYRCTCPDGYSGRNCEKAEHACTSNPCAN 300 310 320 330 340 350 390 400 410 420 430 440 pF1KE3 GSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGANPCEHAGKCINTLGSFECQCLQG :..: : . . : ::::..::.:. :.:::. .::: .: :.. . .::: : . CCDS99 GGSCHEVPSGFE--CHCPSGWSGPTCALDIDECA--SNPCAAGGTCVDQVDGFECICPEQ 360 370 380 390 400 410 450 460 470 480 490 500 pF1KE3 YTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGVHCEVNTDECASSPCLHNG ..: :..:::.: . ::. .:: : .. .::.: :. : :::.. :::::::: .: CCDS99 WVGATCQLDVNDC-RGQCQHGGTCKDLVNGYQCVCPRGFGGRHCELERDECASSPCHSGG 420 430 440 450 460 470 510 520 530 540 550 560 pF1KE3 RCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNGAKCLDGPNTYTCVCTEGYTGTHC : : . :.:.:: ::.: ::. ::: : .::.:::.: . . : :.: . . : .: CCDS99 LCEDLADGFHCHCPQGFSGPLCEVDVDLCEPSPCRNGARCYNLEGDYYCACPDDFGGKNC 480 490 500 510 520 530 570 580 590 600 610 620 pF1KE3 EVDIDECDP-DPCHYGSCK--DGVATFTCLCRPGYTGHHCETNINECSSQPCRHGGTCQD : : .:: :.:. :: .. . :: .. ..: ::: ::. CCDS99 SV------PREPCPGGACRVIDGCGSDAGPGMPGTAASGVCGPHGRCVSQP---GGN--- 540 550 560 570 580 630 640 650 660 670 pF1KE3 RDNAYLCFCLKGTTGPNCEINLDDCASSPC-DSGTCLDKIDGYECACEPGYTGSMCNINI . :.: .: :: :. :.::: ..:: ..:::.:..:...: : :. : .:. : CCDS99 ----FSCICDSGFTGTYCHENIDDCLGQPCRNGGTCIDEVDAFRCFCPSGWEGELCDTNP 590 600 610 620 630 680 690 700 710 720 730 pF1KE3 DECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNECNSNPCVHGA-CRDSLNGYK ..: .:::. : : : .: : : : .:.. :: :. .:.. : .:. : :: . .. CCDS99 NDCLPDPCHSRGRCYDLVNDFYCACDDGWKGKTCHSREFQCDAYTCSNGGTCYDSGDTFR 640 650 660 670 680 690 740 750 760 770 780 790 pF1KE3 CDCDPGWSGTNCDI-NNNECESNPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNINECAS : : :::.:..: . .:. : ::::::::: ... : ::.:. : .: : :.: CCDS99 CACPPGWKGSTCAVAKNSSCLPNPCVNGGTCVGSGASFSCICRDGWEGRTCTHNTNDCNP 700 710 720 730 740 750 800 810 820 830 840 850 pF1KE3 NPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRNGGECRQSEDYESFSCVC :: : : :.: : ..:.: :: CCDS99 LPCYNGGICVDGVNWFRCEC----------------AP---------------------- 760 770 860 870 880 890 900 910 pF1KE3 PTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYRCHCQAGYSGRNCETDID---DC--R :. : :...:.:: ::: .::.: . .:::: : : .: :. : .: : CCDS99 --GFAGPDCRINIDECQSSPCAYGATCVDEINGYRCSCPPGRAGPRCQEVIGFGRSCWSR 780 790 800 810 820 830 920 930 940 950 960 970 pF1KE3 PNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANCTDCVDSYTCTCP .: .:.: .. :. : :: : : : . :. :: ... .. . :: CCDS99 GTPFPHGSSWVEDCNS--CRCLDGRRD--CSK--VWCGWKPCLLAGQ----PEALSAQCP 840 850 860 870 880 980 990 1000 1010 1020 1030 pF1KE3 AGFSGIHCENNTP-DCTESSCFNGGTC-VDGINSFTCLCPPGFTGSYCQHDVNECDSQPC : .: ...: .: . : : : .. : :: : . : . . . . . CCDS99 LG---QRCLEKAPGQCLRPPCEAWGECGAEEPPSTPCLPRSGHLDNNCARLTLHFNRDHV 890 900 910 920 930 940 1040 1050 1060 1070 1080 1090 pF1KE3 LHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWT .: : :.. : . : . . :: :: CCDS99 PQGTTVGAICSGIR-SLPATRAVARDRLLVLLCDRASSGASAVEVAVSFSPARDLPDSSL 950 960 970 980 990 1000 1100 1110 1120 1130 1140 1150 pF1KE3 GLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECS CCDS99 IQGAAHAIVAAITQRGNSSLLLAVTEVKVETVVTGGSSTGLLVPVLCGAFSVLWLACVVL 1010 1020 1030 1040 1050 1060 >>CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238 aa) initn: 1435 init1: 768 opt: 1247 Z-score: 544.6 bits: 114.0 E(32554): 5.1e-24 Smith-Waterman score: 2047; 35.4% identity (57.6% similar) in 891 aa overlap (510-1366:208-1044) 480 490 500 510 520 530 pF1KE3 PGYEGVHCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHL-C-QYD----VD--- :.: :. . : :: : :: .: CCDS99 WKSLHFSGHVAHLELQIRVRCDENYYSATCNKF-CRPRNDFFGHYTCDQYGNKACMDGWM 180 190 200 210 220 230 540 550 560 570 580 pF1KE3 --ECASTPCKNGAKCLDGPNTYT--CVCTEGYTGTHCEVDIDECDPDP-CHYGSCKDGVA :: . ::.: . : : : : :. :. : : ::: : : : .::: : CCDS99 GKECKEAVCKQGCNLLHGGCTVPGECRCSYGWQGRFC----DECVPYPGCVHGSC---VE 240 250 260 270 280 590 600 610 620 630 640 pF1KE3 TFTCLCRPGYTGHHCETNINECSSQ-PCRHGGTCQDRD-NAYLCFCLKGTTGPNCEINLD . : :. .. : :. ..: :.:. :: .:::: . . . : : : : .: ::: CCDS99 PWQCNCETNWGGLLCDKDLNYCGSHHPCTNGGTCINAEPDQYRCTCPDGYSGRNCEKAEH 290 300 310 320 330 340 650 660 670 680 690 700 pF1KE3 DCASSPC-DSGTCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTC :.:.:: ..:.: . .:.:: : :..: : ..:::::.::: :::: : ..:: : CCDS99 ACTSNPCANGGSCHEVPSGFECHCPSGWSGPTCALDIDECASNPCAAGGTCVDQVDGFEC 350 360 370 380 390 400 710 720 730 740 750 760 pF1KE3 RCPEGYHDPTCLSEVNECNSNPCVHG-ACRDSLNGYKCDCDPGWSGTNCDINNNECESNP ::: . :: ..:::...::... .:.. ..:: ::: :::.: :: :: :.:... CCDS99 ICPEQWVGATCQLDANECEGKPCLNAFSCKNLIGGYYCDCIPGWKGINCHINVNDCRGQ- 410 420 430 440 450 460 770 780 790 800 810 820 pF1KE3 CVNGGTCKDMTSGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPY : .::::::...:: :.: .::.: .:. . .::::.:: . : : : . :..:.: . CCDS99 CQHGGTCKDLVNGYQCVCPRGFGGRHCELERDECASSPCHSGGLCEDLADGFHCHCPQGF 470 480 490 500 510 520 830 840 850 860 870 880 pF1KE3 TGATCEVVLAPCAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHG .: ::: . : :::::::..: . : .. :.:: . :..: : . :: : CCDS99 SGPLCEVDVDLCEPSPCRNGARCYNLEG--DYYCACPDDFGGKNCSVPRE-----PCPGG 530 540 550 560 570 580 890 900 910 920 930 940 pF1KE3 ASCQNTHGGYRCHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAF-CDCLPGFRGT : :. : : .:: : . : :. : :.. . : : : :: :: CCDS99 A-CRVIDG---CGSDAG-PGMPGTAASGVCGPH-----GRCVSQPGGNFSCICDSGFTGT 590 600 610 620 630 950 960 970 980 990 1000 pF1KE3 FCEEDINECASDPCRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVD .:.:.:..: ..:::::..: : ::.. : ::.:. : :..: :: . : . : : : CCDS99 YCHENIDDCLGQPCRNGGTCIDEVDAFRCFCPSGWEGELCDTNPNDCLPDPCHSRGRCYD 640 650 660 670 680 690 1010 1020 1030 1040 1050 1060 pF1KE3 GINSFTCLCPPGFTGSYCQHDVNECDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLV .:.: : : :. :. :. .::. : .:::: :. ..::.:: :. : .: CCDS99 LVNDFYCACDDGWKGKTCHSREFQCDAYTCSNGGTCYDSGDTFRCACPPGWKGSTCAVAK 700 710 720 730 740 750 1070 1080 1090 1100 1110 pF1KE3 HW-CDSSPCKNGGKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHG . : .:: ::: : . ... : : .:: : : . .:. : .: CCDS99 NSSCLPNPCVNGGTCVGSGASFSCICRDGWEGRTCTHNTNDCNPLP----------CYNG 760 770 780 790 800 1120 1130 1140 1150 1160 1170 pF1KE3 GLCVDAGNTHHCRCQAGYTGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVN :.:::. : .:.: :..: :. .:::. ::: ::::.: ..:: :.: : : CCDS99 GICVDGVNWFRCECAPGFAGPDCRINIDECQSSPCAYGATCVDEINGYRCSCPPGRAGPR 810 820 830 840 850 860 1180 1190 1200 1210 1220 1230 pF1KE3 CSEEIDECLSHPCQNGGTCLDLPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCF :.: : ... : . :: . ... .: .. .: . ::. . .: :. CCDS99 CQEVIG--FGRSCWSRGTPFPHGSSWVEDC----NSCRCLDGRRDCSKVW--CGWKP-CL 870 880 890 900 910 1240 1250 1260 1270 1280 1290 pF1KE3 NNGTCVDQVGGYSCTCPPGFVGERC-EGDVNECLSNPCDARGTQNC-VQRVNDFHCECRA : : . : :: .:.:: : ..:: ::.: : .: ... . : :. CCDS99 LAG----QPEALSAQCP---LGQRCLEKAPGQCLRPPCEAWG--ECGAEEPPSTPCLPRS 920 930 940 950 960 1300 1310 1320 1330 1340 pF1KE3 GHTGRRC---------ESVINGCK-GKPCKNGGTCAVASNTARG--FICKCPAGFEGATC :: : . : .: : :.. . .. .:: .. : . ::. CCDS99 GHLDNNCARLTLHFNRDHVPQGTTVGAICSGIRSLPATRAVARDRLLVLLCDRASSGASA 970 980 990 1000 1010 1020 1350 1360 1370 1380 1390 1400 pF1KE3 ENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTGPECQFPASSPCLGGNPCYNQGTCEP . : . . : : .. :.: CCDS99 VEVAVSFSPARDLPDSSLIQGAAHAIVAAITQRGNSSLLLAVTEVKVETVVTGGSSTGLL 1030 1040 1050 1060 1070 1080 2555 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 17:23:26 2016 done: Tue Nov 8 17:23:28 2016 Total Scan time: 7.150 Total Display time: 1.610 Function used was FASTA [36.3.4 Apr, 2011]