FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9166, 2003 aa 1>>>pF1KB9166 2003 - 2003 aa - 2003 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.6967+/-0.00131; mu= 18.4722+/- 0.079 mean_var=407.6636+/-77.806, 0's: 0 Z-trim(113.6): 321 B-trim: 0 in 0/54 Lambda= 0.063522 statistics sampled from 13916 (14262) to 13916 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.74), E-opt: 0.2 (0.438), width: 16 Scan time: 6.900 The best scores are: opt bits E(32554) CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003) 15277 1416.9 0 CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471) 3248 314.7 2.9e-84 CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555) 2662 261.0 4.4e-68 CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321) 2443 240.9 4.6e-62 CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238) 1536 157.3 3.6e-37 CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200) 1498 153.8 3.9e-36 CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 ( 870) 1372 142.0 1e-32 CCDS1390.1 CRB1 gene_id:23418|Hs108|chr1 (1406) 1307 136.4 7.9e-31 CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144) 1263 133.0 1.9e-29 CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165) 1263 133.0 1.9e-29 CCDS58053.1 CRB1 gene_id:23418|Hs108|chr1 (1382) 1243 130.5 4.5e-29 CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809) 1191 126.3 1.7e-27 CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 1151 122.7 2.3e-26 CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218) 1076 115.1 1.7e-24 CCDS46562.1 SNED1 gene_id:25992|Hs108|chr2 (1413) 975 106.0 1.1e-21 CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 955 104.7 5.7e-21 CCDS33390.1 DNER gene_id:92737|Hs108|chr2 ( 737) 939 102.2 8.1e-21 CCDS53454.1 CRB1 gene_id:23418|Hs108|chr1 (1294) 900 99.1 1.3e-19 CCDS5313.1 DLL1 gene_id:28514|Hs108|chr6 ( 723) 892 97.9 1.6e-19 CCDS75111.1 SLIT2 gene_id:9353|Hs108|chr4 (1521) 868 96.2 1.1e-18 CCDS75110.1 SLIT2 gene_id:9353|Hs108|chr4 (1525) 868 96.2 1.1e-18 CCDS3426.1 SLIT2 gene_id:9353|Hs108|chr4 (1529) 868 96.3 1.1e-18 CCDS48004.1 SVEP1 gene_id:79987|Hs108|chr9 (3571) 821 92.6 3.2e-17 CCDS4369.1 SLIT3 gene_id:6586|Hs108|chr5 (1523) 811 91.0 3.9e-17 CCDS64311.1 SLIT3 gene_id:6586|Hs108|chr5 (1530) 810 90.9 4.2e-17 CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044) 802 89.9 5.8e-17 CCDS9831.1 LTBP2 gene_id:4053|Hs108|chr14 (1821) 755 86.0 1.5e-15 CCDS6852.2 CRB2 gene_id:286204|Hs108|chr9 (1285) 749 85.2 1.9e-15 CCDS4142.1 MEGF10 gene_id:84466|Hs108|chr5 (1140) 745 84.8 2.3e-15 CCDS45232.1 DLL4 gene_id:54567|Hs108|chr15 ( 685) 739 83.8 2.6e-15 CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 745 85.0 2.6e-15 CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 745 85.0 2.7e-15 CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 745 85.0 2.7e-15 CCDS7453.1 SLIT1 gene_id:6585|Hs108|chr10 (1534) 727 83.3 8.2e-15 CCDS78055.1 MEGF10 gene_id:84466|Hs108|chr5 ( 567) 686 78.8 6.8e-14 CCDS12537.1 DLL3 gene_id:10683|Hs108|chr19 ( 587) 681 78.4 9.5e-14 CCDS12538.1 DLL3 gene_id:10683|Hs108|chr19 ( 618) 681 78.4 9.8e-14 CCDS4897.1 DLK2 gene_id:65989|Hs108|chr6 ( 383) 642 74.5 9.2e-13 CCDS54345.1 LTBP1 gene_id:4052|Hs108|chr2 (1342) 616 73.1 8.9e-12 CCDS33178.2 LTBP1 gene_id:4052|Hs108|chr2 (1395) 616 73.1 9.1e-12 CCDS33177.2 LTBP1 gene_id:4052|Hs108|chr2 (1721) 616 73.2 1e-11 CCDS75461.1 DLK2 gene_id:65989|Hs108|chr6 ( 377) 581 68.9 4.4e-11 >>CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003 aa) initn: 15277 init1: 15277 opt: 15277 Z-score: 7584.7 bits: 1416.9 E(32554): 0 Smith-Waterman score: 15277; 99.9% identity (100.0% similar) in 2003 aa overlap (1-2003:1-2003) 10 20 30 40 50 60 pF1KB9 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 TCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLED ::::::::::::::::::::::::::::::::::::::::::::::::::::::::.::: CCDS34 TCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAKLED 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 PCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQIQC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQIQC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 HCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 HCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 RGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 LCPETWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCI :::::::::::::::::::.:::::::::::::::::::::::::::::::::::::::: CCDS34 LCPETWTGWDCSEDVDECETQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 AATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLEDMCLSQPCHGDAQCSTNPLTGSTLCLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLEDMCLSQPCHGDAQCSTNPLTGSTLCLC 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 QPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 SQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 PGFSGTRCEEDIDECRSSPCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PGFSGTRCEEDIDECRSSPCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 GASCLDLPGAFFCLCPSGFTGQLCEVPLCAPNLCQPKQICKDQKDKANCLCPDGSPGCAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GASCLDLPGAFFCLCPSGFTGQLCEVPLCAPNLCQPKQICKDQKDKANCLCPDGSPGCAP 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 PEDNCTCHHGHCQRSSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PEDNCTCHHGHCQRSSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTG 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 YTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 YTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 TCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 CQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 CQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 CHNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 CHNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGY 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 DGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGFVGLRCEGDVDECLDQPCHPTGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGFVGLRCEGDVDECLDQPCHPTGT 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB9 AACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFE 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB9 GPTCSHRAPSCGFHHCHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GPTCSHRAPSCGFHHCHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPC 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB9 LYNGSCSETTGLGGPGFRCSCPHSSPGPRCQKPGAKGCEGRSGDGACDAGCSGPGGNWDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LYNGSCSETTGLGGPGFRCSCPHSSPGPRCQKPGAKGCEGRSGDGACDAGCSGPGGNWDG 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB9 GDCSLGVPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPPACTPAYDQYCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GDCSLGVPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPPACTPAYDQYCH 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB9 DHFHNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DHFHNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLS 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KB9 LTLRVGLWVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGKETDSLSAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LTLRVGLWVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGKETDSLSAG 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KB9 FVVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 FVVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAP 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KB9 PANQLPWPVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRPRTQSAPHRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PANQLPWPVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRPRTQSAPHRR 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KB9 RPPLGEDSIGLKALKPKAEVDEDGVVMCSGPEEGEEVGQAEETGPPSTCQLWSLSGGCGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RPPLGEDSIGLKALKPKAEVDEDGVVMCSGPEEGEEVGQAEETGPPSTCQLWSLSGGCGA 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KB9 LPQAAMLTPPQESEMEAPDLDTRGPDGVTPLMSAVCCGEVQSGTFQGAWLGCPEPWEPLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LPQAAMLTPPQESEMEAPDLDTRGPDGVTPLMSAVCCGEVQSGTFQGAWLGCPEPWEPLL 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KB9 DGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQPDRAGRTPLHAAVAADAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQPDRAGRTPLHAAVAADAR 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KB9 EVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAAQADVGARDKWGKTALHW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAAQADVGARDKWGKTALHW 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KB9 AAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVAQLLLGLGAARELRDQAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVAQLLLGLGAARELRDQAG 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KB9 LAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREAGPFPRARTVSVSVPPHGGGALPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREAGPFPRARTVSVSVPPHGGGALPR 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KB9 CRTLSAGAGPRGGGACLQARTWSVDLAARGGGAYSHCRSLSGVGAGGGPTPRGRRFSAGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 CRTLSAGAGPRGGGACLQARTWSVDLAARGGGAYSHCRSLSGVGAGGGPTPRGRRFSAGM 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KB9 RGPRPNPAIMRGRYGVAAGRGGRVSTDDWPCDWVALGACGSASNIPIPPPCLTPSPERGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RGPRPNPAIMRGRYGVAAGRGGRVSTDDWPCDWVALGACGSASNIPIPPPCLTPSPERGS 1930 1940 1950 1960 1970 1980 1990 2000 pF1KB9 PQLDCGPPALQEMPINQGGEGKK ::::::::::::::::::::::: CCDS34 PQLDCGPPALQEMPINQGGEGKK 1990 2000 >>CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471 aa) initn: 2785 init1: 834 opt: 3248 Z-score: 1626.2 bits: 314.7 E(32554): 2.9e-84 Smith-Waterman score: 5080; 38.4% identity (57.8% similar) in 2079 aa overlap (4-1773:6-2016) 10 20 30 40 50 pF1KB9 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFL :.:: :: : : :.. . ..: : . :::.: : :.. : : :.: ::: CCDS90 MPALRPALLWALLALWLCCAAPA--HALQCRDGYEPCVNEGMCVTYHNGTGYCKCPEGFL 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 GETCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQL :: :: :::.. . :::::.: : : :: . : : ::::: :: . CCDS90 GEYCQHRDPCEKNR-CQNGGTCVA--QAMLGKAT----------CRCASGFTGEDCQYST 60 70 80 90 100 120 130 140 150 160 170 pF1KB9 EDPCPPSF-CSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQ :: : : . : ::. . .:.:. :.::..:: : : ..::.::..: .. : CCDS90 SHPCFVSRPCLNGGTCHMLSRDTYECTCQVGFTGKECQWTDACLSHPCANGSTCTTVANQ 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB9 IQCHCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGP ..:.: :: :. :: ::::: . :: : .: .: : ::.:: :: : : :. : CCDS90 FSCKCLTGFTGQKCETDVNEC-DIPGHCQHGGTCLNLPGSYQCQCPQGFTGQYCDSLYVP 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB9 CPPRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDT : : : :::::. : ::. : : ::: : :: : :.: .:.:::::.: ::..: CCDS90 CAPSPCVNGGTCR--QTGDFTFE-CNCLPGFEGSTCERNIDDCPNHRCQNGGVCVDGVNT 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB9 YTCLCPETWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLD :.: :: ::: :.:::::: : : :.::::: : :.. ::::.::.: .: ::.: CCDS90 YNCRCPPQWTGQFCTEDVDECLLQ-PNACQNGGTCANRNGGYGCVCVNGWSGDDCSENID 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB9 DCIAATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLEDMCLSQPCHGDAQCSTNPLTGSTL :: :.:.:::::::::.::::.:: :..::::::.: :.:.::: : :.::::.:. . CCDS90 DCAFASCTPGSTCIDRVASFSCMCPEGKAGLLCHLDDACISNPCHKGALCDTNPLNGQYI 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB9 CLCQPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHN : : ::.: : .:.::: ::.. .::::.:.:.:: :.:.: : ::.: ::: : : CCDS90 CTCPQGYKGADCTEDVDECAMANS--NPCEHAGKCVNTDGAFHCECLKGYAGPRCEMDIN 410 420 430 440 450 480 490 500 510 520 530 pF1KB9 ECLSQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQC :: :.::. .:::: .. : ::: ::..: ::.: ::: : ::.:...: : .: ::: CCDS90 ECHSDPCQNDATCLDKIGGFTCLCMPGFKGVHCELEINECQSNPCVNNGQCVDKVNRFQC 460 470 480 490 500 510 540 550 560 570 pF1KB9 ICLPGFSGTRCEEDIDECRSSPCANGGQCQDQPGAFHCKCL------------------- .: :::.: :. :::.: :.:: ::..: :.:....:.: CCDS90 LCPPGFTGPVCQIDIDDCSSTPCLNGAKCIDHPNGYECQCATGFTGVLCEENIDNCDPDP 520 530 540 550 560 570 580 590 600 610 pF1KB9 ------------------PGFEGPRCQTEVDECLSDPCPVGASCLDL---------PGA- ::. : :. ..::: :.:: . :.:: ::. CCDS90 CHHGQCQDGIDSYTCICNPGYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQCNCQPGTS 580 590 600 610 620 630 620 630 640 pF1KB9 ---------------------------FFCLCPSGFTGQLCEVPL--CAPNLCQPKQICK . :.: ::::: :.. . :: : :. : CCDS90 GVNCEINFDDCASNPCIHGICMDGINRYSCVCSPGFTGQRCNIDIDECASNPCRKGATCI 640 650 660 670 680 690 650 660 670 680 690 pF1KB9 DQKDKANCLCPDGS--PGCAPPEDNCT---CHHGHCQRS----SCVCDVGWTGPECEAEL . . :.::.: :.: ..: : ::.: . .:.::.::.: .::.. CCDS90 NGVNGFRCICPEGPHHPSCYSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVGINCEVDK 700 710 720 730 740 750 700 710 720 730 740 pF1KB9 GGCISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEMTACHSGPCLNGGSC-------- . :.: :: .:::: .:: ::: :. : .:. .. : :.:::: :.: CCDS90 NECLSNPCQNGGTCDNLVNGYRCTCKKGFKGYNCQVNIDECASNPCLNQGTCFDDISGYT 760 770 780 790 800 810 pF1KB9 -------------------NPSP------------------------------------- .:.: CCDS90 CHCVLPYTGKNCQTVLAPCSPNPCENAAVCKESPNFESYTCLCAPGWQGQRCTIDIDECI 820 830 840 850 860 870 750 760 770 780 790 pF1KB9 --------------GGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGGTCVNRPGTFSCLCA :.:.: :::. .: .:. . : :.. :: :::.:.. .:::::: CCDS90 SKPCMNHGLCHNTQGSYMCECPPGFSGMDCEEDIDDCLANPCQNGGSCMDGVNTFSCLCL 880 890 900 910 920 930 800 810 820 pF1KB9 MGFQGPRCEGKLRPSCADSPCRNRATCQD------------------------------- :: : .:. . : . ::.: .::.: CCDS90 PGFTGDKCQTDMNE-CLSEPCKNGGTCSDYVNSYTCKCQAGFDGVHCENNINECTESSCF 940 950 960 970 980 990 830 pF1KB9 ---------------SPQG----------------P--------------RCLCPTGYTG : : : :: :: :::: CCDS90 NGGTCVDGINSFSCLCPVGFTGSFCLHEINECSSHPCLNEGTCVDGLGTYRCSCPLGYTG 1000 1010 1020 1030 1040 1050 840 850 860 870 880 890 pF1KB9 GSCQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVS .::::..::...:: .. :.: .::: .::.: :..: ::. :: .:. : CCDS90 KNCQTLVNLCSRSPCKNKGTCVQKKAESQCLCPSGWAGAYCDVPNVSCDIAASRRGVLVE 1060 1070 1080 1090 1100 1110 900 910 920 930 940 950 pF1KB9 SLCHNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAP ::...:.:...: ...:.:: :. :: :..... : : :::.:::: .:: :.:.: CCDS90 HLCQHSGVCINAGNTHYCQCPLGYTGSYCEEQLDECASNPCQHGATCSDFIGGYRCECVP 1120 1130 1140 1150 1160 1170 960 970 980 pF1KB9 GYDGQNCSKELDACQSQPCHNHGTCT----------P----------------------- ::.: :: :.: ::.:::.: ::: : CCDS90 GYQGVNCEYEVDECQNQPCQNGGTCIDLVNHFKCSCPPGTRGLLCEENIDDCARGPHCLN 1180 1190 1200 1210 1220 1230 990 1000 1010 1020 1030 pF1KB9 ------KPGGFHCACPPGFVGLRCEGDVDECLDQPCHPTGTAACHSLANAFYCQCLPGHT . ::. : : :::.: :::::..:::..:: :. : .:.: . : : . : CCDS90 GGQCMDRIGGYSCRCLPGFAGERCEGDINECLSNPCSSEGSLDCIQLTNDYLCVCRSAFT 1240 1250 1260 1270 1280 1290 1040 1050 1060 1070 1080 1090 pF1KB9 GQWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFEGPTCSHRAPSCGFHHCHHG :. ::. .: : ..::..:::: .... : ::::.:: :: : :. ::: .:..: CCDS90 GRHCETFVDVCPQMPCLNGGTCAVASNMPDGFICRCPPGFSGARCQ---SSCGQVKCRKG 1300 1310 1320 1330 1340 1350 1100 1110 1120 1130 1140 1150 pF1KB9 GLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPCLYNGSCSETTGLGGPGFRC :. . . : ::: : : :: . ::. ::: ..::: : . : CCDS90 EQCVHTAS-G--PRCFCPSPR---DCES-----GCAS-SPCQHGGSCHPQRQ--PPYYSC 1360 1370 1380 1390 1400 1160 1170 1180 1190 1200 pF1KB9 SCPHSSPGPRCQ-------KPGA----KGCEGRSGDGACDAGCSGPGGNWDGGDCSLGVP .: : ::. : : . : .. ::.:: .:.. . .:::::::: . CCDS90 QCAPPFSGSRCELYTAPPSTPPATCLSQYCADKARDGVCDEACNSHACQWDGGDCSLTME 1410 1420 1430 1440 1450 1460 1210 1220 1230 1240 1250 1260 pF1KB9 DPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCE-TPPACTPAYDQYCHDHFHNGH .:: .: : :: . ..:: :.. :::::...:. . .: ::.:: :::...: CCDS90 NPWANCSSPLPCWD-YINNQCDELCNTVECLFDNFECQGNSKTC--KYDKYCADHFKDNH 1470 1480 1490 1500 1510 1270 1280 1290 1300 1310 1320 pF1KB9 CEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLSLTLRVGL :..:::. :::::: :: .. . .:...:.. : : :. .. :.:. :...: CCDS90 CDQGCNSEECGWDGLDCAADQPENLAEGTLVIVVLMPPEQLLQDARSFLRALGTLLHTNL 1520 1530 1540 1550 1560 1570 1330 1340 1350 1360 1370 1380 pF1KB9 WVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGKETDSLSAGFVVVMGV ...: .:. ::::: : :: .. . . .:. : : .:. :: : . . CCDS90 RIKRDSQGELMVYPYYG----EKSAAMKKQRMTRRSLPGEQE--QEV----AGSKVFLEI 1580 1590 1600 1610 1620 1390 1400 1410 1420 1430 1440 pF1KB9 DLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAPPANQLPW : .: : ...: . ::. : :.. : ::..: .. : : .:: . CCDS90 DNRQCVQD--SDHCFKNTDAA----AALLASHAIQGTLSYPLVSVVSESLT-PERTQLLY 1630 1640 1650 1660 1670 1680 1450 1460 1470 1480 1490 1500 pF1KB9 PVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRPRTQSAPHRRRPPLGED . . : .... ::.... .:.:.::.:::: ::: : ... :.:: :.:.: CCDS90 LLAVAVVIILFIILLGVIMA-----KRKRKHGSLWLPEGFTL--RRDASNHKRREPVGQD 1690 1700 1710 1720 1730 1510 1520 1530 1540 1550 pF1KB9 SIGLKALKPK-AEVDEDGV------VMCSGPE----EGEEVGQAEETGPPSTCQLWSLSG ..::: :. . .:.. :. : ::. ..:. . : : . :. . CCDS90 AVGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDRRPWTQQH 1740 1750 1760 1770 1780 1790 1560 1570 1580 1590 1600 pF1KB9 GCGA----LPQAAMLTPPQ-ESEMEAPDLDTRGPDGVTPLMSAVCCGEVQ--SGTFQGAW .: :. : ::::: :.:... :...::::: :::: : : . : . : CCDS90 LEAADIRRTPSLA-LTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSDLSDEDEDAE 1800 1810 1820 1830 1840 1850 1610 1620 1630 1640 1650 1660 pF1KB9 LGCPEPWEPLLDGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQPDRAGRT . . :. :: ::.: ::: ::::::.:: ::.:::.:::. : : :: CCDS90 DSSANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANAQDNMGRC 1860 1870 1880 1890 1900 1910 1670 1680 1690 1700 1710 1720 pF1KB9 PLHAAVAADAREVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAAQADVGA ::::::::::. : :.:.:.: : .::: .::::::.:::::::: .: ::: ::::.: CCDS90 PLHAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELINCQADVNA 1920 1930 1940 1950 1960 1970 1730 1740 1750 1760 1770 1780 pF1KB9 RDKWGKTALHWAAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVAQLLLGL : ::.::::::::::..:. ::. ::..: :::.:.::::: CCDS90 VDDHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEAAKILLDH 1980 1990 2000 2010 2020 2030 1790 1800 1810 1820 1830 1840 pF1KB9 GAARELRDQAGLAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREAGPFPRARTVSVS CCDS90 FANRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPPGTVLTSALSPVICGPNRSFL 2040 2050 2060 2070 2080 2090 >>CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555 aa) initn: 2706 init1: 819 opt: 2662 Z-score: 1335.8 bits: 261.0 E(32554): 4.4e-68 Smith-Waterman score: 5134; 39.0% identity (60.9% similar) in 2007 aa overlap (32-1889:224-2179) 10 20 30 40 50 60 pF1KB9 QPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGET : :: ::::: . : : ::: :.. CCDS43 TCHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTGQN 200 210 220 230 240 250 70 80 90 100 pF1KB9 CQFP-DPCQNAQLCQNGGSCQALL--------PAPLGLPSSPS----PLTPS-------- :. : : . . :.:::.: . : : . . : :. CCDS43 CEENIDDCPGNN-CKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTC 260 270 280 290 300 310 110 120 130 140 150 pF1KB9 ------FLCTCLPGFTGERCQAQLEDPCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQC . :.:. :.::: :. ...: : . : . . :: .... : : : :: : CCDS43 HNTHGGYNCVCVNGWTGEDCSENIDD-CASAACFHGATCHDRVASF-YCECPHGRTGLLC 320 330 340 350 360 370 160 170 180 190 200 210 pF1KB9 QLRDFCSANPCVNGGVCLATYP---QIQCHCPPGFEGHACERDVNECFQDPGPCPKGTSC .: : : .::: .:. : : : . : :: :. : :: .::.:: .:: .. .: CCDS43 HLNDACISNPCNEGSNC-DTNPVNGKAICTCPSGYTGPACSQDVDECSLGANPCEHAGKC 380 390 400 410 420 220 230 240 250 260 270 pF1KB9 HNTLGSFQCLCPVGQEGPRCELRAGPCPPRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGP ::::::.: : : :::::. .. : :.: .:: .. . :. :.: ::. : CCDS43 INTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCL---DQIGEFQ-CICMPGYEGV 430 440 450 460 470 480 280 290 300 310 320 330 pF1KB9 DCEVNPDNCVSHQCQNGGTCQDGLDTYTCLCPETWTGWDCSEDVDECEAQGPPHCRNGGT :::: :.:.: : ..: : : .. . : :: .:: :. ::::: :. : :.::. CCDS43 HCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDEC-ASTP--CKNGAK 490 500 510 520 530 540 340 350 360 370 380 390 pF1KB9 CQNSAGSFHCVCVSGWGGTSCEENLDDCIAATCAPGSTCIDRVGSFSCLCPPGRTGLLCH : .. ... :::. :. :: :: ..:.: : :: : : :..:.::: :: :: :. CCDS43 CLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGS-CKDGVATFTCLCRPGYTGHHCE 550 560 570 580 590 600 400 410 420 430 440 450 pF1KB9 LE-DMCLSQPCHGDAQCSTNPLTGSTLCLCQPGYSGPTCHQDLDECLMAQQGPSPCEHGG . . : ::::. . :. .. ::.: : .::.:. .::.: . :::. .: CCDS43 TNINECSSQPCRHGGTCQDR--DNAYLCFCLKGTTGPNCEINLDDC-----ASSPCD-SG 610 620 630 640 650 460 470 480 490 500 510 pF1KB9 SCLNTPGSFNCLCPPGYTGSRCEADHNECLSQPCHPGSTCLDLLATFHCLCPPGLEGQLC .::. ...: : :::::: :. . .:: ..::: :.:: : . : : :: : . : CCDS43 TCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTC 660 670 680 690 700 710 520 530 540 550 560 570 pF1KB9 EVETNECASAPCLNHADCHDLLNGFQCICLPGFSGTRCEEDIDECRSSPCANGGQCQDQP :.::: : ::. :. :.: :::..: : ::.::: :. . .::.:.::.::: :.:. CCDS43 LSEVNECNSNPCV-HGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMT 720 730 740 750 760 770 580 590 600 610 620 pF1KB9 GAFHCKCLPGFEGPRCQTEVDECLSDPCPVGASCLDLPGAFFCLCPSGFTGQLCEVPL-- ... : : :: :: :::...:: :.:: ..:.: ... : : .:: ::: : CCDS43 SGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAP 780 790 800 810 820 830 630 640 650 660 670 pF1KB9 CAPNLCQPKQICKDQKDKAN--CLCPDGSPG--CAPPEDNCT---CHHG-HCQRSS---- :::. :. :....: . :.:: : : : ..:. :.:: :: . CCDS43 CAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYR 840 850 860 870 880 890 680 690 700 710 720 730 pF1KB9 CVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEMTACHSG : :..:..: .::... : :: .::.: . : : :. : : :... : : CCDS43 CHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASD 900 910 920 930 940 950 740 750 760 770 780 790 pF1KB9 PCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGGTCVNRPGTFSCLCAMG :: ::..:. .: :::: . .: .:...: :. . ::::::::. ..:.::: : CCDS43 PCRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPG 960 970 980 990 1000 1010 800 810 820 830 840 850 pF1KB9 FQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGSCQTLMDLCAQKPCPRN : : :. . : ..:: . .::::. . :: :: :::: .::.:. : ..:: . CCDS43 FTGSYCQHDVNE-CDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNG 1020 1030 1040 1050 1060 1070 860 870 880 890 900 910 pF1KB9 SHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSLCHNGGLCVDSGPSYFC ..: :: ...: : .:::: :..: ::. :: ::.::. ::..::::::.: .. : CCDS43 GKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHC 1080 1090 1100 1110 1120 1130 920 930 940 950 960 970 pF1KB9 HCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGYDGQNCSKELDACQSQP .: :. :: :.: :. : :::::::: .:: :.:. :: : :::.:.: : :.: CCDS43 RCQAGYTGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHP 1140 1150 1160 1170 1180 1190 980 990 pF1KB9 CHNHGTCTPKP----------------------------------------------GGF :.: ::: : ::. CCDS43 CQNGGTCLDLPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGY 1200 1210 1220 1230 1240 1250 1000 1010 1020 1030 1040 1050 pF1KB9 HCACPPGFVGLRCEGDVDECLDQPCHPTGTAACHSLANAFYCQCLPGHTGQWCEVEIDPC :.::::::: ::::::.:::..:: :: : . .: :.:.: ::::. :: :. : CCDS43 SCTCPPGFVGERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECRAGHTGRRCESVINGC 1260 1270 1280 1290 1300 1310 1060 1070 1080 1090 1100 1110 pF1KB9 HSQPCFHGGTCEATAGSPLGFICHCPKGFEGPTCSHRAPSCGFHHCHHGGLCLPSPKPGF ...:: .:::: ..... ::::.:: :::: :: . : .:: .: .:: :. .:. CCDS43 KGKPCKNGGTCAVASNTARGFICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRS-- 1320 1330 1340 1350 1360 1120 1130 1140 1150 1160 1170 pF1KB9 PPRCACLSGYGGPDCLTPPAPKGCGPPSPCLYNGSCSETTGLGGPGFRCSCPHSSPGPRC : : ::. . ::.: : : . : .:: .:.: :. .: .:: :: . : : CCDS43 -PTCLCLGPFTGPECQFP-ASSPCLGGNPCYNQGTCEPTSE--SPFYRCLCPAKFNGLLC 1370 1380 1390 1400 1410 1420 1180 1190 1200 pF1KB9 QK-----PGAKG----------------CEGRSGDGACDAGCSGPGGNWDGGDCSLGVPD . :. : :. .:. .:. :.. . .::::::::. : CCDS43 HILDYSFGGGAGRDIPPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFND 1430 1440 1450 1460 1470 1480 1210 1220 1230 1240 1250 1260 pF1KB9 PWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPPA-CTPAYDQYCHDHFHNGHC :::.: . .:: : ::.: ::.: :::::.::. . :.: :::::.::: .::: CCDS43 PWKNCTQSLQCWKYFSDGHCDSQCNSAGCLFDGFDCQRAEGQCNPLYDQYCKDHFSDGHC 1490 1500 1510 1520 1530 1540 1270 1280 1290 1300 1310 1320 pF1KB9 EKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLSLTLRVGLW ..:::.::: ::: :: . . . .:...:.. : : .. : . : :: .:.... CCDS43 DQGCNSAECEWDGLDCAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVV 1550 1560 1570 1580 1590 1600 1330 1340 1350 1360 1370 pF1KB9 VRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAP-----QTQ----PLG-------K ..: :..:..:: : : :: . . ::: :.. : : . CCDS43 FKRDAHGQQMIFPYYG-REEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRR 1610 1620 1630 1640 1650 1660 1380 1390 1400 1410 1420 1430 pF1KB9 ETDSLSA-GFVVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLA : : ... : .: . .: .: . .:.: . . ::.:.:..:.:. .: . : CCDS43 ELDPMDVRGSIVYLEIDNRQCV--QASSQCFQSATDVAAFLGALASLGSLN--IPYKIEA 1670 1680 1690 1700 1710 1720 1440 1450 1460 1470 1480 1490 pF1KB9 VHPHAGTAPPANQLPWPVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRP :. .. :: :: . . . .: :.:. .: ..:. :.:::.:: ::.: :: CCDS43 VQSETVEPPPPAQLHF-MYVAAAAFVLLFFVGCGVLLS--RKRRRQHGQLWFPEGFKV-- 1730 1740 1750 1760 1770 1500 1510 1520 1530 1540 pF1KB9 RTQSAPHRRRPPLGEDSIGLKALKPKAEVDEDGVVMCSGPEE-GEEVGQAE--------- .... ..:: ::::::.::: :: . ::..: .. .: :.: ... CCDS43 -SEASKKKRREPLGEDSVGLKPLKNAS----DGALMDDNQNEWGDEDLETKKFRFEEPVV 1780 1790 1800 1810 1820 1830 1550 1560 1570 1580 1590 pF1KB9 --ETGPPSTCQLWSLSGGCGA-LPQAAML-TPPQ-ESEMEAPDLDTRGPDGVTPLMSAVC . . . :. . .: : ..:: :::: : . . :...::::: :::: : : CCDS43 LPDLDDQTDHRQWTQQHLDAADLRMSAMAPTPPQGEVDADCMDVNVRGPDGFTPLMIASC 1840 1850 1860 1870 1880 1890 1600 1610 1620 1630 1640 1650 pF1KB9 CGE-VQSGTFQGAWLGCPEPWEPLLDGGACPQAHTVGTGETPLHLAARFSRPTAARRLLE : ...:. . : .. :: . .: :::: ::::::.:: ::.:::: CCDS43 SGGGLETGNSEEEE-DAPAVISDFIYQGASLHNQTDRTGETALHLAARYSRSDAAKRLLE 1900 1910 1920 1930 1940 1660 1670 1680 1690 1700 1710 pF1KB9 AGANPNQPDRAGRTPLHAAVAADAREVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVED :.:. : : :::::::::.:::. : :.:.:.: : .::: .::::::.:::::::: CCDS43 ASADANIQDNMGRTPLHAAVSADAQGVFQILIRNRATDLDARMHDGTTPLILAARLAVEG 1950 1960 1970 1980 1990 2000 1720 1730 1740 1750 1760 1770 pF1KB9 LVEELIAAQADVGARDKWGKTALHWAAAVNNARAARSLLQAGADKDAQDNREQTPLFLAA ..:.:: ..:::.: : ::.::::::::::. :: ::. ::.:: :.:::.::::::: CCDS43 MLEDLINSHADVNAVDDLGKSALHWAAAVNNVDAAVVLLKNGANKDMQNNREETPLFLAA 2010 2020 2030 2040 2050 2060 1780 1790 1800 1810 1820 1830 pF1KB9 REGAVEVAQLLLGLGAARELRDQAGLAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGR :::. :.:..:: : :.. :. : :.:..: : :.. ::. : .: CCDS43 REGSYETAKVLLDHFANRDITDHMDRLPRDIAQERMHHDIVRLLD-----EYNLVRSPQL 2070 2080 2090 2100 2110 2120 1840 1850 1860 1870 1880 1890 pF1KB9 EAGPFPRARTVSVSV-PPHG--GGALPRCRTLSAGAGPRGGGACLQARTWSVDLAARGGG ...:. . :.: . :.: :. : . .. : :: . . :: :: CCDS43 HGAPLGGTPTLSPPLCSPNGYLGSLKPGVQGKKVRKPSSKGLAC--GSKEAKDLKARRKK 2130 2140 2150 2160 2170 2180 1900 1910 1920 1930 1940 1950 pF1KB9 AYSHCRSLSGVGAGGGPTPRGRRFSAGMRGPRPNPAIMRGRYGVAAGRGGRVSTDDWPCD CCDS43 SQDGKGCLLDSSGMLSPVDSLESPHGYLSDVASPPLLPSPFQQSPSVPLNHLPGMPDTHL 2190 2200 2210 2220 2230 2240 >-- initn: 435 init1: 435 opt: 679 Z-score: 353.7 bits: 79.3 E(32554): 2.2e-13 Smith-Waterman score: 679; 39.0% identity (61.9% similar) in 236 aa overlap (3-238:2-222) 10 20 30 40 50 60 pF1KB9 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGE :: : :: : :: ... :: :.. : : ::: : . . : .: :. .:.: CCDS43 MPPLLAPLLCLALLPALAARGPR---CSQPGETCLNGGKCEAAN-GTEACVCGGAFVGP 10 20 30 40 50 70 80 90 100 110 120 pF1KB9 TCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLED :: :.:: .. :.:.:.:... :. . . :.: ::.: : . :.. CCDS43 RCQDPNPCLSTP-CKNAGTCHVV--DRRGVAD--------YACSCALGFSGPLCLTPLDN 60 70 80 90 100 130 140 150 160 170 180 pF1KB9 PCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQIQC : . : . : : . . . .: : :::.:..:: : :..:::.::: :: . : CCDS43 ACLTNPCRNGGTCDLLTLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYIC 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB9 HCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPP ::::.:.: .:..::::: : :: : .: .::: .::..:.: . . :: :: :: CCDS43 HCPPSFHGPTCRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSP 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB9 RGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTC CCDS43 SPCQNGGTCRPTGDVTHECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNCRCP 230 240 250 260 270 280 >>CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321 aa) initn: 2955 init1: 730 opt: 2443 Z-score: 1227.7 bits: 240.9 E(32554): 4.6e-62 Smith-Waterman score: 4956; 37.2% identity (59.3% similar) in 2129 aa overlap (41-1994:174-2208) 20 30 40 50 60 pF1KB9 LLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGETCQFPD-PCQ ::. :. ::: :. : :. : :: CCDS12 CSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTP-GSFRCQCPAGYTGPLCENPAVPCA 150 160 170 180 190 200 70 80 90 100 110 120 pF1KB9 NAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLEDPCPPSFCSK . :.:::.:. . . :: . :.::::: :. :.....: :: : . CCDS12 PSP-CRNGGTCR-----------QSGDLT--YDCACLPGFEGQNCEVNVDD-CPGHRCLN 210 220 230 240 130 140 150 160 170 180 pF1KB9 RGRCHIQASGRPQCSCMPGWTGEQC-QLRDFCSANP--CVNGGVCLATYPQIQCHCPPGF : : ... . .:.: : :::. : . : :. .: : :::.:. : .: : :. CCDS12 GGTC-VDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGW 250 260 270 280 290 300 190 200 210 220 230 240 pF1KB9 EGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPPRGCSNG :..: .....: . : .:..::. ..:: : ::.:. : :.: . : : . CCDS12 TGESCSQNIDDC--ATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDA-CVSNPCHED 310 320 330 340 350 360 250 260 270 280 290 300 pF1KB9 GTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCV--SHQCQNGGTCQDGLDTYTCLCPE . :. : . . .: ::::: : :. . :.: .. :.. : : . .. : : . CCDS12 AICDTNPVNGRA--ICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCGR 370 380 390 400 410 420 310 320 330 340 350 360 pF1KB9 TWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCIAATC .:: : ::.:: .:: ::: .:: . :.: :.:..:. :: :: ..:.: .. : CCDS12 GYTGPRCETDVNEC-LSGP--CRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQSSPC 430 440 450 460 470 370 380 390 400 410 420 pF1KB9 APGSTCIDRVGSFSCLCPPGRTGLLCHLE-DMCLSQPCHGDAQCSTNPLTGSTLCLCQPG . :..: :::..::: :: : .: :.:. : : : ::.. :.: .: . : : : CCDS12 VNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQP--DGYECRCAEG 480 490 500 510 520 530 430 440 450 460 470 480 pF1KB9 YSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECLSQP . : : ...:.: .:.::.:: :.. .::.: : :::::.:::.. .:: ::: CCDS12 FEGTLCDRNVDDC-----SPDPCHHG-RCVDGIASFSCACAPGYTGTRCESQVDECRSQP 540 550 560 570 580 590 490 500 510 520 530 540 pF1KB9 CHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICLPGF :. :. ::::. . : :: : : :::. ..::: :: . . :.: .: ..:.: ::: CCDS12 CRHGGKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPC-TFGVCRDGINRYDCVCQPGF 600 610 620 630 640 550 560 pF1KB9 SGTRCEEDIDECRSSPCANGGQC------------------------------------- .: :. .:.:: ::::..::.: CCDS12 TGPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGIC 650 660 670 680 690 700 570 580 590 600 610 620 pF1KB9 QDQPGAFHCKCLPGFEGPRCQTEV--DECLSDPCPVGASCLDLPGAFFCLCPSGFTGQLC : ::.:.: : ::. ::::. . : : :.:: .:..: . .: : :: : :. : CCDS12 YDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQC 710 720 730 740 750 760 630 640 650 660 670 pF1KB9 EV--PLCAPNLCQPKQICKDQKDKAN-CLCPDG--SPGCAPPEDNCT----CH-HGHCQR :. : :.:: :. :.. . : ::.: .: : :.:. : :: : CCDS12 ELLSP-CTPNPCEHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTN 770 780 790 800 810 820 680 690 700 710 720 730 pF1KB9 S----SCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEM ::.: :.::: :. ... : :: .::.: ....:.: :..:: :.... CCDS12 LAGSFSCTCHGGYTGPSCDQDINDCDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDV 830 840 850 860 870 880 740 750 760 770 780 790 pF1KB9 TACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGGTCVNRPGTFS : :.:: . :.:. ... :::::.. : .:. . : . ::::::::. ..:: CCDS12 DECLSNPC-GPGTCTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFS 890 900 910 920 930 940 800 810 820 830 840 850 pF1KB9 CLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGSCQTLMDLCAQ ::: :. : .:. . : : . :: . ..:. . : :: : ..:: .::::.: :.. CCDS12 CLCRPGYTGAHCQHEADP-CLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSR 950 960 970 980 990 1000 860 870 880 890 900 910 pF1KB9 KPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSLCHNGGLCVDS .:: ...:.::: .::: ::.: ::.. :..:: . :. . .::. :: ::: CCDS12 QPCQNGGRCVQTGA--YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDE 1010 1020 1030 1040 1050 1060 920 930 940 950 960 970 pF1KB9 GPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGYDGQNCSKELD :..: :: : :: :...:.:: ..:::.:.:: . .::.:.: :::.:.:: ..: CCDS12 DSSHYCVCPEGRTGSHCEQEVDPCLAQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVD 1070 1080 1090 1100 1110 1120 980 pF1KB9 ACQSQPCHNHGTCT---------------------------PKP---------------- : ::::.. :.: : : CCDS12 ECASQPCQHGGSCIDLVARYLCSCPPGTLGVLCEINEDDCGPGPPLDSGPRCLHNGTCVD 1130 1140 1150 1160 1170 1180 990 1000 1010 1020 1030 1040 pF1KB9 --GGFHCACPPGFVGLRCEGDVDECLDQPCHPTGTAAC-HSLANAFYCQCLPGHTGQWCE :::.:.::::..:::::.:..:: . :: . : : .. ...: : : : .: :. CCDS12 LVGGFRCTCPPGYTGLRCEADINECRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQ 1190 1200 1210 1220 1230 1240 1050 1060 1070 1080 1090 1100 pF1KB9 VEIDPCHSQPCFHGGTCEATAGSPLG--FICHCPKGFEGPTCSHRAPSCGFHHCHHGGLC . ..::.:::: ::: :. . : : : ::: . : :: : . : :: .: : : CCDS12 TVLSPCESQPCQHGGQCRPSPGPGGGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPC 1250 1260 1270 1280 1290 1300 1110 1120 1130 1140 1150 pF1KB9 LPSPKPGFPPRCACLSGYGGPDCLT-PPAPKGCGPPS----PCLYNGSCSETTGLGGPGF .:. ::::: : .::.: . : .: : . : :::..::: . .: : CCDS12 QQTPRG---PRCACPPGLSGPSCRSFPGSPPGASNASCAAAPCLHGGSCRPAP--LAPFF 1310 1320 1330 1340 1350 1160 1170 1180 1190 1200 pF1KB9 RCSCPHSSPGPRCQKPGAK------------GCEGRSGDGACDAGCSGPGGNWDGGDCSL ::.: .. ::::. :.: .:... :: :: :..:: .:::::::: CCDS12 RCACAQGWTGPRCEAPAAAPEVSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSL 1360 1370 1380 1390 1400 1410 1210 1220 1230 1240 1250 1260 pF1KB9 GVPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPP---ACTPAYDQYCHDH .: :::. : . .:: :: ...: : :.: ::.:..::.. .:.:.:..:: :: CCDS12 SVGDPWRQCEAL-QCWRLFNNSRCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADH 1420 1430 1440 1450 1460 1470 1270 1280 1290 1300 1310 1320 pF1KB9 FHNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLSLT : .:.:..:::: :::::: :: : :.: :.: : : .. . . :: CCDS12 FADGRCDQGCNTEECGWDGLDCASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAI 1480 1490 1500 1510 1520 1530 1330 1340 1350 1360 1370 1380 pF1KB9 LRVGLWVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGK-ETDSLSAGF ::..: : : :. ::.:: .: .: ..: .. : : CCDS12 LRTSLRFRLDAHGQAMVFPY------------------HRPSPGSEPRARRELAPEVIGS 1540 1550 1560 1570 1580 1390 1400 1410 1420 1430 1440 pF1KB9 VVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAPP ::.. .: : . ..: : .:.:..:: :. .: :: :. . :: CCDS12 VVMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERLD--FPYPLRDVRGEP-LEPP 1590 1600 1610 1620 1630 1450 1460 1470 1480 1490 pF1KB9 ANQLPW-PVLCSPVAGVILLALGALLVLQ-LIRRRRREHGALWLPPGFTRRPRTQSAPHR ..: :.: :::..:: . .::: .. ::.:::..::.: ::. . . :. . CCDS12 EPSVPLLPLL---VAGAVLLLV--ILVLGVMVARRKREHSTLWFPEGFSLHKDVASGHKG 1640 1650 1660 1670 1680 1690 1500 1510 1520 1530 1540 1550 pF1KB9 RRPPLGEDSIGLKALKPK----AEVDEDGV-VMCSGPEEG----EEVGQAEETGPPSTCQ :: :.:.:..:.: . .:: : . . : :: :: :.. : . :. CCDS12 RREPVGQDALGMKNMAKGESLMGEVATDWMDTEC--PEAKRLKVEEPGMGAEEA--VDCR 1700 1710 1720 1730 1740 1560 1570 1580 1590 1600 pF1KB9 LWSLSGGCGA---LPQAAMLTPPQ-ESEMEAPDLDTRGPDGVTPLMSAVCCG---EVQSG :. .: . : ::::: ... .. :...::::: :::: : :: : . CCDS12 QWTQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMPT 1750 1760 1770 1780 1790 1800 1610 1620 1630 1640 1650 1660 pF1KB9 TFQGAWLGCPEPWEPLLDGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQP . : :. :: :.: :::: ::::::..: ::.:::.:::. : CCDS12 EEDEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNAQ 1810 1820 1830 1840 1850 1860 1670 1680 1690 1700 1710 1720 pF1KB9 DRAGRTPLHAAVAADAREVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAA :..::::::.::.:::. : :.:.:.:.: .::: ::.: :.:::::::: .::::::. CCDS12 DHSGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIAS 1870 1880 1890 1900 1910 1920 1730 1740 1750 1760 1770 1780 pF1KB9 QADVGARDKWGKTALHWAAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVA .:::.: :. ::.::::::::::..:. .::. ::.:: ::..:.::::::::::. :.: CCDS12 HADVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEAA 1930 1940 1950 1960 1970 1980 1790 1800 1810 1820 1830 1840 pF1KB9 QLLLGLGAARELRDQAGLAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREA-GPF-- .::: : ::. :. : :::..: : :.. ::. . : .. :: .. ::. CCDS12 KLLLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGP----RSPPGPHGLGPLLC 1990 2000 2010 2020 2030 2040 1850 1860 1870 1880 1890 1900 pF1KB9 PRARTVSVSVPPHGGGALPRCRTLSAGAGPRGGGACLQARTWSVDLAARGGGAYSHCRSL : . . ..:. : .:: ::.: ..: .. :: : : : .: CCDS12 PPGAFLPGLKAAQSGSKKSRRPPGKAGLGPQGP----RGRGKKLTLACPGPLADSSV-TL 2050 2060 2070 2080 2090 1910 1920 1930 1940 pF1KB9 SGVGAGGGPTPRGRRFSAGMRGPRPNPA--IMRGRYGVAA---------GRGGRVSTDDW : : . .: : : :: .:. ..: :..:. : ::.. CCDS12 SPVDSLDSPRPFG--------GPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQ 2100 2110 2120 2130 2140 2150 1950 1960 1970 1980 1990 pF1KB9 P---CDWVALGACGSASNIPI-----PPPCLT-PS---PERGSPQL-DCGPPAL-QEMPI : : ..:: . .. .:. ::: :: : .::: . : :. :: : CCDS12 PPGGC-VLSLGLLNPVA-VPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPP 2160 2170 2180 2190 2200 2000 pF1KB9 NQGGEGKK CCDS12 PYLAVPGHGEEYPAAGAHSSPPKARFLRVPSEHPYLTPSPESPEHWASPSPPSLSDWSES 2210 2220 2230 2240 2250 2260 >>CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238 aa) initn: 1429 init1: 597 opt: 1536 Z-score: 780.9 bits: 157.3 E(32554): 3.6e-37 Smith-Waterman score: 1854; 34.1% identity (54.6% similar) in 821 aa overlap (105-901:231-992) 80 90 100 110 120 130 pF1KB9 QNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLEDPCPPSFCSKRGRCH :. :. :..:. : : . .: : CCDS99 NYYSATCNKFCRPRNDFFGHYTCDQYGNKACMDGWMGKECK---EAVCKQGCNLLHGGCT 210 220 230 240 250 140 150 160 170 180 190 pF1KB9 IQASGRPQCSCMPGWTGEQCQLRDFCSANP-CVNGGVCLATYPQIQCHCPPGFEGHACER . . .: : :: :. : : : : ::.:. :. . ::.: .. : :.. CCDS99 VPG----ECRCSYGWQGRFC---DECVPYPGCVHGS-CVEPW---QCNCETNWGGLLCDK 260 270 280 290 300 200 210 220 230 240 250 pF1KB9 DVNECFQDPGPCPKGTSCHNTL-GSFQCLCPVGQEGPRCELRAGPCPPRGCSNGGTCQLM :.: : . :: .: .: :. ...: :: : : :: : :.:::.:. . CCDS99 DLNYC-GSHHPCTNGGTCINAEPDQYRCTCPDGYSGRNCEKAEHACTSNPCANGGSCHEV 310 320 330 340 350 360 260 270 280 290 300 310 pF1KB9 PEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTCLCPETWTGWDCS : : :. : :: :. :: : .. :.:.:. : :::: : .: . :.::: :.: :. CCDS99 P---SGFE-CHCPSGWSGPTCALDIDECASNPCAAGGTCVDQVDGFECICPEQWVGATCQ 370 380 390 400 410 420 320 330 340 350 360 370 pF1KB9 EDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCIAATCAPGSTCID :..::: : : : :. .:.: :...: :. :: : .:. :..:: . : :.:: : CCDS99 LDANECE--GKP-CLNAFSCKNLIGGYYCDCIPGWKGINCHINVNDC-RGQCQHGGTCKD 430 440 450 460 470 380 390 400 410 420 430 pF1KB9 RVGSFSCLCPPGRTGLLCHLE-DMCLSQPCHGDAQCSTNPLTGSTLCLCQPGYSGPTCHQ :....:.:: : : :.:: : : :.:::. . : . :. . : : :.::: :. CCDS99 LVNGYQCVCPRGFGGRHCELERDECASSPCHSGGLC--EDLADGFHCHCPQGFSGPLCEV 480 490 500 510 520 530 440 450 460 470 480 490 pF1KB9 DLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECLSQPCHPGSTCL :.: : ::::..:. : : :.. : :: . :. : . . .:: ::..: CCDS99 DVDLCE-----PSPCRNGARCYNLEGDYYCACPDDFGGKNCSVPR-----EPC-PGGAC- 540 550 560 570 580 500 510 520 530 540 550 pF1KB9 DLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNG-FQCICLPGFSGTRCEE .. ::. : ::. : :. : . .: :.::: ::.:: :.: CCDS99 RVIDGCGSDAGPGMPGT--------AASGVCGPHGRCVSQPGGNFSCICDSGFTGTYCHE 590 600 610 620 630 560 570 580 590 600 610 pF1KB9 DIDECRSSPCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPVGASCLDLPGA .::.: ..:: ::: : :. ::.: : :.:: :.:. ..:: ::: . : :: . CCDS99 NIDDCLGQPCRNGGTCIDEVDAFRCFCPSGWEGELCDTNPNDCLPDPCHSRGRCYDLVND 640 650 660 670 680 690 620 630 640 650 660 pF1KB9 FFCLCPSGFTGQLCEVP--LCAPNLCQPKQICKDQKDKANCLCPDGSPG--CAPPEDN-C :.: : .:. :. :. : :. : :. : : :: : : :: ... : CCDS99 FYCACDDGWKGKTCHSREFQCDAYTCSNGGTCYDSGDTFRCACPPGWKGSTCAVAKNSSC 700 710 720 730 740 750 670 680 690 700 710 pF1KB9 T---C-HHGHCQRS----SCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTC : . : : : ::.: :: : : . . : :: .:: : . . : : CCDS99 LPNPCVNGGTCVGSGASFSCICRDGWEGRTCTHNTNDCNPLPCYNGGICVDGVNWFRCEC 760 770 780 790 800 810 720 730 740 750 760 770 pF1KB9 PTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCF :..:: : .. :.:.:: :..: .:: :.:::...::.:: . : :. CCDS99 APGFAGPDCRINIDECQSSPCAYGATCVDEINGYRCSCPPGRAGPRCQEVIGFGRS--CW 820 830 840 850 860 870 780 790 800 810 820 830 pF1KB9 NGGTCVNRPGTF-----SCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLC . :: . ... :: : ..: : .:. :. .:: .:.. : CCDS99 SRGTPFPHGSSWVEDCNSCRC---LDGRRDCSKVW--CGWKPC----LLAGQPEALSAQC 880 890 900 910 920 840 850 860 870 880 890 pF1KB9 PTGYTGGSC-QTLMDLCAQKPCPRNSHC-LQTGPSFHCLCLQGWTGPLCNLPLSSCQKAA : : : . : . :: ..: . :: :: .: : .. CCDS99 PLGQR---CLEKAPGQCLRPPCEAWGECGAEEPPSTPCLPRSGHLDNNCARLTLHFNRDH 930 940 950 960 970 980 900 910 920 930 940 950 pF1KB9 LSQGIDVSSLCHNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPS . :: :...: CCDS99 VPQGTTVGAICSGIRSLPATRAVARDRLLVLLCDRASSGASAVEVAVSFSPARDLPDSSL 990 1000 1010 1020 1030 1040 >>CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200 aa) initn: 1407 init1: 597 opt: 1498 Z-score: 762.2 bits: 153.8 E(32554): 3.9e-36 Smith-Waterman score: 1739; 31.6% identity (51.5% similar) in 961 aa overlap (185-1099:60-947) 160 170 180 190 200 pF1KB9 QLRDFCSANPCVNGGVCLATYPQIQCHCPPGFEGH-ACERDVNECFQD------P-GPCP : :: :. : :... : ::: CCDS99 FELQLSALRNVNGELLSGACCDGDGRTTRAGGCGHDECDTYVRVCLKEYQAKVTPTGPCS 30 40 50 60 70 80 210 220 230 240 250 260 pF1KB9 KGTSCHNTLG--SFQCLCPVGQEGPRCELRAGPCPPRGCSNGGTCQLMPEKDSTFHLCLC : . .:: :: : :.: : : . :: : .. : ..: :.. CCDS99 YGHGATPVLGGNSFY-LPPAGAAGDRARARARAG---GDQDPGLV-VIP-----FQFAW- 90 100 110 120 130 270 280 290 300 310 320 pF1KB9 PPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTCLCPET-WTGWDCSEDVDECEAQGP : .: . :: .. : . .. . :: : . : : . : : CCDS99 PRSFTLIVEAWDWDNDTT---PNEELLIERVSHAGMINPEDRWKSLHFSGHVAHLELQIR 140 150 160 170 180 190 330 340 350 360 pF1KB9 PHCRNG---GTCQNSA-------GSFHC------VCVSGWGGTSCEENLDDCIAATCAPG .: .. .::.. : . : .:..:: : :.: :.: : CCDS99 VRCDENYYSATCNKFCRPRNDFFGHYTCDQYGNKACMDGWMGKECKE-------AVCKQG 200 210 220 230 240 370 380 390 400 410 420 pF1KB9 STCIDRVGSFS----CLCPPGRTGLLCHLEDMCLSQP-C-HGDAQCSTNPLTGSTLCLCQ : :. . : : : : .: : :. : : :: .: ..: : :. CCDS99 --CNLLHGGCTVPGECRCSYGWQGRFC---DECVPYPGCVHG--SC-VEPWQ----CNCE 250 260 270 280 290 430 440 450 460 470 480 pF1KB9 PGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNT-PGSFNCLCPPGYTGSRCEADHNECL ...: : .::. : . :: .::.:.:. : .. : :: ::.: :: .. : CCDS99 TNWGGLLCDKDLNYC----GSHHPCTNGGTCINAEPDQYRCTCPDGYSGRNCEKAEHACT 300 310 320 330 340 350 490 500 510 520 530 540 pF1KB9 SQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICL :.:: :..: .. . :.: :: : : : .. .:::: :: . : : ..::.::: CCDS99 SNPCANGGSCHEVPSGFECHCPSGWSGPTCALDIDECASNPCAAGGTCVDQVDGFECICP 360 370 380 390 400 410 550 560 570 580 590 600 pF1KB9 PGFSGTRCEEDIDECRSSPCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPV . :. :. :...::.. : .:: :.: ....: : :: : .:. : ::: :.:: CCDS99 EQWVGATCQLDVNDCRGQ-CQHGGTCKDLVNGYQCVCPRGFGGRHCELERDECASSPCHS 420 430 440 450 460 470 610 620 630 640 650 pF1KB9 GASCLDLPGAFFCLCPSGFTGQLCEVP--LCAPNLCQPKQICKDQKDKANCLCPD--GSP :. : :: .: : ::.::.: :::: :: :. :. : . . : ::: :. CCDS99 GGLCEDLADGFHCHCPQGFSGPLCEVDVDLCEPSPCRNGARCYNLEGDYYCACPDDFGGK 480 490 500 510 520 530 660 670 680 690 700 710 pF1KB9 GCAPPEDNCTCHHGHCQR-SSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSG-YN .:. :.. : : :. ..: :.: : : :. :. : : ::.: .. CCDS99 NCSVPRE--PCPGGACRVIDGCGSDAGPGMP------GTAASGVCGPHGRCVSQPGGNFS 540 550 560 570 580 720 730 740 750 760 770 pF1KB9 CTCPTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSA : : .:.:: : :.. : . :: :::.: .. : :: . : :.:. . :. CCDS99 CICDSGFTGTYCHENIDDCLGQPCRNGGTCIDEVDAFRCFCPSGWEGELCDTNPNDCLPD 590 600 610 620 630 640 780 790 800 810 820 830 pF1KB9 PCFNGGTCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPT :: . : : . . : : : :..: :... . .: : : .:: :: . :: :: CCDS99 PCHSRGRCYDLVNDFYCACDDGWKGKTCHSR-EFQCDAYTCSNGGTCYDSGDTFRCACPP 650 660 670 680 690 700 840 850 860 870 880 890 pF1KB9 GYTGGSCQTLMDL-CAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQ :. :..: . . : .:: .. :. .: :: :.: .:: : :. ..:. CCDS99 GWKGSTCAVAKNSSCLPNPCVNGGTCVGSGASFSCICRDGWEGRTCTHNTNDCNPLP--- 710 720 730 740 750 900 910 920 930 940 950 pF1KB9 GIDVSSLCHNGGLCVDSGPSYF-CHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGY :.:::.::: : ..: :.: ::: : :. ... :.: :: ::::. . .:: CCDS99 -------CYNGGICVD-GVNWFRCECAPGFAGPDCRINIDECQSSPCAYGATCVDEINGY 760 770 780 790 800 810 960 970 980 990 1000 1010 pF1KB9 LCQCAPGYDGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGFVGLRCEGDVDECLD :.: :: : :.. . .: : ..:: :. ... : . :: .: CCDS99 RCSCPPGRAGPRCQEVIGFGRS--CWSRGTPFPHGSSWVEDCN----SCRCLDGRRDCSK 820 830 840 850 860 1020 1030 1040 1050 1060 pF1KB9 QPCHPTGTAAC--HSLANAFYCQCLPGHTGQWCEVEIDP--CHSQPCFHGGTCEATAGSP : : : . .:. :: : :: : .: : : :: : : : : CCDS99 VWC---GWKPCLLAGQPEALSAQC-P--LGQRC-LEKAPGQCLRPPCEAWGECGAE--EP 870 880 890 900 910 1070 1080 1090 1100 1110 1120 pF1KB9 LGFICHCPKGFEGPTCSHRAPSCGFHHCHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTP . : .: .:.. . . : .: CCDS99 PSTPCLPRSGHLDNNCARLTLHFNRDHVPQGTTVGAICSGIRSLPATRAVARDRLLVLLC 920 930 940 950 960 970 1130 1140 1150 1160 1170 1180 pF1KB9 PAPKGCGPPSPCLYNGSCSETTGLGGPGFRCSCPHSSPGPRCQKPGAKGCEGRSGDGACD CCDS99 DRASSGASAVEVAVSFSPARDLPDSSLIQGAAHAIVAAITQRGNSSLLLAVTEVKVETVV 980 990 1000 1010 1020 1030 >>CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 (870 aa) initn: 1202 init1: 682 opt: 1372 Z-score: 701.0 bits: 142.0 E(32554): 1e-32 Smith-Waterman score: 1493; 32.5% identity (52.8% similar) in 791 aa overlap (352-1047:27-800) 330 340 350 360 370 380 pF1KB9 GPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCIAATCAPGSTCIDRVGSFSCLC :..: :.. .: .::: : . .: : CCDS58 MALKNINYLLIFYLSFSLLIYIKNSFCNKNNTRCLSNSCQNNSTCKDFSKDNDCSC 10 20 30 40 50 390 400 410 420 430 pF1KB9 PPGRTGLL--C-HLEDMCLSQPCHGDAQCSTNPLTGSTLCLCQPGYSGPTCHQDLDECLM ..: : ...: :.:.::.:.: : ..: : :: : ::::: :. . : CCDS58 SDTANNLDKDCDNMKDPCFSNPCQGSATCVNTPGERSFLCKCPPGYSGTICETTIGSC-- 60 70 80 90 100 110 440 450 460 470 480 490 pF1KB9 AQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECLSQPCHPGSTCLDLLATFH : . :.::: : . : :.:: ::.: :: ::.:: :.::. :..: : . . CCDS58 ---GKNSCQHGGICHQDPIYPVCICPAGYAGRFCEIDHDECASSPCQNGAVCQDGIDGYS 120 130 140 150 160 170 500 510 520 530 540 550 pF1KB9 CLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICLPGFSGTRCEEDIDECRSS :.: :: .:. :..:..:::: :: :.: : . .. . ::: ..::. :: .:::: :. CCDS58 CFCVPGYQGRHCDLEVDECASDPCKNEATCLNEIGRYTCICPHNYSGVNCELEIDECWSQ 180 190 200 210 220 230 560 570 580 590 600 610 pF1KB9 PCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPVGASCLDLPGAFFCLCP-S :: ::. ::: ::. : : ::: : .:. ..::: :.:: :. :.: . . : : : CCDS58 PCLNGATCQDALGAYFCDCAPGFLGDHCELNTDECASQPCLHGGLCVDGENRYSCNCTGS 240 250 260 270 280 290 620 630 640 650 660 670 pF1KB9 GFTGQLCE--VPLCAPNLCQPKQICKDQKDKANCLCPDGSPGCAPPEDNCTCHHGHCQRS :::: :: .::: . :. . :.:. :. .: : : : : :. . :: . CCDS58 GFTGTHCETLMPLCWSKPCHNNATCEDSVDNYTCHCWPGYTGAQCEIDLNECNSNPCQSN 300 310 320 330 340 350 680 690 700 710 720 730 pF1KB9 SCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEMTACHS . ... : . : . : . . : . ::: : : :.:: : :... : : CCDS58 GECVELS-----SEKQYGRITGLPSSFS---YHEASGYVCICQPGFTGIHCEEDVNECSS 360 370 380 390 400 740 750 760 770 780 pF1KB9 GPCLNGGSCNPSPGGYYCTCPPSHT------GPQCQTSTDYCVSAPCFNGGTCVN--RPG .:: :::.:. ::.: : :: .. : .:. :. :.:.:::. . : CCDS58 NPCQNGGTCENLPGNYTCHCPFDNLSRTFYGGRDCSDILLGCTHQQCLNNGTCIPHFQDG 410 420 430 440 450 460 790 800 810 820 830 pF1KB9 T--FSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRC--------LCPTGYT ::::: :. : :: : . . . . .: : . : . CCDS58 QHGFSCLCPSGYTGSLCEIATTLSFEGDGFLWVKSGSVTTKGSVCNIALRFQTVQPMALL 470 480 490 500 510 520 840 850 860 870 880 pF1KB9 ---------------GGSCQTLMDLCAQ-KPCPRNSHCLQTGPSFHCLCLQGWTGPLCNL .: . ... : : :: . : .: . . . .: CCDS58 LFRSNRDVFVKLELLSGYIHLSIQVNNQSKVLLFISHNTSDGE-WHFVEVIFAEAVTLTL 530 540 550 560 570 580 890 900 910 920 pF1KB9 PLSSCQKAALSQGIDV----SSLC--HN---GGLCV---DSGPSY--FCHCP--PGFQGS .::.. .... .:.: .: ::: : ..: . : . : :.: : CCDS58 IDDSCKEKCIAKAPTPLESDQSICAFQNSFLGGLPVGMTSNGVALLNFYNMPSTPSFVGC 590 600 610 620 630 640 930 940 950 pF1KB9 LCQD------HV--------------------NPCESRPCQNGATCMAQPSGYLCQCAPG : :: :. . :::.:::. . :. .: :.: CCDS58 L-QDIKIDWNHITLENISSGSSLNVKAGCVRKDWCESQPCQSRGRCINLWLSYQCDCHRP 650 660 670 680 690 700 960 970 980 990 1000 pF1KB9 YDGQNCSK-------ELDA--CQSQP----CHNHGTCTPKPGGFHCACPPGFVGLRCEGD :.: :: . .: . : .. :.: :.:: ..: : :::.: :: : CCDS58 YEGPNCLRGKFCRQSRLPSTVCGNEKTNLTCYNGGNCTEFQTELKCMCRPGFTGEWCEKD 710 720 730 740 750 760 1010 1020 1030 1040 1050 1060 pF1KB9 VDECLDQPCHPTGTAACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAG .::: ..:: : :..: : : : : . .:. :::.. CCDS58 IDECASDPCVNGGL--CQDLLNKFQCLCDVAFAGERCEVDLADDLISDIFTTIGSVTVAL 770 780 790 800 810 1070 1080 1090 1100 1110 1120 pF1KB9 SPLGFICHCPKGFEGPTCSHRAPSCGFHHCHHGGLCLPSPKPGFPPRCACLSGYGGPDCL CCDS58 LLILLLAIVASVVTSNKRATQGTYSPSRQEKEGSRVEMWNLMPPPAMERLI 820 830 840 850 860 870 >>CCDS1390.1 CRB1 gene_id:23418|Hs108|chr1 (1406 aa) initn: 1202 init1: 682 opt: 1307 Z-score: 667.0 bits: 136.4 E(32554): 7.9e-31 Smith-Waterman score: 1430; 25.3% identity (46.4% similar) in 1390 aa overlap (6-1171:9-1333) 10 20 30 40 50 pF1KB9 MQPPSLLLLLL---LLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCA ::.. : ::. . : . : : . : :..:: ..: .. :.:. CCDS13 MALKNINYLLIFYLSFSLLIYIKNSFCNKNNTRCLS--NSCQNNSTCKDFS-KDNDCSCS 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 P--GFLGETCQ-FPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTG . : . :. . ::: . ::....: .: :::: : ::..: CCDS13 DTANNLDKDCDNMKDPCFSNP-CQGSATCVN------------TPGERSFLCKCPPGYSG 60 70 80 90 100 120 130 140 150 160 170 pF1KB9 ERCQAQLEDPCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQL-RDFCSANPCVNGGV :.. . : . :.. : :: : : : : :..:. :.. .: :...:: ::.: CCDS13 TICETTI-GSCGKNSCQHGGICH-QDPIYPVCICPAGYAGRFCEIDHDECASSPCQNGAV 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB9 CLATYPQIQCHCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPR : .: : ::..:. :. .:.:: .:: : . ..: : .: . :.:: . : CCDS13 CQDGIDGYSCFCVPGYQGRHCDLEVDECASDP--CKNEATCLNEIGRYTCICPHNYSGVN 170 180 190 200 210 220 240 250 260 270 280 pF1KB9 CELRAGPCPPRGCSNGGTCQLMPEKDST-FHLCLCPPGFIGPDCEVNPDNCVSHQCQNGG :::. : . : ::.::: :. ..: : :::.: ::.: :.:.:. : .:: CCDS13 CELEIDECWSQPCLNGATCQ-----DALGAYFCDCAPGFLGDHCELNTDECASQPCLHGG 230 240 250 260 270 290 300 310 320 330 340 pF1KB9 TCQDGLDTYTCLCPET-WTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWG : :: . :.: : . .:: : . : .. : :.:..::..:. .. : : :. CCDS13 LCVDGENRYSCNCTGSGFTGTHCETLMPLCWSK-P--CHNNATCEDSVDNYTCHCWPGYT 280 290 300 310 320 330 350 360 370 380 pF1KB9 GTSCEENLDDCIAATCAPGSTCID--------RV----GSFS--------CLCPPGRTGL :..:: .:..: . : .. :.. :. .::: :.: :: ::. CCDS13 GAQCEIDLNECNSNPCQSNGECVELSSEKQYGRITGLPSSFSYHEASGYVCICQPGFTGI 340 350 360 370 380 390 390 400 410 420 430 440 pF1KB9 LCHLEDM--CLSQPCHGDAQCSTNPLTGSTLCLC------QPGYSGPTCHQDLDECLMAQ :. ::. : :.::.. . : . : :. : : . :.: : . : : : CCDS13 HCE-EDVNECSSNPCQNGGTCENLP--GNYTCHCPFDNLSRTFYGGRDCSDILLGCTHQQ 400 410 420 430 440 450 460 470 480 pF1KB9 QGPSPCEHGGSCL----NTPGSFNCLCPPGYTGSRCEADHNECL----------SQPCHP : ..:.:. . .:.:::: ::::: :: . . .. CCDS13 -----CLNNGTCIPHFQDGQHGFSCLCPSGYTGSLCEIATTLSFEGDGFLWVKSGSVTTK 450 460 470 480 490 500 490 pF1KB9 GSTC--------------------------LDLLATF-H--------------------- ::.: :.::. . : CCDS13 GSVCNIALRFQTVQPMALLLFRSNRDVFVKLELLSGYIHLSIQVNNQSKVLLFISHNTSD 510 520 530 540 550 560 500 510 520 pF1KB9 --------------------------CLC--PPGLEGQ--LCEVETNECASAPCLNHADC :. : ::.. .: ... .. : .. CCDS13 GEWHFVEVIFAEAVTLTLIDDSCKEKCIAKAPTPLESDQSICAFQNSFLGGLPVGMTSNG 570 580 590 600 610 620 530 540 550 560 pF1KB9 HDLLNGFQCICLPGFSGTRCEEDI---------------------------DECRSSPCA ::: .. :.: : : .:: : :.:.:: CCDS13 VALLNFYNMPSTPSFVG--CLQDIKIDWNHITLENISSGSSLNVKAGCVRKDWCESQPCQ 630 640 650 660 670 680 570 580 590 600 pF1KB9 NGGQCQDQPGAFHCKCLPGFEGPRCQTE------------------VDECLSDPCPVGAS . :.: . ...: : .::: : : .:: .: .. CCDS13 SRGRCINLWLSYQCDCHRPYEGPNCLREYVAGRFGQDDSTGYVIFTLDESYGDTISLSMF 690 700 710 720 730 740 610 620 630 640 650 pF1KB9 CLDLPGAFFCLCPSGFTGQLCEV-------PLCAPNLCQPKQICKDQKDKANCLCPDGSP : . . : . : : .: . .:: .:: . : . .: . . CCDS13 VRTLQPSGLLLALENSTYQYIRVWLERGRLAMLTPN--SPKLVVKFVLNDGNVHLISLKI 750 760 770 780 790 800 660 670 680 690 700 pF1KB9 GCAPPEDNCTCHH-GHCQRSS------CVCDVGWTGPECEAELGGCISAPCAH------- : . .. : . :. : .: . :.::.: . : . CCDS13 KPYKIELYQSSQNLGFISASTWKIEKGDVIYIGGLPDKQETELNGGFFKGCIQDVRLNNQ 810 820 830 840 850 860 710 720 730 740 750 760 pF1KB9 GGTCYPQPSGYNCTCPTGYT-GPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTG . .:.:.. :. . :. . ..:.:.:: ::: :. . :.:: .: CCDS13 NLEFFPNPTNNASLNPVLVNVTQGCAGD-NSCKSNPCHNGGVCHSRWDDFSCSCPALTSG 870 880 890 900 910 770 780 790 800 810 820 pF1KB9 PQCQTSTDYCVSAPCFNGGTCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATC :. ...: .:: .:. : : :. :.: . .: . . . : CCDS13 KACEE-VQWCGFSPCPHGAQCQPVLQGFECIANAVFNGQSGQILFRSNGNITRELTNITF 920 930 940 950 960 970 830 840 850 860 870 pF1KB9 QDSPQGPRCLCPTGYTGGSCQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQG-------- . . . . .... : : ::.: ::. : : . CCDS13 GFRTRDANVII---LHAEKEPEFLNISIQD--SRLFFQLQSGNSFYMLSLTSLQSVNDGT 980 990 1000 1010 1020 1030 880 890 900 910 920 pF1KB9 WTGPLCNL--PLSSCQKAALSQGID---VSSLCHNGGLCV--DSGPSYF----CHCPPGF : .. :::. .. . . :.: .:.: :. : :. CCDS13 WHEVTLSMTDPLSQTSRWQMEVDNETPFVTSTIATGSLNFLKDNTDIYVGDRAIDNIKGL 1040 1050 1060 1070 1080 1090 930 940 950 960 970 980 pF1KB9 QGSLCQDHVNPCESRPCQNGATCMAQPSG-YLCQCAPGYDGQNCSKELDACQSQPCHNHG :: : ... .: . .:. . . . . .: . :..:.:.:: . : CCDS13 QGCLSTIEIGGIYLSYFENVHGFINKPQEEQFLKISTNSVVTGCLQ-LNVCNSNPCLHGG 1100 1110 1120 1130 1140 1150 990 1000 1010 1020 1030 1040 pF1KB9 TCTPKPGGFHCACPPGFVGLRCEGDVDECLDQPC-HPTGTAACHSLANAFYCQCLPGHTG .: ...::.:: :. : .:: ..:::...:: : . : . . :..: : ::.:: CCDS13 NCEDIYSSYHCSCPLGWSGKHCELNIDECFSNPCIH----GNCSDRVAAYHCTCEPGYTG 1160 1170 1180 1190 1200 1050 1060 1070 1080 1090 pF1KB9 QWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFEGPTCSH-RAPS--CGFHH-- :::.:: :.:. : .:.:: . .. :. : : .: : : . : :: :: .. CCDS13 VNCEVDIDNCQSHQCANGATCISHTN---GYSCLCFGNFTGKFCRQSRLPSTVCGNEKTN 1210 1220 1230 1240 1250 1260 1100 1110 1120 1130 1140 1150 pF1KB9 --CHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPCLYNGSCSETTGLG :..:: : .: : :. : : :. .::. .: :.. . CCDS13 LTCYNGGNCTEFQTE---LKCMCRPGFTGEWC--EKDIDECAS-DPCVNGGLCQDLLN-- 1270 1280 1290 1300 1310 1160 1170 1180 1190 1200 1210 pF1KB9 GPGFRCSCPHSSPGPRCQKPGAKGCEGRSGDGACDAGCSGPGGNWDGGDCSLGVPDPWKG :.: : . : ::. CCDS13 --KFQCLCDVAFAGERCEVDLADDLISDIFTTIGSVTVALLLILLLAIVASVVTSNKRAT 1320 1330 1340 1350 1360 1370 >>CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144 aa) initn: 854 init1: 557 opt: 1263 Z-score: 642.1 bits: 133.0 E(32554): 1.9e-29 Smith-Waterman score: 1791; 31.0% identity (53.4% similar) in 928 aa overlap (103-1006:394-1238) 80 90 100 110 120 130 pF1KB9 LCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLEDPCP--PSFCSKR :.:. ::: . :. . : : : .. CCDS47 DLLCKSIQTSCESFPLRNNATCKKCEKDYPCSCISGFTEKNCEKAI-DHCKLLSINCLNE 370 380 390 400 410 420 140 150 160 170 180 pF1KB9 GRCHIQASGRPQCSCMPGWTGEQCQ-LRD--FCSANPCVNG----GVCLATYP-QIQCHC : .. :: . :.:: : . : :.. . . : : :.: : :.. CCDS47 EWC-FNIIGRFKYVCIPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVW 430 440 450 460 470 480 190 200 210 220 230 pF1KB9 PPGF---EGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCP :: ::. :. .. : . : . .. : . . : .:: . :. CCDS47 QLGFAGSEGEKCQGVIDAYFFLAANCTEDATYVNDPEDNNSSCWFPHEGTK-EI------ 490 500 510 520 530 240 250 260 270 280 290 pF1KB9 PRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYT :.:: .: . :.:: . :: . : : . ..::. ..:.: .. CCDS47 ---CANGCSC--LSEEDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPR 540 550 560 570 580 300 310 320 330 340 350 pF1KB9 CLCPETWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDC : : .. : : .:: : : : : . . .: .. . . :: . .:: CCDS47 CSCSLSYIGRLCVVNVDYC--LGNHSISVHGLCLALSHNCNCSGLQRYERNICEIDTEDC 590 600 610 620 630 640 360 370 380 390 400 410 pF1KB9 IAATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLE-DMCLSQPCHGDAQCSTNPLTGSTLC .:.: :.: : : : :: : :... : : :.::.. : : .: :. .: CCDS47 KSASCKNGTTSTHLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQP--GNYFC 650 660 670 680 690 700 420 430 440 450 460 470 pF1KB9 LCQPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNE : : . . .: .:.::: :::.: ::: : .. CCDS47 QCVPPF------KVVD-----------------------GFSCLCNPGYVGIRCEQDIDD 710 720 730 480 490 500 510 520 530 pF1KB9 CLSQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCI :. . :. .::: :: ...:.: ::..:: :.::: :: :.. : :: ....: CCDS47 CILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKMNPCKNNSTCTDLYKSYRCE 740 750 760 770 780 790 540 550 560 570 580 590 pF1KB9 CLPGFSGTRCEEDIDECRSSPCANGGQCQDQ--PGAFHCKCLPGFEGPRCQTEVDEC--L : :..: : :.:.:: :.:: ::: :... :: : : : : . : :. . . : : CCDS47 CTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLCPPLYTGQFCHQRYNLCDLL 800 810 820 830 840 850 600 610 620 630 640 650 pF1KB9 SDPCPVGASCLDLPGAF-FCLCPSGFTGQLCEVPLCAPNLCQPKQICKDQKDKANCLCPD .:: ...:: : : :.: : :. ::. : :: :: . CCDS47 HNPCRNNSTCLALVDANQHCICREEFEGKNCEI---------------DVKD---CLFLS 860 870 880 890 660 670 680 690 700 710 pF1KB9 GSPGCAPPEDNCTCHHGHCQRSSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGY : .: :. . :.: :..: :: :.. : : :: ..::: . . CCDS47 ----C---QDYGDCED-MVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRF 900 910 920 930 940 950 720 730 740 750 760 770 pF1KB9 NCTCPTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVS :.: : :: : ... :. .:::. .: :: : : :..:: .:. . : :.: CCDS47 FCNCEPEYHGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINLDECLS 960 970 980 990 1000 1010 780 790 800 810 820 830 pF1KB9 APCFNGGTCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCP ::.. :.:.. . ..: : :: : .:: . .: ..:: . . : . . : : CCDS47 EPCLHDGVCIDGINHYTCDCKSGFFGTHCETNAN-DCLSNPCLH-GRCTELINEYPCSCD 1020 1030 1040 1050 1060 840 850 860 870 880 890 pF1KB9 TGYTGGSCQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQ . :. .:. .. :.. :: .. : ... .: :.: .:.:: :. ...: . :. CCDS47 ADGTSTQCKIKINDCTSIPCMNEGFCQKSAHGFTCICPRGYTGAYCEKSIDNCAEPELN- 1070 1080 1090 1100 1110 1120 900 910 920 930 940 950 pF1KB9 GIDVSSLCHNGGLCVDS-GPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGY : .: :::.:::. : .. :.: :::.:..:. ..: : : :: .:: : . .:: CCDS47 ----SVICLNGGICVDGPGHTFDCRCLPGFSGQFCEININECSSSPCLHGADCEDHINGY 1130 1140 1150 1160 1170 1180 960 970 980 990 1000 pF1KB9 LCQCAPGYDGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGF----VGLRCEGDVD .:.: ::..:..: .::. : . : : : . : : : ::: .:: : :: CCDS47 VCKCQPGWSGHHCENELE-CIPNSC-VHELCMENEPGSTCLCTPGFMTCSIGLLC-GDEI 1190 1200 1210 1220 1230 1240 1010 1020 1030 1040 1050 1060 pF1KB9 ECLDQPCHPTGTAACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSP CCDS47 RRITCLTPIFQRTDPISTQTYTIPPSETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIV 1250 1260 1270 1280 1290 1300 >>CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165 aa) initn: 854 init1: 557 opt: 1263 Z-score: 642.1 bits: 133.0 E(32554): 1.9e-29 Smith-Waterman score: 1791; 31.0% identity (53.4% similar) in 928 aa overlap (103-1006:394-1238) 80 90 100 110 120 130 pF1KB9 LCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLEDPCP--PSFCSKR :.:. ::: . :. . : : : .. CCDS78 DLLCKSIQTSCESFPLRNNATCKKCEKDYPCSCISGFTEKNCEKAI-DHCKLLSINCLNE 370 380 390 400 410 420 140 150 160 170 180 pF1KB9 GRCHIQASGRPQCSCMPGWTGEQCQ-LRD--FCSANPCVNG----GVCLATYP-QIQCHC : .. :: . :.:: : . : :.. . . : : :.: : :.. CCDS78 EWC-FNIIGRFKYVCIPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVW 430 440 450 460 470 480 190 200 210 220 230 pF1KB9 PPGF---EGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCP :: ::. :. .. : . : . .. : . . : .:: . :. CCDS78 QLGFAGSEGEKCQGVIDAYFFLAANCTEDATYVNDPEDNNSSCWFPHEGTK-EI------ 490 500 510 520 530 240 250 260 270 280 290 pF1KB9 PRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYT :.:: .: . :.:: . :: . : : . ..::. ..:.: .. CCDS78 ---CANGCSC--LSEEDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPR 540 550 560 570 580 300 310 320 330 340 350 pF1KB9 CLCPETWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDC : : .. : : .:: : : : : . . .: .. . . :: . .:: CCDS78 CSCSLSYIGRLCVVNVDYC--LGNHSISVHGLCLALSHNCNCSGLQRYERNICEIDTEDC 590 600 610 620 630 640 360 370 380 390 400 410 pF1KB9 IAATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLE-DMCLSQPCHGDAQCSTNPLTGSTLC .:.: :.: : : : :: : :... : : :.::.. : : .: :. .: CCDS78 KSASCKNGTTSTHLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQP--GNYFC 650 660 670 680 690 700 420 430 440 450 460 470 pF1KB9 LCQPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNE : : . . .: .:.::: :::.: ::: : .. CCDS78 QCVPPF------KVVD-----------------------GFSCLCNPGYVGIRCEQDIDD 710 720 730 480 490 500 510 520 530 pF1KB9 CLSQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCI :. . :. .::: :: ...:.: ::..:: :.::: :: :.. : :: ....: CCDS78 CILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKMNPCKNNSTCTDLYKSYRCE 740 750 760 770 780 790 540 550 560 570 580 590 pF1KB9 CLPGFSGTRCEEDIDECRSSPCANGGQCQDQ--PGAFHCKCLPGFEGPRCQTEVDEC--L : :..: : :.:.:: :.:: ::: :... :: : : : : . : :. . . : : CCDS78 CTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLCPPLYTGQFCHQRYNLCDLL 800 810 820 830 840 850 600 610 620 630 640 650 pF1KB9 SDPCPVGASCLDLPGAF-FCLCPSGFTGQLCEVPLCAPNLCQPKQICKDQKDKANCLCPD .:: ...:: : : :.: : :. ::. : :: :: . CCDS78 HNPCRNNSTCLALVDANQHCICREEFEGKNCEI---------------DVKD---CLFLS 860 870 880 890 660 670 680 690 700 710 pF1KB9 GSPGCAPPEDNCTCHHGHCQRSSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGY : .: :. . :.: :..: :: :.. : : :: ..::: . . CCDS78 ----C---QDYGDCED-MVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRF 900 910 920 930 940 950 720 730 740 750 760 770 pF1KB9 NCTCPTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVS :.: : :: : ... :. .:::. .: :: : : :..:: .:. . : :.: CCDS78 FCNCEPEYHGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINLDECLS 960 970 980 990 1000 1010 780 790 800 810 820 830 pF1KB9 APCFNGGTCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCP ::.. :.:.. . ..: : :: : .:: . .: ..:: . . : . . : : CCDS78 EPCLHDGVCIDGINHYTCDCKSGFFGTHCETNAN-DCLSNPCLH-GRCTELINEYPCSCD 1020 1030 1040 1050 1060 840 850 860 870 880 890 pF1KB9 TGYTGGSCQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQ . :. .:. .. :.. :: .. : ... .: :.: .:.:: :. ...: . :. CCDS78 ADGTSTQCKIKINDCTSIPCMNEGFCQKSAHGFTCICPRGYTGAYCEKSIDNCAEPELN- 1070 1080 1090 1100 1110 1120 900 910 920 930 940 950 pF1KB9 GIDVSSLCHNGGLCVDS-GPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGY : .: :::.:::. : .. :.: :::.:..:. ..: : : :: .:: : . .:: CCDS78 ----SVICLNGGICVDGPGHTFDCRCLPGFSGQFCEININECSSSPCLHGADCEDHINGY 1130 1140 1150 1160 1170 1180 960 970 980 990 1000 pF1KB9 LCQCAPGYDGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGF----VGLRCEGDVD .:.: ::..:..: .::. : . : : : . : : : ::: .:: : :: CCDS78 VCKCQPGWSGHHCENELE-CIPNSC-VHELCMENEPGSTCLCTPGFMTCSIGLLC-GDEI 1190 1200 1210 1220 1230 1240 1010 1020 1030 1040 1050 1060 pF1KB9 ECLDQPCHPTGTAACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSP CCDS78 RRITCLTPIFQRTDPISTQTYTIPPSETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIV 1250 1260 1270 1280 1290 1300 2003 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 9 12:13:26 2016 done: Wed Nov 9 12:13:27 2016 Total Scan time: 6.900 Total Display time: 1.180 Function used was FASTA [36.3.4 Apr, 2011]