FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9166, 2003 aa
1>>>pF1KB9166 2003 - 2003 aa - 2003 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.6967+/-0.00131; mu= 18.4722+/- 0.079
mean_var=407.6636+/-77.806, 0's: 0 Z-trim(113.6): 321 B-trim: 0 in 0/54
Lambda= 0.063522
statistics sampled from 13916 (14262) to 13916 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.74), E-opt: 0.2 (0.438), width: 16
Scan time: 6.900
The best scores are: opt bits E(32554)
CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003) 15277 1416.9 0
CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471) 3248 314.7 2.9e-84
CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555) 2662 261.0 4.4e-68
CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321) 2443 240.9 4.6e-62
CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238) 1536 157.3 3.6e-37
CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200) 1498 153.8 3.9e-36
CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 ( 870) 1372 142.0 1e-32
CCDS1390.1 CRB1 gene_id:23418|Hs108|chr1 (1406) 1307 136.4 7.9e-31
CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144) 1263 133.0 1.9e-29
CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165) 1263 133.0 1.9e-29
CCDS58053.1 CRB1 gene_id:23418|Hs108|chr1 (1382) 1243 130.5 4.5e-29
CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809) 1191 126.3 1.7e-27
CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 1151 122.7 2.3e-26
CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218) 1076 115.1 1.7e-24
CCDS46562.1 SNED1 gene_id:25992|Hs108|chr2 (1413) 975 106.0 1.1e-21
CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 955 104.7 5.7e-21
CCDS33390.1 DNER gene_id:92737|Hs108|chr2 ( 737) 939 102.2 8.1e-21
CCDS53454.1 CRB1 gene_id:23418|Hs108|chr1 (1294) 900 99.1 1.3e-19
CCDS5313.1 DLL1 gene_id:28514|Hs108|chr6 ( 723) 892 97.9 1.6e-19
CCDS75111.1 SLIT2 gene_id:9353|Hs108|chr4 (1521) 868 96.2 1.1e-18
CCDS75110.1 SLIT2 gene_id:9353|Hs108|chr4 (1525) 868 96.2 1.1e-18
CCDS3426.1 SLIT2 gene_id:9353|Hs108|chr4 (1529) 868 96.3 1.1e-18
CCDS48004.1 SVEP1 gene_id:79987|Hs108|chr9 (3571) 821 92.6 3.2e-17
CCDS4369.1 SLIT3 gene_id:6586|Hs108|chr5 (1523) 811 91.0 3.9e-17
CCDS64311.1 SLIT3 gene_id:6586|Hs108|chr5 (1530) 810 90.9 4.2e-17
CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044) 802 89.9 5.8e-17
CCDS9831.1 LTBP2 gene_id:4053|Hs108|chr14 (1821) 755 86.0 1.5e-15
CCDS6852.2 CRB2 gene_id:286204|Hs108|chr9 (1285) 749 85.2 1.9e-15
CCDS4142.1 MEGF10 gene_id:84466|Hs108|chr5 (1140) 745 84.8 2.3e-15
CCDS45232.1 DLL4 gene_id:54567|Hs108|chr15 ( 685) 739 83.8 2.6e-15
CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 745 85.0 2.6e-15
CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 745 85.0 2.7e-15
CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 745 85.0 2.7e-15
CCDS7453.1 SLIT1 gene_id:6585|Hs108|chr10 (1534) 727 83.3 8.2e-15
CCDS78055.1 MEGF10 gene_id:84466|Hs108|chr5 ( 567) 686 78.8 6.8e-14
CCDS12537.1 DLL3 gene_id:10683|Hs108|chr19 ( 587) 681 78.4 9.5e-14
CCDS12538.1 DLL3 gene_id:10683|Hs108|chr19 ( 618) 681 78.4 9.8e-14
CCDS4897.1 DLK2 gene_id:65989|Hs108|chr6 ( 383) 642 74.5 9.2e-13
CCDS54345.1 LTBP1 gene_id:4052|Hs108|chr2 (1342) 616 73.1 8.9e-12
CCDS33178.2 LTBP1 gene_id:4052|Hs108|chr2 (1395) 616 73.1 9.1e-12
CCDS33177.2 LTBP1 gene_id:4052|Hs108|chr2 (1721) 616 73.2 1e-11
CCDS75461.1 DLK2 gene_id:65989|Hs108|chr6 ( 377) 581 68.9 4.4e-11
>>CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003 aa)
initn: 15277 init1: 15277 opt: 15277 Z-score: 7584.7 bits: 1416.9 E(32554): 0
Smith-Waterman score: 15277; 99.9% identity (100.0% similar) in 2003 aa overlap (1-2003:1-2003)
10 20 30 40 50 60
pF1KB9 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 TCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::.:::
CCDS34 TCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAKLED
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 PCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQIQC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQIQC
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 HCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 HCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 RGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTC
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 LCPETWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCI
:::::::::::::::::::.::::::::::::::::::::::::::::::::::::::::
CCDS34 LCPETWTGWDCSEDVDECETQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 AATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLEDMCLSQPCHGDAQCSTNPLTGSTLCLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 AATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLEDMCLSQPCHGDAQCSTNPLTGSTLCLC
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 QPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 SQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 PGFSGTRCEEDIDECRSSPCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PGFSGTRCEEDIDECRSSPCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 GASCLDLPGAFFCLCPSGFTGQLCEVPLCAPNLCQPKQICKDQKDKANCLCPDGSPGCAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GASCLDLPGAFFCLCPSGFTGQLCEVPLCAPNLCQPKQICKDQKDKANCLCPDGSPGCAP
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 PEDNCTCHHGHCQRSSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PEDNCTCHHGHCQRSSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 YTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 YTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGG
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB9 TCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB9 CQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 CQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSL
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB9 CHNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 CHNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGY
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB9 DGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGFVGLRCEGDVDECLDQPCHPTGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGFVGLRCEGDVDECLDQPCHPTGT
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB9 AACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 AACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFE
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB9 GPTCSHRAPSCGFHHCHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GPTCSHRAPSCGFHHCHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPC
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB9 LYNGSCSETTGLGGPGFRCSCPHSSPGPRCQKPGAKGCEGRSGDGACDAGCSGPGGNWDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LYNGSCSETTGLGGPGFRCSCPHSSPGPRCQKPGAKGCEGRSGDGACDAGCSGPGGNWDG
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB9 GDCSLGVPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPPACTPAYDQYCH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GDCSLGVPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPPACTPAYDQYCH
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB9 DHFHNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DHFHNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLS
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KB9 LTLRVGLWVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGKETDSLSAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LTLRVGLWVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGKETDSLSAG
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KB9 FVVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 FVVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAP
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KB9 PANQLPWPVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRPRTQSAPHRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PANQLPWPVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRPRTQSAPHRR
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KB9 RPPLGEDSIGLKALKPKAEVDEDGVVMCSGPEEGEEVGQAEETGPPSTCQLWSLSGGCGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RPPLGEDSIGLKALKPKAEVDEDGVVMCSGPEEGEEVGQAEETGPPSTCQLWSLSGGCGA
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KB9 LPQAAMLTPPQESEMEAPDLDTRGPDGVTPLMSAVCCGEVQSGTFQGAWLGCPEPWEPLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LPQAAMLTPPQESEMEAPDLDTRGPDGVTPLMSAVCCGEVQSGTFQGAWLGCPEPWEPLL
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KB9 DGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQPDRAGRTPLHAAVAADAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQPDRAGRTPLHAAVAADAR
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KB9 EVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAAQADVGARDKWGKTALHW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAAQADVGARDKWGKTALHW
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KB9 AAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVAQLLLGLGAARELRDQAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 AAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVAQLLLGLGAARELRDQAG
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KB9 LAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREAGPFPRARTVSVSVPPHGGGALPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREAGPFPRARTVSVSVPPHGGGALPR
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KB9 CRTLSAGAGPRGGGACLQARTWSVDLAARGGGAYSHCRSLSGVGAGGGPTPRGRRFSAGM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 CRTLSAGAGPRGGGACLQARTWSVDLAARGGGAYSHCRSLSGVGAGGGPTPRGRRFSAGM
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KB9 RGPRPNPAIMRGRYGVAAGRGGRVSTDDWPCDWVALGACGSASNIPIPPPCLTPSPERGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RGPRPNPAIMRGRYGVAAGRGGRVSTDDWPCDWVALGACGSASNIPIPPPCLTPSPERGS
1930 1940 1950 1960 1970 1980
1990 2000
pF1KB9 PQLDCGPPALQEMPINQGGEGKK
:::::::::::::::::::::::
CCDS34 PQLDCGPPALQEMPINQGGEGKK
1990 2000
>>CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471 aa)
initn: 2785 init1: 834 opt: 3248 Z-score: 1626.2 bits: 314.7 E(32554): 2.9e-84
Smith-Waterman score: 5080; 38.4% identity (57.8% similar) in 2079 aa overlap (4-1773:6-2016)
10 20 30 40 50
pF1KB9 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFL
:.:: :: : : :.. . ..: : . :::.: : :.. : : :.: :::
CCDS90 MPALRPALLWALLALWLCCAAPA--HALQCRDGYEPCVNEGMCVTYHNGTGYCKCPEGFL
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 GETCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQL
:: :: :::.. . :::::.: : : :: . : : ::::: :: .
CCDS90 GEYCQHRDPCEKNR-CQNGGTCVA--QAMLGKAT----------CRCASGFTGEDCQYST
60 70 80 90 100
120 130 140 150 160 170
pF1KB9 EDPCPPSF-CSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQ
:: : : . : ::. . .:.:. :.::..:: : : ..::.::..: .. :
CCDS90 SHPCFVSRPCLNGGTCHMLSRDTYECTCQVGFTGKECQWTDACLSHPCANGSTCTTVANQ
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB9 IQCHCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGP
..:.: :: :. :: ::::: . :: : .: .: : ::.:: :: : : :. :
CCDS90 FSCKCLTGFTGQKCETDVNEC-DIPGHCQHGGTCLNLPGSYQCQCPQGFTGQYCDSLYVP
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB9 CPPRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDT
: : : :::::. : ::. : : ::: : :: : :.: .:.:::::.: ::..:
CCDS90 CAPSPCVNGGTCR--QTGDFTFE-CNCLPGFEGSTCERNIDDCPNHRCQNGGVCVDGVNT
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB9 YTCLCPETWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLD
:.: :: ::: :.:::::: : : :.::::: : :.. ::::.::.: .: ::.:
CCDS90 YNCRCPPQWTGQFCTEDVDECLLQ-PNACQNGGTCANRNGGYGCVCVNGWSGDDCSENID
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB9 DCIAATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLEDMCLSQPCHGDAQCSTNPLTGSTL
:: :.:.:::::::::.::::.:: :..::::::.: :.:.::: : :.::::.:. .
CCDS90 DCAFASCTPGSTCIDRVASFSCMCPEGKAGLLCHLDDACISNPCHKGALCDTNPLNGQYI
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB9 CLCQPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHN
: : ::.: : .:.::: ::.. .::::.:.:.:: :.:.: : ::.: ::: : :
CCDS90 CTCPQGYKGADCTEDVDECAMANS--NPCEHAGKCVNTDGAFHCECLKGYAGPRCEMDIN
410 420 430 440 450
480 490 500 510 520 530
pF1KB9 ECLSQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQC
:: :.::. .:::: .. : ::: ::..: ::.: ::: : ::.:...: : .: :::
CCDS90 ECHSDPCQNDATCLDKIGGFTCLCMPGFKGVHCELEINECQSNPCVNNGQCVDKVNRFQC
460 470 480 490 500 510
540 550 560 570
pF1KB9 ICLPGFSGTRCEEDIDECRSSPCANGGQCQDQPGAFHCKCL-------------------
.: :::.: :. :::.: :.:: ::..: :.:....:.:
CCDS90 LCPPGFTGPVCQIDIDDCSSTPCLNGAKCIDHPNGYECQCATGFTGVLCEENIDNCDPDP
520 530 540 550 560 570
580 590 600 610
pF1KB9 ------------------PGFEGPRCQTEVDECLSDPCPVGASCLDL---------PGA-
::. : :. ..::: :.:: . :.:: ::.
CCDS90 CHHGQCQDGIDSYTCICNPGYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQCNCQPGTS
580 590 600 610 620 630
620 630 640
pF1KB9 ---------------------------FFCLCPSGFTGQLCEVPL--CAPNLCQPKQICK
. :.: ::::: :.. . :: : :. :
CCDS90 GVNCEINFDDCASNPCIHGICMDGINRYSCVCSPGFTGQRCNIDIDECASNPCRKGATCI
640 650 660 670 680 690
650 660 670 680 690
pF1KB9 DQKDKANCLCPDGS--PGCAPPEDNCT---CHHGHCQRS----SCVCDVGWTGPECEAEL
. . :.::.: :.: ..: : ::.: . .:.::.::.: .::..
CCDS90 NGVNGFRCICPEGPHHPSCYSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVGINCEVDK
700 710 720 730 740 750
700 710 720 730 740
pF1KB9 GGCISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEMTACHSGPCLNGGSC--------
. :.: :: .:::: .:: ::: :. : .:. .. : :.:::: :.:
CCDS90 NECLSNPCQNGGTCDNLVNGYRCTCKKGFKGYNCQVNIDECASNPCLNQGTCFDDISGYT
760 770 780 790 800 810
pF1KB9 -------------------NPSP-------------------------------------
.:.:
CCDS90 CHCVLPYTGKNCQTVLAPCSPNPCENAAVCKESPNFESYTCLCAPGWQGQRCTIDIDECI
820 830 840 850 860 870
750 760 770 780 790
pF1KB9 --------------GGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGGTCVNRPGTFSCLCA
:.:.: :::. .: .:. . : :.. :: :::.:.. .::::::
CCDS90 SKPCMNHGLCHNTQGSYMCECPPGFSGMDCEEDIDDCLANPCQNGGSCMDGVNTFSCLCL
880 890 900 910 920 930
800 810 820
pF1KB9 MGFQGPRCEGKLRPSCADSPCRNRATCQD-------------------------------
:: : .:. . : . ::.: .::.:
CCDS90 PGFTGDKCQTDMNE-CLSEPCKNGGTCSDYVNSYTCKCQAGFDGVHCENNINECTESSCF
940 950 960 970 980 990
830
pF1KB9 ---------------SPQG----------------P--------------RCLCPTGYTG
: : : :: :: ::::
CCDS90 NGGTCVDGINSFSCLCPVGFTGSFCLHEINECSSHPCLNEGTCVDGLGTYRCSCPLGYTG
1000 1010 1020 1030 1040 1050
840 850 860 870 880 890
pF1KB9 GSCQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVS
.::::..::...:: .. :.: .::: .::.: :..: ::. :: .:. :
CCDS90 KNCQTLVNLCSRSPCKNKGTCVQKKAESQCLCPSGWAGAYCDVPNVSCDIAASRRGVLVE
1060 1070 1080 1090 1100 1110
900 910 920 930 940 950
pF1KB9 SLCHNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAP
::...:.:...: ...:.:: :. :: :..... : : :::.:::: .:: :.:.:
CCDS90 HLCQHSGVCINAGNTHYCQCPLGYTGSYCEEQLDECASNPCQHGATCSDFIGGYRCECVP
1120 1130 1140 1150 1160 1170
960 970 980
pF1KB9 GYDGQNCSKELDACQSQPCHNHGTCT----------P-----------------------
::.: :: :.: ::.:::.: ::: :
CCDS90 GYQGVNCEYEVDECQNQPCQNGGTCIDLVNHFKCSCPPGTRGLLCEENIDDCARGPHCLN
1180 1190 1200 1210 1220 1230
990 1000 1010 1020 1030
pF1KB9 ------KPGGFHCACPPGFVGLRCEGDVDECLDQPCHPTGTAACHSLANAFYCQCLPGHT
. ::. : : :::.: :::::..:::..:: :. : .:.: . : : . :
CCDS90 GGQCMDRIGGYSCRCLPGFAGERCEGDINECLSNPCSSEGSLDCIQLTNDYLCVCRSAFT
1240 1250 1260 1270 1280 1290
1040 1050 1060 1070 1080 1090
pF1KB9 GQWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFEGPTCSHRAPSCGFHHCHHG
:. ::. .: : ..::..:::: .... : ::::.:: :: : :. ::: .:..:
CCDS90 GRHCETFVDVCPQMPCLNGGTCAVASNMPDGFICRCPPGFSGARCQ---SSCGQVKCRKG
1300 1310 1320 1330 1340 1350
1100 1110 1120 1130 1140 1150
pF1KB9 GLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPCLYNGSCSETTGLGGPGFRC
:. . . : ::: : : :: . ::. ::: ..::: : . :
CCDS90 EQCVHTAS-G--PRCFCPSPR---DCES-----GCAS-SPCQHGGSCHPQRQ--PPYYSC
1360 1370 1380 1390 1400
1160 1170 1180 1190 1200
pF1KB9 SCPHSSPGPRCQ-------KPGA----KGCEGRSGDGACDAGCSGPGGNWDGGDCSLGVP
.: : ::. : : . : .. ::.:: .:.. . .:::::::: .
CCDS90 QCAPPFSGSRCELYTAPPSTPPATCLSQYCADKARDGVCDEACNSHACQWDGGDCSLTME
1410 1420 1430 1440 1450 1460
1210 1220 1230 1240 1250 1260
pF1KB9 DPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCE-TPPACTPAYDQYCHDHFHNGH
.:: .: : :: . ..:: :.. :::::...:. . .: ::.:: :::...:
CCDS90 NPWANCSSPLPCWD-YINNQCDELCNTVECLFDNFECQGNSKTC--KYDKYCADHFKDNH
1470 1480 1490 1500 1510
1270 1280 1290 1300 1310 1320
pF1KB9 CEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLSLTLRVGL
:..:::. :::::: :: .. . .:...:.. : : :. .. :.:. :...:
CCDS90 CDQGCNSEECGWDGLDCAADQPENLAEGTLVIVVLMPPEQLLQDARSFLRALGTLLHTNL
1520 1530 1540 1550 1560 1570
1330 1340 1350 1360 1370 1380
pF1KB9 WVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGKETDSLSAGFVVVMGV
...: .:. ::::: : :: .. . . .:. : : .:. :: : . .
CCDS90 RIKRDSQGELMVYPYYG----EKSAAMKKQRMTRRSLPGEQE--QEV----AGSKVFLEI
1580 1590 1600 1610 1620
1390 1400 1410 1420 1430 1440
pF1KB9 DLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAPPANQLPW
: .: : ...: . ::. : :.. : ::..: .. : : .:: .
CCDS90 DNRQCVQD--SDHCFKNTDAA----AALLASHAIQGTLSYPLVSVVSESLT-PERTQLLY
1630 1640 1650 1660 1670 1680
1450 1460 1470 1480 1490 1500
pF1KB9 PVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRPRTQSAPHRRRPPLGED
. . : .... ::.... .:.:.::.:::: ::: : ... :.:: :.:.:
CCDS90 LLAVAVVIILFIILLGVIMA-----KRKRKHGSLWLPEGFTL--RRDASNHKRREPVGQD
1690 1700 1710 1720 1730
1510 1520 1530 1540 1550
pF1KB9 SIGLKALKPK-AEVDEDGV------VMCSGPE----EGEEVGQAEETGPPSTCQLWSLSG
..::: :. . .:.. :. : ::. ..:. . : : . :. .
CCDS90 AVGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDRRPWTQQH
1740 1750 1760 1770 1780 1790
1560 1570 1580 1590 1600
pF1KB9 GCGA----LPQAAMLTPPQ-ESEMEAPDLDTRGPDGVTPLMSAVCCGEVQ--SGTFQGAW
.: :. : ::::: :.:... :...::::: :::: : : . : . :
CCDS90 LEAADIRRTPSLA-LTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSDLSDEDEDAE
1800 1810 1820 1830 1840 1850
1610 1620 1630 1640 1650 1660
pF1KB9 LGCPEPWEPLLDGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQPDRAGRT
. . :. :: ::.: ::: ::::::.:: ::.:::.:::. : : ::
CCDS90 DSSANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANAQDNMGRC
1860 1870 1880 1890 1900 1910
1670 1680 1690 1700 1710 1720
pF1KB9 PLHAAVAADAREVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAAQADVGA
::::::::::. : :.:.:.: : .::: .::::::.:::::::: .: ::: ::::.:
CCDS90 PLHAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELINCQADVNA
1920 1930 1940 1950 1960 1970
1730 1740 1750 1760 1770 1780
pF1KB9 RDKWGKTALHWAAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVAQLLLGL
: ::.::::::::::..:. ::. ::..: :::.:.:::::
CCDS90 VDDHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEAAKILLDH
1980 1990 2000 2010 2020 2030
1790 1800 1810 1820 1830 1840
pF1KB9 GAARELRDQAGLAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREAGPFPRARTVSVS
CCDS90 FANRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPPGTVLTSALSPVICGPNRSFL
2040 2050 2060 2070 2080 2090
>>CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555 aa)
initn: 2706 init1: 819 opt: 2662 Z-score: 1335.8 bits: 261.0 E(32554): 4.4e-68
Smith-Waterman score: 5134; 39.0% identity (60.9% similar) in 2007 aa overlap (32-1889:224-2179)
10 20 30 40 50 60
pF1KB9 QPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGET
: :: ::::: . : : ::: :..
CCDS43 TCHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTGQN
200 210 220 230 240 250
70 80 90 100
pF1KB9 CQFP-DPCQNAQLCQNGGSCQALL--------PAPLGLPSSPS----PLTPS--------
:. : : . . :.:::.: . : : . . : :.
CCDS43 CEENIDDCPGNN-CKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTC
260 270 280 290 300 310
110 120 130 140 150
pF1KB9 ------FLCTCLPGFTGERCQAQLEDPCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQC
. :.:. :.::: :. ...: : . : . . :: .... : : : :: :
CCDS43 HNTHGGYNCVCVNGWTGEDCSENIDD-CASAACFHGATCHDRVASF-YCECPHGRTGLLC
320 330 340 350 360 370
160 170 180 190 200 210
pF1KB9 QLRDFCSANPCVNGGVCLATYP---QIQCHCPPGFEGHACERDVNECFQDPGPCPKGTSC
.: : : .::: .:. : : : . : :: :. : :: .::.:: .:: .. .:
CCDS43 HLNDACISNPCNEGSNC-DTNPVNGKAICTCPSGYTGPACSQDVDECSLGANPCEHAGKC
380 390 400 410 420
220 230 240 250 260 270
pF1KB9 HNTLGSFQCLCPVGQEGPRCELRAGPCPPRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGP
::::::.: : : :::::. .. : :.: .:: .. . :. :.: ::. :
CCDS43 INTLGSFECQCLQGYTGPRCEIDVNECVSNPCQNDATCL---DQIGEFQ-CICMPGYEGV
430 440 450 460 470 480
280 290 300 310 320 330
pF1KB9 DCEVNPDNCVSHQCQNGGTCQDGLDTYTCLCPETWTGWDCSEDVDECEAQGPPHCRNGGT
:::: :.:.: : ..: : : .. . : :: .:: :. ::::: :. : :.::.
CCDS43 HCEVNTDECASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDEC-ASTP--CKNGAK
490 500 510 520 530 540
340 350 360 370 380 390
pF1KB9 CQNSAGSFHCVCVSGWGGTSCEENLDDCIAATCAPGSTCIDRVGSFSCLCPPGRTGLLCH
: .. ... :::. :. :: :: ..:.: : :: : : :..:.::: :: :: :.
CCDS43 CLDGPNTYTCVCTEGYTGTHCEVDIDECDPDPCHYGS-CKDGVATFTCLCRPGYTGHHCE
550 560 570 580 590 600
400 410 420 430 440 450
pF1KB9 LE-DMCLSQPCHGDAQCSTNPLTGSTLCLCQPGYSGPTCHQDLDECLMAQQGPSPCEHGG
. . : ::::. . :. .. ::.: : .::.:. .::.: . :::. .:
CCDS43 TNINECSSQPCRHGGTCQDR--DNAYLCFCLKGTTGPNCEINLDDC-----ASSPCD-SG
610 620 630 640 650
460 470 480 490 500 510
pF1KB9 SCLNTPGSFNCLCPPGYTGSRCEADHNECLSQPCHPGSTCLDLLATFHCLCPPGLEGQLC
.::. ...: : :::::: :. . .:: ..::: :.:: : . : : :: : . :
CCDS43 TCLDKIDGYECACEPGYTGSMCNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTC
660 670 680 690 700 710
520 530 540 550 560 570
pF1KB9 EVETNECASAPCLNHADCHDLLNGFQCICLPGFSGTRCEEDIDECRSSPCANGGQCQDQP
:.::: : ::. :. :.: :::..: : ::.::: :. . .::.:.::.::: :.:.
CCDS43 LSEVNECNSNPCV-HGACRDSLNGYKCDCDPGWSGTNCDINNNECESNPCVNGGTCKDMT
720 730 740 750 760 770
580 590 600 610 620
pF1KB9 GAFHCKCLPGFEGPRCQTEVDECLSDPCPVGASCLDLPGAFFCLCPSGFTGQLCEVPL--
... : : :: :: :::...:: :.:: ..:.: ... : : .:: ::: :
CCDS43 SGYVCTCREGFSGPNCQTNINECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAP
780 790 800 810 820 830
630 640 650 660 670
pF1KB9 CAPNLCQPKQICKDQKDKAN--CLCPDGSPG--CAPPEDNCT---CHHG-HCQRSS----
:::. :. :....: . :.:: : : : ..:. :.:: :: .
CCDS43 CAPSPCRNGGECRQSEDYESFSCVCPTGWQGQTCEVDINECVLSPCRHGASCQNTHGGYR
840 850 860 870 880 890
680 690 700 710 720 730
pF1KB9 CVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEMTACHSG
: :..:..: .::... : :: .::.: . : : :. : : :... : :
CCDS43 CHCQAGYSGRNCETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASD
900 910 920 930 940 950
740 750 760 770 780 790
pF1KB9 PCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGGTCVNRPGTFSCLCAMG
:: ::..:. .: :::: . .: .:...: :. . ::::::::. ..:.::: :
CCDS43 PCRNGANCTDCVDSYTCTCPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPG
960 970 980 990 1000 1010
800 810 820 830 840 850
pF1KB9 FQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGSCQTLMDLCAQKPCPRN
: : :. . : ..:: . .::::. . :: :: :::: .::.:. : ..:: .
CCDS43 FTGSYCQHDVNE-CDSQPCLHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNG
1020 1030 1040 1050 1060 1070
860 870 880 890 900 910
pF1KB9 SHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSLCHNGGLCVDSGPSYFC
..: :: ...: : .:::: :..: ::. :: ::.::. ::..::::::.: .. :
CCDS43 GKCWQTHTQYRCECPSGWTGLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHC
1080 1090 1100 1110 1120 1130
920 930 940 950 960 970
pF1KB9 HCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGYDGQNCSKELDACQSQP
.: :. :: :.: :. : :::::::: .:: :.:. :: : :::.:.: : :.:
CCDS43 RCQAGYTGSYCEDLVDECSPSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHP
1140 1150 1160 1170 1180 1190
980 990
pF1KB9 CHNHGTCTPKP----------------------------------------------GGF
:.: ::: : ::.
CCDS43 CQNGGTCLDLPNTYKCSCPRGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGY
1200 1210 1220 1230 1240 1250
1000 1010 1020 1030 1040 1050
pF1KB9 HCACPPGFVGLRCEGDVDECLDQPCHPTGTAACHSLANAFYCQCLPGHTGQWCEVEIDPC
:.::::::: ::::::.:::..:: :: : . .: :.:.: ::::. :: :. :
CCDS43 SCTCPPGFVGERCEGDVNECLSNPCDARGTQNCVQRVNDFHCECRAGHTGRRCESVINGC
1260 1270 1280 1290 1300 1310
1060 1070 1080 1090 1100 1110
pF1KB9 HSQPCFHGGTCEATAGSPLGFICHCPKGFEGPTCSHRAPSCGFHHCHHGGLCLPSPKPGF
...:: .:::: ..... ::::.:: :::: :: . : .:: .: .:: :. .:.
CCDS43 KGKPCKNGGTCAVASNTARGFICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRS--
1320 1330 1340 1350 1360
1120 1130 1140 1150 1160 1170
pF1KB9 PPRCACLSGYGGPDCLTPPAPKGCGPPSPCLYNGSCSETTGLGGPGFRCSCPHSSPGPRC
: : ::. . ::.: : : . : .:: .:.: :. .: .:: :: . : :
CCDS43 -PTCLCLGPFTGPECQFP-ASSPCLGGNPCYNQGTCEPTSE--SPFYRCLCPAKFNGLLC
1370 1380 1390 1400 1410 1420
1180 1190 1200
pF1KB9 QK-----PGAKG----------------CEGRSGDGACDAGCSGPGGNWDGGDCSLGVPD
. :. : :. .:. .:. :.. . .::::::::. :
CCDS43 HILDYSFGGGAGRDIPPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFND
1430 1440 1450 1460 1470 1480
1210 1220 1230 1240 1250 1260
pF1KB9 PWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPPA-CTPAYDQYCHDHFHNGHC
:::.: . .:: : ::.: ::.: :::::.::. . :.: :::::.::: .:::
CCDS43 PWKNCTQSLQCWKYFSDGHCDSQCNSAGCLFDGFDCQRAEGQCNPLYDQYCKDHFSDGHC
1490 1500 1510 1520 1530 1540
1270 1280 1290 1300 1310 1320
pF1KB9 EKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLSLTLRVGLW
..:::.::: ::: :: . . . .:...:.. : : .. : . : :: .:....
CCDS43 DQGCNSAECEWDGLDCAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVV
1550 1560 1570 1580 1590 1600
1330 1340 1350 1360 1370
pF1KB9 VRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAP-----QTQ----PLG-------K
..: :..:..:: : : :: . . ::: :.. : : .
CCDS43 FKRDAHGQQMIFPYYG-REEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRR
1610 1620 1630 1640 1650 1660
1380 1390 1400 1410 1420 1430
pF1KB9 ETDSLSA-GFVVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLA
: : ... : .: . .: .: . .:.: . . ::.:.:..:.:. .: . :
CCDS43 ELDPMDVRGSIVYLEIDNRQCV--QASSQCFQSATDVAAFLGALASLGSLN--IPYKIEA
1670 1680 1690 1700 1710 1720
1440 1450 1460 1470 1480 1490
pF1KB9 VHPHAGTAPPANQLPWPVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRP
:. .. :: :: . . . .: :.:. .: ..:. :.:::.:: ::.: ::
CCDS43 VQSETVEPPPPAQLHF-MYVAAAAFVLLFFVGCGVLLS--RKRRRQHGQLWFPEGFKV--
1730 1740 1750 1760 1770
1500 1510 1520 1530 1540
pF1KB9 RTQSAPHRRRPPLGEDSIGLKALKPKAEVDEDGVVMCSGPEE-GEEVGQAE---------
.... ..:: ::::::.::: :: . ::..: .. .: :.: ...
CCDS43 -SEASKKKRREPLGEDSVGLKPLKNAS----DGALMDDNQNEWGDEDLETKKFRFEEPVV
1780 1790 1800 1810 1820 1830
1550 1560 1570 1580 1590
pF1KB9 --ETGPPSTCQLWSLSGGCGA-LPQAAML-TPPQ-ESEMEAPDLDTRGPDGVTPLMSAVC
. . . :. . .: : ..:: :::: : . . :...::::: :::: : :
CCDS43 LPDLDDQTDHRQWTQQHLDAADLRMSAMAPTPPQGEVDADCMDVNVRGPDGFTPLMIASC
1840 1850 1860 1870 1880 1890
1600 1610 1620 1630 1640 1650
pF1KB9 CGE-VQSGTFQGAWLGCPEPWEPLLDGGACPQAHTVGTGETPLHLAARFSRPTAARRLLE
: ...:. . : .. :: . .: :::: ::::::.:: ::.::::
CCDS43 SGGGLETGNSEEEE-DAPAVISDFIYQGASLHNQTDRTGETALHLAARYSRSDAAKRLLE
1900 1910 1920 1930 1940
1660 1670 1680 1690 1700 1710
pF1KB9 AGANPNQPDRAGRTPLHAAVAADAREVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVED
:.:. : : :::::::::.:::. : :.:.:.: : .::: .::::::.::::::::
CCDS43 ASADANIQDNMGRTPLHAAVSADAQGVFQILIRNRATDLDARMHDGTTPLILAARLAVEG
1950 1960 1970 1980 1990 2000
1720 1730 1740 1750 1760 1770
pF1KB9 LVEELIAAQADVGARDKWGKTALHWAAAVNNARAARSLLQAGADKDAQDNREQTPLFLAA
..:.:: ..:::.: : ::.::::::::::. :: ::. ::.:: :.:::.:::::::
CCDS43 MLEDLINSHADVNAVDDLGKSALHWAAAVNNVDAAVVLLKNGANKDMQNNREETPLFLAA
2010 2020 2030 2040 2050 2060
1780 1790 1800 1810 1820 1830
pF1KB9 REGAVEVAQLLLGLGAARELRDQAGLAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGR
:::. :.:..:: : :.. :. : :.:..: : :.. ::. : .:
CCDS43 REGSYETAKVLLDHFANRDITDHMDRLPRDIAQERMHHDIVRLLD-----EYNLVRSPQL
2070 2080 2090 2100 2110 2120
1840 1850 1860 1870 1880 1890
pF1KB9 EAGPFPRARTVSVSV-PPHG--GGALPRCRTLSAGAGPRGGGACLQARTWSVDLAARGGG
...:. . :.: . :.: :. : . .. : :: . . :: ::
CCDS43 HGAPLGGTPTLSPPLCSPNGYLGSLKPGVQGKKVRKPSSKGLAC--GSKEAKDLKARRKK
2130 2140 2150 2160 2170 2180
1900 1910 1920 1930 1940 1950
pF1KB9 AYSHCRSLSGVGAGGGPTPRGRRFSAGMRGPRPNPAIMRGRYGVAAGRGGRVSTDDWPCD
CCDS43 SQDGKGCLLDSSGMLSPVDSLESPHGYLSDVASPPLLPSPFQQSPSVPLNHLPGMPDTHL
2190 2200 2210 2220 2230 2240
>--
initn: 435 init1: 435 opt: 679 Z-score: 353.7 bits: 79.3 E(32554): 2.2e-13
Smith-Waterman score: 679; 39.0% identity (61.9% similar) in 236 aa overlap (3-238:2-222)
10 20 30 40 50 60
pF1KB9 MQPPSLLLLLLLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGE
:: : :: : :: ... :: :.. : : ::: : . . : .: :. .:.:
CCDS43 MPPLLAPLLCLALLPALAARGPR---CSQPGETCLNGGKCEAAN-GTEACVCGGAFVGP
10 20 30 40 50
70 80 90 100 110 120
pF1KB9 TCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLED
:: :.:: .. :.:.:.:... :. . . :.: ::.: : . :..
CCDS43 RCQDPNPCLSTP-CKNAGTCHVV--DRRGVAD--------YACSCALGFSGPLCLTPLDN
60 70 80 90 100
130 140 150 160 170 180
pF1KB9 PCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQLRDFCSANPCVNGGVCLATYPQIQC
: . : . : : . . . .: : :::.:..:: : :..:::.::: :: . :
CCDS43 ACLTNPCRNGGTCDLLTLTEYKCRCPPGWSGKSCQQADPCASNPCANGGQCLPFEASYIC
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB9 HCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPP
::::.:.: .:..::::: : :: : .: .::: .::..:.: . . :: :: ::
CCDS43 HCPPSFHGPTCRQDVNECGQKPGLCRHGGTCHNEVGSYRCVCRATHTGPNCERPYVPCSP
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB9 RGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTC
CCDS43 SPCQNGGTCRPTGDVTHECACLPGFTGQNCEENIDDCPGNNCKNGGACVDGVNTYNCRCP
230 240 250 260 270 280
>>CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321 aa)
initn: 2955 init1: 730 opt: 2443 Z-score: 1227.7 bits: 240.9 E(32554): 4.6e-62
Smith-Waterman score: 4956; 37.2% identity (59.3% similar) in 2129 aa overlap (41-1994:174-2208)
20 30 40 50 60
pF1KB9 LLLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCAPGFLGETCQFPD-PCQ
::. :. ::: :. : :. : ::
CCDS12 CSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTP-GSFRCQCPAGYTGPLCENPAVPCA
150 160 170 180 190 200
70 80 90 100 110 120
pF1KB9 NAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLEDPCPPSFCSK
. :.:::.:. . . :: . :.::::: :. :.....: :: : .
CCDS12 PSP-CRNGGTCR-----------QSGDLT--YDCACLPGFEGQNCEVNVDD-CPGHRCLN
210 220 230 240
130 140 150 160 170 180
pF1KB9 RGRCHIQASGRPQCSCMPGWTGEQC-QLRDFCSANP--CVNGGVCLATYPQIQCHCPPGF
: : ... . .:.: : :::. : . : :. .: : :::.:. : .: : :.
CCDS12 GGTC-VDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGW
250 260 270 280 290 300
190 200 210 220 230 240
pF1KB9 EGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCPPRGCSNG
:..: .....: . : .:..::. ..:: : ::.:. : :.: . : : .
CCDS12 TGESCSQNIDDC--ATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDA-CVSNPCHED
310 320 330 340 350 360
250 260 270 280 290 300
pF1KB9 GTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCV--SHQCQNGGTCQDGLDTYTCLCPE
. :. : . . .: ::::: : :. . :.: .. :.. : : . .. : : .
CCDS12 AICDTNPVNGRA--ICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCGR
370 380 390 400 410 420
310 320 330 340 350 360
pF1KB9 TWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCIAATC
.:: : ::.:: .:: ::: .:: . :.: :.:..:. :: :: ..:.: .. :
CCDS12 GYTGPRCETDVNEC-LSGP--CRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQSSPC
430 440 450 460 470
370 380 390 400 410 420
pF1KB9 APGSTCIDRVGSFSCLCPPGRTGLLCHLE-DMCLSQPCHGDAQCSTNPLTGSTLCLCQPG
. :..: :::..::: :: : .: :.:. : : : ::.. :.: .: . : : :
CCDS12 VNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQP--DGYECRCAEG
480 490 500 510 520 530
430 440 450 460 470 480
pF1KB9 YSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECLSQP
. : : ...:.: .:.::.:: :.. .::.: : :::::.:::.. .:: :::
CCDS12 FEGTLCDRNVDDC-----SPDPCHHG-RCVDGIASFSCACAPGYTGTRCESQVDECRSQP
540 550 560 570 580 590
490 500 510 520 530 540
pF1KB9 CHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICLPGF
:. :. ::::. . : :: : : :::. ..::: :: . . :.: .: ..:.: :::
CCDS12 CRHGGKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPC-TFGVCRDGINRYDCVCQPGF
600 610 620 630 640
550 560
pF1KB9 SGTRCEEDIDECRSSPCANGGQC-------------------------------------
.: :. .:.:: ::::..::.:
CCDS12 TGPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGIC
650 660 670 680 690 700
570 580 590 600 610 620
pF1KB9 QDQPGAFHCKCLPGFEGPRCQTEV--DECLSDPCPVGASCLDLPGAFFCLCPSGFTGQLC
: ::.:.: : ::. ::::. . : : :.:: .:..: . .: : :: : :. :
CCDS12 YDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQC
710 720 730 740 750 760
630 640 650 660 670
pF1KB9 EV--PLCAPNLCQPKQICKDQKDKAN-CLCPDG--SPGCAPPEDNCT----CH-HGHCQR
:. : :.:: :. :.. . : ::.: .: : :.:. : :: :
CCDS12 ELLSP-CTPNPCEHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTN
770 780 790 800 810 820
680 690 700 710 720 730
pF1KB9 S----SCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEM
::.: :.::: :. ... : :: .::.: ....:.: :..:: :....
CCDS12 LAGSFSCTCHGGYTGPSCDQDINDCDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDV
830 840 850 860 870 880
740 750 760 770 780 790
pF1KB9 TACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCFNGGTCVNRPGTFS
: :.:: . :.:. ... :::::.. : .:. . : . ::::::::. ..::
CCDS12 DECLSNPC-GPGTCTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFS
890 900 910 920 930 940
800 810 820 830 840 850
pF1KB9 CLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGSCQTLMDLCAQ
::: :. : .:. . : : . :: . ..:. . : :: : ..:: .::::.: :..
CCDS12 CLCRPGYTGAHCQHEADP-CLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSR
950 960 970 980 990 1000
860 870 880 890 900 910
pF1KB9 KPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSLCHNGGLCVDS
.:: ...:.::: .::: ::.: ::.. :..:: . :. . .::. :: :::
CCDS12 QPCQNGGRCVQTGA--YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDE
1010 1020 1030 1040 1050 1060
920 930 940 950 960 970
pF1KB9 GPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGYDGQNCSKELD
:..: :: : :: :...:.:: ..:::.:.:: . .::.:.: :::.:.:: ..:
CCDS12 DSSHYCVCPEGRTGSHCEQEVDPCLAQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVD
1070 1080 1090 1100 1110 1120
980
pF1KB9 ACQSQPCHNHGTCT---------------------------PKP----------------
: ::::.. :.: : :
CCDS12 ECASQPCQHGGSCIDLVARYLCSCPPGTLGVLCEINEDDCGPGPPLDSGPRCLHNGTCVD
1130 1140 1150 1160 1170 1180
990 1000 1010 1020 1030 1040
pF1KB9 --GGFHCACPPGFVGLRCEGDVDECLDQPCHPTGTAAC-HSLANAFYCQCLPGHTGQWCE
:::.:.::::..:::::.:..:: . :: . : : .. ...: : : : .: :.
CCDS12 LVGGFRCTCPPGYTGLRCEADINECRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQ
1190 1200 1210 1220 1230 1240
1050 1060 1070 1080 1090 1100
pF1KB9 VEIDPCHSQPCFHGGTCEATAGSPLG--FICHCPKGFEGPTCSHRAPSCGFHHCHHGGLC
. ..::.:::: ::: :. . : : : ::: . : :: : . : :: .: : :
CCDS12 TVLSPCESQPCQHGGQCRPSPGPGGGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPC
1250 1260 1270 1280 1290 1300
1110 1120 1130 1140 1150
pF1KB9 LPSPKPGFPPRCACLSGYGGPDCLT-PPAPKGCGPPS----PCLYNGSCSETTGLGGPGF
.:. ::::: : .::.: . : .: : . : :::..::: . .: :
CCDS12 QQTPRG---PRCACPPGLSGPSCRSFPGSPPGASNASCAAAPCLHGGSCRPAP--LAPFF
1310 1320 1330 1340 1350
1160 1170 1180 1190 1200
pF1KB9 RCSCPHSSPGPRCQKPGAK------------GCEGRSGDGACDAGCSGPGGNWDGGDCSL
::.: .. ::::. :.: .:... :: :: :..:: .::::::::
CCDS12 RCACAQGWTGPRCEAPAAAPEVSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSL
1360 1370 1380 1390 1400 1410
1210 1220 1230 1240 1250 1260
pF1KB9 GVPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPP---ACTPAYDQYCHDH
.: :::. : . .:: :: ...: : :.: ::.:..::.. .:.:.:..:: ::
CCDS12 SVGDPWRQCEAL-QCWRLFNNSRCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADH
1420 1430 1440 1450 1460 1470
1270 1280 1290 1300 1310 1320
pF1KB9 FHNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLSLT
: .:.:..:::: :::::: :: : :.: :.: : : .. . . ::
CCDS12 FADGRCDQGCNTEECGWDGLDCASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAI
1480 1490 1500 1510 1520 1530
1330 1340 1350 1360 1370 1380
pF1KB9 LRVGLWVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGK-ETDSLSAGF
::..: : : :. ::.:: .: .: ..: .. : :
CCDS12 LRTSLRFRLDAHGQAMVFPY------------------HRPSPGSEPRARRELAPEVIGS
1540 1550 1560 1570 1580
1390 1400 1410 1420 1430 1440
pF1KB9 VVVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAPP
::.. .: : . ..: : .:.:..:: :. .: :: :. . ::
CCDS12 VVMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERLD--FPYPLRDVRGEP-LEPP
1590 1600 1610 1620 1630
1450 1460 1470 1480 1490
pF1KB9 ANQLPW-PVLCSPVAGVILLALGALLVLQ-LIRRRRREHGALWLPPGFTRRPRTQSAPHR
..: :.: :::..:: . .::: .. ::.:::..::.: ::. . . :. .
CCDS12 EPSVPLLPLL---VAGAVLLLV--ILVLGVMVARRKREHSTLWFPEGFSLHKDVASGHKG
1640 1650 1660 1670 1680 1690
1500 1510 1520 1530 1540 1550
pF1KB9 RRPPLGEDSIGLKALKPK----AEVDEDGV-VMCSGPEEG----EEVGQAEETGPPSTCQ
:: :.:.:..:.: . .:: : . . : :: :: :.. : . :.
CCDS12 RREPVGQDALGMKNMAKGESLMGEVATDWMDTEC--PEAKRLKVEEPGMGAEEA--VDCR
1700 1710 1720 1730 1740
1560 1570 1580 1590 1600
pF1KB9 LWSLSGGCGA---LPQAAMLTPPQ-ESEMEAPDLDTRGPDGVTPLMSAVCCG---EVQSG
:. .: . : ::::: ... .. :...::::: :::: : :: : .
CCDS12 QWTQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMPT
1750 1760 1770 1780 1790 1800
1610 1620 1630 1640 1650 1660
pF1KB9 TFQGAWLGCPEPWEPLLDGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQP
. : :. :: :.: :::: ::::::..: ::.:::.:::. :
CCDS12 EEDEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNAQ
1810 1820 1830 1840 1850 1860
1670 1680 1690 1700 1710 1720
pF1KB9 DRAGRTPLHAAVAADAREVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAA
:..::::::.::.:::. : :.:.:.:.: .::: ::.: :.:::::::: .::::::.
CCDS12 DHSGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIAS
1870 1880 1890 1900 1910 1920
1730 1740 1750 1760 1770 1780
pF1KB9 QADVGARDKWGKTALHWAAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVA
.:::.: :. ::.::::::::::..:. .::. ::.:: ::..:.::::::::::. :.:
CCDS12 HADVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEAA
1930 1940 1950 1960 1970 1980
1790 1800 1810 1820 1830 1840
pF1KB9 QLLLGLGAARELRDQAGLAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREA-GPF--
.::: : ::. :. : :::..: : :.. ::. . : .. :: .. ::.
CCDS12 KLLLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGP----RSPPGPHGLGPLLC
1990 2000 2010 2020 2030 2040
1850 1860 1870 1880 1890 1900
pF1KB9 PRARTVSVSVPPHGGGALPRCRTLSAGAGPRGGGACLQARTWSVDLAARGGGAYSHCRSL
: . . ..:. : .:: ::.: ..: .. :: : : : .:
CCDS12 PPGAFLPGLKAAQSGSKKSRRPPGKAGLGPQGP----RGRGKKLTLACPGPLADSSV-TL
2050 2060 2070 2080 2090
1910 1920 1930 1940
pF1KB9 SGVGAGGGPTPRGRRFSAGMRGPRPNPA--IMRGRYGVAA---------GRGGRVSTDDW
: : . .: : : :: .:. ..: :..:. : ::..
CCDS12 SPVDSLDSPRPFG--------GPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQ
2100 2110 2120 2130 2140 2150
1950 1960 1970 1980 1990
pF1KB9 P---CDWVALGACGSASNIPI-----PPPCLT-PS---PERGSPQL-DCGPPAL-QEMPI
: : ..:: . .. .:. ::: :: : .::: . : :. :: :
CCDS12 PPGGC-VLSLGLLNPVA-VPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPP
2160 2170 2180 2190 2200
2000
pF1KB9 NQGGEGKK
CCDS12 PYLAVPGHGEEYPAAGAHSSPPKARFLRVPSEHPYLTPSPESPEHWASPSPPSLSDWSES
2210 2220 2230 2240 2250 2260
>>CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238 aa)
initn: 1429 init1: 597 opt: 1536 Z-score: 780.9 bits: 157.3 E(32554): 3.6e-37
Smith-Waterman score: 1854; 34.1% identity (54.6% similar) in 821 aa overlap (105-901:231-992)
80 90 100 110 120 130
pF1KB9 QNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLEDPCPPSFCSKRGRCH
:. :. :..:. : : . .: :
CCDS99 NYYSATCNKFCRPRNDFFGHYTCDQYGNKACMDGWMGKECK---EAVCKQGCNLLHGGCT
210 220 230 240 250
140 150 160 170 180 190
pF1KB9 IQASGRPQCSCMPGWTGEQCQLRDFCSANP-CVNGGVCLATYPQIQCHCPPGFEGHACER
. . .: : :: :. : : : : ::.:. :. . ::.: .. : :..
CCDS99 VPG----ECRCSYGWQGRFC---DECVPYPGCVHGS-CVEPW---QCNCETNWGGLLCDK
260 270 280 290 300
200 210 220 230 240 250
pF1KB9 DVNECFQDPGPCPKGTSCHNTL-GSFQCLCPVGQEGPRCELRAGPCPPRGCSNGGTCQLM
:.: : . :: .: .: :. ...: :: : : :: : :.:::.:. .
CCDS99 DLNYC-GSHHPCTNGGTCINAEPDQYRCTCPDGYSGRNCEKAEHACTSNPCANGGSCHEV
310 320 330 340 350 360
260 270 280 290 300 310
pF1KB9 PEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTCLCPETWTGWDCS
: : :. : :: :. :: : .. :.:.:. : :::: : .: . :.::: :.: :.
CCDS99 P---SGFE-CHCPSGWSGPTCALDIDECASNPCAAGGTCVDQVDGFECICPEQWVGATCQ
370 380 390 400 410 420
320 330 340 350 360 370
pF1KB9 EDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCIAATCAPGSTCID
:..::: : : : :. .:.: :...: :. :: : .:. :..:: . : :.:: :
CCDS99 LDANECE--GKP-CLNAFSCKNLIGGYYCDCIPGWKGINCHINVNDC-RGQCQHGGTCKD
430 440 450 460 470
380 390 400 410 420 430
pF1KB9 RVGSFSCLCPPGRTGLLCHLE-DMCLSQPCHGDAQCSTNPLTGSTLCLCQPGYSGPTCHQ
:....:.:: : : :.:: : : :.:::. . : . :. . : : :.::: :.
CCDS99 LVNGYQCVCPRGFGGRHCELERDECASSPCHSGGLC--EDLADGFHCHCPQGFSGPLCEV
480 490 500 510 520 530
440 450 460 470 480 490
pF1KB9 DLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECLSQPCHPGSTCL
:.: : ::::..:. : : :.. : :: . :. : . . .:: ::..:
CCDS99 DVDLCE-----PSPCRNGARCYNLEGDYYCACPDDFGGKNCSVPR-----EPC-PGGAC-
540 550 560 570 580
500 510 520 530 540 550
pF1KB9 DLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNG-FQCICLPGFSGTRCEE
.. ::. : ::. : :. : . .: :.::: ::.:: :.:
CCDS99 RVIDGCGSDAGPGMPGT--------AASGVCGPHGRCVSQPGGNFSCICDSGFTGTYCHE
590 600 610 620 630
560 570 580 590 600 610
pF1KB9 DIDECRSSPCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPVGASCLDLPGA
.::.: ..:: ::: : :. ::.: : :.:: :.:. ..:: ::: . : :: .
CCDS99 NIDDCLGQPCRNGGTCIDEVDAFRCFCPSGWEGELCDTNPNDCLPDPCHSRGRCYDLVND
640 650 660 670 680 690
620 630 640 650 660
pF1KB9 FFCLCPSGFTGQLCEVP--LCAPNLCQPKQICKDQKDKANCLCPDGSPG--CAPPEDN-C
:.: : .:. :. :. : :. : :. : : :: : : :: ... :
CCDS99 FYCACDDGWKGKTCHSREFQCDAYTCSNGGTCYDSGDTFRCACPPGWKGSTCAVAKNSSC
700 710 720 730 740 750
670 680 690 700 710
pF1KB9 T---C-HHGHCQRS----SCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTC
: . : : : ::.: :: : : . . : :: .:: : . . : :
CCDS99 LPNPCVNGGTCVGSGASFSCICRDGWEGRTCTHNTNDCNPLPCYNGGICVDGVNWFRCEC
760 770 780 790 800 810
720 730 740 750 760 770
pF1KB9 PTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSAPCF
:..:: : .. :.:.:: :..: .:: :.:::...::.:: . : :.
CCDS99 APGFAGPDCRINIDECQSSPCAYGATCVDEINGYRCSCPPGRAGPRCQEVIGFGRS--CW
820 830 840 850 860 870
780 790 800 810 820 830
pF1KB9 NGGTCVNRPGTF-----SCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLC
. :: . ... :: : ..: : .:. :. .:: .:.. :
CCDS99 SRGTPFPHGSSWVEDCNSCRC---LDGRRDCSKVW--CGWKPC----LLAGQPEALSAQC
880 890 900 910 920
840 850 860 870 880 890
pF1KB9 PTGYTGGSC-QTLMDLCAQKPCPRNSHC-LQTGPSFHCLCLQGWTGPLCNLPLSSCQKAA
: : : . : . :: ..: . :: :: .: : ..
CCDS99 PLGQR---CLEKAPGQCLRPPCEAWGECGAEEPPSTPCLPRSGHLDNNCARLTLHFNRDH
930 940 950 960 970 980
900 910 920 930 940 950
pF1KB9 LSQGIDVSSLCHNGGLCVDSGPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPS
. :: :...:
CCDS99 VPQGTTVGAICSGIRSLPATRAVARDRLLVLLCDRASSGASAVEVAVSFSPARDLPDSSL
990 1000 1010 1020 1030 1040
>>CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200 aa)
initn: 1407 init1: 597 opt: 1498 Z-score: 762.2 bits: 153.8 E(32554): 3.9e-36
Smith-Waterman score: 1739; 31.6% identity (51.5% similar) in 961 aa overlap (185-1099:60-947)
160 170 180 190 200
pF1KB9 QLRDFCSANPCVNGGVCLATYPQIQCHCPPGFEGH-ACERDVNECFQD------P-GPCP
: :: :. : :... : :::
CCDS99 FELQLSALRNVNGELLSGACCDGDGRTTRAGGCGHDECDTYVRVCLKEYQAKVTPTGPCS
30 40 50 60 70 80
210 220 230 240 250 260
pF1KB9 KGTSCHNTLG--SFQCLCPVGQEGPRCELRAGPCPPRGCSNGGTCQLMPEKDSTFHLCLC
: . .:: :: : :.: : : . :: : .. : ..: :..
CCDS99 YGHGATPVLGGNSFY-LPPAGAAGDRARARARAG---GDQDPGLV-VIP-----FQFAW-
90 100 110 120 130
270 280 290 300 310 320
pF1KB9 PPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYTCLCPET-WTGWDCSEDVDECEAQGP
: .: . :: .. : . .. . :: : . : : . : :
CCDS99 PRSFTLIVEAWDWDNDTT---PNEELLIERVSHAGMINPEDRWKSLHFSGHVAHLELQIR
140 150 160 170 180 190
330 340 350 360
pF1KB9 PHCRNG---GTCQNSA-------GSFHC------VCVSGWGGTSCEENLDDCIAATCAPG
.: .. .::.. : . : .:..:: : :.: :.: :
CCDS99 VRCDENYYSATCNKFCRPRNDFFGHYTCDQYGNKACMDGWMGKECKE-------AVCKQG
200 210 220 230 240
370 380 390 400 410 420
pF1KB9 STCIDRVGSFS----CLCPPGRTGLLCHLEDMCLSQP-C-HGDAQCSTNPLTGSTLCLCQ
: :. . : : : : .: : :. : : :: .: ..: : :.
CCDS99 --CNLLHGGCTVPGECRCSYGWQGRFC---DECVPYPGCVHG--SC-VEPWQ----CNCE
250 260 270 280 290
430 440 450 460 470 480
pF1KB9 PGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNT-PGSFNCLCPPGYTGSRCEADHNECL
...: : .::. : . :: .::.:.:. : .. : :: ::.: :: .. :
CCDS99 TNWGGLLCDKDLNYC----GSHHPCTNGGTCINAEPDQYRCTCPDGYSGRNCEKAEHACT
300 310 320 330 340 350
490 500 510 520 530 540
pF1KB9 SQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICL
:.:: :..: .. . :.: :: : : : .. .:::: :: . : : ..::.:::
CCDS99 SNPCANGGSCHEVPSGFECHCPSGWSGPTCALDIDECASNPCAAGGTCVDQVDGFECICP
360 370 380 390 400 410
550 560 570 580 590 600
pF1KB9 PGFSGTRCEEDIDECRSSPCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPV
. :. :. :...::.. : .:: :.: ....: : :: : .:. : ::: :.::
CCDS99 EQWVGATCQLDVNDCRGQ-CQHGGTCKDLVNGYQCVCPRGFGGRHCELERDECASSPCHS
420 430 440 450 460 470
610 620 630 640 650
pF1KB9 GASCLDLPGAFFCLCPSGFTGQLCEVP--LCAPNLCQPKQICKDQKDKANCLCPD--GSP
:. : :: .: : ::.::.: :::: :: :. :. : . . : ::: :.
CCDS99 GGLCEDLADGFHCHCPQGFSGPLCEVDVDLCEPSPCRNGARCYNLEGDYYCACPDDFGGK
480 490 500 510 520 530
660 670 680 690 700 710
pF1KB9 GCAPPEDNCTCHHGHCQR-SSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSG-YN
.:. :.. : : :. ..: :.: : : :. :. : : ::.: ..
CCDS99 NCSVPRE--PCPGGACRVIDGCGSDAGPGMP------GTAASGVCGPHGRCVSQPGGNFS
540 550 560 570 580
720 730 740 750 760 770
pF1KB9 CTCPTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVSA
: : .:.:: : :.. : . :: :::.: .. : :: . : :.:. . :.
CCDS99 CICDSGFTGTYCHENIDDCLGQPCRNGGTCIDEVDAFRCFCPSGWEGELCDTNPNDCLPD
590 600 610 620 630 640
780 790 800 810 820 830
pF1KB9 PCFNGGTCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPT
:: . : : . . : : : :..: :... . .: : : .:: :: . :: ::
CCDS99 PCHSRGRCYDLVNDFYCACDDGWKGKTCHSR-EFQCDAYTCSNGGTCYDSGDTFRCACPP
650 660 670 680 690 700
840 850 860 870 880 890
pF1KB9 GYTGGSCQTLMDL-CAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQ
:. :..: . . : .:: .. :. .: :: :.: .:: : :. ..:.
CCDS99 GWKGSTCAVAKNSSCLPNPCVNGGTCVGSGASFSCICRDGWEGRTCTHNTNDCNPLP---
710 720 730 740 750
900 910 920 930 940 950
pF1KB9 GIDVSSLCHNGGLCVDSGPSYF-CHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGY
:.:::.::: : ..: :.: ::: : :. ... :.: :: ::::. . .::
CCDS99 -------CYNGGICVD-GVNWFRCECAPGFAGPDCRINIDECQSSPCAYGATCVDEINGY
760 770 780 790 800 810
960 970 980 990 1000 1010
pF1KB9 LCQCAPGYDGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGFVGLRCEGDVDECLD
:.: :: : :.. . .: : ..:: :. ... : . :: .:
CCDS99 RCSCPPGRAGPRCQEVIGFGRS--CWSRGTPFPHGSSWVEDCN----SCRCLDGRRDCSK
820 830 840 850 860
1020 1030 1040 1050 1060
pF1KB9 QPCHPTGTAAC--HSLANAFYCQCLPGHTGQWCEVEIDP--CHSQPCFHGGTCEATAGSP
: : : . .:. :: : :: : .: : : :: : : : :
CCDS99 VWC---GWKPCLLAGQPEALSAQC-P--LGQRC-LEKAPGQCLRPPCEAWGECGAE--EP
870 880 890 900 910
1070 1080 1090 1100 1110 1120
pF1KB9 LGFICHCPKGFEGPTCSHRAPSCGFHHCHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTP
. : .: .:.. . . : .:
CCDS99 PSTPCLPRSGHLDNNCARLTLHFNRDHVPQGTTVGAICSGIRSLPATRAVARDRLLVLLC
920 930 940 950 960 970
1130 1140 1150 1160 1170 1180
pF1KB9 PAPKGCGPPSPCLYNGSCSETTGLGGPGFRCSCPHSSPGPRCQKPGAKGCEGRSGDGACD
CCDS99 DRASSGASAVEVAVSFSPARDLPDSSLIQGAAHAIVAAITQRGNSSLLLAVTEVKVETVV
980 990 1000 1010 1020 1030
>>CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 (870 aa)
initn: 1202 init1: 682 opt: 1372 Z-score: 701.0 bits: 142.0 E(32554): 1e-32
Smith-Waterman score: 1493; 32.5% identity (52.8% similar) in 791 aa overlap (352-1047:27-800)
330 340 350 360 370 380
pF1KB9 GPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDCIAATCAPGSTCIDRVGSFSCLC
:..: :.. .: .::: : . .: :
CCDS58 MALKNINYLLIFYLSFSLLIYIKNSFCNKNNTRCLSNSCQNNSTCKDFSKDNDCSC
10 20 30 40 50
390 400 410 420 430
pF1KB9 PPGRTGLL--C-HLEDMCLSQPCHGDAQCSTNPLTGSTLCLCQPGYSGPTCHQDLDECLM
..: : ...: :.:.::.:.: : ..: : :: : ::::: :. . :
CCDS58 SDTANNLDKDCDNMKDPCFSNPCQGSATCVNTPGERSFLCKCPPGYSGTICETTIGSC--
60 70 80 90 100 110
440 450 460 470 480 490
pF1KB9 AQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNECLSQPCHPGSTCLDLLATFH
: . :.::: : . : :.:: ::.: :: ::.:: :.::. :..: : . .
CCDS58 ---GKNSCQHGGICHQDPIYPVCICPAGYAGRFCEIDHDECASSPCQNGAVCQDGIDGYS
120 130 140 150 160 170
500 510 520 530 540 550
pF1KB9 CLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCICLPGFSGTRCEEDIDECRSS
:.: :: .:. :..:..:::: :: :.: : . .. . ::: ..::. :: .:::: :.
CCDS58 CFCVPGYQGRHCDLEVDECASDPCKNEATCLNEIGRYTCICPHNYSGVNCELEIDECWSQ
180 190 200 210 220 230
560 570 580 590 600 610
pF1KB9 PCANGGQCQDQPGAFHCKCLPGFEGPRCQTEVDECLSDPCPVGASCLDLPGAFFCLCP-S
:: ::. ::: ::. : : ::: : .:. ..::: :.:: :. :.: . . : : :
CCDS58 PCLNGATCQDALGAYFCDCAPGFLGDHCELNTDECASQPCLHGGLCVDGENRYSCNCTGS
240 250 260 270 280 290
620 630 640 650 660 670
pF1KB9 GFTGQLCE--VPLCAPNLCQPKQICKDQKDKANCLCPDGSPGCAPPEDNCTCHHGHCQRS
:::: :: .::: . :. . :.:. :. .: : : : : :. . :: .
CCDS58 GFTGTHCETLMPLCWSKPCHNNATCEDSVDNYTCHCWPGYTGAQCEIDLNECNSNPCQSN
300 310 320 330 340 350
680 690 700 710 720 730
pF1KB9 SCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGYNCTCPTGYTGPTCSEEMTACHS
. ... : . : . : . . : . ::: : : :.:: : :... : :
CCDS58 GECVELS-----SEKQYGRITGLPSSFS---YHEASGYVCICQPGFTGIHCEEDVNECSS
360 370 380 390 400
740 750 760 770 780
pF1KB9 GPCLNGGSCNPSPGGYYCTCPPSHT------GPQCQTSTDYCVSAPCFNGGTCVN--RPG
.:: :::.:. ::.: : :: .. : .:. :. :.:.:::. . :
CCDS58 NPCQNGGTCENLPGNYTCHCPFDNLSRTFYGGRDCSDILLGCTHQQCLNNGTCIPHFQDG
410 420 430 440 450 460
790 800 810 820 830
pF1KB9 T--FSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRC--------LCPTGYT
::::: :. : :: : . . . . .: : . : .
CCDS58 QHGFSCLCPSGYTGSLCEIATTLSFEGDGFLWVKSGSVTTKGSVCNIALRFQTVQPMALL
470 480 490 500 510 520
840 850 860 870 880
pF1KB9 ---------------GGSCQTLMDLCAQ-KPCPRNSHCLQTGPSFHCLCLQGWTGPLCNL
.: . ... : : :: . : .: . . . .:
CCDS58 LFRSNRDVFVKLELLSGYIHLSIQVNNQSKVLLFISHNTSDGE-WHFVEVIFAEAVTLTL
530 540 550 560 570 580
890 900 910 920
pF1KB9 PLSSCQKAALSQGIDV----SSLC--HN---GGLCV---DSGPSY--FCHCP--PGFQGS
.::.. .... .:.: .: ::: : ..: . : . : :.: :
CCDS58 IDDSCKEKCIAKAPTPLESDQSICAFQNSFLGGLPVGMTSNGVALLNFYNMPSTPSFVGC
590 600 610 620 630 640
930 940 950
pF1KB9 LCQD------HV--------------------NPCESRPCQNGATCMAQPSGYLCQCAPG
: :: :. . :::.:::. . :. .: :.:
CCDS58 L-QDIKIDWNHITLENISSGSSLNVKAGCVRKDWCESQPCQSRGRCINLWLSYQCDCHRP
650 660 670 680 690 700
960 970 980 990 1000
pF1KB9 YDGQNCSK-------ELDA--CQSQP----CHNHGTCTPKPGGFHCACPPGFVGLRCEGD
:.: :: . .: . : .. :.: :.:: ..: : :::.: :: :
CCDS58 YEGPNCLRGKFCRQSRLPSTVCGNEKTNLTCYNGGNCTEFQTELKCMCRPGFTGEWCEKD
710 720 730 740 750 760
1010 1020 1030 1040 1050 1060
pF1KB9 VDECLDQPCHPTGTAACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAG
.::: ..:: : :..: : : : : . .:. :::..
CCDS58 IDECASDPCVNGGL--CQDLLNKFQCLCDVAFAGERCEVDLADDLISDIFTTIGSVTVAL
770 780 790 800 810
1070 1080 1090 1100 1110 1120
pF1KB9 SPLGFICHCPKGFEGPTCSHRAPSCGFHHCHHGGLCLPSPKPGFPPRCACLSGYGGPDCL
CCDS58 LLILLLAIVASVVTSNKRATQGTYSPSRQEKEGSRVEMWNLMPPPAMERLI
820 830 840 850 860 870
>>CCDS1390.1 CRB1 gene_id:23418|Hs108|chr1 (1406 aa)
initn: 1202 init1: 682 opt: 1307 Z-score: 667.0 bits: 136.4 E(32554): 7.9e-31
Smith-Waterman score: 1430; 25.3% identity (46.4% similar) in 1390 aa overlap (6-1171:9-1333)
10 20 30 40 50
pF1KB9 MQPPSLLLLLL---LLLLLCVSVVRPRGLLCGSFPEPCANGGTCLSLSLGQGTCQCA
::.. : ::. . : . : : . : :..:: ..: .. :.:.
CCDS13 MALKNINYLLIFYLSFSLLIYIKNSFCNKNNTRCLS--NSCQNNSTCKDFS-KDNDCSCS
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 P--GFLGETCQ-FPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTG
. : . :. . ::: . ::....: .: :::: : ::..:
CCDS13 DTANNLDKDCDNMKDPCFSNP-CQGSATCVN------------TPGERSFLCKCPPGYSG
60 70 80 90 100
120 130 140 150 160 170
pF1KB9 ERCQAQLEDPCPPSFCSKRGRCHIQASGRPQCSCMPGWTGEQCQL-RDFCSANPCVNGGV
:.. . : . :.. : :: : : : : :..:. :.. .: :...:: ::.:
CCDS13 TICETTI-GSCGKNSCQHGGICH-QDPIYPVCICPAGYAGRFCEIDHDECASSPCQNGAV
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB9 CLATYPQIQCHCPPGFEGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPR
: .: : ::..:. :. .:.:: .:: : . ..: : .: . :.:: . :
CCDS13 CQDGIDGYSCFCVPGYQGRHCDLEVDECASDP--CKNEATCLNEIGRYTCICPHNYSGVN
170 180 190 200 210 220
240 250 260 270 280
pF1KB9 CELRAGPCPPRGCSNGGTCQLMPEKDST-FHLCLCPPGFIGPDCEVNPDNCVSHQCQNGG
:::. : . : ::.::: :. ..: : :::.: ::.: :.:.:. : .::
CCDS13 CELEIDECWSQPCLNGATCQ-----DALGAYFCDCAPGFLGDHCELNTDECASQPCLHGG
230 240 250 260 270
290 300 310 320 330 340
pF1KB9 TCQDGLDTYTCLCPET-WTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWG
: :: . :.: : . .:: : . : .. : :.:..::..:. .. : : :.
CCDS13 LCVDGENRYSCNCTGSGFTGTHCETLMPLCWSK-P--CHNNATCEDSVDNYTCHCWPGYT
280 290 300 310 320 330
350 360 370 380
pF1KB9 GTSCEENLDDCIAATCAPGSTCID--------RV----GSFS--------CLCPPGRTGL
:..:: .:..: . : .. :.. :. .::: :.: :: ::.
CCDS13 GAQCEIDLNECNSNPCQSNGECVELSSEKQYGRITGLPSSFSYHEASGYVCICQPGFTGI
340 350 360 370 380 390
390 400 410 420 430 440
pF1KB9 LCHLEDM--CLSQPCHGDAQCSTNPLTGSTLCLC------QPGYSGPTCHQDLDECLMAQ
:. ::. : :.::.. . : . : :. : : . :.: : . : : :
CCDS13 HCE-EDVNECSSNPCQNGGTCENLP--GNYTCHCPFDNLSRTFYGGRDCSDILLGCTHQQ
400 410 420 430 440
450 460 470 480
pF1KB9 QGPSPCEHGGSCL----NTPGSFNCLCPPGYTGSRCEADHNECL----------SQPCHP
: ..:.:. . .:.:::: ::::: :: . . ..
CCDS13 -----CLNNGTCIPHFQDGQHGFSCLCPSGYTGSLCEIATTLSFEGDGFLWVKSGSVTTK
450 460 470 480 490 500
490
pF1KB9 GSTC--------------------------LDLLATF-H---------------------
::.: :.::. . :
CCDS13 GSVCNIALRFQTVQPMALLLFRSNRDVFVKLELLSGYIHLSIQVNNQSKVLLFISHNTSD
510 520 530 540 550 560
500 510 520
pF1KB9 --------------------------CLC--PPGLEGQ--LCEVETNECASAPCLNHADC
:. : ::.. .: ... .. : ..
CCDS13 GEWHFVEVIFAEAVTLTLIDDSCKEKCIAKAPTPLESDQSICAFQNSFLGGLPVGMTSNG
570 580 590 600 610 620
530 540 550 560
pF1KB9 HDLLNGFQCICLPGFSGTRCEEDI---------------------------DECRSSPCA
::: .. :.: : : .:: : :.:.::
CCDS13 VALLNFYNMPSTPSFVG--CLQDIKIDWNHITLENISSGSSLNVKAGCVRKDWCESQPCQ
630 640 650 660 670 680
570 580 590 600
pF1KB9 NGGQCQDQPGAFHCKCLPGFEGPRCQTE------------------VDECLSDPCPVGAS
. :.: . ...: : .::: : : .:: .: ..
CCDS13 SRGRCINLWLSYQCDCHRPYEGPNCLREYVAGRFGQDDSTGYVIFTLDESYGDTISLSMF
690 700 710 720 730 740
610 620 630 640 650
pF1KB9 CLDLPGAFFCLCPSGFTGQLCEV-------PLCAPNLCQPKQICKDQKDKANCLCPDGSP
: . . : . : : .: . .:: .:: . : . .: . .
CCDS13 VRTLQPSGLLLALENSTYQYIRVWLERGRLAMLTPN--SPKLVVKFVLNDGNVHLISLKI
750 760 770 780 790 800
660 670 680 690 700
pF1KB9 GCAPPEDNCTCHH-GHCQRSS------CVCDVGWTGPECEAELGGCISAPCAH-------
: . .. : . :. : .: . :.::.: . : .
CCDS13 KPYKIELYQSSQNLGFISASTWKIEKGDVIYIGGLPDKQETELNGGFFKGCIQDVRLNNQ
810 820 830 840 850 860
710 720 730 740 750 760
pF1KB9 GGTCYPQPSGYNCTCPTGYT-GPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTG
. .:.:.. :. . :. . ..:.:.:: ::: :. . :.:: .:
CCDS13 NLEFFPNPTNNASLNPVLVNVTQGCAGD-NSCKSNPCHNGGVCHSRWDDFSCSCPALTSG
870 880 890 900 910
770 780 790 800 810 820
pF1KB9 PQCQTSTDYCVSAPCFNGGTCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATC
:. ...: .:: .:. : : :. :.: . .: . . . :
CCDS13 KACEE-VQWCGFSPCPHGAQCQPVLQGFECIANAVFNGQSGQILFRSNGNITRELTNITF
920 930 940 950 960 970
830 840 850 860 870
pF1KB9 QDSPQGPRCLCPTGYTGGSCQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQG--------
. . . . .... : : ::.: ::. : : .
CCDS13 GFRTRDANVII---LHAEKEPEFLNISIQD--SRLFFQLQSGNSFYMLSLTSLQSVNDGT
980 990 1000 1010 1020 1030
880 890 900 910 920
pF1KB9 WTGPLCNL--PLSSCQKAALSQGID---VSSLCHNGGLCV--DSGPSYF----CHCPPGF
: .. :::. .. . . :.: .:.: :. : :.
CCDS13 WHEVTLSMTDPLSQTSRWQMEVDNETPFVTSTIATGSLNFLKDNTDIYVGDRAIDNIKGL
1040 1050 1060 1070 1080 1090
930 940 950 960 970 980
pF1KB9 QGSLCQDHVNPCESRPCQNGATCMAQPSG-YLCQCAPGYDGQNCSKELDACQSQPCHNHG
:: : ... .: . .:. . . . . .: . :..:.:.:: . :
CCDS13 QGCLSTIEIGGIYLSYFENVHGFINKPQEEQFLKISTNSVVTGCLQ-LNVCNSNPCLHGG
1100 1110 1120 1130 1140 1150
990 1000 1010 1020 1030 1040
pF1KB9 TCTPKPGGFHCACPPGFVGLRCEGDVDECLDQPC-HPTGTAACHSLANAFYCQCLPGHTG
.: ...::.:: :. : .:: ..:::...:: : . : . . :..: : ::.::
CCDS13 NCEDIYSSYHCSCPLGWSGKHCELNIDECFSNPCIH----GNCSDRVAAYHCTCEPGYTG
1160 1170 1180 1190 1200
1050 1060 1070 1080 1090
pF1KB9 QWCEVEIDPCHSQPCFHGGTCEATAGSPLGFICHCPKGFEGPTCSH-RAPS--CGFHH--
:::.:: :.:. : .:.:: . .. :. : : .: : : . : :: :: ..
CCDS13 VNCEVDIDNCQSHQCANGATCISHTN---GYSCLCFGNFTGKFCRQSRLPSTVCGNEKTN
1210 1220 1230 1240 1250 1260
1100 1110 1120 1130 1140 1150
pF1KB9 --CHHGGLCLPSPKPGFPPRCACLSGYGGPDCLTPPAPKGCGPPSPCLYNGSCSETTGLG
:..:: : .: : :. : : :. .::. .: :.. .
CCDS13 LTCYNGGNCTEFQTE---LKCMCRPGFTGEWC--EKDIDECAS-DPCVNGGLCQDLLN--
1270 1280 1290 1300 1310
1160 1170 1180 1190 1200 1210
pF1KB9 GPGFRCSCPHSSPGPRCQKPGAKGCEGRSGDGACDAGCSGPGGNWDGGDCSLGVPDPWKG
:.: : . : ::.
CCDS13 --KFQCLCDVAFAGERCEVDLADDLISDIFTTIGSVTVALLLILLLAIVASVVTSNKRAT
1320 1330 1340 1350 1360 1370
>>CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144 aa)
initn: 854 init1: 557 opt: 1263 Z-score: 642.1 bits: 133.0 E(32554): 1.9e-29
Smith-Waterman score: 1791; 31.0% identity (53.4% similar) in 928 aa overlap (103-1006:394-1238)
80 90 100 110 120 130
pF1KB9 LCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLEDPCP--PSFCSKR
:.:. ::: . :. . : : : ..
CCDS47 DLLCKSIQTSCESFPLRNNATCKKCEKDYPCSCISGFTEKNCEKAI-DHCKLLSINCLNE
370 380 390 400 410 420
140 150 160 170 180
pF1KB9 GRCHIQASGRPQCSCMPGWTGEQCQ-LRD--FCSANPCVNG----GVCLATYP-QIQCHC
: .. :: . :.:: : . : :.. . . : : :.: : :..
CCDS47 EWC-FNIIGRFKYVCIPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVW
430 440 450 460 470 480
190 200 210 220 230
pF1KB9 PPGF---EGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCP
:: ::. :. .. : . : . .. : . . : .:: . :.
CCDS47 QLGFAGSEGEKCQGVIDAYFFLAANCTEDATYVNDPEDNNSSCWFPHEGTK-EI------
490 500 510 520 530
240 250 260 270 280 290
pF1KB9 PRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYT
:.:: .: . :.:: . :: . : : . ..::. ..:.: ..
CCDS47 ---CANGCSC--LSEEDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPR
540 550 560 570 580
300 310 320 330 340 350
pF1KB9 CLCPETWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDC
: : .. : : .:: : : : : . . .: .. . . :: . .::
CCDS47 CSCSLSYIGRLCVVNVDYC--LGNHSISVHGLCLALSHNCNCSGLQRYERNICEIDTEDC
590 600 610 620 630 640
360 370 380 390 400 410
pF1KB9 IAATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLE-DMCLSQPCHGDAQCSTNPLTGSTLC
.:.: :.: : : : :: : :... : : :.::.. : : .: :. .:
CCDS47 KSASCKNGTTSTHLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQP--GNYFC
650 660 670 680 690 700
420 430 440 450 460 470
pF1KB9 LCQPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNE
: : . . .: .:.::: :::.: ::: : ..
CCDS47 QCVPPF------KVVD-----------------------GFSCLCNPGYVGIRCEQDIDD
710 720 730
480 490 500 510 520 530
pF1KB9 CLSQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCI
:. . :. .::: :: ...:.: ::..:: :.::: :: :.. : :: ....:
CCDS47 CILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKMNPCKNNSTCTDLYKSYRCE
740 750 760 770 780 790
540 550 560 570 580 590
pF1KB9 CLPGFSGTRCEEDIDECRSSPCANGGQCQDQ--PGAFHCKCLPGFEGPRCQTEVDEC--L
: :..: : :.:.:: :.:: ::: :... :: : : : : . : :. . . : :
CCDS47 CTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLCPPLYTGQFCHQRYNLCDLL
800 810 820 830 840 850
600 610 620 630 640 650
pF1KB9 SDPCPVGASCLDLPGAF-FCLCPSGFTGQLCEVPLCAPNLCQPKQICKDQKDKANCLCPD
.:: ...:: : : :.: : :. ::. : :: :: .
CCDS47 HNPCRNNSTCLALVDANQHCICREEFEGKNCEI---------------DVKD---CLFLS
860 870 880 890
660 670 680 690 700 710
pF1KB9 GSPGCAPPEDNCTCHHGHCQRSSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGY
: .: :. . :.: :..: :: :.. : : :: ..::: . .
CCDS47 ----C---QDYGDCED-MVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRF
900 910 920 930 940 950
720 730 740 750 760 770
pF1KB9 NCTCPTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVS
:.: : :: : ... :. .:::. .: :: : : :..:: .:. . : :.:
CCDS47 FCNCEPEYHGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINLDECLS
960 970 980 990 1000 1010
780 790 800 810 820 830
pF1KB9 APCFNGGTCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCP
::.. :.:.. . ..: : :: : .:: . .: ..:: . . : . . : :
CCDS47 EPCLHDGVCIDGINHYTCDCKSGFFGTHCETNAN-DCLSNPCLH-GRCTELINEYPCSCD
1020 1030 1040 1050 1060
840 850 860 870 880 890
pF1KB9 TGYTGGSCQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQ
. :. .:. .. :.. :: .. : ... .: :.: .:.:: :. ...: . :.
CCDS47 ADGTSTQCKIKINDCTSIPCMNEGFCQKSAHGFTCICPRGYTGAYCEKSIDNCAEPELN-
1070 1080 1090 1100 1110 1120
900 910 920 930 940 950
pF1KB9 GIDVSSLCHNGGLCVDS-GPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGY
: .: :::.:::. : .. :.: :::.:..:. ..: : : :: .:: : . .::
CCDS47 ----SVICLNGGICVDGPGHTFDCRCLPGFSGQFCEININECSSSPCLHGADCEDHINGY
1130 1140 1150 1160 1170 1180
960 970 980 990 1000
pF1KB9 LCQCAPGYDGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGF----VGLRCEGDVD
.:.: ::..:..: .::. : . : : : . : : : ::: .:: : ::
CCDS47 VCKCQPGWSGHHCENELE-CIPNSC-VHELCMENEPGSTCLCTPGFMTCSIGLLC-GDEI
1190 1200 1210 1220 1230 1240
1010 1020 1030 1040 1050 1060
pF1KB9 ECLDQPCHPTGTAACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSP
CCDS47 RRITCLTPIFQRTDPISTQTYTIPPSETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIV
1250 1260 1270 1280 1290 1300
>>CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165 aa)
initn: 854 init1: 557 opt: 1263 Z-score: 642.1 bits: 133.0 E(32554): 1.9e-29
Smith-Waterman score: 1791; 31.0% identity (53.4% similar) in 928 aa overlap (103-1006:394-1238)
80 90 100 110 120 130
pF1KB9 LCQNGGSCQALLPAPLGLPSSPSPLTPSFLCTCLPGFTGERCQAQLEDPCP--PSFCSKR
:.:. ::: . :. . : : : ..
CCDS78 DLLCKSIQTSCESFPLRNNATCKKCEKDYPCSCISGFTEKNCEKAI-DHCKLLSINCLNE
370 380 390 400 410 420
140 150 160 170 180
pF1KB9 GRCHIQASGRPQCSCMPGWTGEQCQ-LRD--FCSANPCVNG----GVCLATYP-QIQCHC
: .. :: . :.:: : . : :.. . . : : :.: : :..
CCDS78 EWC-FNIIGRFKYVCIPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVW
430 440 450 460 470 480
190 200 210 220 230
pF1KB9 PPGF---EGHACERDVNECFQDPGPCPKGTSCHNTLGSFQCLCPVGQEGPRCELRAGPCP
:: ::. :. .. : . : . .. : . . : .:: . :.
CCDS78 QLGFAGSEGEKCQGVIDAYFFLAANCTEDATYVNDPEDNNSSCWFPHEGTK-EI------
490 500 510 520 530
240 250 260 270 280 290
pF1KB9 PRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPDCEVNPDNCVSHQCQNGGTCQDGLDTYT
:.:: .: . :.:: . :: . : : . ..::. ..:.: ..
CCDS78 ---CANGCSC--LSEEDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPR
540 550 560 570 580
300 310 320 330 340 350
pF1KB9 CLCPETWTGWDCSEDVDECEAQGPPHCRNGGTCQNSAGSFHCVCVSGWGGTSCEENLDDC
: : .. : : .:: : : : : . . .: .. . . :: . .::
CCDS78 CSCSLSYIGRLCVVNVDYC--LGNHSISVHGLCLALSHNCNCSGLQRYERNICEIDTEDC
590 600 610 620 630 640
360 370 380 390 400 410
pF1KB9 IAATCAPGSTCIDRVGSFSCLCPPGRTGLLCHLE-DMCLSQPCHGDAQCSTNPLTGSTLC
.:.: :.: : : : :: : :... : : :.::.. : : .: :. .:
CCDS78 KSASCKNGTTSTHLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQP--GNYFC
650 660 670 680 690 700
420 430 440 450 460 470
pF1KB9 LCQPGYSGPTCHQDLDECLMAQQGPSPCEHGGSCLNTPGSFNCLCPPGYTGSRCEADHNE
: : . . .: .:.::: :::.: ::: : ..
CCDS78 QCVPPF------KVVD-----------------------GFSCLCNPGYVGIRCEQDIDD
710 720 730
480 490 500 510 520 530
pF1KB9 CLSQPCHPGSTCLDLLATFHCLCPPGLEGQLCEVETNECASAPCLNHADCHDLLNGFQCI
:. . :. .::: :: ...:.: ::..:: :.::: :: :.. : :: ....:
CCDS78 CILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKMNPCKNNSTCTDLYKSYRCE
740 750 760 770 780 790
540 550 560 570 580 590
pF1KB9 CLPGFSGTRCEEDIDECRSSPCANGGQCQDQ--PGAFHCKCLPGFEGPRCQTEVDEC--L
: :..: : :.:.:: :.:: ::: :... :: : : : : . : :. . . : :
CCDS78 CTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLCPPLYTGQFCHQRYNLCDLL
800 810 820 830 840 850
600 610 620 630 640 650
pF1KB9 SDPCPVGASCLDLPGAF-FCLCPSGFTGQLCEVPLCAPNLCQPKQICKDQKDKANCLCPD
.:: ...:: : : :.: : :. ::. : :: :: .
CCDS78 HNPCRNNSTCLALVDANQHCICREEFEGKNCEI---------------DVKD---CLFLS
860 870 880 890
660 670 680 690 700 710
pF1KB9 GSPGCAPPEDNCTCHHGHCQRSSCVCDVGWTGPECEAELGGCISAPCAHGGTCYPQPSGY
: .: :. . :.: :..: :: :.. : : :: ..::: . .
CCDS78 ----C---QDYGDCED-MVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRF
900 910 920 930 940 950
720 730 740 750 760 770
pF1KB9 NCTCPTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTSTDYCVS
:.: : :: : ... :. .:::. .: :: : : :..:: .:. . : :.:
CCDS78 FCNCEPEYHGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINLDECLS
960 970 980 990 1000 1010
780 790 800 810 820 830
pF1KB9 APCFNGGTCVNRPGTFSCLCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCP
::.. :.:.. . ..: : :: : .:: . .: ..:: . . : . . : :
CCDS78 EPCLHDGVCIDGINHYTCDCKSGFFGTHCETNAN-DCLSNPCLH-GRCTELINEYPCSCD
1020 1030 1040 1050 1060
840 850 860 870 880 890
pF1KB9 TGYTGGSCQTLMDLCAQKPCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQ
. :. .:. .. :.. :: .. : ... .: :.: .:.:: :. ...: . :.
CCDS78 ADGTSTQCKIKINDCTSIPCMNEGFCQKSAHGFTCICPRGYTGAYCEKSIDNCAEPELN-
1070 1080 1090 1100 1110 1120
900 910 920 930 940 950
pF1KB9 GIDVSSLCHNGGLCVDS-GPSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGY
: .: :::.:::. : .. :.: :::.:..:. ..: : : :: .:: : . .::
CCDS78 ----SVICLNGGICVDGPGHTFDCRCLPGFSGQFCEININECSSSPCLHGADCEDHINGY
1130 1140 1150 1160 1170 1180
960 970 980 990 1000
pF1KB9 LCQCAPGYDGQNCSKELDACQSQPCHNHGTCTPKPGGFHCACPPGF----VGLRCEGDVD
.:.: ::..:..: .::. : . : : : . : : : ::: .:: : ::
CCDS78 VCKCQPGWSGHHCENELE-CIPNSC-VHELCMENEPGSTCLCTPGFMTCSIGLLC-GDEI
1190 1200 1210 1220 1230 1240
1010 1020 1030 1040 1050 1060
pF1KB9 ECLDQPCHPTGTAACHSLANAFYCQCLPGHTGQWCEVEIDPCHSQPCFHGGTCEATAGSP
CCDS78 RRITCLTPIFQRTDPISTQTYTIPPSETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIV
1250 1260 1270 1280 1290 1300
2003 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 9 12:13:26 2016 done: Wed Nov 9 12:13:27 2016
Total Scan time: 6.900 Total Display time: 1.180
Function used was FASTA [36.3.4 Apr, 2011]