FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4465, 2321 aa 1>>>pF1KB4465 2321 - 2321 aa - 2321 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.5057+/-0.00138; mu= 6.7318+/- 0.084 mean_var=579.7663+/-114.272, 0's: 0 Z-trim(114.8): 249 B-trim: 0 in 0/53 Lambda= 0.053266 statistics sampled from 15126 (15376) to 15126 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.745), E-opt: 0.2 (0.472), width: 16 Scan time: 8.180 The best scores are: opt bits E(32554) CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321) 17489 1361.5 0 CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555) 5428 434.7 2.7e-120 CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471) 5232 419.6 9.1e-116 CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003) 2443 205.1 2.7e-51 CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144) 1610 141.4 6.4e-32 CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165) 1610 141.4 6.4e-32 CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 1497 132.7 2.5e-29 CCDS46562.1 SNED1 gene_id:25992|Hs108|chr2 (1413) 1300 117.1 6.1e-25 CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 ( 870) 1275 114.9 1.7e-24 CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 1255 114.1 1e-23 CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238) 1241 112.5 1.3e-23 CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218) 1198 109.2 1.3e-22 CCDS1390.1 CRB1 gene_id:23418|Hs108|chr1 (1406) 1190 108.6 2.1e-22 CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200) 1156 105.9 1.2e-21 CCDS58053.1 CRB1 gene_id:23418|Hs108|chr1 (1382) 1101 101.8 2.4e-20 CCDS33390.1 DNER gene_id:92737|Hs108|chr2 ( 737) 1008 94.2 2.4e-18 CCDS6852.2 CRB2 gene_id:286204|Hs108|chr9 (1285) 962 91.1 3.8e-17 CCDS48004.1 SVEP1 gene_id:79987|Hs108|chr9 (3571) 959 91.5 7.9e-17 CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541) 888 85.5 2.2e-15 CCDS5313.1 DLL1 gene_id:28514|Hs108|chr6 ( 723) 858 82.7 7e-15 CCDS45232.1 DLL4 gene_id:54567|Hs108|chr15 ( 685) 839 81.2 1.9e-14 CCDS53454.1 CRB1 gene_id:23418|Hs108|chr1 (1294) 792 78.0 3.3e-13 CCDS7453.1 SLIT1 gene_id:6585|Hs108|chr10 (1534) 788 77.8 4.4e-13 CCDS64311.1 SLIT3 gene_id:6586|Hs108|chr5 (1530) 776 76.9 8.4e-13 CCDS75111.1 SLIT2 gene_id:9353|Hs108|chr4 (1521) 767 76.2 1.3e-12 CCDS75110.1 SLIT2 gene_id:9353|Hs108|chr4 (1525) 767 76.2 1.3e-12 CCDS3426.1 SLIT2 gene_id:9353|Hs108|chr4 (1529) 767 76.2 1.4e-12 CCDS4369.1 SLIT3 gene_id:6586|Hs108|chr5 (1523) 764 75.9 1.6e-12 CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044) 707 71.3 2.7e-11 CCDS72880.1 NOTCH2NL gene_id:388677|Hs108|chr1 ( 236) 688 68.9 3.2e-11 CCDS12537.1 DLL3 gene_id:10683|Hs108|chr19 ( 587) 691 69.7 4.5e-11 CCDS12538.1 DLL3 gene_id:10683|Hs108|chr19 ( 618) 691 69.8 4.7e-11 CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 691 70.3 7.8e-11 CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 691 70.4 7.9e-11 CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 691 70.4 8e-11 >>CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321 aa) initn: 17489 init1: 17489 opt: 17489 Z-score: 7282.6 bits: 1361.5 E(32554): 0 Smith-Waterman score: 17489; 100.0% identity (100.0% similar) in 2321 aa overlap (1-2321:1-2321) 10 20 30 40 50 60 pF1KB4 MGPGARGRRRRRRPMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGGRCTQLPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MGPGARGRRRRRRPMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGGRCTQLPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 REAACLCPPGWVGERCQLEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPDCSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 REAACLCPPGWVGERCQLEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPDCSLP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 DPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTPGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTPGS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 FRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNCEVNVDDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNCEVNVDDC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 PGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 VCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDACVSNPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDACVSNPC 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 HEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 HEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 RGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQSSPCVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQSSPCVN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 GGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 LCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRHGGKCLDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRHGGKCLDL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB4 VDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPLCNVEINE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPLCNVEINE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB4 CASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPGGFRCVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPGGFRCVC 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB4 EPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCELLSPCTPNPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 EPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCELLSPCTPNPC 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB4 EHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 EHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGG 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB4 YTGPSCDQDINDCDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGPGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 YTGPSCDQDINDCDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGPGT 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB4 CTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQ 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB4 HEADPCLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 HEADPCLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGA 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB4 YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSH 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB4 CEQEVDPCLAQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CEQEVDPCLAQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDL 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB4 VARYLCSCPPGTLGVLCEINEDDCGPGPPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VARYLCSCPPGTLGVLCEINEDDCGPGPPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGL 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB4 RCEADINECRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RCEADINECRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQ 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB4 CRPSPGPGGGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CRPSPGPGGGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLS 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KB4 GPSCRSFPGSPPGASNASCAAAPCLHGGSCRPAPLAPFFRCACAQGWTGPRCEAPAAAPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GPSCRSFPGSPPGASNASCAAAPCLHGGSCRPAPLAPFFRCACAQGWTGPRCEAPAAAPE 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KB4 VSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLSVGDPWRQCEALQCWRLFNNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLSVGDPWRQCEALQCWRLFNNS 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KB4 RCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDGLDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDGLDC 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KB4 ASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFPYHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFPYHR 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KB4 PSPGSEPRARRELAPEVIGSVVMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PSPGSEPRARRELAPEVIGSVVMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERL 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KB4 DFPYPLRDVRGEPLEPPEPSVPLLPLLVAGAVLLLVILVLGVMVARRKREHSTLWFPEGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DFPYPLRDVRGEPLEPPEPSVPLLPLLVAGAVLLLVILVLGVMVARRKREHSTLWFPEGF 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KB4 SLHKDVASGHKGRREPVGQDALGMKNMAKGESLMGEVATDWMDTECPEAKRLKVEEPGMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SLHKDVASGHKGRREPVGQDALGMKNMAKGESLMGEVATDWMDTECPEAKRLKVEEPGMG 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KB4 AEEAVDCRQWTQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AEEAVDCRQWTQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCG 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KB4 GALEPMPTEEDEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GALEPMPTEEDEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLD 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KB4 AGADTNAQDHSGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AGADTNAQDHSGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEG 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KB4 MVEELIASHADVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MVEELIASHADVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAA 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KB4 REGSYEAAKLLLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPPGPHGLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 REGSYEAAKLLLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPPGPHGLG 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KB4 PLLCPPGAFLPGLKAAQSGSKKSRRPPGKAGLGPQGPRGRGKKLTLACPGPLADSSVTLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PLLCPPGAFLPGLKAAQSGSKKSRRPPGKAGLGPQGPRGRGKKLTLACPGPLADSSVTLS 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KB4 PVDSLDSPRPFGGPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQPPGGCVLSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PVDSLDSPRPFGGPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQPPGGCVLSL 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KB4 GLLNPVAVPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GLLNPVAVPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEE 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KB4 YPAAGAHSSPPKARFLRVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTPSPATATGAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 YPAAGAHSSPPKARFLRVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTPSPATATGAM 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 pF1KB4 ATTTGALPAQPLPLSVPSSLAQAQTQLGPQPEVTPKRQVLA ::::::::::::::::::::::::::::::::::::::::: CCDS12 ATTTGALPAQPLPLSVPSSLAQAQTQLGPQPEVTPKRQVLA 2290 2300 2310 2320 >>CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555 aa) initn: 5566 init1: 3565 opt: 5428 Z-score: 2273.1 bits: 434.7 E(32554): 2.7e-120 Smith-Waterman score: 8800; 51.2% identity (72.2% similar) in 2381 aa overlap (33-2293:52-2369) 10 20 30 40 50 60 pF1KB4 PGARGRRRRRRPMSPPPPPPPVRALPLLLLLAGPGAAAP-PCLDGSPCANGGRCTQLPSR ..:: : :::. .:: :.: : . : CCDS43 PRCSQPGETCLNGGKCEAANGTEACVCGGAFVGPRCQDPNPCLS-TPCKNAGTCHVVDRR 30 40 50 60 70 80 70 80 90 100 110 pF1KB4 ---EAACLCPPGWVGERC--QLEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPD . :: : :. : : :.. : ..:: . :.:. . ....:::: :. : . CCDS43 GVADYACSCALGFSGPLCLTPLDNACLTNPCRNGGTCD---LLTLTEYKCRCPPGWSGKS 90 100 110 120 130 120 130 140 150 160 170 pF1KB4 CSLPDPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGE-P--CRHGGT :. ::: :.:::.:..: . .. ..: :::...: .::.::.:: :. : :::::: CCDS43 CQQADPCASNPCANGGQC-LPFEASYICHCPPSFHGPTCRQDVNEC--GQKPGLCRHGGT 140 150 160 170 180 190 180 190 200 210 220 230 pF1KB4 CLNTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNC : : ::.:: : : .::: :: : :::.::::.:::::: .::.:..::::::: :::: CCDS43 CHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTGQNC 200 210 220 230 240 250 240 250 260 270 280 290 pF1KB4 EVNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFN : :.:::::. : :::.::::::::::.::::::::.::::::::::.::::.::::: : CCDS43 EENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHN 260 270 280 290 300 310 300 310 320 330 340 350 pF1KB4 TLGGHSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDD : ::..::::::::::.::.::::::.:.:::::::::::::::: :: :.:::::::.: CCDS43 THGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCECPHGRTGLLCHLND 320 330 340 350 360 370 360 370 380 390 400 410 pF1KB4 ACVSNPCHEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQG ::.::::.: . ::::::::.:::::: :.:: ::.:::::::.::::::: :.:.:: : CCDS43 ACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGANPCEHAGKCINTLG 380 390 400 410 420 430 420 430 440 450 460 470 pF1KB4 SFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDEC :: ::: .:::::::: :::::.:.::.:.:::::.::.: :::: :. :..:::. ::: CCDS43 SFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGVHCEVNTDEC 440 450 460 470 480 490 480 490 500 510 520 530 pF1KB4 QSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRC ::::...: : :..: :.: ::.::.: :: ::::::::::.:::::.: :. : : : CCDS43 ASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNGAKCLDGPNTYTCVC 500 510 520 530 540 550 540 550 560 570 580 590 pF1KB4 AEGFEGTLCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRH .::. :: :. ..:.:.:::::.: : ::.:.:.: : ::::: .::....:: :::::: CCDS43 TEGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRPGYTGHHCETNINECSSQPCRH 560 570 580 590 600 610 600 610 620 630 640 650 pF1KB4 GGKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPL :: : : . ::: : .:::: :::.:.:::::.:: :.: : :. :.:.:.::.:: . CCDS43 GGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSGTCLDKIDGYECACEPGYTGSM 620 630 640 650 660 670 660 670 680 690 700 710 pF1KB4 CNVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAP ::..:.:::..:: .::.: :: ::: : :: : : :: . : .:: :: : :. CCDS43 CNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNECNSNPCVHGACRDSL 680 690 700 710 720 730 720 730 740 750 760 770 pF1KB4 GGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCE--- .:..: :.::::: : .. . :::.:: ::::.. :. ::: : .: .:. CCDS43 NGYKCDCDPGWSGTNC--DINNNECESNPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNI 740 750 760 770 780 790 780 790 pF1KB4 ------------------------------------LLSPCTPNPCEHGGRC-ESAPGQL .:.::.:.::..::.: .: . CCDS43 NECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRNGGECRQSEDYES 800 810 820 830 840 850 800 810 820 830 840 850 pF1KB4 PVCSCPQGWQGPRCQQDVDECAGPAPCGPHGI-CTNLAGSFSCTCHGGYTGPSCDQDIND : :: :::: :. :..::. .:: :: : : :.. : :..::.: .:. ::.: CCDS43 FSCVCPTGWQGQTCEVDINECVL-SPCR-HGASCQNTHGGYRCHCQAGYSGRNCETDIDD 860 870 880 890 900 910 860 870 880 890 900 910 pF1KB4 CDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGPGT-CTDHVASFTCT : :::: ::::: ::... :.::::: : : .:..:: :.:: :. ::: : :.::: CCDS43 CRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANCTDCVDSYTCT 920 930 940 950 960 970 920 930 940 950 960 970 pF1KB4 CPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPC :: :..:.:::.. :::. ::::::::::::.:::.::: ::.::..:::... : :.:: CCDS43 CPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSYCQHDVNECDSQPC 980 990 1000 1010 1020 1030 980 990 1000 1010 1020 pF1KB4 LHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGAY--CLCPPGWS ::::.:. . ..:::: ...:::.::.:: ::. .::.:::.: :: . : :: ::. CCDS43 LHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWT 1040 1050 1060 1070 1080 1090 1030 1040 1050 1060 1070 1080 pF1KB4 GRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCL : ::. :. :. :: . :: . .::: :: ::: ..:.: : : :::.::. :: : CCDS43 GLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECS 1100 1110 1120 1130 1140 1150 1090 1100 1110 1120 1130 1140 pF1KB4 AQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDLVARYLCSCP .:::.:.:: :.::: :.:. ::.: :: ...::: :.:::.::.:.:: : :::: CCDS43 PSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGTCLDLPNTYKCSCP 1160 1170 1180 1190 1200 1210 1150 1160 1170 1180 1190 1200 pF1KB4 PGTLGVLCEINEDDCGPG-PPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGLRCEADINE :: :: :::: :::.: :.. .:.:..:::::: :::. ::::::..: :::.:.:: CCDS43 RGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFVGERCEGDVNE 1220 1230 1240 1250 1260 1270 1210 1220 1230 1240 1250 1260 pF1KB4 CRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQCRPSPGPG : :. : : :..:.: . :.: :.:: .: ::..:.. :...::..:: : . . . CCDS43 CLSNPCDARGTQNCVQRVND-FHCECRAGHTGRRCESVINGCKGKPCKNGGTCAVASNTA 1280 1290 1300 1310 1320 1270 1280 1290 1300 1310 1320 pF1KB4 GGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLSGPSCRSFP : : :.: : : :: ::.: :.: : : . ::.: : : ..:: :. :: CCDS43 RG--FICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTGPECQ-FP 1330 1340 1350 1360 1370 1380 1330 1340 1350 1360 1370 pF1KB4 GSPPGASNASC-AAAPCLHGGSCRPAPLAPFFRCACAQGWTGPRCE---------APAAA .: : : .. :: . :.:.:. .::.:: : ..: :. : CCDS43 ASSP------CLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDI 1390 1400 1410 1420 1430 1440 1380 1390 1400 1410 1420 1430 pF1KB4 PEVSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLSVGDPWRQC-EALQCWRLF : : : :: :.. :. .::. .::::::::::. .:::..: ..::::. : CCDS43 PPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQSLQCWKYF 1450 1460 1470 1480 1490 1500 1440 1450 1460 1470 1480 1490 pF1KB4 NNSRCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDG ....:: :.: .::.:.:::. . : :::.:..:: :::.::.::::::. :: ::: CCDS43 SDGHCDSQCNSAGCLFDGFDCQRA--EGQCNPLYDQYCKDHFSDGHCDQGCNSAECEWDG 1510 1520 1530 1540 1550 1500 1510 1520 1530 1540 1550 pF1KB4 LDCASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFP :::: .:: :: :.::..::.:::.: :: ::..:: .:.:.. :. ::::: :.:: CCDS43 LDCAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQQMIFP 1560 1570 1580 1590 1600 1610 1560 1570 1580 pF1KB4 YH------RPSP-------------------------GSEP-RARRELAP-EVIGSVVML :. : : ::: : :::: : .: ::.:.: CCDS43 YYGREEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVRGSIVYL 1620 1630 1640 1650 1660 1670 1590 1600 1610 1620 1630 1640 pF1KB4 EIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERLDFPYPLRDVRGEPLEPPEPSVPLL ::::: :.:. ...:: .: ..: .::::... :..:: .. :..: .::: :. : CCDS43 EIDNRQCVQA--SSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPA-QLH 1680 1690 1700 1710 1720 1730 1650 1660 1670 1680 1690 1700 pF1KB4 PLLVAGAVLLLVILV-LGVMVAR-RKREHSTLWFPEGFSLHKDVASGHKGRREPVGQDAL . ::.:...:...: ::...: :.:.:. :::::::.. . ...: ::::.:.:.. CCDS43 FMYVAAAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVSE---ASKKKRREPLGEDSV 1740 1750 1760 1770 1780 1790 1710 1720 1730 1740 1750 pF1KB4 GMKNM--AKGESLMGEVATDWMDTECPEAKRLKVEEPGM--GAEEAVDCRQWTQHHLVAA :.: . :. .:: . ..: : . :.:... ::: . .. .: :::::.:: :: CCDS43 GLKPLKNASDGALMDDNQNEWGDEDL-ETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAA 1800 1810 1820 1830 1840 1850 1760 1770 1780 1790 1800 1810 pF1KB4 DIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMPTEEDEADDTSA :.:.. ::: :::::..::: :::::::::::::::.:: ::.:: .::.: :. : CCDS43 DLRMS-AMAPTPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEEE--DAPA 1860 1870 1880 1890 1900 1820 1830 1840 1850 1860 1870 pF1KB4 SIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNAQDHSGRTPLHT .:::.: :::.: .:::::::::::::::.:.:::::::.:.::.: ::. ::::::. CCDS43 -VISDFIYQGASLHNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPLHA 1910 1920 1930 1940 1950 1960 1880 1890 1900 1910 1920 1930 pF1KB4 AVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIASHADVNAVDEL ::.::::::::::::::.::::::: ::.: ::::::::::::.:.:: :::::::::.: CCDS43 AVSADAQGVFQILIRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVDDL 1970 1980 1990 2000 2010 2020 1940 1950 1960 1970 1980 1990 pF1KB4 GKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEAAKLLLDHFANR ::::::::::::::.:...:::::::::::...:::::::::::::::.::.:::::::: CCDS43 GKSALHWAAAVNNVDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFANR 2030 2040 2050 2060 2070 2080 2000 2010 2020 2030 2040 2050 pF1KB4 EITDHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPP---GPHG----LGPLLCPPGAFLP .::::.::::::.::::.:.:::::::. . ::: .: : :.: :: :...: CCDS43 DITDHMDRLPRDIAQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLG 2090 2100 2110 2120 2130 2140 2060 2070 2080 2090 2100 pF1KB4 GLKAAQSGSKKSRRPPGKAGLGPQGPRGRG----KKLTLACPGPLADSSVTLSPVDSLDS .:: . .: :: :.: .: ::. . ... .: . : : ::: :::::::.: CCDS43 SLKPGVQG-KKVRKPSSK-GLACGSKEAKDLKARRKKSQDGKGCLLDSSGMLSPVDSLES 2150 2160 2170 2180 2190 2200 2110 2120 2130 2140 2150 2160 pF1KB4 PRPFGGPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQPPGGCVLSLGLLNPVA :. . . ::: .: .:. . . : : .: : . :: .: :: .: CCDS43 PHGYLSDVASPPLLP--SPFQQSPS--VPLNHLPGMPDTHLG----------IGHLNVAA 2210 2220 2230 2240 2250 2170 2180 2190 2200 2210 2220 pF1KB4 VPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEEYPAAGAH : . : : : . : . :: :. ::. . . : . .. ..:. CCDS43 KP-EMAAL------GGGGRLAFETGPPRLSH-LPVA-SGTSTVLGSSSGGALNFTVGGST 2260 2270 2280 2290 2300 2230 2240 2250 2260 2270 2280 pF1KB4 SSPPKARFL-RVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTP----SPATATGAMAT : . ..: :. : ..:. .: . .: .: :: . : .: .. : .. CCDS43 SLNGQCEWLSRLQS---GMVPNQYNPLR-GSVAPGPLSTQAPSLQHGMVGPLHSSLAASA 2310 2320 2330 2340 2350 2290 2300 2310 2320 pF1KB4 TTGALPAQPLPLSVPSSLAQAQTQLGPQPEVTPKRQVLA . . : :: CCDS43 LSQMMSYQGLPSTRLATQPHLVQTQQVQPQNLQMQQQNLQPANIQQQQSLQPPPPPPQPH 2360 2370 2380 2390 2400 2410 >>CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471 aa) initn: 5366 init1: 2003 opt: 5232 Z-score: 2191.9 bits: 419.6 E(32554): 9.1e-116 Smith-Waterman score: 8744; 51.2% identity (71.8% similar) in 2372 aa overlap (42-2297:67-2375) 20 30 40 50 60 70 pF1KB4 RRPMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGGRCT-QLPSREAACLCPPG :: . . : ::: :. : .:.: : : CCDS90 NEGMCVTYHNGTGYCKCPEGFLGEYCQHRDPC-EKNRCQNGGTCVAQAMLGKATCRCASG 40 50 60 70 80 90 80 90 100 110 120 pF1KB4 WVGERCQLED--PCH-SGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPDCSLPDPCLSSP ..:: :: :: : :: . :.:. . . . : : :: : .:. : ::: : CCDS90 FTGEDCQYSTSHPCFVSRPCLNGGTCH---MLSRDTYECTCQVGFTGKECQWTDACLSHP 100 110 120 130 140 150 130 140 150 160 170 180 pF1KB4 CAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTPGSFRCQCPA ::.:. :.. . .: :.: :. :..:..::.:: . :.::::::: :::..:::: CCDS90 CANGSTCTTVAN-QFSCKCLTGFTGQKCETDVNECDIPGHCQHGGTCLNLPGSYQCQCPQ 160 170 180 190 200 210 190 200 210 220 230 240 pF1KB4 GYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNCEVNVDDCPGHRCLN :.:: :.. :::::::: :::::::.::.:..: :::::::..:: :.::::.::: : CCDS90 GFTGQYCDSLYVPCAPSPCVNGGTCRQTGDFTFECNCLPGFEGSTCERNIDDCPNHRCQN 220 230 240 250 260 270 250 260 270 280 290 300 pF1KB4 GGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWT ::.::::::::::.:::.::::::::::::: ::::::.::::: : ::..:::::::. CCDS90 GGVCVDGVNTYNCRCPPQWTGQFCTEDVDECLLQPNACQNGGTCANRNGGYGCVCVNGWS 280 290 300 310 320 330 310 320 330 340 350 360 pF1KB4 GESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDACVSNPCHEDAICD :..::.:::::: : : :.:: :::::: : :: ::.::::::::::.:::::. :.:: CCDS90 GDDCSENIDDCAFASCTPGSTCIDRVASFSCMCPEGKAGLLCHLDDACISNPCHKGALCD 340 350 360 370 380 390 370 380 390 400 410 420 pF1KB4 TNPVNGRAICTCPPGFTGGACDQDVDECSIG-ANPCEHLGRCVNTQGSFLCQCGRGYTGP :::.::. ::::: :. :. : .:::::... .::::: :.::::.:.: :.: .::.:: CCDS90 TNPLNGQYICTCPQGYKGADCTEDVDECAMANSNPCEHAGKCVNTDGAFHCECLKGYAGP 400 410 420 430 440 450 430 440 450 460 470 480 pF1KB4 RCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQSSPCVNGGVCKD ::: :.::: : ::.:.:::::.:: :::.:: :: :..::..:.::::.::::.: : : CCDS90 RCEMDINECHSDPCQNDATCLDKIGGFTCLCMPGFKGVHCELEINECQSNPCVNNGQCVD 460 470 480 490 500 510 490 500 510 520 530 540 pF1KB4 RVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGTLCDRNV .:: :.: :: ::.: .::.:.:.:.:::: :::::.:.:.::::.:: :: :.::..:. CCDS90 KVNRFQCLCPPGFTGPVCQIDIDDCSSTPCLNGAKCIDHPNGYECQCATGFTGVLCEENI 520 530 540 550 560 570 550 560 570 580 590 600 pF1KB4 DDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRHGGKCLDLVDKYLC :.:.:::::::.: ::: :..: : ::: :. : .:.::: :.:: . :.:.:::. : : CCDS90 DNCDPDPCHHGQCQDGIDSYTCICNPGYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQC 580 590 600 610 620 630 610 620 630 640 650 660 pF1KB4 RCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPLCNVEINECASSPC : ::.:::::.:.:::::::: :.: ::::::.:::.::::: ::..:.::::.:: CCDS90 NCQPGTSGVNCEINFDDCASNPCIHGICMDGINRYSCVCSPGFTGQRCNIDIDECASNPC 640 650 660 670 680 690 670 680 690 700 710 720 pF1KB4 GEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPGGFRCVCEPGWSG .:..:..: :::::.:: : : : . : .:: :: : . .:..:.:. :: : CCDS90 RKGATCINGVNGFRCICPEGPHHPSCYSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVG 700 710 720 730 740 750 730 740 750 760 770 pF1KB4 PRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCEL--------------- : . .. : :.::. ::::.. :..::: : .: .:.. CCDS90 INC--EVDKNECLSNPCQNGGTCDNLVNGYRCTCKKGFKGYNCQVNIDECASNPCLNQGT 760 770 780 790 800 780 790 800 pF1KB4 ------------------------LSPCTPNPCEHGGRCESAPG-QLPVCSCPQGWQGPR :.::.:::::... :. .:. . .: : :::: : CCDS90 CFDDISGYTCHCVLPYTGKNCQTVLAPCSPNPCENAAVCKESPNFESYTCLCAPGWQGQR 810 820 830 840 850 860 810 820 830 840 850 860 pF1KB4 CQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDCDPNPCLNGGSCQD : :.::: . :: ::.: : ::. : : :..: .:..::.:: ::: :::::.: CCDS90 CTIDIDECISK-PCMNHGLCHNTQGSYMCECPPGFSGMDCEEDIDDCLANPCQNGGSCMD 870 880 890 900 910 920 870 880 890 900 910 920 pF1KB4 GVGSFSCSCLPGFAGPRCARDVDECLSNPC-GPGTCTDHVASFTCTCPPGYGGFHCEQDL ::..::: :::::.: .: :..::::.:: . :::.:.: :.:: : :. : :::... CCDS90 GVNTFSCLCLPGFTGDKCQTDMNECLSEPCKNGGTCSDYVNSYTCKCQAGFDGVHCENNI 930 940 950 960 970 980 930 940 950 960 970 980 pF1KB4 PDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPCLHGGVCSAAHPGFR .:. ::::::::::::.::::::: :.::. : :: . : :.:::. :.: . .: CCDS90 NECTESSCFNGGTCVDGINSFSCLCPVGFTGSFCLHEINECSSHPCLNEGTCVDGLGTYR 990 1000 1010 1020 1030 1040 990 1000 1010 1020 1030 1040 pF1KB4 CTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGA--YCLCPPGWSGRLCDIRSLPCREA :.: ..:: .:::::. :::.::.: : ::: : :::: ::.: ::. .. : : CCDS90 CSCPLGYTGKNCQTLVNLCSRSPCKNKGTCVQKKAESQCLCPSGWAGAYCDVPNVSCDIA 1050 1060 1070 1080 1090 1100 1050 1060 1070 1080 1090 1100 pF1KB4 AAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCLAQPCQHGGTCRGYM :.. :: .:.::: .: :.. ..::: :: : :::.::...: : ..:::::.:: .. CCDS90 ASRRGVLVEHLCQHSGVCINAGNTHYCQCPLGYTGSYCEEQLDECASNPCQHGATCSDFI 1110 1120 1130 1140 1150 1160 1110 1120 1130 1140 1150 1160 pF1KB4 GGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDLVARYLCSCPPGTLGVLCEINEDD ::: :::.:::.: ::: .:::: .::::.::.::::: .. ::::::: :.::: : :: CCDS90 GGYRCECVPGYQGVNCEYEVDECQNQPCQNGGTCIDLVNHFKCSCPPGTRGLLCEENIDD 1170 1180 1190 1200 1210 1220 1170 1180 1190 1200 1210 1220 pF1KB4 CGPGPPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGLRCEADINECRSGACHAAHTRDCL :. ::.::..: :.: .::. : : ::..: :::.::::: :. : . . ::. CCDS90 CA------RGPHCLNGGQCMDRIGGYSCRCLPGFAGERCEGDINECLSNPCSSEGSLDCI 1230 1240 1250 1260 1270 1280 1230 1240 1250 1260 1270 1280 pF1KB4 QDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQCR-PSPGPGGGLTFTCHCAQPFW : . . :.:...:.: .:.: .. : ..:: .:: : : : : : :.: : CCDS90 QLTND-YLCVCRSAFTGRHCETFVDVCPQMPCLNGGTCAVASNMPDG---FICRCPPGFS 1290 1300 1310 1320 1330 1290 1300 1310 1320 1330 1340 pF1KB4 GPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLSGPSCRSFPGSPPGASNASCAAA : ::. :: ...: : : .: :::: :: : .:.: .::.. CCDS90 GARCQS---SCGQVKCRKGEQCVHTASGPRCFCP---SPRDCES-----------GCASS 1340 1350 1360 1370 1380 1350 1360 1370 1380 1390 1400 pF1KB4 PCLHGGSCRPAPLAPFFRCACAQGWTGPRCEAPAAAPEVSEEP-RCPRAACQAKRGDQRC :: :::::.: :.. : :: ..: ::: .: : : : : : : : : CCDS90 PCQHGGSCHPQRQPPYYSCQCAPPFSGSRCELYTAPP--STPPATCLSQYCADKARDGVC 1390 1400 1410 1420 1430 1410 1420 1430 1440 1450 1460 pF1KB4 DRECNSPGCGWDGGDCSLSVGDPWRQCEA-LQCWRLFNNSRCDPACSSPACLYDNFDCHA :. ::: .: ::::::::.. .:: .: . : :: .:: .:: :.. ::.:::.:. CCDS90 DEACNSHACQWDGGDCSLTMENPWANCSSPLPCWDYINN-QCDELCNTVECLFDNFECQ- 1440 1450 1460 1470 1480 1490 1470 1480 1490 1500 1510 1520 pF1KB4 GGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDGLDCASEVPALLARGVLVLTVLLP : .::. :.::::::: :..::::::.:::::::::::.. : ::.:.::..::.: CCDS90 -GNSKTCK--YDKYCADHFKDNHCDQGCNSEECGWDGLDCAADQPENLAEGTLVIVVLMP 1500 1510 1520 1530 1540 1550 1530 1540 1550 1560 1570 pF1KB4 PEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFPYH--RPSPGSEPRARRELAP--- ::.::... .::. :...:.:.::.. :..:. ::.::. . . .. : :. : CCDS90 PEQLLQDARSFLRALGTLLHTNLRIKRDSQGELMVYPYYGEKSAAMKKQRMTRRSLPGEQ 1560 1570 1580 1590 1600 1610 1580 1590 1600 1610 1620 1630 pF1KB4 --EVIGSVVMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERLDFPYPLRDVRGEP :: :: :.:::::: :.: ..:::: ....:: : : :.. . ::: .: .: CCDS90 EQEVAGSKVFLEIDNRQCVQ--DSDHCFKNTDAAAALL-ASHAIQGT-LSYPLVSVVSES 1620 1630 1640 1650 1660 1670 1640 1650 1660 1670 1680 1690 pF1KB4 LEPPEPSVPLLPLLVAGAVLLLVILVLGVMVARRKREHSTLWFPEGFSLHKDVASGHKGR : : . . :: ::....:..: :..:::..:.:::.:..::.::::.:..: ::.:: : CCDS90 LTPERTQ--LLYLLAVAVVIILFIILLGVIMAKRKRKHGSLWLPEGFTLRRD-ASNHK-R 1680 1690 1700 1710 1720 1700 1710 1720 1730 1740 pF1KB4 REPVGQDALGMKNMAKGES---LMGEVATD-WMDTECPEAKRLKVEEPGMGAEE--AVDC ::::::::.:.::.. : :.: ... :.: : :. :..:.:. .. .:: .: CCDS90 REPVGQDAVGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDR 1730 1740 1750 1760 1770 1780 1750 1760 1770 1780 1790 1800 pF1KB4 RQWTQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMP : :::.:: ::::: .:..::::::.. ..: .::::::::: :::::::. ::. . . CCDS90 RPWTQQHLEAADIRRTPSLALTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSD-LS 1790 1800 1810 1820 1830 1840 1810 1820 1830 1840 1850 1860 pF1KB4 TEEDEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNA :...:.:.::.::.::. :::.: :.:::::: ::::::::.::::::::::::::.:: CCDS90 DEDEDAEDSSANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANA 1850 1860 1870 1880 1890 1900 1870 1880 1890 1900 1910 1920 pF1KB4 QDHSGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIA ::. :: :::.::.:::::::::::::: ::::::: ::.: ::::::::::::: ::: CCDS90 QDNMGRCPLHAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELIN 1910 1920 1930 1940 1950 1960 1930 1940 1950 1960 1970 1980 pF1KB4 SHADVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEA .:::::::. :::::::::::::::::: :::::::.::::.::::::::::::::::: CCDS90 CQADVNAVDDHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEA 1970 1980 1990 2000 2010 2020 1990 2000 2010 2020 2030 2040 pF1KB4 AKLLLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPPGP---HGLGPLLC ::.::::::::.::::.::::::::..:.:.:::::::. . :::: .:.:..: CCDS90 AKILLDHFANRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPPGTVLTSALSPVIC 2030 2040 2050 2060 2070 2080 2050 2060 2070 2080 2090 pF1KB4 PPGAFLPGLKAAQSGSKKSRRPPGKAGLGPQGP---------RGRGKKLTLACPGPLADS :. . .:: . : :::::: .:. . . : .: .: .:. :..: CCDS90 GPNRSFLSLKHTPMG-KKSRRPSAKSTMPTSLPNLAKEAKDAKGSRRKKSLSEKVQLSES 2090 2100 2110 2120 2130 2140 2100 2110 2120 2130 2140 pF1KB4 SVTLSPVDSLDSPRPF----GGPP--ASPGGF-----PL---EGPYAAATAT-AVSLAQL ::::::::::.::. . . : .::: . :. .: : . : :.:...: CCDS90 SVTLSPVDSLESPHTYVSDTTSSPMITSPGILQASPNPMLATAAPPAPVHAQHALSFSNL 2150 2160 2170 2180 2190 2200 2150 2160 2170 2180 pF1KB4 --------GG----PGRAGLGRQ-----PPGGCVLSLGLLNPVAVPLDWA-RLP-PPAPP :. :. . : . : .: . ::. :.:: :: :: :. . CCDS90 HEMQPLAHGASTVLPSVSQLLSHHHIVSPGSGSAGSLSRLHPVPVPADWMNRMEVNETQY 2210 2220 2230 2240 2250 2260 2190 2200 2210 2220 2230 2240 pF1KB4 GPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEEYPAAGAHSSPPKARFLRVPS- . : . :::. . .:: ..:: ::: :. : . :: . : .:. CCDS90 NEMFGMVLAPA-EGTHPG--IAPQSRPPE-----GKHITTPR---EPLPPIVTFQLIPKG 2270 2280 2290 2300 2310 2250 2260 2270 2280 2290 pF1KB4 --EHPYLTPSPESPEHWASPSP-PSLSDWSEST--PSPATATGAMATTTGALPAQPLPLS .: .:.:.: : .: :.. . : . :: : :. : : . :: CCDS90 SIAQPAGAPQPQSTCPPAVAGPLPTMYQIPEMARLPSVAFPTAMMPQQDGQVAQTILPAY 2320 2330 2340 2350 2360 2370 2300 2310 2320 pF1KB4 VPSSLAQAQTQLGPQPEVTPKRQVLA : CCDS90 HPFPASVGKYPTPPSQHSYASSNAAERTPSHSGHLQGEHPYLTPSPESPDQWSSSSPHSA 2380 2390 2400 2410 2420 2430 >>CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003 aa) initn: 2955 init1: 730 opt: 2443 Z-score: 1034.5 bits: 205.1 E(32554): 2.7e-51 Smith-Waterman score: 5306; 38.9% identity (57.7% similar) in 2241 aa overlap (42-2208:67-1994) 20 30 40 50 60 pF1KB4 RRPMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGGRCTQL-------PSREAA :: ... : ::: : : :: . CCDS34 NGGTCLSLSLGQGTCQCAPGFLGETCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSP 40 50 60 70 80 90 70 80 90 100 110 pF1KB4 ------CLCPPGWVGERCQ--LEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPD : : ::..::::: ::::: . :. :: :. . ...: .: : :. : . CCDS34 LTPSFLCTCLPGFTGERCQAKLEDPCPPSFCSKRGRCH---IQASGRPQCSCMPGWTGEQ 100 110 120 130 140 150 120 130 140 150 160 170 pF1KB4 CSLPDPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGE-PCRHGGTCL :.: : : ..::..:. : .. .. : ::::..:..:. ::.:: :: .: .: CCDS34 CQLRDFCSANPCVNGGVC-LATYPQIQCHCPPGFEGHACERDVNECFQDPGPCPKGTSCH 160 170 180 190 200 210 180 190 200 210 220 230 pF1KB4 NTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCR--QSGDLTYD-CACLPGFEGQN :: :::.: ::.: :: :: : :: : : :::::. : :. : : ::: : . CCDS34 NTLGSFQCLCPVGQEGPRCELRAGPCPPRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPD 220 230 240 250 260 270 240 250 260 270 280 290 pF1KB4 CEVNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQ-PNACHNGGTC :::: :.: .:.: ::::: ::..::.: :: ::: :.::::::. : : :.::::: CCDS34 CEVNPDNCVSHQCQNGGTCQDGLDTYTCLCPETWTGWDCSEDVDECETQGPPHCRNGGTC 280 290 300 310 320 330 300 310 320 330 340 350 pF1KB4 FNTLGGHSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHL :. :. ::::.:: : :: .:.::: .:.: :.:: :::.:: : :: :.::::::: CCDS34 QNSAGSFHCVCVSGWGGTSCEENLDDCIAATCAPGSTCIDRVGSFSCLCPPGRTGLLCHL 340 350 360 370 380 390 360 370 380 390 400 pF1KB4 DDACVSNPCHEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSI---GANPCEHLGRC .: :.:.::: :: :.:::..: ..: : ::..: .: ::.::: . : .:::: : : CCDS34 EDMCLSQPCHGDAQCSTNPLTGSTLCLCQPGYSGPTCHQDLDECLMAQQGPSPCEHGGSC 400 410 420 430 440 450 410 420 430 440 450 460 pF1KB4 VNTQGSFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEV .:: ::: : : :::: :::.: ::::: ::. .:::: .. : :.: :. : ::: CCDS34 LNTPGSFNCLCPPGYTGSRCEADHNECLSQPCHPGSTCLDLLATFHCLCPPGLEGQLCEV 460 470 480 490 500 510 470 480 490 500 510 520 pF1KB4 DIDECQSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDG . .:: :.::.: . :.: .:::.: : ::::. :. :.::: :.:: ::..: ::: . CCDS34 ETNECASAPCLNHADCHDLLNGFQCICLPGFSGTRCEEDIDECRSSPCANGGQCQDQPGA 520 530 540 550 560 570 530 540 550 560 570 580 pF1KB4 YECRCAEGFEGTLCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRS ..:.: :::: : ::...:::: : CCDS34 FHCKCLPGFEG-------------P------------------------RCQTEVDECLS 580 590 590 600 610 620 630 640 pF1KB4 QPCRHGGKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPG .:: :..:::: ..: :::: :: ::: . :: : .::: CCDS34 DPCPVGASCLDLPGAFFCLCPSGFTGQLCEVPL--CAPN----------------LCQPK 600 610 620 630 650 660 670 680 690 700 pF1KB4 FTGPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGI .: : : .. :::: :: : : :: :. : :: CCDS34 --------QI-------------CKDQKDKANCLCPDGS--PGCAPPEDNCT---CHHGH 640 650 660 670 710 720 730 740 750 760 pF1KB4 CYDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQ : . :::. ::.::.: : :: CCDS34 CQRSS----CVCDVGWTGPECEAEL------------GG--------------------- 680 690 770 780 790 800 810 820 pF1KB4 CELLSPCTPNPCEHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTN : :: ::: : : : : CCDS34 ------CISAPCAHGGTCY-----------------------------PQPSG------- 700 710 830 840 850 860 870 880 pF1KB4 LAGSFSCTCHGGYTGPSCDQDINDCDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDV ..::: :::::.:..... : .::::::::. . :.. :.: :. .::.: .. CCDS34 ----YNCTCPTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTST 720 730 740 750 760 890 900 910 920 930 940 pF1KB4 DECLSNPCGPGTCTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSC : :.: :: :::::::. ..::: CCDS34 DYCVSAPC-------------------------------------FNGGTCVNRPGTFSC 770 780 790 950 960 970 980 990 1000 pF1KB4 LCRPGYTGAHCQHEADP-CLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQ :: :. : .:. . : : . :: . ..:. . : :: : ..:: .::::.: :... CCDS34 LCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGSCQTLMDLCAQK 800 810 820 830 840 850 1010 1020 1030 1040 1050 1060 pF1KB4 PCQNGGRCVQTGA--YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDED :: ...:.::: .::: ::.: ::.. :..:: . :. . .::. :: ::: CCDS34 PCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSLCHNGGLCVDSG 860 870 880 890 900 910 1070 1080 1090 1100 1110 1120 pF1KB4 SSHYCVCPEGRTGSHCEQEVDPCLAQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDE :..: :: : :: :...:.:: ..:::.:.:: . .::.:.: :::.:.:: ..: CCDS34 PSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGYDGQNCSKELDA 920 930 940 950 960 970 1130 1140 1150 1160 1170 1180 pF1KB4 CASQPCQHGGSCIDLVARYLCSCPPGTLGVLCEINEDDCGPGPPLDSGPRCLHNGTCVDL : ::::.. :.: : : CCDS34 CQSQPCHNHGTCT---------------------------PKP----------------- 980 1190 1200 1210 1220 1230 1240 pF1KB4 VGGFRCTCPPGYTGLRCEADINECRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQT :::.:.::::..:::::.:..:: . :: . : : .. ...: : : : .: :.. CCDS34 -GGFHCACPPGFVGLRCEGDVDECLDQPCHPTGTAAC-HSLANAFYCQCLPGHTGQWCEV 990 1000 1010 1020 1030 1040 1250 1260 1270 1280 1290 1300 pF1KB4 VLSPCESQPCQHGGQCRPSPGPGGGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQ ..::.:::: ::: :. . :. : : ::: . : :: : . : :: .: : : CCDS34 EIDPCHSQPCFHGGTCEATA--GSPLGFICHCPKGFEGPTCSHRAPSCGFHHCHHGGLCL 1050 1060 1070 1080 1090 1100 1310 1320 1330 1340 1350 1360 pF1KB4 QTPRG---PRCACPPGLSGPSCRSFPGSPPGASNASCAAAPCLHGGSCRPAPL--APFFR .:. ::::: : .::.: . : .: : . : :::..::: . .: :: CCDS34 PSPKPGFPPRCACLSGYGGPDCLT-PPAPKGCGPPS----PCLYNGSCSETTGLGGPGFR 1110 1120 1130 1140 1150 1370 1380 1390 1400 1410 1420 pF1KB4 CACAQGWTGPRCEAPAAAPEVSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLS :.: .. ::::. :.: .:... :: :: :..:: .::::::::. CCDS34 CSCPHSSPGPRCQKPGAK------------GCEGRSGDGACDAGCSGPGGNWDGGDCSLG 1160 1170 1180 1190 1200 1430 1440 1450 1460 1470 pF1KB4 VGDPWRQCEAL-QCWRLFNNSRCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHF : :::. : . .:: :: ...: : :.: ::.:..::.. .:.:.:..:: ::: CCDS34 VPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPP---ACTPAYDQYCHDHF 1210 1220 1230 1240 1250 1260 1480 1490 1500 1510 1520 1530 pF1KB4 ADGRCDQGCNTEECGWDGLDCASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAIL .:.:..:::: :::::: :: : :.: :.: : : .. . . :: : CCDS34 HNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLSLTL 1270 1280 1290 1300 1310 1320 1540 1550 1560 1570 1580 pF1KB4 RTSLRFRLDAHGQAMVFPY------------------HRPSPGSEPRARRELAPEVIGSV :..: : : :. ::.:: .: .: ..: .. : : : CCDS34 RVGLWVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGK-ETDSLSAGFV 1330 1340 1350 1360 1370 1380 1590 1600 1610 1620 1630 pF1KB4 VMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERLD--FPYPLRDVRGEP-LEPPE :.. .: : . ..: : .:.:..:: :. .: :: :. . :: CCDS34 VVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAPPA 1390 1400 1410 1420 1430 1440 1640 1650 1660 1670 1680 1690 pF1KB4 PSVPLLPLL---VAGAVLL-LVILVLGVMVARRKREHSTLWFPEGFSLHKDVASGHKGRR ..: :.: :::..:: : :.. .. ::.:::..::.: ::. . . :. . :: CCDS34 NQLPW-PVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRPRTQSAPHRRR 1450 1460 1470 1480 1490 1500 1700 1710 1720 1730 1740 1750 pF1KB4 EPVGQDALGMKNMAKGESLMGEVATDWMDTEC--PEAKRLKVEEPGMGAEEA--VDCRQW :.:.:..:.: . : .. :: : . . : :: . :: :.. : . :. : CCDS34 PPLGEDSIGLKAL-KPKA---EVDEDGV-VMCSGPE----EGEEVGQAEETGPPSTCQLW 1510 1520 1530 1540 1550 1760 1770 1780 1790 1800 1810 pF1KB4 TQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMPTEE . .: . : ::::: ... .. :...::::: :::: : :: : . CCDS34 SLSGGCGA---LPQAAMLTPPQ-ESEMEAPDLDTRGPDGVTPLMSAVCCG---EVQSGTF 1560 1570 1580 1590 1600 1820 1830 1840 1850 1860 1870 pF1KB4 DEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNAQDH . : :. :: :.: :::: ::::::..: ::.:::.:::. : :. CCDS34 QGAWLGCPEPWEPLLDGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQPDR 1610 1620 1630 1640 1650 1660 1880 1890 1900 1910 1920 1930 pF1KB4 SGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIASHA .::::::.::.:::. : :.:.:.:.: .::: ::.: :.:::::::: .::::::..: CCDS34 AGRTPLHAAVAADAREVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAAQA 1670 1680 1690 1700 1710 1720 1940 1950 1960 1970 1980 1990 pF1KB4 DVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEAAKL ::.: :. ::.::::::::::..:. .::. ::.:: ::..:.::::::::::. :.:.: CCDS34 DVGARDKWGKTALHWAAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVAQL 1730 1740 1750 1760 1770 1780 2000 2010 2020 2030 2040 pF1KB4 LLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGP----RSPPGPHGLGPLLCPP :: : ::. :. : :::..: : :.. ::. . : .. :: .. ::. : CCDS34 LLGLGAARELRDQAGLAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREA-GPF---P 1790 1800 1810 1820 1830 1840 2050 2060 2070 2080 2090 2100 pF1KB4 GAFLPGLKAA-QSGSKKSRRPPGKAGLGPQGP----RGRGKKLTLACPGPLADSSV-TLS : .... ..:. : .:: ::.: ..: .. :: : : : .:: CCDS34 RARTVSVSVPPHGGGALPRCRTLSAGAGPRGGGACLQARTWSVDLAARGGGAYSHCRSLS 1850 1860 1870 1880 1890 1900 2110 2120 2130 2140 2150 pF1KB4 PVDSLDSPRPFGGPPASPGGFPLEGPYAAATATAVSLAQLG-GPGRAGLGRQPPGGC-VL : . .: : : : : ..:: :. .. : . ::.: : . CCDS34 GVGAGGGPTPRGRR-FSAG---MRGPRP---NPAIMRGRYGVAAGRGGRVSTDDWPCDWV 1910 1920 1930 1940 1950 2160 2170 2180 2190 2200 2210 pF1KB4 SLGLLNPVA-VPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGH .:: . .. .: .::: :: : .::: . : :. :: : CCDS34 ALGACGSASNIP-----IPPPCLT-PS---PERGSPQL-DCGPPAL-QEMPINQGGEGKK 1960 1970 1980 1990 2000 2220 2230 2240 2250 2260 2270 pF1KB4 GEEYPAAGAHSSPPKARFLRVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTPSPATAT >>CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144 aa) initn: 968 init1: 968 opt: 1610 Z-score: 686.6 bits: 141.4 E(32554): 6.4e-32 Smith-Waterman score: 1849; 33.3% identity (57.7% similar) in 807 aa overlap (210-968:467-1247) 180 190 200 210 220 230 pF1KB4 SFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGF---EGQNCEVN : :...: .. . :: ::..:. CCDS47 IPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVWQLGFAGSEGEKCQGV 440 450 460 470 480 490 240 250 260 270 280 290 pF1KB4 VDD--CPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNT .: . : . .: :. . : .: : . :... : :: .:.. CCDS47 IDAYFFLAANCTEDATYVNDPEDNNSSC---WFPHEGTKEI---------CANGCSCLSE 500 510 520 530 540 300 310 320 330 340 350 pF1KB4 LGG--HSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLD . . .: :.:. .: : : : :.:.:.. :.: .. : :: .. CCDS47 EDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPRCSCSLSYIGRLCVVN 550 560 570 580 590 600 360 370 380 390 400 pF1KB4 -DACVSNPC-HEDAICDTNPVNGRAICTCP--PGFTGGACDQDVDECSIGANPCEHLGRC : :..: ..: . : :.: . . :. :...:. . :.. CCDS47 VDYCLGNHSISVHGLCLALSHN----CNCSGLQRYERNICEIDTEDCK--SASCKNGTTS 610 620 630 640 650 410 420 430 440 450 pF1KB4 VNTQGSFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQ--------------FT .. .: :. .: :. : .:: :..:: : ::.: :::.:. :. :. CCDS47 THLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQPGNYFCQCVPPFKVVDGFS 660 670 680 690 700 710 460 470 480 490 500 510 pF1KB4 CICMAGFTGTYCEVDIDECQSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECAST :.: :..: :: :::.: . : ....::: ...:.: : . :. :. . .:: . CCDS47 CLCNPGYVGIRCEQDIDDCILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKMN 720 730 740 750 760 770 520 530 540 550 560 570 pF1KB4 PCRNGAKCVDQPDGYECRCAEGFEGTLCDRNVDDCSPDPCHHGR-CVDGI--ASFSCACA ::.:.. :.: .:.:.:. :. : :......:. ::: .: : .. ..: : : CCDS47 PCKNNSTCTDLYKSYRCECTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLCP 780 790 800 810 820 830 580 590 600 610 620 pF1KB4 PGYTGTRCESQVDECR--SQPCRHGGKCLDLVD-KYLCRCPSGTTGVNCEVNIDDCASNP : ::: :... . : .:::... :: ::: . : : : :::... :: CCDS47 PLYTGQFCHQRYNLCDLLHNPCRNNSTCLALVDANQHCICREEFEGKNCEIDVKDCLFLS 840 850 860 870 880 890 630 640 650 660 670 680 pF1KB4 CT-FGVCRDGINRYDCVCQPGFTGPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGS : .: :.: .: . :.:.:::.: ::..:::::.: :: ..:.::: : : : : : CCDS47 CQDYGDCEDMVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRFFCNCEPEY 900 910 920 930 940 950 690 700 710 720 730 740 pF1KB4 LPPLCLPPSHPCAHEPC-SHGICYDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAG :.: . : :: .. : :. :.: ::..: : .: : : :.:: CCDS47 HGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINL--DECLSEPCLHD 960 970 980 990 1000 1010 750 760 770 780 790 800 pF1KB4 GTCSSDGMG-FHCTCPPGVQGRQCEL-LSPCTPNPCEHGGRCESAPGQLPVCSCPQGWQG :.: ::.. . : : : : .:: . : ::: :: :: .. : ::: . CCDS47 GVCI-DGINHYTCDCKSGFFGTHCETNANDCLSNPCLHG-RCTELINEYP-CSCDADGTS 1020 1030 1040 1050 1060 1070 810 820 830 840 850 pF1KB4 PRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDC-DPN----PCL .:. ...:.. :: .:.: . : .:.: : :::: :...:..: .:. :: CCDS47 TQCKIKINDCTS-IPCMNEGFCQKSAHGFTCICPRGYTGAYCEKSIDNCAEPELNSVICL 1080 1090 1100 1110 1120 1130 860 870 880 890 900 910 pF1KB4 NGGSCQDGVG-SFSCSCLPGFAGPRCARDVDECLSNPCGPGT-CTDHVASFTCTCPPGYG ::: : :: : .:.: :::::.: : ...:: :.:: :. : ::. ...: : ::.. CCDS47 NGGICVDGPGHTFDCRCLPGFSGQFCEININECSSSPCLHGADCEDHINGYVCKCQPGWS 1140 1150 1160 1170 1180 1190 920 930 940 950 960 970 pF1KB4 GFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYT----GAHCQHEAD--PCLSRPC : :::..: .: :.:: . :... . .::: ::. : : : ::. CCDS47 GHHCENEL-ECIPNSCVHE-LCMENEPGSTCLCTPGFMTCSIGLLCGDEIRRITCLTPIF 1200 1210 1220 1230 1240 1250 980 990 1000 1010 1020 1030 pF1KB4 LHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGAYCLCPPGWSGR CCDS47 QRTDPISTQTYTIPPSETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIVKHDILPTTGL 1260 1270 1280 1290 1300 1310 >>CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165 aa) initn: 968 init1: 968 opt: 1610 Z-score: 686.5 bits: 141.4 E(32554): 6.4e-32 Smith-Waterman score: 1849; 33.3% identity (57.7% similar) in 807 aa overlap (210-968:467-1247) 180 190 200 210 220 230 pF1KB4 SFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGF---EGQNCEVN : :...: .. . :: ::..:. CCDS78 IPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVWQLGFAGSEGEKCQGV 440 450 460 470 480 490 240 250 260 270 280 290 pF1KB4 VDD--CPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNT .: . : . .: :. . : .: : . :... : :: .:.. CCDS78 IDAYFFLAANCTEDATYVNDPEDNNSSC---WFPHEGTKEI---------CANGCSCLSE 500 510 520 530 540 300 310 320 330 340 350 pF1KB4 LGG--HSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLD . . .: :.:. .: : : : :.:.:.. :.: .. : :: .. CCDS78 EDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPRCSCSLSYIGRLCVVN 550 560 570 580 590 600 360 370 380 390 400 pF1KB4 -DACVSNPC-HEDAICDTNPVNGRAICTCP--PGFTGGACDQDVDECSIGANPCEHLGRC : :..: ..: . : :.: . . :. :...:. . :.. CCDS78 VDYCLGNHSISVHGLCLALSHN----CNCSGLQRYERNICEIDTEDCK--SASCKNGTTS 610 620 630 640 650 410 420 430 440 450 pF1KB4 VNTQGSFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQ--------------FT .. .: :. .: :. : .:: :..:: : ::.: :::.:. :. :. CCDS78 THLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQPGNYFCQCVPPFKVVDGFS 660 670 680 690 700 710 460 470 480 490 500 510 pF1KB4 CICMAGFTGTYCEVDIDECQSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECAST :.: :..: :: :::.: . : ....::: ...:.: : . :. :. . .:: . CCDS78 CLCNPGYVGIRCEQDIDDCILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKMN 720 730 740 750 760 770 520 530 540 550 560 570 pF1KB4 PCRNGAKCVDQPDGYECRCAEGFEGTLCDRNVDDCSPDPCHHGR-CVDGI--ASFSCACA ::.:.. :.: .:.:.:. :. : :......:. ::: .: : .. ..: : : CCDS78 PCKNNSTCTDLYKSYRCECTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLCP 780 790 800 810 820 830 580 590 600 610 620 pF1KB4 PGYTGTRCESQVDECR--SQPCRHGGKCLDLVD-KYLCRCPSGTTGVNCEVNIDDCASNP : ::: :... . : .:::... :: ::: . : : : :::... :: CCDS78 PLYTGQFCHQRYNLCDLLHNPCRNNSTCLALVDANQHCICREEFEGKNCEIDVKDCLFLS 840 850 860 870 880 890 630 640 650 660 670 680 pF1KB4 CT-FGVCRDGINRYDCVCQPGFTGPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGS : .: :.: .: . :.:.:::.: ::..:::::.: :: ..:.::: : : : : : CCDS78 CQDYGDCEDMVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRFFCNCEPEY 900 910 920 930 940 950 690 700 710 720 730 740 pF1KB4 LPPLCLPPSHPCAHEPC-SHGICYDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAG :.: . : :: .. : :. :.: ::..: : .: : : :.:: CCDS78 HGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINL--DECLSEPCLHD 960 970 980 990 1000 1010 750 760 770 780 790 800 pF1KB4 GTCSSDGMG-FHCTCPPGVQGRQCEL-LSPCTPNPCEHGGRCESAPGQLPVCSCPQGWQG :.: ::.. . : : : : .:: . : ::: :: :: .. : ::: . CCDS78 GVCI-DGINHYTCDCKSGFFGTHCETNANDCLSNPCLHG-RCTELINEYP-CSCDADGTS 1020 1030 1040 1050 1060 1070 810 820 830 840 850 pF1KB4 PRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDC-DPN----PCL .:. ...:.. :: .:.: . : .:.: : :::: :...:..: .:. :: CCDS78 TQCKIKINDCTS-IPCMNEGFCQKSAHGFTCICPRGYTGAYCEKSIDNCAEPELNSVICL 1080 1090 1100 1110 1120 1130 860 870 880 890 900 910 pF1KB4 NGGSCQDGVG-SFSCSCLPGFAGPRCARDVDECLSNPCGPGT-CTDHVASFTCTCPPGYG ::: : :: : .:.: :::::.: : ...:: :.:: :. : ::. ...: : ::.. CCDS78 NGGICVDGPGHTFDCRCLPGFSGQFCEININECSSSPCLHGADCEDHINGYVCKCQPGWS 1140 1150 1160 1170 1180 1190 920 930 940 950 960 970 pF1KB4 GFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYT----GAHCQHEAD--PCLSRPC : :::..: .: :.:: . :... . .::: ::. : : : ::. CCDS78 GHHCENEL-ECIPNSCVHE-LCMENEPGSTCLCTPGFMTCSIGLLCGDEIRRITCLTPIF 1200 1210 1220 1230 1240 1250 980 990 1000 1010 1020 1030 pF1KB4 LHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGAYCLCPPGWSGR CCDS78 QRTDPISTQTYTIPPSETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIVKHDILPTTGL 1260 1270 1280 1290 1300 1310 >>CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871 aa) initn: 395 init1: 158 opt: 1497 Z-score: 640.0 bits: 132.7 E(32554): 2.5e-29 Smith-Waterman score: 2119; 29.2% identity (50.1% similar) in 1738 aa overlap (44-1500:977-2622) 20 30 40 50 60 pF1KB4 PMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGG-----RCTQLPSR---EAAC .:. :. :. .: . : : : CCDS32 GRICLDIRLETCFLRYEDEECTLPIAGRHRMDACCCSVGAAWGTEECEECPMRNTPEYEE 950 960 970 980 990 1000 70 80 90 100 110 pF1KB4 LCP--PGWVGERCQLEDP-------CHSGP--CAGRGVCQSSVVAGTARFSCRCPRGF-- ::: ::.. .. : :. : :. .: :.... :. :.::: :: CCDS32 LCPRGPGFATKEITNGKPFFKDINECKMIPSLCT-HGKCRNTI--GS--FKCRCDSGFAL 1010 1020 1030 1040 1050 1060 120 130 140 150 160 pF1KB4 --RGPDCSLPDPCLSSP--CAHGARCSVGPDGRFLCSCPPGYQG-----RSCRSDVDECR . .:. : : :: :..: .: :. : : :.: ::.. ..: :.:::. CCDS32 DSEERNCTDIDECRISPDLCGRG-QC-VNTPGDFECKCDEGYESGFMMMKNCM-DIDECQ 1070 1080 1090 1100 1110 170 180 190 200 210 pF1KB4 VGEP--CRHGGTCLNTPGSFRCQCPAGYT-GP---LCENPAVPCAPSP--CRNGGTCRQS .: :: ::.: :: ::.::.:: :. .: : . : : : :: CCDS32 R-DPLLCR-GGVCHNTEGSYRCECPPGHQLSPNISACID-INECELSAHLCPNGRCVNLI 1120 1130 1140 1150 1160 1170 220 230 240 250 260 pF1KB4 GDLTYDCACLPGFEGQN----CEVNVDDCPGHRCLNGGT---CVDGVNTYNCQCPPEWT- : :.::: ::... : :..:.: .::: :... ..:.:.: : .. CCDS32 GK--YQCACNPGYHSTPDRLFC-VDIDECS---IMNGGCETFCTNSEGSYECSCQPGFAL 1180 1190 1200 1210 1220 270 280 290 300 310 pF1KB4 --GQFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTG----ESCSQNIDDC--A : :.:::. .:: : .:: : : : . :.: .:. . ..: ....: CCDS32 MPDQRSCTDIDECEDNPNIC-DGGQCTNIPGEYRCLCYDGFMASEDMKTCV-DVNECDLN 1230 1240 1250 1260 1270 1280 320 330 340 350 360 370 pF1KB4 TAVCFHGATCHDRVASFYCACPMGKTG----LLCHLDDACV--SNPCHEDAICDTNPVNG .:. : ::.. .:: : : :: .: : . : .. : . :.: :: . : CCDS32 PNICLSG-TCENTKGSFICHCDMGYSGKKGKTGCTDINECEIGAHNCGKHAVC-TN-TAG 1290 1300 1310 1320 1330 1340 380 390 400 410 420 430 pF1KB4 RAICTCPPGFTG-GACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCGRGYTGP--RCET :.: ::. : : :.:::: :.. : . . : ::.::. : : .:::: : : CCDS32 SFKCSCSPGWIGDGIKCTDLDECSNGTHMCSQHADCKNTMGSYRCLCKEGYTGDGFTC-T 1350 1360 1370 1380 1390 1400 440 450 460 470 480 pF1KB4 DVNECLSGP--CRNQATCLDRIGQFTCICMAGFT----GTYCEVDIDECQSSP--CVNGG :..:: . : : . ::. : . : : ::. : :: ::::: : : :: : CCDS32 DLDECSENLNLCGN-GQCLNAPGGYRCECDMGFVPSADGKACE-DIDEC-SLPNICVFG- 1410 1420 1430 1440 1450 490 500 510 520 530 pF1KB4 VCKDRVNGFSCTCPSGF----SGSTCQLDVDECAS-TPCRNGAKCVDQPDGYECRCAEGF .:.. . : : : :. ::..: ::.:: . : : .: .::. : .: : : : CCDS32 TCHNLPGLFRCECEIGYELDRSGGNCT-DVNECLDPTTCISG-NCVNTPGSYICDCPPDF 1460 1470 1480 1490 1500 1510 540 550 560 570 580 pF1KB4 E----GTLC-DRNVDDCSPDPCHHGR-----CVD----GIASFSCACAPGYT-GTRCE-- : . : : .: : .: : . :... :: :. : . :: :: CCDS32 ELNPTRVGCVDTRSGNCYLDIRPRGDNGDTACSNEIGVGVSKASCCCSLGKAWGTPCEMC 1520 1530 1540 1550 1560 1570 590 600 610 pF1KB4 ---------------------------SQVDECRSQP--CRHGGKCLDLVDKYLCRCPSG ..:::. : :. ::::.. .. ::::.: CCDS32 PAVNTSEYKILCPGGEGFRPNPITVILEDIDECQELPGLCQ-GGKCINTFGSFQCRCPTG 1580 1590 1600 1610 1620 1630 620 630 640 650 660 pF1KB4 -----TTGVNCEVNIDDCAS-NPCTFGVCRDGINRYDCVCQPGFT----GPLC-NVEINE : : :. ....: . . : :.: . .. : :.: : . : : ... . CCDS32 YYLNEDTRV-CD-DVNECETPGICGPGTCYNTVGNYTCICPPDYMQVNGGNNCMDMRRSL 1640 1650 1660 1670 1680 1690 670 680 690 pF1KB4 CASSPCGEGGSCVDGENGFR-----CLC----------PPGSLP-P-------LC----- : . ... .: ::: : : : : . : : :: CCDS32 CYRNYYADNQTC-DGELLFNMTKKMCCCSYNIGRAWNKPCEQCPIPSTDEFATLCGSQRP 1700 1710 1720 1730 1740 1750 700 710 720 730 pF1KB4 ---------LPPS-HPCAHEP--CSHGICYDAPGGFRCVCEPGW-SGPRCSQSLARDACE :: . : . : : .:.: . :.::: : :. . . : :. CCDS32 GFVIDIYTGLPVDIDECREIPGVCENGVCINMVGSFRCECPVGFFYNDKLLVCEDIDECQ 1760 1770 1780 1790 1800 1810 740 750 760 770 780 790 pF1KB4 SQP-CRAGGTCSSDGMGFHCTCPPGVQGR---QCELLSPCT--PNPCEHGGRCESAPGQL . : :. .. : . . ...: : :: . ::. . : :: : :: .: .. :.. CCDS32 NGPVCQRNAECINTAGSYRCDCKPGYRFTSTGQCNDRNECQEIPNICSHG-QCIDTVGSF 1820 1830 1840 1850 1860 1870 800 810 820 830 840 pF1KB4 PVCSCPQGWQGPRCQQ---DVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQ-- : : :.. : :..:: : :: .: : : :::.: :. :. .. CCDS32 -YCLCHTGFKTNDDQTMCLDINECERDA-CG-NGTCRNTIGSFNCRCNHGFILSHNNDCI 1880 1890 1900 1910 1920 850 860 870 880 890 900 pF1KB4 DINDC---DPNPCLNGGSCQDGVGSFSCSCLPGF-AGP--RCARDVDECLSNP--CGPGT :...: . : : :: .: . ::::.:.: :. ..: : :..::: .: :.::: CCDS32 DVDECASGNGNLCRNG-QCINTVGSFQCQCNEGYEVAPDGRTCVDINECLLEPRKCAPGT 1930 1940 1950 1960 1970 1980 910 920 930 940 950 pF1KB4 CTDHVASFTCTCPPGYG--GFHCEQDLPDC--SPSSCFNGGTCVDGVNSFSCLCRPGYT- : . .:. : :::::. . .:: :. .: : : ::: . .::.::: :.. CCDS32 CQNLDGSYRCICPPGYSLQNEKCE-DIDECVEEPEIC-ALGTCSNTEGSFKCLCPEGFSL 1990 2000 2010 2020 2030 2040 960 970 980 990 1000 pF1KB4 ---GAHCQH-EADPCLSRPCLHGGVCSAA----HPGFRCTCLESFTGPQCQTLVDWCSRQ : .:: . . : .. ..:: ::. : .: : . : : . CCDS32 SSSGRRCQDLRMSYCYAK--FEGGKCSSPKSRNHSKQECCCALKGEG--------WGD-- 2050 2060 2070 2080 2090 1010 1020 1030 1040 1050 1060 pF1KB4 PCQNGGRCVQTGAYCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSS ::. . . .:: : :: . : :. . . ..:. : ::.. :.: CCDS32 PCELCPTEPDEAFRQICPYG-SGIIVG----PDDSAVDMDECKEPDVCKHG-QCINTDGS 2100 2110 2120 2130 2140 1070 1080 1090 1100 1110 1120 pF1KB4 HYCVCPEGR--TGSHCEQEVDPC-LAQPCQHGGTCRGYMGGYMCECLPGYNGD---NCED . : :: : .:..: ..: : ...:: .: ::.. .::. : : :.. .::: CCDS32 YRCECPFGYILAGNECV-DTDECSVGNPCGNG-TCKNVIGGFECTCEEGFEPGPMMTCED 2150 2160 2170 2180 2190 2200 1130 1140 1150 1160 1170 pF1KB4 DVDECASQPCQHGGSCIDLVARYLCSCPPGTL----GVLCEINEDDCGPGPPLDSGPRCL ..:::..: . :.. . : :.:: : . .:. .::.: : : . . CCDS32 -INECAQNPLLCAFRCVNTYGSYECKCPVGYVLREDRRMCK-DEDECEEGKH-DCTEKQM 2210 2220 2230 2240 2250 2260 1180 1190 1200 1210 1220 1230 pF1KB4 HNGTCVDLVGGFRCTCPPGYT----GLRCEADINECRS--GACHAAHTRDCLQDPGGGFR . : .:.: . : : ::: : : .: :::.. : :. .. :: . :.. CCDS32 E---CKNLIGTYMCICGPGYQRRPDGEGC-VDENECQTKPGICENGR---CL-NTRGSYT 2270 2280 2290 2300 2310 1240 1250 1260 1270 1280 pF1KB4 CLCHAGFSG-PRCQTVLSP----CESQPCQHGGQCRPSPGPGGGLTFT-CHCAQPF-WGP : :. ::.. : . :. : .. :. .:. . . . .: . : : ::: CCDS32 CECNDGFTASPNQDECLDNREGYCFTEVLQN--MCQIGSSNRNPVTKSECCCDGGRGWGP 2320 2330 2340 2350 2360 2370 1290 1300 1310 1320 pF1KB4 RCE----RVARSCRELQCPVGV----------PCQ---QTPRGPRCACPPGLSGPSCRSF .:: . . . ..: :: : :. .. :. .:. : :.. CCDS32 HCEICPFQGTVAFKKL-CPHGRGFMTNGADIDECKVIHDVCRNGECVNDRGSYHCICKT- 2380 2390 2400 2410 2420 2430 1330 1340 1350 1360 1370 pF1KB4 PGSPPGASNASC--------AAAPCLHGGSCRPAPLAPFFRCACAQGWT----GPRCEA- : : ...:: : :: . :. . . ..:.: .:. : :. CCDS32 -GYTPDITGTSCVDLNECNQAPKPC--NFICKNTEGS--YQCSCPKGYILQEDGRSCKDL 2440 2450 2460 2470 2480 1380 1390 1400 1410 1420 pF1KB4 -PAAAPEVSEEPRCPRA----ACQAKRG----DQRC--DRECNSPG--CGWDGGDCSLSV :. . . . : . .:. : : . ::.: :: . : :. . CCDS32 DECATKQHNCQFLCVNTIGGFTCKCPPGFTQHHTSCIDNNECTSDINLCG-SKGICQNTP 2490 2500 2510 2520 2530 2540 1430 1440 1450 1460 1470 pF1KB4 GDPWRQCEALQCWRLFNNSRCDPACSSPACLYDNFDCH------AGGRERTCNPVYEKYC :. :: : : :. .. .: . : :. :: . .: : . CCDS32 GS--FTCE---CQRGFSLDQTGSSCEDVDECEGNHRCQHGCQNIIGGYRCSCPQGYLQ-- 2550 2560 2570 2580 2590 1480 1490 1500 1510 1520 1530 pF1KB4 ADHFADGRC-DQG-CNTEE-CGWDGLDCASEVPALLARGVLVLTVLLPPEELLRSSADFL :. ..: :.. : . . :: : .: CCDS32 --HYQWNQCVDENECLSAHICG--GASCHNTLGSYKCMCPAGFQYEQFSGGCQDINECGS 2600 2610 2620 2630 2640 2650 >-- initn: 369 init1: 143 opt: 837 Z-score: 365.9 bits: 82.0 E(32554): 4.6e-14 Smith-Waterman score: 1261; 29.8% identity (49.0% similar) in 1046 aa overlap (60-1040:61-958) 30 40 50 60 70 80 pF1KB4 LLLLAGPGAAAPPCLDGSPCANGGRCTQLPSREAACLCPPGWV----GERCQLEDPCHSG :: : : ::: :..: . :: CCDS32 AGNVKETRASRAKRRGGGGHDALKGPNVCGSRYNA-YCCPGWKTLPGGNQCIVPICRHS- 40 50 60 70 80 90 100 110 120 130 140 pF1KB4 PCAGRGVCQSSVVAGTARFSCRCPRGFRGPDCSLPD--PCLSSPCAHGARCSVGPDGRFL : : : :. . : :: : .:.:. . : . : .:. :: : . CCDS32 -C-GDGFCSRPNM-------CTCPSGQIAPSCGSRSIQHC-NIRCMNGGSCS---DDH-- 90 100 110 120 130 150 160 170 180 190 200 pF1KB4 CSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTPGSFRCQCPAGYTGPLCENP--AVPC : : :: : : . : :. : : .:: :. .:. :: : :.::: :: . :: CCDS32 CLCQKGYIGTHCGQPV--CESG--CLNGGRCV-APN--RCACTYGFTGPQCERDYRTGPC 140 150 160 170 180 210 220 230 240 250 pF1KB4 ----APSPCR---NGGTCRQSGDLTYDCACLPGFEGQNCEVNVDDCPG--HRCLNGGTCV . . :. .: .: . : :: . :. ::. ::. : : : . CCDS32 FTVISNQMCQGQLSGIVCTK----TLCCATVGRAWGHPCEM----CPAQPHPCRRG--FI 190 200 210 220 230 260 270 280 290 300 310 pF1KB4 DGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTGESCS .. : :: :::::: :. :. ::.:.::.:. : : : . : CCDS32 PNIRTGACQ------------DVDECQAIPGLCQ-GGNCINTVGSFECKCPAGHKLNEVS 240 250 260 270 280 320 330 340 350 360 pF1KB4 Q---NIDDCAT--AVCFHGATCHDRVASFYCACPMGKTGLLCHLDDA-CVSNPCHEDAIC : .::.:.: ..: .:. : . :.:..: :: :. : . :.. . . : CCDS32 QKCEDIDECSTIPGIC-EGGECTNTVSSYFCKCP---PGFYTSPDGTRCIDV---RPGYC 290 300 310 320 330 370 380 390 400 410 420 pF1KB4 DTNPVNGRAICTCPPGFTGGACDQDVDEC-SIGANPCEHLGRC-VNTQGSFLCQCGRGYT : .::: : ..: : :. .: : :.. .. : . . .: :. .. CCDS32 YTALTNGRCSNQLPQSITKMQCCCDAGRCWSPGVTVAPEM--CPIRATEDFNKLCSVPMV 340 350 360 370 380 390 430 440 450 460 470 480 pF1KB4 GPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFT-GTYCEVDIDECQSSPCVNGGV : : . : : . :: : : . . . CCDS32 IP-----------GRPEYPPPPLGPIPPVLPV-PPGFPPGPQIPVPRPPVEY---LYPSR 400 410 420 430 490 500 510 520 530 540 pF1KB4 CKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGTL-- :: . : . ::: . :.:: .:. : .:.:.: .::. : CCDS32 EPPRVLPVNVT-------DYCQL-----VRYLCQNG-RCIPTPGSYRCECNKGFQLDLRG 440 450 460 470 480 550 560 570 580 590 pF1KB4 -CDRNVDDCSPDPCHHGRCVDGIASFSCACAPGY--TGTRCESQ-VDEC--RSQPCRHGG : .::.: .:: :.:... .:..: : :: : :: : . .::: .. : ..: CCDS32 ECI-DVDECEKNPCAGGECINNQGSYTCQCRAGYQSTLTRTECRDIDECLQNGRIC-NNG 490 500 510 520 530 540 600 610 620 630 640 650 pF1KB4 KCLDLVDKYLCRCPSG----TTGVNCEVNIDDCA-SNPCTFGVCRDGINRYDCVCQPGFT .:.. .. : : .: : ::: ..:.:. : : :.: . . . :.:.::: CCDS32 RCINTDGSFHCVCNAGFHVTRDGKNCE-DMDECSIRNMCLNGMCINEDGSFKCICKPGFQ 550 560 570 580 590 600 660 670 680 690 700 pF1KB4 ----GPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSH : :. .:::: . .: ::. ....:: : :: : . CCDS32 LASDGRYCK-DINECETPGICMNGRCVNTDGSYRCECFPGLAVGL-------------DG 610 620 630 640 710 720 730 740 750 760 pF1KB4 GICYDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQG .: :. .: .: :.. .: . : . .:. : :.: ..: : CCDS32 RVCVDTH--MRSTCYGGYKRGQCIKPLFGAVTKSECC-----CASTEYAF---------G 650 660 670 680 690 770 780 790 800 810 820 pF1KB4 RQCELLSPC-TPNPCEHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECA-GPAPCGPHG . :. :: . : :. . : :.::. . : :..::: : : :.: CCDS32 EPCQ---PCPAQNSAEYQALCSSGPGMTSAGS------------DINECALDPDIC-PNG 700 710 720 730 830 840 850 860 870 pF1KB4 ICTNLAGSFSCTCHGGY----TGPSCDQDINDCDPNPCL-NGGSCQDGVGSFSCSCLPGF :: :: :...: :..:: :: .: :::.: : : ..:.:.. ::: :.: :: CCDS32 ICENLRGTYKCICNSGYEVDSTGKNC-VDINECVLNSLLCDNGQCRNTPGSFVCTCPKGF 740 750 760 770 780 790 880 890 900 910 920 930 pF1KB4 A-GP--RCARDVDECLSNPCGPGTCTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNG : . .:.::: :.:: :.: . .:: : : :. : : . . :.. CCDS32 IYKPDLKTCEDIDECESSPCINGVCKNSPGSFICECSS-------ESTL-DPTKTICIET 800 810 820 830 840 940 950 960 970 980 990 pF1KB4 --GTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPCLHGGVCSAAHPGFRCTCLES-FT ::: . : .. :. . .:: . . : : :. :. . : : . CCDS32 IKGTCWQTV--IDGRCEININGATLKSQC--CSSLGAAWGSPCTLCQVDPICGKGYSRIK 850 860 870 880 890 900 1000 1010 1020 1030 1040 pF1KB4 GPQCQTLVDWCSRQP--CQNGGRCVQT-GAY-CLCPPGWS----GRLC-DIRSLPCREAA : ::. .: : : :.:: ::.: :.. : :: : . ::.: ::: : CCDS32 GTQCED-IDECEVFPGVCKNG-LCVNTRGSFKCQCPSGMTLDATGRICLDIRLETCFLRY 910 920 930 940 950 960 1050 1060 1070 1080 1090 1100 pF1KB4 AQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCLAQPCQHGGTCRGYMG CCDS32 EDEECTLPIAGRHRMDACCCSVGAAWGTEECEECPMRNTPEYEELCPRGPGFATKEITNG 970 980 990 1000 1010 1020 >>CCDS46562.1 SNED1 gene_id:25992|Hs108|chr2 (1413 aa) initn: 1231 init1: 500 opt: 1300 Z-score: 561.3 bits: 117.1 E(32554): 6.1e-25 Smith-Waterman score: 1720; 36.9% identity (58.8% similar) in 650 aa overlap (123-733:272-906) 100 110 120 130 140 pF1KB4 CQSSVVAGTARFSCRCPRGFRGPDCSLPDPCLS-SPCAHGARC---SVGPDGRFLCSCPP ::. :: .:..: : . . ::: CCDS46 TTNVGVPGRWAFRIDDAQVRVGGCGHTTSVCLALRPCLNGGKCIDDCVTGNPSYTCSCLS 250 260 270 280 290 300 150 160 170 180 190 200 pF1KB4 GYQGRSCRSDVDECRVGEPCRHGGTCLNTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRN :. :: :. ::.:: ...::..:::: . .:::::::::. :: ::. :: . :.. CCDS46 GFTGRRCHLDVNEC-ASQPCQNGGTCTHGINSFRCQCPAGFGGPTCETAQSPCDTKECQH 310 320 330 340 350 360 210 220 230 240 250 260 pF1KB4 GGTCRQSGDLTYDCACLPGFEGQNCEVNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTG :: : : . . :.: :. : ::..:::: :::::.::: :..:.: : . : CCDS46 GGQC-QVENGSAVCVCQAGYTGAACEMDVDDCSPDPCLNGGSCVDLVGNYTCLCAEPFKG 370 380 390 400 410 270 280 290 300 310 320 pF1KB4 QFC-TED---VDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTGESCSQNI-DDCATAVC : : : : : : ::::::: .. :. : : .:. : .: . . ::: : CCDS46 LRCETGDHPVPDACLSAP--CHNGGTCVDADQGYVCECPEGFMGLDCRERVPDDCE---C 420 430 440 450 460 470 330 340 350 360 370 pF1KB4 FHGATCHDRVASFYCACPMGKTGLLCHLDDACVSNPCHEDAICDTNPV----NGRAICTC .:. : . . : ::.: ::::... .. ::. .. : . .: .:.: CCDS46 RNGGRCLG-ANTTLCQCPLGFFGLLCEFE--ITAMPCNMNTQCPDGGYCMEHGGSYLCVC 480 490 500 510 520 530 380 390 400 410 420 430 pF1KB4 PPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCGRGYTGPRCE-TDVNECLSG .: . . :. ..:: . : : . :. :.: ::. : .:: . . : :: CCDS46 HTDH--NASHSLPSPCD--SDPCFNGGSCDAHDDSYTCECPRGFHGKHCEKARPHLCSSG 540 550 560 570 580 440 450 460 470 480 490 pF1KB4 PCRNQATCLDRIGQFTCICMAGFTGTYCEVDI-DECQSSPCVNGGVCKDRVNGFSCTCPS :::: .:: . :.. : : ::: .::. : : :.:: :::.: .. ..: :: CCDS46 PCRNGGTCKEAGGEYHCSCPYRFTGRHCEIGKPDSCASGPCHNGGTCFHYIGKYKCDCPP 590 600 610 620 630 640 500 510 520 530 540 550 pF1KB4 GFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGTLCDRNVDDCSPDPCHH- :::: :.. . : .:: ::. : :. . :.: :. : :. .:: :. .: CCDS46 GFSGRHCEIAPSPCFRSPCVNGGTCEDRDTDFFCHCQAGYMGRRCQAEVDCGPPEEVKHA 650 660 670 680 690 700 560 570 580 590 pF1KB4 -----GRCVDGIASFSC-------------ACAPGYTGT---RCESQVDECRSQPCRHGG : . ..: ..: .: : . . .: ..:::::::: ::: CCDS46 TLRFNGTRLGAVALYACDRGYSLSAPSRIRVCQPHGVWSEPPQCL-EIDECRSQPCLHGG 710 720 730 740 750 760 600 610 620 630 640 650 pF1KB4 KCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPC-TFGVCRDGINRYDCVCQPGFTGPLC .: : : ::: : .: :..::.. :.: ..:: . : ::. . : : : ::.: : CCDS46 SCQDRVAGYLCLCSTGYEGAHCELERDECRAHPCRNGGSCRNLPGAYVCRCPAGFVGVHC 770 780 790 800 810 820 660 670 680 690 700 710 pF1KB4 NVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCS-HGICYDAP ..:.. : :::: .:: : .: ... :.:: . . : : :: ::. .: : . CCDS46 ETEVDACDSSPCQHGGRCESGGGAYLCVCPESFFGYHCETVSDPCFSSPCGGRGYCLASN 830 840 850 860 870 880 720 730 740 750 760 770 pF1KB4 GGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCELLS :. :.:. :..: :.. : CCDS46 GSHSCTCKVGYTGEDCAKELFPPTALKMERVEESGVSISWNPPNGPAARQMLDGYAVTYV 890 900 910 920 930 940 >>CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 (870 aa) initn: 1336 init1: 568 opt: 1275 Z-score: 553.0 bits: 114.9 E(32554): 1.7e-24 Smith-Waterman score: 1537; 32.2% identity (54.7% similar) in 792 aa overlap (311-1002:27-802) 290 300 310 320 330 340 pF1KB4 QPNACHNGGTCFNTLGGHSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCAC :..: : . : ...::.: . :.: CCDS58 MALKNINYLLIFYLSFSLLIYIKNSFCNKNNTRCLSNSCQNNSTCKDFSKDNDCSC 10 20 30 40 50 350 360 370 380 390 pF1KB4 PMGKTGLL--C-HLDDACVSNPCHEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSI ..: : .. : : ::::. .: : ..: . .: ::::..: :. . : CCDS58 SDTANNLDKDCDNMKDPCFSNPCQGSATCVNTPGERSFLCKCPPGYSGTICETTIGSC-- 60 70 80 90 100 110 400 410 420 430 440 450 pF1KB4 GANPCEHLGRCVNTQGSFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCIC : : :.: : : . .: : ::.: :: : .:: :.::.: :.: : : ..:.: CCDS58 GKNSCQHGGICHQDPIYPVCICPAGYAGRFCEIDHDECASSPCQNGAVCQDGIDGYSCFC 120 130 140 150 160 170 460 470 480 490 500 510 pF1KB4 MAGFTGTYCEVDIDECQSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCR . :. : .:....::: :.:: : ..: .... ..: :: ..:: .:.:..::: : :: CCDS58 VPGYQGRHCDLEVDECASDPCKNEATCLNEIGRYTCICPHNYSGVNCELEIDECWSQPCL 180 190 200 210 220 230 520 530 540 550 560 570 pF1KB4 NGAKCVDQPDGYECRCAEGFEGTLCDRNVDDCSPDPC-HHGRCVDGIASFSCACA-PGYT ::: : : .: : :: :: : :. :.:.:. .:: : : :::: .:: :. :.: CCDS58 NGATCQDALGAYFCDCAPGFLGDHCELNTDECASQPCLHGGLCVDGENRYSCNCTGSGFT 240 250 260 270 280 290 580 590 600 610 620 630 pF1KB4 GTRCESQVDECRSQPCRHGGKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPC-TFGVC ::.::. . : :.::.... : : ::.: :.: : ::..::.....: :::: . : : CCDS58 GTHCETLMPLCWSKPCHNNATCEDSVDNYTCHCWPGYTGAQCEIDLNECNSNPCQSNGEC 300 310 320 330 340 350 640 650 660 670 pF1KB4 RD-----------GI---------NRYDCVCQPGFTGPLCNVEINECASSPCGEGGSCVD . :. . : :.::::::: :. ..:::.:.:: .::.: . CCDS58 VELSSEKQYGRITGLPSSFSYHEASGYVCICQPGFTGIHCEEDVNECSSNPCQNGGTCEN 360 370 380 390 400 410 680 690 700 710 720 pF1KB4 GENGFRCLCPPGSLPPL------CLPPSHPCAHEPC-SHGICY----DAPGGFRCVCEPG ... : :: .: : :.:. : ..: : :. :: :.: : CCDS58 LPGNYTCHCPFDNLSRTFYGGRDCSDILLGCTHQQCLNNGTCIPHFQDGQHGFSCLCPSG 420 430 440 450 460 470 730 740 750 760 pF1KB4 WSGPRC----SQSLARDA---CESQPCRAGGTCSSDGMGFHCTCPPGV------------ ..: : . :. :. .: . :. . .. :. . : .. CCDS58 YTGSLCEIATTLSFEGDGFLWVKSGSVTTKGSVCNIALRFQTVQPMALLLFRSNRDVFVK 480 490 500 510 520 530 770 780 790 800 pF1KB4 ----------------QGRQCELLSPCTPNPCEHGGRC---ESAPGQLPVCSCPQG--WQ :.. ..: : . : . :.. : :: . . CCDS58 LELLSGYIHLSIQVNNQSKVLLFISHNTSDGEWHFVEVIFAEAVTLTLIDDSCKEKCIAK 540 550 560 570 580 590 810 820 830 840 850 pF1KB4 GPR-CQQDVDECA------GPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDCDPN .: ..: . :: : : : . . : . .. ...: : :::. : : CCDS58 APTPLESDQSICAFQNSFLGGLPVGMTSNGVALLNFYNMPSTPSFVG--CLQDIK-IDWN 600 610 620 630 640 650 860 870 880 890 900 910 pF1KB4 P-CLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGP-GTCTDHVASFTCTCPP :.. : : : : :: :.: : : :.:: : : . :. : : CCDS58 HITLENIS--------SGSSLNVKAG--CVRK-DWCESQPCQSRGRCINLWLSYQCDCHR 660 670 680 690 700 920 930 940 950 960 pF1KB4 GYGGFHC-------EQDLPD--CSPS----SCFNGGTCVDGVNSFSCLCRPGYTGAHCQH : : .: .. ::. :. .:.:::.:.. . ..:.::::.:: :.. CCDS58 PYEGPNCLRGKFCRQSRLPSTVCGNEKTNLTCYNGGNCTEFQTELKCMCRPGFTGEWCEK 710 720 730 740 750 760 970 980 990 1000 1010 1020 pF1KB4 EADPCLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQT-LVDWCSRQPCQNGGRCVQTGA . : : : ::..::.:. :.: : .:.: .:.. :.: CCDS58 DIDECASDPCVNGGLCQDLLNKFQCLCDVAFAGERCEVDLADDLISDIFTTIGSVTVALL 770 780 790 800 810 820 1030 1040 1050 1060 1070 1080 pF1KB4 YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSH CCDS58 LILLLAIVASVVTSNKRATQGTYSPSRQEKEGSRVEMWNLMPPPAMERLI 830 840 850 860 870 >>CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912 aa) initn: 487 init1: 151 opt: 1255 Z-score: 539.5 bits: 114.1 E(32554): 1e-23 Smith-Waterman score: 2189; 29.7% identity (50.4% similar) in 1794 aa overlap (44-1495:1022-2717) 20 30 40 50 60 pF1KB4 PMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGG----RCTQLP---SREAACL .:. :: :. .: . : ..: : CCDS34 GRVCLDIRMEQCYLKWDEDECIHPVPGKFRMDACCCAVGAAWGTECEECPKPGTKEYETL 1000 1010 1020 1030 1040 1050 70 80 90 100 110 pF1KB4 CPPGW----VGE----RCQLED--PCHSGP--CAGRGVCQSSVVAGTARFSCRCPRGF-- :: : :. : .: :.. : :. : :.... :. :.::: :: CCDS34 CPRGAGFANRGDVLTGRPFYKDINECKAFPGMCT-YGKCRNTI--GS--FKCRCNSGFAL 1060 1070 1080 1090 1100 120 130 140 150 160 pF1KB4 --RGPDCSLPDPCLSSPCAHGARCSVGPDGRFLCSCPPGYQG-----RSCRSDVDEC-RV . .:. : : :: :. :. : : : : ::.. ..: :.::: : CCDS34 DMEERNCTDIDECRISPDLCGSGICVNTPGSFECECFEGYESGFMMMKNCM-DIDECERN 1110 1120 1130 1140 1150 1160 170 180 190 200 210 pF1KB4 GEPCRHGGTCLNTPGSFRCQCPAGYT-GPLCEN--PAVPCAPSP--CRNGGTCRQSGDLT :: ::::.:: :::.:.:: :. .: :. :. : :::: . : : CCDS34 PLLCR-GGTCVNTEGSFQCDCPLGHELSPSREDCVDINECSLSDNLCRNGKCVNMIG--T 1170 1180 1190 1200 1210 1220 220 230 240 250 260 pF1KB4 YDCACLPGFEG----QNCEVNVDDCPGHRCLNGGT---CVDGVNTYNCQCPPEWT----G :.:.: ::... :.: ...:.: .::: :... ..:.:.: .. : CCDS34 YQCSCNPGYQATPDRQGC-TDIDEC---MIMNGGCDTQCTNSEGSYECSCSEGYALMPDG 1230 1240 1250 1260 1270 270 280 290 300 310 320 pF1KB4 QFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTG----ESCSQNIDDC--ATAV . :. :.:::. .:. : .:: : : : . :.: .:. . ..: ....: . . CCDS34 RSCA-DIDECENNPDIC-DGGQCTNIPGEYRCLCYDGFMASMDMKTCI-DVNECDLNSNI 1280 1290 1300 1310 1320 1330 330 340 350 360 370 pF1KB4 CFHGATCHDRVASFYCACPMG---KTGLL-CHLDDACV--SNPCHEDAICDTNPVNGRAI :. : :.. .:: : : .: : : : : : .. : : : . : : CCDS34 CMFGE-CENTKGSFICHCQLGYSVKKGTTGCTDVDECEIGAHNCDMHASCLNIP--GSFK 1340 1350 1360 1370 1380 1390 380 390 400 410 420 430 pF1KB4 CTCPPGFTG-GACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCGRGYTGP--RCETDVN :.: :. : : :.:::: :.. : ..:::: ::. : :..:.:: : .::. CCDS34 CSCREGWIGNGIKCIDLDECSNGTHQCSINAQCVNTPGSYRCACSEGFTGDGFTC-SDVD 1400 1410 1420 1430 1440 1450 440 450 460 470 480 pF1KB4 ECLSGP--CRNQATCLDRIGQFTCICMAGFT----GTYCEVDIDECQ-SSPCVNGGVCKD :: . :.: . ::. : . : : ::: . :. :::::. .. :: : .:.. CCDS34 ECAENINLCEN-GQCLNVPGAYRCECEMGFTPASDSRSCQ-DIDECSFQNICVFG-TCNN 1460 1470 1480 1490 1500 490 500 510 520 530 pF1KB4 RVNGFSCTCPSGF----SGSTCQLDVDECAST-PCRNGAKCVDQPDGYECRCAEGFE--- . : : : .:. .:..: :.::::. : :: ::. : ::: : :. CCDS34 LPGMFHCICDDGYELDRTGGNCT-DIDECADPINCVNGL-CVNTPGRYECNCPPDFQLNP 1510 1520 1530 1540 1550 1560 540 550 560 570 580 pF1KB4 -GTLC-DRNVDDC--SPDPCHHGR--CVD----GIASFSCACAPGYT-GTRCES------ :. : : : .: . : : : :.. :: :. : . :. ::. CCDS34 TGVGCVDNRVGNCYLKFGPRGDGSLSCNTEIGVGVSRSSCCCSLGKAWGNPCETCPPVNS 1570 1580 1590 1600 1610 1620 590 600 610 pF1KB4 -----------------------QVDECRSQP--CRHGGKCLDLVDKYLCRCPSG----- ..:::. : :. ::.:.. .. :.::.: CCDS34 TEYYTLCPGGEGFRPNPITIILEDIDECQELPGLCQ-GGNCINTFGSFQCECPQGYYLSE 1630 1640 1650 1660 1670 1680 620 630 640 650 660 pF1KB4 TTGVNCEVNIDDCASNP--CTFGVCRDGINRYDCVCQPGFT----GPLC-NVEINECASS : . :: .::.: ..: : :.: . .. : :.: : . : : ... . : : CCDS34 DTRI-CE-DIDECFAHPGVCGPGTCYNTLGNYTCICPPEYMQVNGGHNCMDMRKSFCYRS 1690 1700 1710 1720 1730 1740 670 680 690 700 710 pF1KB4 PCGEGGSCVDGENGFR-----CLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPG--GFR .: .: ..: : : : . ..:: ::: .:: :. CCDS34 --YNGTTC-ENELPFNVTKRMCCCTYNVGKAW----NKPC--EPCP------TPGTADFK 1750 1760 1770 1780 720 730 740 750 760 pF1KB4 CVCE--PGWS-GPRCSQSLARDACESQP--CRAGGTCSSDGMGFHCTCPPGVQGRQ---- .: ::.. . .... : :. : : :.:.: .. .:.: :: : . . CCDS34 TICGNIPGFTFDIHTGKAVDIDECKEIPGIC-ANGVCINQIGSFRCECPTGFSYNDLLLV 1790 1800 1810 1820 1830 1840 770 780 790 800 810 820 pF1KB4 CELLSPCT--PNPCEHGGRCESAPGQLPVCSCPQGWQ-GPR--CQQDVDECAG-PAPCGP :: .. :. : :.... : ..::. : : :.. .: : : .:: : :. CCDS34 CEDIDECSNGDNLCQRNADCINSPGSYR-CECAAGFKLSPNGACV-DRNECLEIPNVCS- 1850 1860 1870 1880 1890 1900 830 840 850 860 870 pF1KB4 HGICTNLAGSFSCTCHGGYTGPSCDQ----DINDCDPNPCLNGGSCQDGVGSFSCSCLPG ::.:..: ::..: ::.:. . : :: :...:. .:: :: .:.. :::..: : :: CCDS34 HGLCVDLQGSYQCICHNGFKA-SQDQTMCMDVDECERHPCGNG-TCKNTVGSYNCLCYPG 1910 1920 1930 1940 1950 1960 880 890 900 910 920 pF1KB4 FA---GPRCARDVDECLS---NPCGPGTCTDHVASFTCTCPPGY----GGFHCEQDLPDC : . : :.::: : . : : : ....:: : : :: : .: : .: CCDS34 FELTHNNDCL-DIDECSSFFGQVCRNGRCFNEIGSFKCLCNEGYELTPDGKNC-IDTNEC 1970 1980 1990 2000 2010 2020 930 940 950 960 970 980 pF1KB4 S--PSSCFNGGTCVDGVNSFSCLCRPGYT--GAHCQHEADPCLSRP--CLHGGVCSAAHP :.:: . ::: . .:: :.: ::: . .: . . : : :: :. :. . CCDS34 VALPGSC-SPGTCQNLEGSFRCICPPGYEVKSENCI-DINECDEDPNICLFGS-CTNTPG 2030 2040 2050 2060 2070 990 1000 1010 1020 pF1KB4 GFRCTCLESFT----GPQC-QTLVDWCSRQPCQNGGRCV------QTGAYCLCP--PG-- ::.: : .:. : .: .: ..: . .:: .: : : : : :: CCDS34 GFQCLCPPGFVLSDNGRRCFDTRQSFCFTN-FENG-KCSVPKAFNTTKAKCCCSKMPGEG 2080 2090 2100 2110 2120 2130 1030 1040 1050 1060 pF1KB4 WSG--RLC---------DI-----RSLPC-REAAAQIGVRLEQ--LCQAGGQCVDEDSSH :. .:: :. ..: ... ... ::. .: ..:::.. :.: CCDS34 WGDPCELCPKDDEVAFQDLCPYGHGTVPSLHDTREDVNECLESPGIC-SNGQCINTDGSF 2140 2150 2160 2170 2180 2190 1070 1080 1090 1100 1110 1120 pF1KB4 YCVCPEGR----TGSHCEQEVDPC-LAQPCQHGGTCRGYMGGYMCECLPGYNGD---NCE : :: : :: .: ..: : ...:: .: :: . .:.. :.: :.. ::: CCDS34 RCECPMGYNLDYTGVRCV-DTDECSIGNPCGNG-TCTNVIGSFECNCNEGFEPGPMMNCE 2200 2210 2220 2230 2240 2250 1130 1140 1150 1160 1170 pF1KB4 DDVDECASQPCQHGGSCIDLVARYLCSCPPGTL----GVLCEINEDDCGPGPPLDSGPRC : ..:::..: . :.. . : :.:: : .:. . :.:. : : . : CCDS34 D-INECAQNPLLCAFRCMNTFGSYECTCPIGYALREDQKMCK-DLDECAEG--LHD---C 2260 2270 2280 2290 2300 1180 1190 1200 1210 1220 pF1KB4 LHNGT-CVDLVGGFRCTCPPGYT----GLRCEADINECRS--GACHAAHTRDCLQDPGGG : : .:.: : : ::::.. : : .: ::::. : :. .. :. . :. CCDS34 ESRGMMCKNLIGTFMCICPPGMARRPDGEGC-VDENECRTKPGICENGR---CV-NIIGS 2310 2320 2330 2340 2350 2360 1230 1240 1250 pF1KB4 FRCLCHAGF----SGPRC----------QTVLSPCE-----------SQPCQHGG----- .:: :. :: :: .: ... . :. :. : :: CCDS34 YRCECNEGFQSSSSGTECLDNRQGLCFAEVLQTICQMASSSRNLVTKSECCCDGGRGWGH 2370 2380 2390 2400 2410 2420 1260 1270 1280 pF1KB4 QCR--PSPG--------PGG-GLTFT------C----------HCAQPFWGPRC------ ::. : :: : : : : : .: . . . :: CCDS34 QCELCPLPGTAQYKKICPHGPGYTTDGRDIDECKVMPNLCTNGQCINTMGSFRCFCKVGY 2430 2440 2450 2460 2470 2480 1290 1300 1310 1320 pF1KB4 --ERVARSCREL-QC-----PVGVPCQQTPRGPRCACPPGL----SGPSCRSFP------ . . :: .: .: : . :..: . .:.:: : .: .:... CCDS34 TTDISGTSCIDLDECSQSPKPCNYICKNTEGSYQCSCPRGYVLQEDGKTCKDLDECQTKQ 2490 2500 2510 2520 2530 2540 1330 1340 1350 1360 pF1KB4 -----------GS-----PPGAS--------NASCAAAPCLHG--GSCRPAPLAPFFRCA :. ::: . : :.. : : : : :. .: . : : CCDS34 HNCQFLCVNTLGGFTCKCPPGFTQHHTACIDNNECGSQPSLCGAKGICQNTPGS--FSCE 2550 2560 2570 2580 2590 1370 1380 1390 1400 1410 pF1KB4 CAQGW----TGPRCEAPAAAPEVSEEPRCPRAACQAKRGDQRCDRECNS---PGCGW--- : .:. :: :: . : . . :: .. :: : :: : . : CCDS34 CQRGFSLDATGLNCED---VDECDGNHRCQHG-CQNILGGYRCG--CPQGYIQHYQWNQC 2600 2610 2620 2630 2640 2650 1420 1430 1440 1450 1460 1470 pF1KB4 -DGGDCSLSVGDPWRQCEALQCWRLFNNSRCDPACSSPACLYDNFDCHAGGRERTCNPVY : ..:: .: : . .:. ... .: :: : . .:.:. .:. : CCDS34 VDENECS----NP-NACGSASCYNTLGSYKC--ACPS-GFSFDQFSS-------ACHDVN 2660 2670 2680 2690 1480 1490 1500 1510 1520 1530 pF1KB4 EKYCADHFADGRCDQGCNTEECGWDGLDCASEVPALLARGVLVLTVLLPPEELLRSSADF : :.. . . :. ::.. : :. CCDS34 E--CSS--SKNPCNYGCSNTEGGYLCGCPPGYYRVGQGHCVSGMGFNKGQYLSLDTEVDE 2700 2710 2720 2730 2740 2750 >-- initn: 350 init1: 142 opt: 1040 Z-score: 450.2 bits: 97.6 E(32554): 9.4e-19 Smith-Waterman score: 1301; 29.8% identity (51.9% similar) in 978 aa overlap (183-1077:97-987) 160 170 180 190 200 210 pF1KB4 RSCRSDVDECRVGEPCRHGGTCLNTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTC : ::. : : .. :: . : .: CCDS34 GAAVASRVRRRGQQDVLRGPNVCGSRFHSYC-CPGWKTLPGGNQCIVPICRNSCGDGFCS 70 80 90 100 110 120 220 230 240 250 260 270 pF1KB4 RQSGDLTYDCACLPGFEGQNC-EVNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFC : . :.: : ...: ....: . ::.:::::.: .::: . : .: CCDS34 RPNM-----CTCSSGQISSTCGSKSIQQC-SVRCMNGGTCADD----HCQCQKGYIGTYC 130 140 150 160 170 280 290 300 310 320 pF1KB4 TEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTGESCSQNIDDCATAVCF---HGAT . : :. :.:.::: : .: . :.:: :.:: .: . : :. :: .. CCDS34 GQPV--CE---NGCQNGGRC---IGPNRCACVYGFTGPQCER---DYRTGPCFTQVNNQM 180 190 200 210 220 330 340 350 360 370 380 pF1KB4 CHDRVASFYCACPMGKTGLLCHLDDACVSNPCHEDAICDTNPVNGRAICTCPPGFTGGAC :. ..... :. :: : : ..::. .: ..: : :.. ::: CCDS34 CQGQLTGIVCT----KT-LCCATIGRAWGHPCE---MCPAQPQPCRR--GFIPNIRTGAC 230 240 250 260 270 390 400 410 420 430 440 pF1KB4 DQDVDECSIGANPCEHLGRCVNTQGSFLCQCGRGY----TGPRCETDVNEC--LSGPCRN ::::::. . :. : :.:: ::: :.: :. : .:: :..:: . : :.. CCDS34 -QDVDECQAIPGICQG-GNCINTVGSFECRCPAGHKQSETTQKCE-DIDECSIIPGICET 280 290 300 310 320 330 450 460 470 480 490 pF1KB4 QATCLDRIGQFTCICMAGFT----GTYCEVDIDECQSSPCVNG---GVCKDRVNG----F . : . .:.. :.: :.. :. : ::. ... : .: : : ... : . CCDS34 -GECSNTVGSYFCVCPRGYVTSTDGSRC---IDQ-RTGMCFSGLVNGRCAQELPGRMTKM 340 350 360 370 380 500 510 520 530 540 pF1KB4 SCTCPSGFS---GS---TCQLDVDECASTPCRNGAKCVDQPDGYECR-CAEGFEGTLCDR .: : : :. .: . .: : .: : . : . : .: . CCDS34 QCCCEPGRCWGIGTIPEACPVRGSEEYRRLCMDGLPMGGIPGSAGSRPGGTGGNGFAPSG 390 400 410 420 430 440 550 560 570 580 590 pF1KB4 NVDDCSPD-------PCHHGRC--VDGIASFSCACAPGYTGTRCESQ-VDECRSQP--CR : . .: : .: : : . . . .: :: .: .: :. . : CCDS34 NGNGYGPGGTGFIPIPGGNGFSPGVGGAGVGAGGQGPIITGLTILNQTIDICKHHANLCL 450 460 470 480 490 500 600 610 620 630 640 pF1KB4 HGGKCLDLVDKYLCRCPSG---TTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGF .: .:. :..: :.: : .. .: ...:.:.::::: : : . . : : :. :: CCDS34 NG-RCIPTVSSYRCECNMGYKQDANGDC-IDVDECTSNPCTNGDCVNTPGSYYCKCHAGF 510 520 530 540 550 560 650 660 670 680 690 pF1KB4 ----TGPLCNVEINECASSP--CGEGGSCVDGENGFRCLCPPG----SLPPLCLPPSHPC : : ..:.:: .. : ..: ::. ...:.:.: : . :. .. CCDS34 QRTPTKQAC-IDIDECIQNGVLC-KNGRCVNTDGSFQCICNAGFELTTDGKNCVDHDECT 570 580 590 600 610 620 700 710 720 730 740 750 pF1KB4 AHEPCSHGICYDAPGGFRCVCEPGW----SGPRCSQSLARDACESQP-CRAGGTCSSDGM . . : .:.: . :.:.:.:.::. .: :.. : :.. : : .:.: CCDS34 TTNMCLNGMCINEDGSFKCICKPGFVLAPNGRYCTDV---DECQTPGICMNGHCINSEG- 630 640 650 660 670 760 770 780 790 800 pF1KB4 GFHCTCPPGV----QGRQCELLSPCTPNPCEHG---GRC-ESAPGQLPVCSCPQGWQGPR .:.: ::::. .:: : .. . : : : : . :: . : CCDS34 SFRCDCPPGLAVGMDGRVC--VDTHMRSTCYGGIKKGVCVRPFPGAVTKSEC-------- 680 690 700 710 720 810 820 830 840 850 860 pF1KB4 CQQDVDECAGPAPCGPHGIC-TNLAGSFSCTCHGGYTGPSCD-QDINDC--DPNPCLNGG : . : : :: : : .. .. : : .: .: . : .:::.: ::. : :: CCDS34 CCANPDYGFGE-PCQP---CPAKNSAEFHGLCSSG-VGITVDGRDINECALDPDICANG- 730 740 750 760 770 780 870 880 890 900 910 pF1KB4 SCQDGVGSFSCSCLPGF---AGPRCARDVDECLSNP--CGPGTCTDHVASFTCTCPPGYG :.. ::. :.: :. :. : :.:::: : : : : . .:..::::::: CCDS34 ICENLRGSYRCNCNSGYEPDASGRNCIDIDECLVNRLLCDNGLCRNTPGSYSCTCPPGYV 790 800 810 820 830 840 920 930 940 950 960 970 pF1KB4 GFHCE----QDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPCLH :. : .:. .: . : ::. : ....::.: : :: .. . . :.. :. CCDS34 -FRTETETCEDINECESNPCVNGA-CRNNLGSFNCECSPG---SKLSSTGLICIDS--LK 850 860 870 880 890 980 990 1000 1010 1020 pF1KB4 GGVCSAAHPGFRCTCL---ESFTGPQCQTL-VDWCSRQPCQNGGRCVQTGAYCLCPPGWS : .: :: .. . : :: . : : ::. :: : :: : CCDS34 G-TCWLNIQDSRCEVNINGATLKSECCATLGAAWGS--PCE---RCELDTA---CPRG-- 900 910 920 930 940 1030 1040 1050 1060 1070 1080 pF1KB4 GRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCL : :... : : . . : . .: .:.::. .: .: :::: : CCDS34 --LARIKGVTC-EDVNECEV-FPGVCP-NGRCVNSKGSFHCECPEGLTLDGTGRVCLDIR 950 960 970 980 990 1090 1100 1110 1120 1130 1140 pF1KB4 AQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDLVARYLCSCP CCDS34 MEQCYLKWDEDECIHPVPGKFRMDACCCAVGAAWGTECEECPKPGTKEYETLCPRGAGFA 1000 1010 1020 1030 1040 1050 2321 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 19:45:33 2016 done: Sat Nov 5 19:45:35 2016 Total Scan time: 8.180 Total Display time: 1.610 Function used was FASTA [36.3.4 Apr, 2011]