FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8564, 911 aa 1>>>pF1KB8564 911 - 911 aa - 911 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.5960+/-0.00106; mu= -0.7111+/- 0.064 mean_var=379.8917+/-74.824, 0's: 0 Z-trim(114.7): 75 B-trim: 256 in 1/52 Lambda= 0.065803 statistics sampled from 15181 (15253) to 15181 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.768), E-opt: 0.2 (0.469), width: 16 Scan time: 4.400 The best scores are: opt bits E(32554) CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 ( 911) 6320 614.8 2.3e-175 CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 ( 671) 4342 426.9 6.3e-119 CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431) 1257 134.6 2.2e-30 CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530) 1257 134.6 2.3e-30 CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321) 1144 123.6 2.5e-27 CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642) 1103 119.8 4.3e-26 CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 ( 655) 1092 118.3 4.7e-26 CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396) 1103 120.1 7.1e-26 CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409) 1093 119.0 1.1e-25 CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 360) 821 92.3 1.7e-18 CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 422) 821 92.4 1.9e-18 CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 ( 354) 804 90.7 5.2e-18 CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 ( 340) 709 81.7 2.6e-15 >>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 (911 aa) initn: 6320 init1: 6320 opt: 6320 Z-score: 3261.8 bits: 614.8 E(32554): 2.3e-175 Smith-Waterman score: 6320; 99.9% identity (100.0% similar) in 911 aa overlap (1-911:1-911) 10 20 30 40 50 60 pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 YLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPASLTDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 YLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPASLTDV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 SLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 RIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 DPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 CSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 CSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 AIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSST 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 PEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALW 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 AWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPT :::::::::::::::::::::::.:::::::::::::::::::::::::::::::::::: CCDS11 AWPSELSSPGPEASLPTEPAAQEESLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 ETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 PEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 CLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 CLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYG 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB8 AHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLS 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB8 GENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB8 RYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGRLLGRWKAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGRLLGRWKAL 850 860 870 880 890 900 910 pF1KB8 LIPPSSPMPGP ::::::::::: CCDS11 LIPPSSPMPGP 910 >>CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 (671 aa) initn: 4641 init1: 4342 opt: 4342 Z-score: 2248.6 bits: 426.9 E(32554): 6.3e-119 Smith-Waterman score: 4342; 99.7% identity (100.0% similar) in 649 aa overlap (1-649:1-649) 10 20 30 40 50 60 pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 YLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPASLTDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 YLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPASLTDV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 SLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 RIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 DPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 CSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 CSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 AIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSST 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 PEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALW 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 AWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPT :::::::::::::::::::::::.:::::::::::::::::::::::::::::::::::: CCDS11 AWPSELSSPGPEASLPTEPAAQEESLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 ETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 PEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGT ::::::::::::::::::::::::::::::::::::::::::::::::. CCDS11 PEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGNSAQGSTALSIL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 CLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYG CCDS11 LLFFPLQLWVT 670 >>CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431 aa) initn: 1934 init1: 1135 opt: 1257 Z-score: 658.8 bits: 134.6 E(32554): 2.2e-30 Smith-Waterman score: 1261; 47.5% identity (71.3% similar) in 432 aa overlap (29-454:23-438) 10 20 30 40 50 pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCH-- :..: .. : : .::. .:: .:::::. CCDS53 MTTLLWVFVTLRVITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFI 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 --VHYLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPAS .: . :: . .::.::. .:. .:. .::: ::.:: ::. .:.:: ::: CCDS53 DPMHPVTTAPSTAPL--APRIKWSRVSKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 LTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQ .:..: .. :: ::::.:::::.:::.:: ..:: :::.:: :: :.::...:. :: CCDS53 PSDATLEVQSLRSNDSGVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 EACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRN .:: . .: ::::::: ::: :..:::::::.::::::::.::::.:::: : :::::. CCDS53 RACLQNSAIIATPEQLQAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 YGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDG ::. : .. :::::.::...::.: . :::.:..:: :.. ::..::::::: ::.. CCDS53 YGIRDTNETYDVYCFAEEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 GLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDS :.: :: ::::: :::::: :::.: ::.:... ::::.:. ::... :. . CCDS53 GMDMCSAGWLADRSVRYPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYT-G 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 AQPSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGA-IYSI-PIMEDG . ::: : . . . . .. ::: :: ::.. ::.:.::. : .. ::.: CCDS53 EDFVDIPE--NFFGVGGEEDI-TVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEV- 360 370 380 390 400 420 430 440 450 460 470 pF1KB8 GGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEV : .: .: : : : . :.:.: :... : CCDS53 ---SPSPLEP-EEP-----FTFAPEIGATAFAEVENETGEATRPWGFPTPGLGPATAFTS 410 420 430 440 450 480 490 500 510 520 530 pF1KB8 EDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPR CCDS53 EDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYE 460 470 480 490 500 510 >-- initn: 1597 init1: 868 opt: 1024 Z-score: 539.3 bits: 112.4 E(32554): 1e-23 Smith-Waterman score: 1024; 39.1% identity (59.7% similar) in 514 aa overlap (156-648:477-969) 130 140 150 160 170 180 pF1KB8 ELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACARIGAH :::: :: : .::...: ::.:: : :: CCDS53 TPGLGPATAFTSEDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAV 450 460 470 480 490 500 190 200 210 220 230 240 pF1KB8 IATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVVDPDDL ::.:::: ::: .:::::::::: :::::::: .:: : :: :. ::::.::: . CCDS53 IASPEQLQAAYEAGYEQCDAGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTET 510 520 530 540 550 560 250 260 270 280 290 300 pF1KB8 YDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDHCSPGW :::::... :.::.:.. :..:..:: .:. ..: .::::::::::. :::.: :: CCDS53 YDVYCFVDRLEGEVFFATRLEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDKCYAGW 570 580 590 600 610 620 310 320 330 340 350 360 pF1KB8 LADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRD-SAQPSAIPE :::::.::::::: ::: :::.:..:.:::::.:. :: ...::: :: :: : CCDS53 LADGSLRYPIVTPRPACGGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEE 630 640 650 660 670 680 370 380 390 400 410 420 pF1KB8 ASNPASNPASDGLEA-IVT-VTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSSTPE .. ..:. :.: ::: :. . . . .:.: : : .: . ..: CCDS53 EGGTPTSPS--GVEEWIVTQVVPGVAAVPVEEETTAVPS-GETTAI-LEFTTEPENQTEW 690 700 710 720 730 740 430 440 450 460 470 480 pF1KB8 DPAEAPRTLLEFE-TQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALWA .:: .: . :::: . ::. : . . :: :: CCDS53 EPAYTPVGTSPLPGILPTWPPTGAATEEST---EGPSATEVPSASEEPSPSEVP------ 750 760 770 780 790 490 500 510 520 530 540 pF1KB8 WPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPTE .::: ::. : : . :. :.. . :. : :. : ::. : . .::. CCDS53 FPSEEPSPSEE---PFPSVRPFPSVELFPSEEPF-PSKEPSPSEEPSASEEPYTPSPPVP 800 810 820 830 840 550 560 570 580 pF1KB8 T---LPTPRERNLASPSPSTLVEAREVGEATG---------GPELSGVPRGESEETGSSE . ::. :. : .:.. . :...: : . ::.: :. . .: . CCDS53 SWTELPSSGEE---SGAPDVSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTS 850 860 870 880 890 900 590 600 610 620 630 640 pF1KB8 GAPSLLPATRA-PEGTRE-LEAPSEDNSGRTAPAGTSV---QAQPVLPTDSASRGGVAVV . : ::. . : : .: .: :: . :. :.:. . .:. : .. : : . CCDS53 TVGSGLPVESGLPSGDEERIEWPSTPTVGEL-PSGAEILEGSASGVGDLSGLPSGEVLET 910 920 930 940 950 960 650 660 670 680 690 700 pF1KB8 PASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFS ::: CCDS53 SASGVGDLSGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAP 970 980 990 1000 1010 1020 >-- initn: 706 init1: 650 opt: 703 Z-score: 374.6 bits: 82.0 E(32554): 1.5e-14 Smith-Waterman score: 705; 30.0% identity (53.5% similar) in 566 aa overlap (303-814:1859-2408) 280 290 300 310 320 330 pF1KB8 ARAYCQERGAEIATTGQLYAAWDGGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTL :. :: : . .: : . .: . . CCDS53 ITFVDTSLVEVAPTTFKEEEGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFT 1830 1840 1850 1860 1870 1880 340 350 360 370 380 pF1KB8 FLFPNQTGFPNKHSRFNVYCFR---DSAQPSAIPEASN-PASNPASDGLEAIVTVTETLE :. .:.:. .. . : :. ::. .:. :.: :. . .. :..:.. CCDS53 SQTPEFSGLPSGIAEVSGESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDR--TLVESVT 1890 1900 1910 1920 1930 1940 390 400 410 420 430 pF1KB8 ELQLPQEATESES-----RGAIYSIPIM--EDGG--------GGSSTPE-DPAEAPRTLL . ::: :. : :: . : : : .: .: : .: .: CCDS53 QAPTAQEAGEGPSGILELSGAHSGAPDMSGEHSGFLDLSGLQSGLIEPSGEPPGTPYFSG 1950 1960 1970 1980 1990 2000 440 450 460 470 pF1KB8 EFETQSMVP------------PTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEV-EDEAL .: . . : .:. : . : : . ..: .. : . : CCDS53 DFASTTNVSGESSVAMGTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQL 2010 2020 2030 2040 2050 2060 480 490 500 510 520 530 pF1KB8 WAWPSELSSPGP-EASLPTEPAA--QEKSLSQAPARAVLQP----GASPLPDGESEASRP . ...:. : .. :. :.. . .:. .. ... : ::: :.. : : CCDS53 FESSGKVSTAGDISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGASAAPEASREDSGS 2070 2080 2090 2100 2110 2120 540 550 560 570 580 pF1KB8 PRVHGPPTETLPTPRERNLASPSP---STLVEAREVGEATGGPELSGVPRGESEETGSSE : . .:: . .: :: : : . . . :::...::.:: :. .:. CCDS53 PDL----SETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSD-VGTE- 2130 2140 2150 2160 2170 2180 590 600 610 620 630 640 pF1KB8 GAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGD ::.: :: . : : : : ::.:. :. .... .: . .. . . . CCDS53 -APGLPSATPTASGDRT--EISGDLSGHTSQLGVVISTS--IPESEWTQQTQRPAETHLE 2190 2200 2210 2220 2230 650 660 670 680 690 pF1KB8 CVPSPCHNGGTCLEEEEGVRCLCLPGYGG-----------DLCDVGLRFCNPGWDAFQGA : .: :: . :. : .. . . . :. ::. .:: CCDS53 IESSSLLYSG---EETHTVETATSPTDASIPASPEWKRESESTAADQEVCEEGWNKYQGH 2240 2250 2260 2270 2280 2290 700 710 720 730 740 750 pF1KB8 CYKHFSTRRSWEEAETQCRMYGAHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLW ::.:: :..: .:: .:: .::.:: :::::.:.:: ..::::::::::::::: : CCDS53 CYRHFPDRETWVDAERRCREQQSHLSSIVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRW 2300 2310 2320 2330 2340 2350 760 770 780 790 800 810 pF1KB8 SDGVPLLYENWNPGQPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPP ::: :. .::: :.:::..: .::.::::.::..:.:.:::::::: .::: : .. CCDS53 SDGHPMQFENWRPNQPDNFFAAGEDCVVMIWHEKGEWNDVPCNYHLPFTCKKGTATTYKR 2360 2370 2380 2390 2400 2410 820 830 840 850 860 870 pF1KB8 PELPLAQVFGRPRLRYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPAR CCDS53 RLQKRSSRHPRRSRPSTAH 2420 2430 >>CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530 aa) initn: 2306 init1: 1135 opt: 1257 Z-score: 658.6 bits: 134.6 E(32554): 2.3e-30 Smith-Waterman score: 1261; 47.5% identity (71.3% similar) in 432 aa overlap (29-454:23-438) 10 20 30 40 50 pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCH-- :..: .. : : .::. .:: .:::::. CCDS53 MTTLLWVFVTLRVITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFI 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 --VHYLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPAS .: . :: . .::.::. .:. .:. .::: ::.:: ::. .:.:: ::: CCDS53 DPMHPVTTAPSTAPL--APRIKWSRVSKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 LTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQ .:..: .. :: ::::.:::::.:::.:: ..:: :::.:: :: :.::...:. :: CCDS53 PSDATLEVQSLRSNDSGVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 EACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRN .:: . .: ::::::: ::: :..:::::::.::::::::.::::.:::: : :::::. CCDS53 RACLQNSAIIATPEQLQAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 YGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDG ::. : .. :::::.::...::.: . :::.:..:: :.. ::..::::::: ::.. CCDS53 YGIRDTNETYDVYCFAEEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 GLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDS :.: :: ::::: :::::: :::.: ::.:... ::::.:. ::... :. . CCDS53 GMDMCSAGWLADRSVRYPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYT-G 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 AQPSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGA-IYSI-PIMEDG . ::: : . . . . .. ::: :: ::.. ::.:.::. : .. ::.: CCDS53 EDFVDIPE--NFFGVGGEEDI-TVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEV- 360 370 380 390 400 420 430 440 450 460 470 pF1KB8 GGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEV : .: .: : : : . :.:.: :... : CCDS53 ---SPSPLEP-EEP-----FTFAPEIGATAFAEVENETGEATRPWGFPTPGLGPATAFTS 410 420 430 440 450 480 490 500 510 520 530 pF1KB8 EDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPR CCDS53 EDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYE 460 470 480 490 500 510 >-- initn: 1969 init1: 1022 opt: 1148 Z-score: 602.7 bits: 124.2 E(32554): 3e-27 Smith-Waterman score: 1148; 32.4% identity (58.3% similar) in 741 aa overlap (183-892:1807-2525) 160 170 180 190 200 210 pF1KB8 KVKGVVFLYREGSARYAFSFSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQT :: ..:. . .. :. :. ... . CCDS53 SQPFGITDLSGETSGVPDLSGQPSGLPGFSGATSGVPDLVSGTTSGSGESSGITFVDTSL 1780 1790 1800 1810 1820 1830 220 230 240 250 260 pF1KB8 VRY-PIQTPREACYG--DMDGFPGVRNYGVVDPDDLYDVYC-YAEDLNGELFLGDPPEKL :. : .: : ...:.:. . . . . :: .. ... : .. :: CCDS53 VEVAPTTFKEEEGLGSVELSGLPS-GEADLSGKSGMVDVSGQFSGTVDSSGFTSQTPEFS 1840 1850 1860 1870 1880 1890 270 280 290 300 310 320 pF1KB8 TLEE--ARAYCQERGAEIATTGQLYAAWDGGLDHCSPGW-LADGSVRYPIV-TPS-QRCG : :.. . :::... : . .: : :.: .. .. .:. :. : CCDS53 GLPSGIAEVSGESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQEAG 1900 1910 1920 1930 1940 1950 330 340 350 360 370 380 pF1KB8 GGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPSAIPEASNPASNPASDGLEAIVTV : :. : : ..: :. .. . . .. : . : ...: ..: .: .... CCDS53 EGPSGI--LELSGAHSGAPDMSGEHSGFLDLSGLQSGLIEPSGEPPGTPYFSG--DFAST 1960 1970 1980 1990 2000 2010 390 400 410 420 430 pF1KB8 TETLEELQLPQEATESESRGAIYSIPIMEDGGGGSSTP---EDPAEAP---RTLLEFETQ :.. : .. . .: .:. : : . : . : .. .. : .: ::.. CCDS53 TNVSGESSVAM-GTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQLFESS 2020 2030 2040 2050 2060 2070 440 450 460 470 480 490 pF1KB8 SMVPPTG-FSEEE----GKALEEEEKYEDEEEKEEEEEEEEVEDEALWAWPSELSSPGPE . : .: .: :...: :. : : . : : :. .: .:. CCDS53 GKVSTAGDISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGASAAPEA--SREDSGSPD 2080 2090 2100 2110 2120 500 510 520 530 540 550 pF1KB8 ASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPTETLPTPRER-NL : : : .: .: .. . .: ..: : :.::: :.: : : : . : .: CCDS53 LS-ETTSAFHEANLERSSGLGV---SGSTLTFQEGEASAAPEVSGESTTTSDVGTEAPGL 2130 2140 2150 2160 2170 2180 560 570 580 590 600 610 pF1KB8 ASPSPSTLVEAREV-GEATGGPELSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAP : .:.. . :. :. .: :: . : :: . . . : : :.:. CCDS53 PSATPTASGDRTEISGDLSGHTSQLGVVISTS--IPESEWTQQ---TQRPAETHLEIESS 2190 2200 2210 2220 2230 620 630 640 650 660 pF1KB8 SEDNSGR--------TAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGTCL : ::. :.:. .:. :.: .: : .:..:: . :. :: ..::: CCDS53 SLLYSGEETHTVETATSPTDASIPASPEWKRESES---TAAAPARS-CAEEPC-GAGTCK 2240 2250 2260 2270 2280 2290 670 680 690 700 710 720 pF1KB8 EEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYGAH : : : ::: ::: :. :.. . :. ::. .:: ::.:: :..: .:: .:: .: CCDS53 ETEGHVICLCPPGYTGEHCNIDQEVCEEGWNKYQGHCYRHFPDRETWVDAERRCREQQSH 2300 2310 2320 2330 2340 2350 730 740 750 760 770 780 pF1KB8 LASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGE :.:: :::::.:.:: ..::::::::::::::: :::: :. .::: :.:::..: .:: CCDS53 LSSIVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHPMQFENWRPNQPDNFFAAGE 2360 2370 2380 2390 2400 2410 790 800 810 820 830 840 pF1KB8 NCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRY .::::.::..:.:.:::::::: .::: : :.:: :: . :..::. . :::.....:: CCDS53 DCVVMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPVVEHARTFGQKKDRYEINSLVRY 2420 2430 2440 2450 2460 2470 850 860 870 880 890 900 pF1KB8 RCREGLAQRNLPLIRCQENGRWEAPQISCV-PRRPARALHPEEDPEGRQGRLLGRWKALL .: ::..::..: :::: .:.:: :::.:. : : :. . . . :..: CCDS53 QCTEGFVQRHMPTIRCQPSGHWEEPQITCTDPTTYKRRLQKRSSRHPRRSRPSTAH 2480 2490 2500 2510 2520 2530 910 pF1KB8 IPPSSPMPGP >-- initn: 938 init1: 868 opt: 1024 Z-score: 539.1 bits: 112.5 E(32554): 1.1e-23 Smith-Waterman score: 1024; 39.1% identity (59.7% similar) in 514 aa overlap (156-648:477-969) 130 140 150 160 170 180 pF1KB8 ELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACARIGAH :::: :: : .::...: ::.:: : :: CCDS53 TPGLGPATAFTSEDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAV 450 460 470 480 490 500 190 200 210 220 230 240 pF1KB8 IATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVVDPDDL ::.:::: ::: .:::::::::: :::::::: .:: : :: :. ::::.::: . CCDS53 IASPEQLQAAYEAGYEQCDAGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTET 510 520 530 540 550 560 250 260 270 280 290 300 pF1KB8 YDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDHCSPGW :::::... :.::.:.. :..:..:: .:. ..: .::::::::::. :::.: :: CCDS53 YDVYCFVDRLEGEVFFATRLEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDKCYAGW 570 580 590 600 610 620 310 320 330 340 350 360 pF1KB8 LADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRD-SAQPSAIPE :::::.::::::: ::: :::.:..:.:::::.:. :: ...::: :: :: : CCDS53 LADGSLRYPIVTPRPACGGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEE 630 640 650 660 670 680 370 380 390 400 410 420 pF1KB8 ASNPASNPASDGLEA-IVT-VTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSSTPE .. ..:. :.: ::: :. . . . .:.: : : .: . ..: CCDS53 EGGTPTSPS--GVEEWIVTQVVPGVAAVPVEEETTAVPS-GETTAI-LEFTTEPENQTEW 690 700 710 720 730 740 430 440 450 460 470 480 pF1KB8 DPAEAPRTLLEFE-TQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALWA .:: .: . :::: . ::. : . . :: :: CCDS53 EPAYTPVGTSPLPGILPTWPPTGAATEEST---EGPSATEVPSASEEPSPSEVP------ 750 760 770 780 790 490 500 510 520 530 540 pF1KB8 WPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPTE .::: ::. : : . :. :.. . :. : :. : ::. : . .::. CCDS53 FPSEEPSPSEE---PFPSVRPFPSVELFPSEEPF-PSKEPSPSEEPSASEEPYTPSPPVP 800 810 820 830 840 550 560 570 580 pF1KB8 T---LPTPRERNLASPSPSTLVEAREVGEATG---------GPELSGVPRGESEETGSSE . ::. :. : .:.. . :...: : . ::.: :. . .: . CCDS53 SWTELPSSGEE---SGAPDVSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTS 850 860 870 880 890 900 590 600 610 620 630 640 pF1KB8 GAPSLLPATRA-PEGTRE-LEAPSEDNSGRTAPAGTSV---QAQPVLPTDSASRGGVAVV . : ::. . : : .: .: :: . :. :.:. . .:. : .. : : . CCDS53 TVGSGLPVESGLPSGDEERIEWPSTPTVGEL-PSGAEILEGSASGVGDLSGLPSGEVLET 910 920 930 940 950 960 650 660 670 680 690 700 pF1KB8 PASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFS ::: CCDS53 SASGVGDLSGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAP 970 980 990 1000 1010 1020 >>CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321 aa) initn: 2021 init1: 1037 opt: 1144 Z-score: 604.2 bits: 123.6 E(32554): 2.5e-27 Smith-Waterman score: 1168; 36.3% identity (60.2% similar) in 661 aa overlap (4-639:9-638) 10 20 30 40 50 pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTI : : .: :... . . :. :.:: :..... :.. .:..:. ... CCDS12 MGAPFVWALGLLMLQMLLFVAGEQGTQDIT--DASE-RGLHMQKLGSGSVQAALAELVAL 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 PCHVHYLRPPPSRRAVLGSPRVKWTFL--SRGREAE--VLVARGVRVKVNEAYRFRVALP :: . :.: :: :. .::.::: . . :.. . .:::. :.: .... ::.:: CCDS12 PC-LFTLQPRPS--AARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 AYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFS .:: ....: :. :: .:::.:::.: .::.: .: : ..: :::: :: . :::.. CCDS12 SYPRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 FSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGF :. ::::: .: ::.:..: ::. :...::::::::.:::::: : .:::: ... CCDS12 FAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 PGVRNYGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLY ::::.:: .:..::::::.:..:.::.: : ..::: ::: :...:: .:..:::. CCDS12 PGVRSYGRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLH 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 AAWDGGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVY :: :::.:.::::::::::::: :: .:::: :::.:.. : :.::::. ::..: CCDS12 LAWHEGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAY 300 310 320 330 340 350 360 370 380 390 400 pF1KB8 CFRDSAQPSAIPEASNPASNPASDGLEA----IVTVTETLEELQL--PQEATESESRGAI ::: : . .:.:. .. : : . . :::: .. :. : : CCDS12 CFRAHHPTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEE 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB8 YSIPIMEDGGGG----SSTPEDPAEAPRTLLEFETQSMVP-PTGFSEEEGKALEEEEKYE .. :.:. . : :: :: : : ....: :. .. . . . : CCDS12 ETL-ILEEKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT 420 430 440 450 460 470 470 480 490 500 510 pF1KB8 DEEEKEEEEEEEEVEDEALWAWPSELSSPGPEASL--PTEPAA---QEKSLSQAPARAVL : ... . . : . : ::: :: :: .: :..: . .: CCDS12 DPMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMA-VTEML 480 490 500 510 520 530 520 530 540 550 560 570 pF1KB8 QPGAS--PLPDGESEASRPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATGGPE : : : : .:.. : . . .. : : : :.: : CCDS12 GSGQSRSPWADLTNEVDMPG-AGSAGGKSSPEPWLW------PPTMVP----------PS 540 550 560 570 580 590 600 610 620 630 pF1KB8 LSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAPSEDNSGRTAPA---GTSVQAQPV .:: :. : ..:: :: ::: :. . .: : . . .:: . : ..: CCDS12 ISGHSRAPVLELEKAEG-PSARPAT--PD---LFWSPLEATVSAPSPAPWEAFPVATSPD 580 590 600 610 620 640 650 660 670 680 690 pF1KB8 LPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNP :: . :: CCDS12 LPMMAMLRGPKEWMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQ 630 640 650 660 670 680 >-- initn: 1045 init1: 956 opt: 1026 Z-score: 543.6 bits: 112.4 E(32554): 5.9e-24 Smith-Waterman score: 1042; 34.2% identity (58.4% similar) in 620 aa overlap (282-878:703-1279) 260 270 280 290 300 pF1KB8 AEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDHCSPG-W----- :.. ::. : . .: : . : CCDS12 AETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNR 680 690 700 710 720 730 310 320 330 340 350 360 pF1KB8 -LADGSVRYPIVTPSQRCG-GGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPSAIP .: : : : : .. : :.:: .. . .. :.. . .: .: ::. CCDS12 NVAVGFV--PTETATEPTGLRGIPGSESGVFDTAES--PTSGLQATVDEVQDP-WPSVYS 740 750 760 770 780 370 380 390 400 410 pF1KB8 ---EASNPASNPASDGLEAIVTVTETLEELQLPQEA-TESESRGAIYSIP-----IMEDG .::.:.. .: :. . :: .:: .:. : . ... : : : : CCDS12 KGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPG 790 800 810 820 830 840 420 430 440 450 460 470 pF1KB8 GGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKA-LEEEEKYEDEEEKEEEEEEEE . :. . .:.. :. :.: : :. :. . . . . : :.. CCDS12 SQVFEEAESTTLSPQVALD---TSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQ 850 860 870 880 890 900 480 490 500 510 520 530 pF1KB8 VEDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPP :: .. . : ::.: . : . :.. :: : :. . .. : .: : CCDS12 VETQG---------TSG--ASVPPH---QSSPLGK-PAVPPGTPTAASVGESASVSSGEP 910 920 930 940 540 550 560 570 580 590 pF1KB8 RVHGPPTETLPTPRERNLASPSPSTL-VEAREVGEATGGPELSGVPRGESEETGSSEGAP : :. :: : :: .: :. .:.: :: .. ::..:.: : CCDS12 TVPWDPSSTL-----------LPVTLGIEDFELEVLAGSP---GV-ESFWEEVASGE-EP 950 960 970 980 990 600 610 620 630 640 pF1KB8 SLLPATRAPEGTRELEA-PSEDNSGRTAPAGTSVQAQPVLPTDSASRG--GVAVVPASGD .: :.: :..:... : :.: : . .:. .. : ..: : : CCDS12 AL-PGTPMNAGAEEVHSDPCENNP---CLHGGTCNANGTMYGCSCDQGFAGENCEIDIDD 1000 1010 1020 1030 1040 650 660 670 680 690 700 pF1KB8 CVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSW :. :::.:::::..: .: :::::.:::..:. . :. :: ::: ::..:. ::.: CCDS12 CLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCYRYFAHRRAW 1050 1060 1070 1080 1090 1100 710 720 730 740 750 760 pF1KB8 EEAETQCRMYGAHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENW :.:: .:: ..::.:. .:::..:::. .: ::::::: .: :: :.:.. : .::: CCDS12 EDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTGLQFENW 1110 1120 1130 1140 1150 1160 770 780 790 800 810 820 pF1KB8 NPGQPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGR .:::..: .::.::::: :..:.:.::::::.: :.:: : : ::::: . :...: CCDS12 RENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVENASLIGA 1170 1180 1190 1200 1210 1220 830 840 850 860 870 880 pF1KB8 PRLRYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQISCV-PRRPARALHPEEDPEG . .:.: ...::.: ::.::... :::. ::.:. ::: :. ::: : CCDS12 RKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRHHHHHQH 1230 1240 1250 1260 1270 1280 890 900 910 pF1KB8 RQGRLLGRWKALLIPPSSPMPGP CCDS12 HHQHHHHKSRKERRKHKKHPTEDWEKDEGNFC 1290 1300 1310 1320 >>CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642 aa) initn: 2211 init1: 1021 opt: 1103 Z-score: 581.9 bits: 119.8 E(32554): 4.3e-26 Smith-Waterman score: 1124; 34.1% identity (62.4% similar) in 619 aa overlap (36-637:23-617) 10 20 30 40 50 60 pF1KB8 LPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPP .:... . :..: :.: ...::: . CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMPTL 10 20 30 40 50 70 80 90 100 110 pF1KB8 PSRRAVLGSPRVKWTFL---SRGR---EAEVLVARGVRVKVNEAYRFRVALPAYPASLTD : . :.::. . . :. :. ::::.. .:... :. ::..:..: .. : CCDS54 PPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAVGD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 VSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEAC .::.. .: .:.:.:::.:..::.:..:.: . : :::: :: ...::...: .::.:: CCDS54 ASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQKAC 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 ARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGV .:: :::::::.::: :.::::::::.::::::::..:: .:::: : :::.:: CCDS54 LDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTYGF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 VDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLD .:.. ::::::.. :.:..: : :.:.::: :... :..::.:.: ::: .:.: CCDS54 RSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNGFD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 HCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQP .:. :::.:.:::.:... .::::: ::.::. : :::::: :::..:::. . CCDS54 QCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKEAT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 ----SAIPEASNPA--SNP--ASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIM : . :...:. ..: .:: :. ... .:: :: : : :. CCDS54 TIDLSILAETASPSLSKEPQMVSDRTTPIIPLVD-----ELPVIPTEFPPVGNIVSFE-- 360 370 380 390 400 420 430 440 450 460 470 pF1KB8 EDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEE .. :. ... : : : : : ... .: : . : ::: . CCDS54 ---QKATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKEEVLQS 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB8 EE-VEDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEAS : : .: . . : . : ..: ... .: . .. . .:. : .. CCDS54 TTGVSHYATDSWDGVV-----EDKQTQESVTQIEQIEVGPLVTSMEI-LKHIPSKEFPVT 470 480 490 500 510 540 550 560 570 580 pF1KB8 RPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATG--GPELSGVPRGESEETGSS . : : . : . :....: . : :: . . : . : : . : .: : CCDS54 ETPLVTA--RMILESKTEKKMVS-TVSELVTTGHYGFTLGEEDDEDRTLTVGSDESTLIF 520 530 540 550 560 570 590 600 610 620 630 640 pF1KB8 EGAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASG . : .. .... : : ... :: ... :.:.:. ..: ...: CCDS54 DQIPEVITVSKTSEDT--IHTHLED--LESVSASTTVSPL-IMPDNNGSSMDDWEERQTS 580 590 600 610 620 650 660 670 680 690 700 pF1KB8 DCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRS CCDS54 GRITEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTE 630 640 650 660 670 680 >-- initn: 1216 init1: 1006 opt: 1042 Z-score: 550.6 bits: 114.0 E(32554): 2.4e-24 Smith-Waterman score: 1042; 36.3% identity (59.7% similar) in 477 aa overlap (418-872:1133-1599) 390 400 410 420 430 440 pF1KB8 EELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEFETQSMVP-PTGFS : ::. :. . :.:. : : .. CCDS54 SYPPGAVTEHKVKTDEVVTLTPRIGPKVSLSPGPEQKYETEGSSTTGFTSSLSPFSTHIT 1110 1120 1130 1140 1150 1160 450 460 470 480 490 500 pF1KB8 EEEGKALEEEEKYEDEEEK----EEEEEEEEVEDEALWAW-PSELSSPGPEAS-LPTEPA . .. :. . :: . :. . : .: .. . ::.... .. : : : CCDS54 QLMEETTTEKTSLEDIDLGSGLFEKPKATELIEFSTIKVTVPSDITTAFSSVDRLHTTSA 1170 1180 1190 1200 1210 1220 510 520 530 540 550 pF1KB8 AQEKS-LSQAPARAVLQPGASPLPD----GESEASRPPR----VHGPPTETLPTPRERNL . .: ... : .:: : ::: . :: . . ::: :: CCDS54 FKPSSAITKKPPLIDREPGEETTSDMVIIGESTSHVPPTTLEDIVAKETET-DIDREYFT 1230 1240 1250 1260 1270 1280 560 570 580 590 600 pF1KB8 ASPSPST------LVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRAPEGTR .: :.: :: .:. ::. ..:. . . .. . . : CCDS54 TSSPPATQPTRPPTVEDKEAF----GPQALSTPQPPASTKFHPDINVYIIEVRENKTGPD 1290 1300 1310 1320 1330 610 620 630 640 650 660 pF1KB8 ELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEE . . :.: :. :: . .: :... . .: .::.::.::.. CCDS54 RCKMNPCLNGGTCYPTETSY-VCTCVPGYSGDQCELDF----DECHSNPCRNGATCVDGF 1340 1350 1360 1370 1380 1390 670 680 690 700 710 720 pF1KB8 EGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYGAHLAS . ::::::.: : ::. . :. :: ::: :::.:. ::.:. :: .::. ::::.: CCDS54 NTFRCLCLPSYVGALCEQDTETCDYGWHKFQGQCYKYFAHRRTWDAAERECRLQGAHLTS 1400 1410 1420 1430 1440 1450 730 740 750 760 770 780 pF1KB8 ISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGENCV : . ::: :.: ..::::::::. .: :: :.:: : :::: :.::::.: .::.:: CCDS54 ILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFRWTDGSTLQYENWRPNQPDSFFSAGEDCV 1460 1470 1480 1490 1500 1510 790 800 810 820 830 840 pF1KB8 VMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRYRCR :..::..:::.::::::::.:::: : :.:: :: . :..::. . :::.....::.:. CCDS54 VIIWHENGQWNDVPCNYHLTYTCKKGTVACGQPPVVENAKTFGKMKPRYEINSLIRYHCK 1520 1530 1540 1550 1560 1570 850 860 870 880 890 900 pF1KB8 EGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGRLLGRWKALLIPPS .:. ::.:: ::: :::: :.:.:. CCDS54 DGFIQRHLPTIRCLGNGRWAIPKITCMNPSAYQRTYSMKYFKNSSSAKDNSINTSKHDHR 1580 1590 1600 1610 1620 1630 >>CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 (655 aa) initn: 2395 init1: 1013 opt: 1092 Z-score: 581.3 bits: 118.3 E(32554): 4.7e-26 Smith-Waterman score: 1623; 34.3% identity (53.3% similar) in 843 aa overlap (36-872:23-612) 10 20 30 40 50 60 pF1KB8 LPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPP .:... . :..: :.: ...::: . CCDS47 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMPTL 10 20 30 40 50 70 80 90 100 110 pF1KB8 PSRRAVLGSPRVKWTFL---SRGR---EAEVLVARGVRVKVNEAYRFRVALPAYPASLTD : . :.::. . . :. :. ::::.. .:... :. ::..:..: .. : CCDS47 PPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAVGD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 VSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEAC .::.. .: .:.:.:::.:..::.:..:.: . : :::: :: ...::...: .::.:: CCDS47 ASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQKAC 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 ARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGV .:: :::::::.::: :.::::::::.::::::::..:: .:::: : :::.:: CCDS47 LDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTYGF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 VDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLD .:.. ::::::.. :.:..: : :.:.::: :... :..::.:.: ::: .:.: CCDS47 RSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNGFD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 HCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQP .:. :::.:.:::.:... .::::: ::.::. : :::::: :::..:::. .: CCDS47 QCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFK---RP 300 310 320 330 340 360 370 380 390 400 410 pF1KB8 SAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSS . :: : ::. CCDS47 DRCK--MNPCLN--------------------------------------------GGTC 350 360 420 430 440 450 460 470 pF1KB8 TPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEAL : . . . . :: :.: : :. : . .: CCDS47 YPTETSYV---------CTCVP--GYS---G----------DQCELDFDE---------- 370 380 480 490 500 510 520 530 pF1KB8 WAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPP CCDS47 ------------------------------------------------------------ 540 550 560 570 580 590 pF1KB8 TETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATR CCDS47 ------------------------------------------------------------ 600 610 620 630 640 650 pF1KB8 APEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGG : .::.::. CCDS47 --------------------------------------------------CHSNPCRNGA 390 660 670 680 690 700 710 pF1KB8 TCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMY ::.. . ::::::.: : ::. . :. :: ::: :::.:. ::.:. :: .::. CCDS47 TCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQGQCYKYFAHRRTWDAAERECRLQ 400 410 420 430 440 450 720 730 740 750 760 770 pF1KB8 GAHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFL ::::.:: . ::: :.: ..::::::::. .: :: :.:: : :::: :.::::.: CCDS47 GAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFRWTDGSTLQYENWRPNQPDSFFS 460 470 480 490 500 510 780 790 800 810 820 830 pF1KB8 SGENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTV .::.:::..::..:::.::::::::.:::: : :.:: :: . :..::. . :::.... CCDS47 AGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQPPVVENAKTFGKMKPRYEINSL 520 530 540 550 560 570 840 850 860 870 880 890 pF1KB8 LRYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGRLLGRWKA .::.:..:. ::.:: ::: :::: :.:.:. CCDS47 IRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAYQRTYSMKYFKNSSSAKDNSINT 580 590 600 610 620 630 900 910 pF1KB8 LLIPPSSPMPGP CCDS47 SKHDHRWSRRWQESRR 640 650 >>CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396 aa) initn: 2178 init1: 1021 opt: 1103 Z-score: 578.0 bits: 120.1 E(32554): 7.1e-26 Smith-Waterman score: 1124; 34.1% identity (62.4% similar) in 619 aa overlap (36-637:23-617) 10 20 30 40 50 60 pF1KB8 LPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPP .:... . :..: :.: ...::: . CCDS40 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMPTL 10 20 30 40 50 70 80 90 100 110 pF1KB8 PSRRAVLGSPRVKWTFL---SRGR---EAEVLVARGVRVKVNEAYRFRVALPAYPASLTD : . :.::. . . :. :. ::::.. .:... :. ::..:..: .. : CCDS40 PPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAVGD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 VSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEAC .::.. .: .:.:.:::.:..::.:..:.: . : :::: :: ...::...: .::.:: CCDS40 ASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQKAC 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 ARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGV .:: :::::::.::: :.::::::::.::::::::..:: .:::: : :::.:: CCDS40 LDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTYGF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 VDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLD .:.. ::::::.. :.:..: : :.:.::: :... :..::.:.: ::: .:.: CCDS40 RSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNGFD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 HCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQP .:. :::.:.:::.:... .::::: ::.::. : :::::: :::..:::. . CCDS40 QCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKEAT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 ----SAIPEASNPA--SNP--ASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIM : . :...:. ..: .:: :. ... .:: :: : : :. CCDS40 TIDLSILAETASPSLSKEPQMVSDRTTPIIPLVD-----ELPVIPTEFPPVGNIVSFE-- 360 370 380 390 400 420 430 440 450 460 470 pF1KB8 EDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEE .. :. ... : : : : : ... .: : . : ::: . CCDS40 ---QKATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKEEVLQS 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB8 EE-VEDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEAS : : .: . . : . : ..: ... .: . .. . .:. : .. CCDS40 TTGVSHYATDSWDGVV-----EDKQTQESVTQIEQIEVGPLVTSMEI-LKHIPSKEFPVT 470 480 490 500 510 540 550 560 570 580 pF1KB8 RPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATG--GPELSGVPRGESEETGSS . : : . : . :....: . : :: . . : . : : . : .: : CCDS40 ETPLVTA--RMILESKTEKKMVS-TVSELVTTGHYGFTLGEEDDEDRTLTVGSDESTLIF 520 530 540 550 560 570 590 600 610 620 630 640 pF1KB8 EGAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASG . : .. .... : : ... :: ... :.:.:. ..: ...: CCDS40 DQIPEVITVSKTSEDT--IHTHLED--LESVSASTTVSPL-IMPDNNGSSMDDWEERQTS 580 590 600 610 620 650 660 670 680 690 700 pF1KB8 DCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRS CCDS40 GRITEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTE 630 640 650 660 670 680 >-- initn: 1206 init1: 1006 opt: 1065 Z-score: 558.5 bits: 116.5 E(32554): 8.7e-25 Smith-Waterman score: 1073; 35.1% identity (60.0% similar) in 573 aa overlap (329-872:2814-3353) 300 310 320 330 340 350 pF1KB8 DHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQ :.:. . .:: :. : ...: ... CCDS40 TTHLMDQSVTEVPDVMEGSNPPYYTDTTLAVSTFAKLSSQT--PS--SPLTIYSGSEASG 2790 2800 2810 2820 2830 360 370 380 390 400 410 pF1KB8 PSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGS . ::. :.. :. : .... ....:... ::: . : . : : . . CCDS40 HTEIPQ---PSALPGIDVGSSVMSPQDSFKEIHVNIEATFKPSSEEY--LHITEPPSLSP 2840 2850 2860 2870 2880 2890 420 430 440 450 460 pF1KB8 STPEDPAE---APRTLLEFETQS--MVPPTG------FSEEE-----GKALEEEEKYEDE .: .:.: :. : :.:.. .. : :... :.:.. . CCDS40 DTKLEPSEDDGKPELLEEMEASPTELIAVEGTEILQDFQNKTDGQVSGEAIKMFPTIKTP 2900 2910 2920 2930 2940 2950 470 480 490 500 510 pF1KB8 EEKEEEEEEEEVEDEALWAWPSELSSP---GPEASL-P-TEPAAQEK-SLSQAP-----A : .:.: :. :: :. : ::.. : : ..:. .::..: . CCDS40 EAGTVITTADEIELEGATQWPHSTSASATYGVEAGVVPWLSPQTSERPTLSSSPEINPET 2960 2970 2980 2990 3000 3010 520 530 540 550 560 pF1KB8 RAVLQPGASPLPDGESEASRPPRVHGPPTETLPTPRERN--LASPSPSTLVEAREVGEAT .:.: : . . :: . :. .. .: : : .:.: : .:.:. . . CCDS40 QAALIRGQDSTI-AASEQQVAARILDSNDQATVNPVEFNTEVATP-PFSLLETSNETDF- 3020 3030 3040 3050 3060 3070 570 580 590 600 610 620 pF1KB8 GGPELSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQP : :. .:: : ::. ::. :. : : :.: :. :: . CCDS40 ----LIGI----NEE--SVEGTAIYLPG---PD--RCKMNPCL-NGGTCYPTETSY-VCT 3080 3090 3100 3110 630 640 650 660 670 680 pF1KB8 VLPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCN .: :... . .: .::.::.::.. . ::::::.: : ::. . :. CCDS40 CVPGYSGDQCELDF----DECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCD 3120 3130 3140 3150 3160 3170 690 700 710 720 730 740 pF1KB8 PGWDAFQGACYKHFSTRRSWEEAETQCRMYGAHLASISTPEEQDFINNRYREYQWIGLND :: ::: :::.:. ::.:. :: .::. ::::.:: . ::: :.: ..:::::::: CCDS40 YGWHKFQGQCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLND 3180 3190 3200 3210 3220 3230 750 760 770 780 790 800 pF1KB8 RTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCK . .: :: :.:: : :::: :.::::.: .::.:::..::..:::.::::::::.:::: CCDS40 KMFEHDFRWTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCK 3240 3250 3260 3270 3280 3290 810 820 830 840 850 860 pF1KB8 MGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQI : :.:: :: . :..::. . :::.....::.:..:. ::.:: ::: :::: :.: CCDS40 KGTVACGQPPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKI 3300 3310 3320 3330 3340 3350 870 880 890 900 910 pF1KB8 SCVPRRPARALHPEEDPEGRQGRLLGRWKALLIPPSSPMPGP .:. CCDS40 TCMNPSAYQRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR 3360 3370 3380 3390 >>CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409 aa) initn: 2178 init1: 1021 opt: 1093 Z-score: 574.7 bits: 119.0 E(32554): 1.1e-25 Smith-Waterman score: 1182; 33.6% identity (60.9% similar) in 654 aa overlap (36-649:23-657) 10 20 30 40 50 60 pF1KB8 LPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPP .:... . :..: :.: ...::: . CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMPTL 10 20 30 40 50 70 80 90 100 110 pF1KB8 PSRRAVLGSPRVKWTFL---SRGR---EAEVLVARGVRVKVNEAYRFRVALPAYPASLTD : . :.::. . . :. :. ::::.. .:... :. ::..:..: .. : CCDS54 PPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAVGD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 VSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEAC .::.. .: .:.:.:::.:..::.:..:.: . : :::: :: ...::...: .::.:: CCDS54 ASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQKAC 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 ARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGV .:: :::::::.::: :.::::::::.::::::::..:: .:::: : :::.:: CCDS54 LDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTYGF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 VDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLD .:.. ::::::.. :.:..: : :.:.::: :... :..::.:.: ::: .:.: CCDS54 RSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNGFD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 HCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQP .:. :::.:.:::.:... .::::: ::.::. : :::::: :::..:::. . CCDS54 QCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKRRMSD 300 310 320 330 340 350 360 370 380 390 400 pF1KB8 SAI---P--------EASNPASNPASDGLEAIVTVTETLEELQL--PQEATESESRGA-- .. : : . ..:. : . :. . :..: .: : : . : CCDS54 LSVIGHPIDSESKEDEPCSEETDPVHDLMAEILPEFPDIIEIDLYHSEENEEEEEECANA 360 370 380 390 400 410 410 420 430 440 450 pF1KB8 --IYSIPIMEDGGGG---SSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEE--E . . : .. .: ...:.:: : .:: :..: .::. . . CCDS54 TDVTTTPSVQYINGKHLVTTVPKDPEAAEARRGQFE--SVAPSQNFSDSSESDTHPFVIA 420 430 440 450 460 470 460 470 480 490 500 510 pF1KB8 KYEDEEEKEEEEEEEEVED-EALW---AWP--SELSSPGPEASLPTEPAAQEKSLSQAPA : : . .: : .:. :. : ..: :: : : .:: : .: . : CCDS54 KTELSTAVQPNESTETTESLEVTWKPETYPETSEHFSGGEPDVFPTVPFHEEFESGTA-- 480 490 500 510 520 520 530 540 550 560 570 pF1KB8 RAVLQPGASPLPDGESEASRPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATGG . :: . . ..:... . : :. .: ..: . : . .. :.: : CCDS54 ----KKGAESVTERDTEVGHQAHEHTEPVSLFPEESSGEIAIDQESQKIAFARATEVTFG 530 540 550 560 570 580 580 590 600 610 620 pF1KB8 PELSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEA------PSEDNSGRTAPAGTSV :. :.. : .:...:.. : . : :: : :. : . : CCDS54 EEV--------EKSTSVTYTPTIVPSS-ASAYVSEEEAVTLIGNPWPDDLLSTKESW--V 590 600 610 620 630 630 640 650 660 670 680 pF1KB8 QAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGL .: : .. .. ... .. .::. CCDS54 EATPRQVVELSGSSSIPITEGSGEAEEDEDTMFTMVTDLSQRNTTDTLITLDTSRIITES 640 650 660 670 680 690 >-- initn: 1227 init1: 1006 opt: 1065 Z-score: 560.4 bits: 116.3 E(32554): 6.8e-25 Smith-Waterman score: 1073; 35.1% identity (60.0% similar) in 573 aa overlap (329-872:1827-2366) 300 310 320 330 340 350 pF1KB8 DHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQ :.:. . .:: :. : ...: ... CCDS54 TTHLMDQSVTEVPDVMEGSNPPYYTDTTLAVSTFAKLSSQT--PS--SPLTIYSGSEASG 1800 1810 1820 1830 1840 1850 360 370 380 390 400 410 pF1KB8 PSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGS . ::. :.. :. : .... ....:... ::: . : . : : . . CCDS54 HTEIPQ---PSALPGIDVGSSVMSPQDSFKEIHVNIEATFKPSSEEY--LHITEPPSLSP 1860 1870 1880 1890 1900 420 430 440 450 460 pF1KB8 STPEDPAE---APRTLLEFETQS--MVPPTG------FSEEE-----GKALEEEEKYEDE .: .:.: :. : :.:.. .. : :... :.:.. . CCDS54 DTKLEPSEDDGKPELLEEMEASPTELIAVEGTEILQDFQNKTDGQVSGEAIKMFPTIKTP 1910 1920 1930 1940 1950 1960 470 480 490 500 510 pF1KB8 EEKEEEEEEEEVEDEALWAWPSELSSP---GPEASL-P-TEPAAQEK-SLSQAP-----A : .:.: :. :: :. : ::.. : : ..:. .::..: . CCDS54 EAGTVITTADEIELEGATQWPHSTSASATYGVEAGVVPWLSPQTSERPTLSSSPEINPET 1970 1980 1990 2000 2010 2020 520 530 540 550 560 pF1KB8 RAVLQPGASPLPDGESEASRPPRVHGPPTETLPTPRERN--LASPSPSTLVEAREVGEAT .:.: : . . :: . :. .. .: : : .:.: : .:.:. . . CCDS54 QAALIRGQDSTI-AASEQQVAARILDSNDQATVNPVEFNTEVATP-PFSLLETSNETDF- 2030 2040 2050 2060 2070 2080 570 580 590 600 610 620 pF1KB8 GGPELSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQP : :. .:: : ::. ::. :. : : :.: :. :: . CCDS54 ----LIGI----NEE--SVEGTAIYLPG---PD--RCKMNPCL-NGGTCYPTETSY-VCT 2090 2100 2110 2120 630 640 650 660 670 680 pF1KB8 VLPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCN .: :... . .: .::.::.::.. . ::::::.: : ::. . :. CCDS54 CVPGYSGDQCELDF----DECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCD 2130 2140 2150 2160 2170 2180 690 700 710 720 730 740 pF1KB8 PGWDAFQGACYKHFSTRRSWEEAETQCRMYGAHLASISTPEEQDFINNRYREYQWIGLND :: ::: :::.:. ::.:. :: .::. ::::.:: . ::: :.: ..:::::::: CCDS54 YGWHKFQGQCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLND 2190 2200 2210 2220 2230 2240 750 760 770 780 790 800 pF1KB8 RTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCK . .: :: :.:: : :::: :.::::.: .::.:::..::..:::.::::::::.:::: CCDS54 KMFEHDFRWTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCK 2250 2260 2270 2280 2290 2300 810 820 830 840 850 860 pF1KB8 MGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQI : :.:: :: . :..::. . :::.....::.:..:. ::.:: ::: :::: :.: CCDS54 KGTVACGQPPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKI 2310 2320 2330 2340 2350 2360 870 880 890 900 910 pF1KB8 SCVPRRPARALHPEEDPEGRQGRLLGRWKALLIPPSSPMPGP .:. CCDS54 TCMNPSAYQRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR 2370 2380 2390 2400 >>CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 (360 aa) initn: 670 init1: 510 opt: 821 Z-score: 445.5 bits: 92.3 E(32554): 1.7e-18 Smith-Waterman score: 821; 44.0% identity (66.1% similar) in 327 aa overlap (37-354:47-358) 10 20 30 40 50 60 pF1KB8 PLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVL---GGALTIPCHVHYLR :... ..: . .. :... .::. .: CCDS10 GLPFYNGFYYSNSANDQNLGNGHGKDLLNGVKLVVETPEETLFTYQGASVILPCRYRYEP 20 30 40 50 60 70 70 80 90 100 110 120 pF1KB8 PPPSRRAVLGSPRVKWTFLSRGR--EAEVLVARGVRVKVNEAYRFRVALPAYPASLTDVS : : : :::: ::.. : .:::: :.: . :. :: : . ::: CCDS10 ALVSPRRV----RVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHL--RQDKEHDVS 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB8 LALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACAR : ...:: .: : ::::: :..: : ::....:::: :. ..:: :.: .:..::. CCDS10 LEIQDLRLEDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAE 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB8 IGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGF-PGVRNYGVV .: .:. :::. :. : . :.::::.: ::.:::. ::. : : :. ::::.:: CCDS10 QAAVVASFEQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGP--GLAPGVRSYGPR 200 210 220 230 240 250 260 270 280 290 pF1KB8 DPD-DLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWD-GGL :::.:.: :.:... . :::::: ::: ::: : :: .:::.::: :: CCDS10 HRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAAWKFHGL 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB8 DHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSR-FNVYCFRDSA :.:. :::::::::::.: : :: :::... :::. .:: ..:::.: CCDS10 DRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSF-------GFPDPQSRLYGVYCYRQH 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB8 QPSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGG 911 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 16:44:45 2016 done: Sat Nov 5 16:44:45 2016 Total Scan time: 4.400 Total Display time: 0.380 Function used was FASTA [36.3.4 Apr, 2011]