FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8564, 911 aa
1>>>pF1KB8564 911 - 911 aa - 911 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.5960+/-0.00106; mu= -0.7111+/- 0.064
mean_var=379.8917+/-74.824, 0's: 0 Z-trim(114.7): 75 B-trim: 256 in 1/52
Lambda= 0.065803
statistics sampled from 15181 (15253) to 15181 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.768), E-opt: 0.2 (0.469), width: 16
Scan time: 4.400
The best scores are: opt bits E(32554)
CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 ( 911) 6320 614.8 2.3e-175
CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 ( 671) 4342 426.9 6.3e-119
CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431) 1257 134.6 2.2e-30
CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530) 1257 134.6 2.3e-30
CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321) 1144 123.6 2.5e-27
CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642) 1103 119.8 4.3e-26
CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 ( 655) 1092 118.3 4.7e-26
CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396) 1103 120.1 7.1e-26
CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409) 1093 119.0 1.1e-25
CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 360) 821 92.3 1.7e-18
CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 422) 821 92.4 1.9e-18
CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 ( 354) 804 90.7 5.2e-18
CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 ( 340) 709 81.7 2.6e-15
>>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 (911 aa)
initn: 6320 init1: 6320 opt: 6320 Z-score: 3261.8 bits: 614.8 E(32554): 2.3e-175
Smith-Waterman score: 6320; 99.9% identity (100.0% similar) in 911 aa overlap (1-911:1-911)
10 20 30 40 50 60
pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 YLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPASLTDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 YLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPASLTDV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 SLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 RIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 DPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 CSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 CSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 AIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSST
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB8 PEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALW
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB8 AWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPT
:::::::::::::::::::::::.::::::::::::::::::::::::::::::::::::
CCDS11 AWPSELSSPGPEASLPTEPAAQEESLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPT
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB8 ETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB8 PEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGT
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB8 CLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 CLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB8 AHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLS
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB8 GENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVL
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB8 RYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGRLLGRWKAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGRLLGRWKAL
850 860 870 880 890 900
910
pF1KB8 LIPPSSPMPGP
:::::::::::
CCDS11 LIPPSSPMPGP
910
>>CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 (671 aa)
initn: 4641 init1: 4342 opt: 4342 Z-score: 2248.6 bits: 426.9 E(32554): 6.3e-119
Smith-Waterman score: 4342; 99.7% identity (100.0% similar) in 649 aa overlap (1-649:1-649)
10 20 30 40 50 60
pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 YLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPASLTDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 YLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPASLTDV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 SLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 RIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 DPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 CSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 CSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 AIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSST
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB8 PEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALW
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB8 AWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPT
:::::::::::::::::::::::.::::::::::::::::::::::::::::::::::::
CCDS11 AWPSELSSPGPEASLPTEPAAQEESLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPT
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB8 ETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB8 PEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGT
::::::::::::::::::::::::::::::::::::::::::::::::.
CCDS11 PEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGNSAQGSTALSIL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB8 CLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYG
CCDS11 LLFFPLQLWVT
670
>>CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431 aa)
initn: 1934 init1: 1135 opt: 1257 Z-score: 658.8 bits: 134.6 E(32554): 2.2e-30
Smith-Waterman score: 1261; 47.5% identity (71.3% similar) in 432 aa overlap (29-454:23-438)
10 20 30 40 50
pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCH--
:..: .. : : .::. .:: .:::::.
CCDS53 MTTLLWVFVTLRVITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFI
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 --VHYLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPAS
.: . :: . .::.::. .:. .:. .::: ::.:: ::. .:.:: :::
CCDS53 DPMHPVTTAPSTAPL--APRIKWSRVSKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 LTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQ
.:..: .. :: ::::.:::::.:::.:: ..:: :::.:: :: :.::...:. ::
CCDS53 PSDATLEVQSLRSNDSGVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQ
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 EACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRN
.:: . .: ::::::: ::: :..:::::::.::::::::.::::.:::: : :::::.
CCDS53 RACLQNSAIIATPEQLQAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 YGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDG
::. : .. :::::.::...::.: . :::.:..:: :.. ::..::::::: ::..
CCDS53 YGIRDTNETYDVYCFAEEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQA
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 GLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDS
:.: :: ::::: :::::: :::.: ::.:... ::::.:. ::... :. .
CCDS53 GMDMCSAGWLADRSVRYPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYT-G
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 AQPSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGA-IYSI-PIMEDG
. ::: : . . . . .. ::: :: ::.. ::.:.::. : .. ::.:
CCDS53 EDFVDIPE--NFFGVGGEEDI-TVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEV-
360 370 380 390 400
420 430 440 450 460 470
pF1KB8 GGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEV
: .: .: : : : . :.:.: :... :
CCDS53 ---SPSPLEP-EEP-----FTFAPEIGATAFAEVENETGEATRPWGFPTPGLGPATAFTS
410 420 430 440 450
480 490 500 510 520 530
pF1KB8 EDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPR
CCDS53 EDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYE
460 470 480 490 500 510
>--
initn: 1597 init1: 868 opt: 1024 Z-score: 539.3 bits: 112.4 E(32554): 1e-23
Smith-Waterman score: 1024; 39.1% identity (59.7% similar) in 514 aa overlap (156-648:477-969)
130 140 150 160 170 180
pF1KB8 ELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACARIGAH
:::: :: : .::...: ::.:: : ::
CCDS53 TPGLGPATAFTSEDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAV
450 460 470 480 490 500
190 200 210 220 230 240
pF1KB8 IATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVVDPDDL
::.:::: ::: .:::::::::: :::::::: .:: : :: :. ::::.::: .
CCDS53 IASPEQLQAAYEAGYEQCDAGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTET
510 520 530 540 550 560
250 260 270 280 290 300
pF1KB8 YDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDHCSPGW
:::::... :.::.:.. :..:..:: .:. ..: .::::::::::. :::.: ::
CCDS53 YDVYCFVDRLEGEVFFATRLEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDKCYAGW
570 580 590 600 610 620
310 320 330 340 350 360
pF1KB8 LADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRD-SAQPSAIPE
:::::.::::::: ::: :::.:..:.:::::.:. :: ...::: :: :: :
CCDS53 LADGSLRYPIVTPRPACGGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEE
630 640 650 660 670 680
370 380 390 400 410 420
pF1KB8 ASNPASNPASDGLEA-IVT-VTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSSTPE
.. ..:. :.: ::: :. . . . .:.: : : .: . ..:
CCDS53 EGGTPTSPS--GVEEWIVTQVVPGVAAVPVEEETTAVPS-GETTAI-LEFTTEPENQTEW
690 700 710 720 730 740
430 440 450 460 470 480
pF1KB8 DPAEAPRTLLEFE-TQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALWA
.:: .: . :::: . ::. : . . :: ::
CCDS53 EPAYTPVGTSPLPGILPTWPPTGAATEEST---EGPSATEVPSASEEPSPSEVP------
750 760 770 780 790
490 500 510 520 530 540
pF1KB8 WPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPTE
.::: ::. : : . :. :.. . :. : :. : ::. : . .::.
CCDS53 FPSEEPSPSEE---PFPSVRPFPSVELFPSEEPF-PSKEPSPSEEPSASEEPYTPSPPVP
800 810 820 830 840
550 560 570 580
pF1KB8 T---LPTPRERNLASPSPSTLVEAREVGEATG---------GPELSGVPRGESEETGSSE
. ::. :. : .:.. . :...: : . ::.: :. . .: .
CCDS53 SWTELPSSGEE---SGAPDVSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTS
850 860 870 880 890 900
590 600 610 620 630 640
pF1KB8 GAPSLLPATRA-PEGTRE-LEAPSEDNSGRTAPAGTSV---QAQPVLPTDSASRGGVAVV
. : ::. . : : .: .: :: . :. :.:. . .:. : .. : : .
CCDS53 TVGSGLPVESGLPSGDEERIEWPSTPTVGEL-PSGAEILEGSASGVGDLSGLPSGEVLET
910 920 930 940 950 960
650 660 670 680 690 700
pF1KB8 PASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFS
:::
CCDS53 SASGVGDLSGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAP
970 980 990 1000 1010 1020
>--
initn: 706 init1: 650 opt: 703 Z-score: 374.6 bits: 82.0 E(32554): 1.5e-14
Smith-Waterman score: 705; 30.0% identity (53.5% similar) in 566 aa overlap (303-814:1859-2408)
280 290 300 310 320 330
pF1KB8 ARAYCQERGAEIATTGQLYAAWDGGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTL
:. :: : . .: : . .: . .
CCDS53 ITFVDTSLVEVAPTTFKEEEGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFT
1830 1840 1850 1860 1870 1880
340 350 360 370 380
pF1KB8 FLFPNQTGFPNKHSRFNVYCFR---DSAQPSAIPEASN-PASNPASDGLEAIVTVTETLE
:. .:.:. .. . : :. ::. .:. :.: :. . .. :..:..
CCDS53 SQTPEFSGLPSGIAEVSGESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDR--TLVESVT
1890 1900 1910 1920 1930 1940
390 400 410 420 430
pF1KB8 ELQLPQEATESES-----RGAIYSIPIM--EDGG--------GGSSTPE-DPAEAPRTLL
. ::: :. : :: . : : : .: .: : .: .:
CCDS53 QAPTAQEAGEGPSGILELSGAHSGAPDMSGEHSGFLDLSGLQSGLIEPSGEPPGTPYFSG
1950 1960 1970 1980 1990 2000
440 450 460 470
pF1KB8 EFETQSMVP------------PTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEV-EDEAL
.: . . : .:. : . : : . ..: .. : . :
CCDS53 DFASTTNVSGESSVAMGTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQL
2010 2020 2030 2040 2050 2060
480 490 500 510 520 530
pF1KB8 WAWPSELSSPGP-EASLPTEPAA--QEKSLSQAPARAVLQP----GASPLPDGESEASRP
. ...:. : .. :. :.. . .:. .. ... : ::: :.. : :
CCDS53 FESSGKVSTAGDISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGASAAPEASREDSGS
2070 2080 2090 2100 2110 2120
540 550 560 570 580
pF1KB8 PRVHGPPTETLPTPRERNLASPSP---STLVEAREVGEATGGPELSGVPRGESEETGSSE
: . .:: . .: :: : : . . . :::...::.:: :. .:.
CCDS53 PDL----SETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSD-VGTE-
2130 2140 2150 2160 2170 2180
590 600 610 620 630 640
pF1KB8 GAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGD
::.: :: . : : : : ::.:. :. .... .: . .. . . .
CCDS53 -APGLPSATPTASGDRT--EISGDLSGHTSQLGVVISTS--IPESEWTQQTQRPAETHLE
2190 2200 2210 2220 2230
650 660 670 680 690
pF1KB8 CVPSPCHNGGTCLEEEEGVRCLCLPGYGG-----------DLCDVGLRFCNPGWDAFQGA
: .: :: . :. : .. . . . :. ::. .::
CCDS53 IESSSLLYSG---EETHTVETATSPTDASIPASPEWKRESESTAADQEVCEEGWNKYQGH
2240 2250 2260 2270 2280 2290
700 710 720 730 740 750
pF1KB8 CYKHFSTRRSWEEAETQCRMYGAHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLW
::.:: :..: .:: .:: .::.:: :::::.:.:: ..::::::::::::::: :
CCDS53 CYRHFPDRETWVDAERRCREQQSHLSSIVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRW
2300 2310 2320 2330 2340 2350
760 770 780 790 800 810
pF1KB8 SDGVPLLYENWNPGQPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPP
::: :. .::: :.:::..: .::.::::.::..:.:.:::::::: .::: : ..
CCDS53 SDGHPMQFENWRPNQPDNFFAAGEDCVVMIWHEKGEWNDVPCNYHLPFTCKKGTATTYKR
2360 2370 2380 2390 2400 2410
820 830 840 850 860 870
pF1KB8 PELPLAQVFGRPRLRYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPAR
CCDS53 RLQKRSSRHPRRSRPSTAH
2420 2430
>>CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530 aa)
initn: 2306 init1: 1135 opt: 1257 Z-score: 658.6 bits: 134.6 E(32554): 2.3e-30
Smith-Waterman score: 1261; 47.5% identity (71.3% similar) in 432 aa overlap (29-454:23-438)
10 20 30 40 50
pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCH--
:..: .. : : .::. .:: .:::::.
CCDS53 MTTLLWVFVTLRVITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFI
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 --VHYLRPPPSRRAVLGSPRVKWTFLSRGREAEVLVARGVRVKVNEAYRFRVALPAYPAS
.: . :: . .::.::. .:. .:. .::: ::.:: ::. .:.:: :::
CCDS53 DPMHPVTTAPSTAPL--APRIKWSRVSKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 LTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQ
.:..: .. :: ::::.:::::.:::.:: ..:: :::.:: :: :.::...:. ::
CCDS53 PSDATLEVQSLRSNDSGVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQ
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 EACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRN
.:: . .: ::::::: ::: :..:::::::.::::::::.::::.:::: : :::::.
CCDS53 RACLQNSAIIATPEQLQAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 YGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDG
::. : .. :::::.::...::.: . :::.:..:: :.. ::..::::::: ::..
CCDS53 YGIRDTNETYDVYCFAEEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQA
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 GLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDS
:.: :: ::::: :::::: :::.: ::.:... ::::.:. ::... :. .
CCDS53 GMDMCSAGWLADRSVRYPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYT-G
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 AQPSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGA-IYSI-PIMEDG
. ::: : . . . . .. ::: :: ::.. ::.:.::. : .. ::.:
CCDS53 EDFVDIPE--NFFGVGGEEDI-TVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEV-
360 370 380 390 400
420 430 440 450 460 470
pF1KB8 GGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEV
: .: .: : : : . :.:.: :... :
CCDS53 ---SPSPLEP-EEP-----FTFAPEIGATAFAEVENETGEATRPWGFPTPGLGPATAFTS
410 420 430 440 450
480 490 500 510 520 530
pF1KB8 EDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPR
CCDS53 EDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYE
460 470 480 490 500 510
>--
initn: 1969 init1: 1022 opt: 1148 Z-score: 602.7 bits: 124.2 E(32554): 3e-27
Smith-Waterman score: 1148; 32.4% identity (58.3% similar) in 741 aa overlap (183-892:1807-2525)
160 170 180 190 200 210
pF1KB8 KVKGVVFLYREGSARYAFSFSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQT
:: ..:. . .. :. :. ... .
CCDS53 SQPFGITDLSGETSGVPDLSGQPSGLPGFSGATSGVPDLVSGTTSGSGESSGITFVDTSL
1780 1790 1800 1810 1820 1830
220 230 240 250 260
pF1KB8 VRY-PIQTPREACYG--DMDGFPGVRNYGVVDPDDLYDVYC-YAEDLNGELFLGDPPEKL
:. : .: : ...:.:. . . . . :: .. ... : .. ::
CCDS53 VEVAPTTFKEEEGLGSVELSGLPS-GEADLSGKSGMVDVSGQFSGTVDSSGFTSQTPEFS
1840 1850 1860 1870 1880 1890
270 280 290 300 310 320
pF1KB8 TLEE--ARAYCQERGAEIATTGQLYAAWDGGLDHCSPGW-LADGSVRYPIV-TPS-QRCG
: :.. . :::... : . .: : :.: .. .. .:. :. :
CCDS53 GLPSGIAEVSGESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQEAG
1900 1910 1920 1930 1940 1950
330 340 350 360 370 380
pF1KB8 GGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPSAIPEASNPASNPASDGLEAIVTV
: :. : : ..: :. .. . . .. : . : ...: ..: .: ....
CCDS53 EGPSGI--LELSGAHSGAPDMSGEHSGFLDLSGLQSGLIEPSGEPPGTPYFSG--DFAST
1960 1970 1980 1990 2000 2010
390 400 410 420 430
pF1KB8 TETLEELQLPQEATESESRGAIYSIPIMEDGGGGSSTP---EDPAEAP---RTLLEFETQ
:.. : .. . .: .:. : : . : . : .. .. : .: ::..
CCDS53 TNVSGESSVAM-GTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQLFESS
2020 2030 2040 2050 2060 2070
440 450 460 470 480 490
pF1KB8 SMVPPTG-FSEEE----GKALEEEEKYEDEEEKEEEEEEEEVEDEALWAWPSELSSPGPE
. : .: .: :...: :. : : . : : :. .: .:.
CCDS53 GKVSTAGDISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGASAAPEA--SREDSGSPD
2080 2090 2100 2110 2120
500 510 520 530 540 550
pF1KB8 ASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPTETLPTPRER-NL
: : : .: .: .. . .: ..: : :.::: :.: : : : . : .:
CCDS53 LS-ETTSAFHEANLERSSGLGV---SGSTLTFQEGEASAAPEVSGESTTTSDVGTEAPGL
2130 2140 2150 2160 2170 2180
560 570 580 590 600 610
pF1KB8 ASPSPSTLVEAREV-GEATGGPELSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAP
: .:.. . :. :. .: :: . : :: . . . : : :.:.
CCDS53 PSATPTASGDRTEISGDLSGHTSQLGVVISTS--IPESEWTQQ---TQRPAETHLEIESS
2190 2200 2210 2220 2230
620 630 640 650 660
pF1KB8 SEDNSGR--------TAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGTCL
: ::. :.:. .:. :.: .: : .:..:: . :. :: ..:::
CCDS53 SLLYSGEETHTVETATSPTDASIPASPEWKRESES---TAAAPARS-CAEEPC-GAGTCK
2240 2250 2260 2270 2280 2290
670 680 690 700 710 720
pF1KB8 EEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYGAH
: : : ::: ::: :. :.. . :. ::. .:: ::.:: :..: .:: .:: .:
CCDS53 ETEGHVICLCPPGYTGEHCNIDQEVCEEGWNKYQGHCYRHFPDRETWVDAERRCREQQSH
2300 2310 2320 2330 2340 2350
730 740 750 760 770 780
pF1KB8 LASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGE
:.:: :::::.:.:: ..::::::::::::::: :::: :. .::: :.:::..: .::
CCDS53 LSSIVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHPMQFENWRPNQPDNFFAAGE
2360 2370 2380 2390 2400 2410
790 800 810 820 830 840
pF1KB8 NCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRY
.::::.::..:.:.:::::::: .::: : :.:: :: . :..::. . :::.....::
CCDS53 DCVVMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPVVEHARTFGQKKDRYEINSLVRY
2420 2430 2440 2450 2460 2470
850 860 870 880 890 900
pF1KB8 RCREGLAQRNLPLIRCQENGRWEAPQISCV-PRRPARALHPEEDPEGRQGRLLGRWKALL
.: ::..::..: :::: .:.:: :::.:. : : :. . . . :..:
CCDS53 QCTEGFVQRHMPTIRCQPSGHWEEPQITCTDPTTYKRRLQKRSSRHPRRSRPSTAH
2480 2490 2500 2510 2520 2530
910
pF1KB8 IPPSSPMPGP
>--
initn: 938 init1: 868 opt: 1024 Z-score: 539.1 bits: 112.5 E(32554): 1.1e-23
Smith-Waterman score: 1024; 39.1% identity (59.7% similar) in 514 aa overlap (156-648:477-969)
130 140 150 160 170 180
pF1KB8 ELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACARIGAH
:::: :: : .::...: ::.:: : ::
CCDS53 TPGLGPATAFTSEDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAV
450 460 470 480 490 500
190 200 210 220 230 240
pF1KB8 IATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVVDPDDL
::.:::: ::: .:::::::::: :::::::: .:: : :: :. ::::.::: .
CCDS53 IASPEQLQAAYEAGYEQCDAGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTET
510 520 530 540 550 560
250 260 270 280 290 300
pF1KB8 YDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDHCSPGW
:::::... :.::.:.. :..:..:: .:. ..: .::::::::::. :::.: ::
CCDS53 YDVYCFVDRLEGEVFFATRLEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDKCYAGW
570 580 590 600 610 620
310 320 330 340 350 360
pF1KB8 LADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRD-SAQPSAIPE
:::::.::::::: ::: :::.:..:.:::::.:. :: ...::: :: :: :
CCDS53 LADGSLRYPIVTPRPACGGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEE
630 640 650 660 670 680
370 380 390 400 410 420
pF1KB8 ASNPASNPASDGLEA-IVT-VTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSSTPE
.. ..:. :.: ::: :. . . . .:.: : : .: . ..:
CCDS53 EGGTPTSPS--GVEEWIVTQVVPGVAAVPVEEETTAVPS-GETTAI-LEFTTEPENQTEW
690 700 710 720 730 740
430 440 450 460 470 480
pF1KB8 DPAEAPRTLLEFE-TQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEALWA
.:: .: . :::: . ::. : . . :: ::
CCDS53 EPAYTPVGTSPLPGILPTWPPTGAATEEST---EGPSATEVPSASEEPSPSEVP------
750 760 770 780 790
490 500 510 520 530 540
pF1KB8 WPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPPTE
.::: ::. : : . :. :.. . :. : :. : ::. : . .::.
CCDS53 FPSEEPSPSEE---PFPSVRPFPSVELFPSEEPF-PSKEPSPSEEPSASEEPYTPSPPVP
800 810 820 830 840
550 560 570 580
pF1KB8 T---LPTPRERNLASPSPSTLVEAREVGEATG---------GPELSGVPRGESEETGSSE
. ::. :. : .:.. . :...: : . ::.: :. . .: .
CCDS53 SWTELPSSGEE---SGAPDVSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTS
850 860 870 880 890 900
590 600 610 620 630 640
pF1KB8 GAPSLLPATRA-PEGTRE-LEAPSEDNSGRTAPAGTSV---QAQPVLPTDSASRGGVAVV
. : ::. . : : .: .: :: . :. :.:. . .:. : .. : : .
CCDS53 TVGSGLPVESGLPSGDEERIEWPSTPTVGEL-PSGAEILEGSASGVGDLSGLPSGEVLET
910 920 930 940 950 960
650 660 670 680 690 700
pF1KB8 PASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFS
:::
CCDS53 SASGVGDLSGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAP
970 980 990 1000 1010 1020
>>CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321 aa)
initn: 2021 init1: 1037 opt: 1144 Z-score: 604.2 bits: 123.6 E(32554): 2.5e-27
Smith-Waterman score: 1168; 36.3% identity (60.2% similar) in 661 aa overlap (4-639:9-638)
10 20 30 40 50
pF1KB8 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTI
: : .: :... . . :. :.:: :..... :.. .:..:. ...
CCDS12 MGAPFVWALGLLMLQMLLFVAGEQGTQDIT--DASE-RGLHMQKLGSGSVQAALAELVAL
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 PCHVHYLRPPPSRRAVLGSPRVKWTFL--SRGREAE--VLVARGVRVKVNEAYRFRVALP
:: . :.: :: :. .::.::: . . :.. . .:::. :.: .... ::.::
CCDS12 PC-LFTLQPRPS--AARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 AYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFS
.:: ....: :. :: .:::.:::.: .::.: .: : ..: :::: :: . :::..
CCDS12 SYPRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALT
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 FSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGF
:. ::::: .: ::.:..: ::. :...::::::::.:::::: : .:::: ...
CCDS12 FAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSL
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 PGVRNYGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLY
::::.:: .:..::::::.:..:.::.: : ..::: ::: :...:: .:..:::.
CCDS12 PGVRSYGRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLH
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 AAWDGGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVY
:: :::.:.::::::::::::: :: .:::: :::.:.. : :.::::. ::..:
CCDS12 LAWHEGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAY
300 310 320 330 340 350
360 370 380 390 400
pF1KB8 CFRDSAQPSAIPEASNPASNPASDGLEA----IVTVTETLEELQL--PQEATESESRGAI
::: : . .:.:. .. : : . . :::: .. :. : :
CCDS12 CFRAHHPTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEE
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB8 YSIPIMEDGGGG----SSTPEDPAEAPRTLLEFETQSMVP-PTGFSEEEGKALEEEEKYE
.. :.:. . : :: :: : : ....: :. .. . . . :
CCDS12 ETL-ILEEKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT
420 430 440 450 460 470
470 480 490 500 510
pF1KB8 DEEEKEEEEEEEEVEDEALWAWPSELSSPGPEASL--PTEPAA---QEKSLSQAPARAVL
: ... . . : . : ::: :: :: .: :..: . .:
CCDS12 DPMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMA-VTEML
480 490 500 510 520 530
520 530 540 550 560 570
pF1KB8 QPGAS--PLPDGESEASRPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATGGPE
: : : : .:.. : . . .. : : : :.: :
CCDS12 GSGQSRSPWADLTNEVDMPG-AGSAGGKSSPEPWLW------PPTMVP----------PS
540 550 560 570
580 590 600 610 620 630
pF1KB8 LSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAPSEDNSGRTAPA---GTSVQAQPV
.:: :. : ..:: :: ::: :. . .: : . . .:: . : ..:
CCDS12 ISGHSRAPVLELEKAEG-PSARPAT--PD---LFWSPLEATVSAPSPAPWEAFPVATSPD
580 590 600 610 620
640 650 660 670 680 690
pF1KB8 LPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNP
:: . ::
CCDS12 LPMMAMLRGPKEWMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQ
630 640 650 660 670 680
>--
initn: 1045 init1: 956 opt: 1026 Z-score: 543.6 bits: 112.4 E(32554): 5.9e-24
Smith-Waterman score: 1042; 34.2% identity (58.4% similar) in 620 aa overlap (282-878:703-1279)
260 270 280 290 300
pF1KB8 AEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLDHCSPG-W-----
:.. ::. : . .: : . :
CCDS12 AETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNR
680 690 700 710 720 730
310 320 330 340 350 360
pF1KB8 -LADGSVRYPIVTPSQRCG-GGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQPSAIP
.: : : : : .. : :.:: .. . .. :.. . .: .: ::.
CCDS12 NVAVGFV--PTETATEPTGLRGIPGSESGVFDTAES--PTSGLQATVDEVQDP-WPSVYS
740 750 760 770 780
370 380 390 400 410
pF1KB8 ---EASNPASNPASDGLEAIVTVTETLEELQLPQEA-TESESRGAIYSIP-----IMEDG
.::.:.. .: :. . :: .:: .:. : . ... : : : :
CCDS12 KGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPG
790 800 810 820 830 840
420 430 440 450 460 470
pF1KB8 GGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKA-LEEEEKYEDEEEKEEEEEEEE
. :. . .:.. :. :.: : :. :. . . . . : :..
CCDS12 SQVFEEAESTTLSPQVALD---TSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQ
850 860 870 880 890 900
480 490 500 510 520 530
pF1KB8 VEDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPP
:: .. . : ::.: . : . :.. :: : :. . .. : .: :
CCDS12 VETQG---------TSG--ASVPPH---QSSPLGK-PAVPPGTPTAASVGESASVSSGEP
910 920 930 940
540 550 560 570 580 590
pF1KB8 RVHGPPTETLPTPRERNLASPSPSTL-VEAREVGEATGGPELSGVPRGESEETGSSEGAP
: :. :: : :: .: :. .:.: :: .. ::..:.: :
CCDS12 TVPWDPSSTL-----------LPVTLGIEDFELEVLAGSP---GV-ESFWEEVASGE-EP
950 960 970 980 990
600 610 620 630 640
pF1KB8 SLLPATRAPEGTRELEA-PSEDNSGRTAPAGTSVQAQPVLPTDSASRG--GVAVVPASGD
.: :.: :..:... : :.: : . .:. .. : ..: : :
CCDS12 AL-PGTPMNAGAEEVHSDPCENNP---CLHGGTCNANGTMYGCSCDQGFAGENCEIDIDD
1000 1010 1020 1030 1040
650 660 670 680 690 700
pF1KB8 CVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSW
:. :::.:::::..: .: :::::.:::..:. . :. :: ::: ::..:. ::.:
CCDS12 CLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCYRYFAHRRAW
1050 1060 1070 1080 1090 1100
710 720 730 740 750 760
pF1KB8 EEAETQCRMYGAHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENW
:.:: .:: ..::.:. .:::..:::. .: ::::::: .: :: :.:.. : .:::
CCDS12 EDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTGLQFENW
1110 1120 1130 1140 1150 1160
770 780 790 800 810 820
pF1KB8 NPGQPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGR
.:::..: .::.::::: :..:.:.::::::.: :.:: : : ::::: . :...:
CCDS12 RENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVENASLIGA
1170 1180 1190 1200 1210 1220
830 840 850 860 870 880
pF1KB8 PRLRYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQISCV-PRRPARALHPEEDPEG
. .:.: ...::.: ::.::... :::. ::.:. ::: :. ::: :
CCDS12 RKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRHHHHHQH
1230 1240 1250 1260 1270 1280
890 900 910
pF1KB8 RQGRLLGRWKALLIPPSSPMPGP
CCDS12 HHQHHHHKSRKERRKHKKHPTEDWEKDEGNFC
1290 1300 1310 1320
>>CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642 aa)
initn: 2211 init1: 1021 opt: 1103 Z-score: 581.9 bits: 119.8 E(32554): 4.3e-26
Smith-Waterman score: 1124; 34.1% identity (62.4% similar) in 619 aa overlap (36-637:23-617)
10 20 30 40 50 60
pF1KB8 LPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPP
.:... . :..: :.: ...::: .
CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMPTL
10 20 30 40 50
70 80 90 100 110
pF1KB8 PSRRAVLGSPRVKWTFL---SRGR---EAEVLVARGVRVKVNEAYRFRVALPAYPASLTD
: . :.::. . . :. :. ::::.. .:... :. ::..:..: .. :
CCDS54 PPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAVGD
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 VSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEAC
.::.. .: .:.:.:::.:..::.:..:.: . : :::: :: ...::...: .::.::
CCDS54 ASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQKAC
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 ARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGV
.:: :::::::.::: :.::::::::.::::::::..:: .:::: : :::.::
CCDS54 LDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTYGF
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 VDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLD
.:.. ::::::.. :.:..: : :.:.::: :... :..::.:.: ::: .:.:
CCDS54 RSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNGFD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 HCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQP
.:. :::.:.:::.:... .::::: ::.::. : :::::: :::..:::. .
CCDS54 QCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKEAT
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 ----SAIPEASNPA--SNP--ASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIM
: . :...:. ..: .:: :. ... .:: :: : : :.
CCDS54 TIDLSILAETASPSLSKEPQMVSDRTTPIIPLVD-----ELPVIPTEFPPVGNIVSFE--
360 370 380 390 400
420 430 440 450 460 470
pF1KB8 EDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEE
.. :. ... : : : : : ... .: : . : ::: .
CCDS54 ---QKATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKEEVLQS
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB8 EE-VEDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEAS
: : .: . . : . : ..: ... .: . .. . .:. : ..
CCDS54 TTGVSHYATDSWDGVV-----EDKQTQESVTQIEQIEVGPLVTSMEI-LKHIPSKEFPVT
470 480 490 500 510
540 550 560 570 580
pF1KB8 RPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATG--GPELSGVPRGESEETGSS
. : : . : . :....: . : :: . . : . : : . : .: :
CCDS54 ETPLVTA--RMILESKTEKKMVS-TVSELVTTGHYGFTLGEEDDEDRTLTVGSDESTLIF
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB8 EGAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASG
. : .. .... : : ... :: ... :.:.:. ..: ...:
CCDS54 DQIPEVITVSKTSEDT--IHTHLED--LESVSASTTVSPL-IMPDNNGSSMDDWEERQTS
580 590 600 610 620
650 660 670 680 690 700
pF1KB8 DCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRS
CCDS54 GRITEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTE
630 640 650 660 670 680
>--
initn: 1216 init1: 1006 opt: 1042 Z-score: 550.6 bits: 114.0 E(32554): 2.4e-24
Smith-Waterman score: 1042; 36.3% identity (59.7% similar) in 477 aa overlap (418-872:1133-1599)
390 400 410 420 430 440
pF1KB8 EELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEFETQSMVP-PTGFS
: ::. :. . :.:. : : ..
CCDS54 SYPPGAVTEHKVKTDEVVTLTPRIGPKVSLSPGPEQKYETEGSSTTGFTSSLSPFSTHIT
1110 1120 1130 1140 1150 1160
450 460 470 480 490 500
pF1KB8 EEEGKALEEEEKYEDEEEK----EEEEEEEEVEDEALWAW-PSELSSPGPEAS-LPTEPA
. .. :. . :: . :. . : .: .. . ::.... .. : : :
CCDS54 QLMEETTTEKTSLEDIDLGSGLFEKPKATELIEFSTIKVTVPSDITTAFSSVDRLHTTSA
1170 1180 1190 1200 1210 1220
510 520 530 540 550
pF1KB8 AQEKS-LSQAPARAVLQPGASPLPD----GESEASRPPR----VHGPPTETLPTPRERNL
. .: ... : .:: : ::: . :: . . ::: ::
CCDS54 FKPSSAITKKPPLIDREPGEETTSDMVIIGESTSHVPPTTLEDIVAKETET-DIDREYFT
1230 1240 1250 1260 1270 1280
560 570 580 590 600
pF1KB8 ASPSPST------LVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATRAPEGTR
.: :.: :: .:. ::. ..:. . . .. . . :
CCDS54 TSSPPATQPTRPPTVEDKEAF----GPQALSTPQPPASTKFHPDINVYIIEVRENKTGPD
1290 1300 1310 1320 1330
610 620 630 640 650 660
pF1KB8 ELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEE
. . :.: :. :: . .: :... . .: .::.::.::..
CCDS54 RCKMNPCLNGGTCYPTETSY-VCTCVPGYSGDQCELDF----DECHSNPCRNGATCVDGF
1340 1350 1360 1370 1380 1390
670 680 690 700 710 720
pF1KB8 EGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYGAHLAS
. ::::::.: : ::. . :. :: ::: :::.:. ::.:. :: .::. ::::.:
CCDS54 NTFRCLCLPSYVGALCEQDTETCDYGWHKFQGQCYKYFAHRRTWDAAERECRLQGAHLTS
1400 1410 1420 1430 1440 1450
730 740 750 760 770 780
pF1KB8 ISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGENCV
: . ::: :.: ..::::::::. .: :: :.:: : :::: :.::::.: .::.::
CCDS54 ILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFRWTDGSTLQYENWRPNQPDSFFSAGEDCV
1460 1470 1480 1490 1500 1510
790 800 810 820 830 840
pF1KB8 VMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRYRCR
:..::..:::.::::::::.:::: : :.:: :: . :..::. . :::.....::.:.
CCDS54 VIIWHENGQWNDVPCNYHLTYTCKKGTVACGQPPVVENAKTFGKMKPRYEINSLIRYHCK
1520 1530 1540 1550 1560 1570
850 860 870 880 890 900
pF1KB8 EGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGRLLGRWKALLIPPS
.:. ::.:: ::: :::: :.:.:.
CCDS54 DGFIQRHLPTIRCLGNGRWAIPKITCMNPSAYQRTYSMKYFKNSSSAKDNSINTSKHDHR
1580 1590 1600 1610 1620 1630
>>CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 (655 aa)
initn: 2395 init1: 1013 opt: 1092 Z-score: 581.3 bits: 118.3 E(32554): 4.7e-26
Smith-Waterman score: 1623; 34.3% identity (53.3% similar) in 843 aa overlap (36-872:23-612)
10 20 30 40 50 60
pF1KB8 LPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPP
.:... . :..: :.: ...::: .
CCDS47 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMPTL
10 20 30 40 50
70 80 90 100 110
pF1KB8 PSRRAVLGSPRVKWTFL---SRGR---EAEVLVARGVRVKVNEAYRFRVALPAYPASLTD
: . :.::. . . :. :. ::::.. .:... :. ::..:..: .. :
CCDS47 PPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAVGD
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 VSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEAC
.::.. .: .:.:.:::.:..::.:..:.: . : :::: :: ...::...: .::.::
CCDS47 ASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQKAC
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 ARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGV
.:: :::::::.::: :.::::::::.::::::::..:: .:::: : :::.::
CCDS47 LDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTYGF
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 VDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLD
.:.. ::::::.. :.:..: : :.:.::: :... :..::.:.: ::: .:.:
CCDS47 RSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNGFD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 HCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQP
.:. :::.:.:::.:... .::::: ::.::. : :::::: :::..:::. .:
CCDS47 QCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFK---RP
300 310 320 330 340
360 370 380 390 400 410
pF1KB8 SAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSS
. :: : ::.
CCDS47 DRCK--MNPCLN--------------------------------------------GGTC
350 360
420 430 440 450 460 470
pF1KB8 TPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEEEEVEDEAL
: . . . . :: :.: : :. : . .:
CCDS47 YPTETSYV---------CTCVP--GYS---G----------DQCELDFDE----------
370 380
480 490 500 510 520 530
pF1KB8 WAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEASRPPRVHGPP
CCDS47 ------------------------------------------------------------
540 550 560 570 580 590
pF1KB8 TETLPTPRERNLASPSPSTLVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLLPATR
CCDS47 ------------------------------------------------------------
600 610 620 630 640 650
pF1KB8 APEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGG
: .::.::.
CCDS47 --------------------------------------------------CHSNPCRNGA
390
660 670 680 690 700 710
pF1KB8 TCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMY
::.. . ::::::.: : ::. . :. :: ::: :::.:. ::.:. :: .::.
CCDS47 TCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQGQCYKYFAHRRTWDAAERECRLQ
400 410 420 430 440 450
720 730 740 750 760 770
pF1KB8 GAHLASISTPEEQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFL
::::.:: . ::: :.: ..::::::::. .: :: :.:: : :::: :.::::.:
CCDS47 GAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFRWTDGSTLQYENWRPNQPDSFFS
460 470 480 490 500 510
780 790 800 810 820 830
pF1KB8 SGENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTV
.::.:::..::..:::.::::::::.:::: : :.:: :: . :..::. . :::....
CCDS47 AGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQPPVVENAKTFGKMKPRYEINSL
520 530 540 550 560 570
840 850 860 870 880 890
pF1KB8 LRYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGRLLGRWKA
.::.:..:. ::.:: ::: :::: :.:.:.
CCDS47 IRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAYQRTYSMKYFKNSSSAKDNSINT
580 590 600 610 620 630
900 910
pF1KB8 LLIPPSSPMPGP
CCDS47 SKHDHRWSRRWQESRR
640 650
>>CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396 aa)
initn: 2178 init1: 1021 opt: 1103 Z-score: 578.0 bits: 120.1 E(32554): 7.1e-26
Smith-Waterman score: 1124; 34.1% identity (62.4% similar) in 619 aa overlap (36-637:23-617)
10 20 30 40 50 60
pF1KB8 LPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPP
.:... . :..: :.: ...::: .
CCDS40 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMPTL
10 20 30 40 50
70 80 90 100 110
pF1KB8 PSRRAVLGSPRVKWTFL---SRGR---EAEVLVARGVRVKVNEAYRFRVALPAYPASLTD
: . :.::. . . :. :. ::::.. .:... :. ::..:..: .. :
CCDS40 PPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAVGD
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 VSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEAC
.::.. .: .:.:.:::.:..::.:..:.: . : :::: :: ...::...: .::.::
CCDS40 ASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQKAC
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 ARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGV
.:: :::::::.::: :.::::::::.::::::::..:: .:::: : :::.::
CCDS40 LDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTYGF
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 VDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLD
.:.. ::::::.. :.:..: : :.:.::: :... :..::.:.: ::: .:.:
CCDS40 RSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNGFD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 HCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQP
.:. :::.:.:::.:... .::::: ::.::. : :::::: :::..:::. .
CCDS40 QCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKEAT
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 ----SAIPEASNPA--SNP--ASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIM
: . :...:. ..: .:: :. ... .:: :: : : :.
CCDS40 TIDLSILAETASPSLSKEPQMVSDRTTPIIPLVD-----ELPVIPTEFPPVGNIVSFE--
360 370 380 390 400
420 430 440 450 460 470
pF1KB8 EDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEEEKYEDEEEKEEEEEE
.. :. ... : : : : : ... .: : . : ::: .
CCDS40 ---QKATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKEEVLQS
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB8 EE-VEDEALWAWPSELSSPGPEASLPTEPAAQEKSLSQAPARAVLQPGASPLPDGESEAS
: : .: . . : . : ..: ... .: . .. . .:. : ..
CCDS40 TTGVSHYATDSWDGVV-----EDKQTQESVTQIEQIEVGPLVTSMEI-LKHIPSKEFPVT
470 480 490 500 510
540 550 560 570 580
pF1KB8 RPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATG--GPELSGVPRGESEETGSS
. : : . : . :....: . : :: . . : . : : . : .: :
CCDS40 ETPLVTA--RMILESKTEKKMVS-TVSELVTTGHYGFTLGEEDDEDRTLTVGSDESTLIF
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB8 EGAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQPVLPTDSASRGGVAVVPASG
. : .. .... : : ... :: ... :.:.:. ..: ...:
CCDS40 DQIPEVITVSKTSEDT--IHTHLED--LESVSASTTVSPL-IMPDNNGSSMDDWEERQTS
580 590 600 610 620
650 660 670 680 690 700
pF1KB8 DCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRS
CCDS40 GRITEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTE
630 640 650 660 670 680
>--
initn: 1206 init1: 1006 opt: 1065 Z-score: 558.5 bits: 116.5 E(32554): 8.7e-25
Smith-Waterman score: 1073; 35.1% identity (60.0% similar) in 573 aa overlap (329-872:2814-3353)
300 310 320 330 340 350
pF1KB8 DHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQ
:.:. . .:: :. : ...: ...
CCDS40 TTHLMDQSVTEVPDVMEGSNPPYYTDTTLAVSTFAKLSSQT--PS--SPLTIYSGSEASG
2790 2800 2810 2820 2830
360 370 380 390 400 410
pF1KB8 PSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGS
. ::. :.. :. : .... ....:... ::: . : . : : . .
CCDS40 HTEIPQ---PSALPGIDVGSSVMSPQDSFKEIHVNIEATFKPSSEEY--LHITEPPSLSP
2840 2850 2860 2870 2880 2890
420 430 440 450 460
pF1KB8 STPEDPAE---APRTLLEFETQS--MVPPTG------FSEEE-----GKALEEEEKYEDE
.: .:.: :. : :.:.. .. : :... :.:.. .
CCDS40 DTKLEPSEDDGKPELLEEMEASPTELIAVEGTEILQDFQNKTDGQVSGEAIKMFPTIKTP
2900 2910 2920 2930 2940 2950
470 480 490 500 510
pF1KB8 EEKEEEEEEEEVEDEALWAWPSELSSP---GPEASL-P-TEPAAQEK-SLSQAP-----A
: .:.: :. :: :. : ::.. : : ..:. .::..: .
CCDS40 EAGTVITTADEIELEGATQWPHSTSASATYGVEAGVVPWLSPQTSERPTLSSSPEINPET
2960 2970 2980 2990 3000 3010
520 530 540 550 560
pF1KB8 RAVLQPGASPLPDGESEASRPPRVHGPPTETLPTPRERN--LASPSPSTLVEAREVGEAT
.:.: : . . :: . :. .. .: : : .:.: : .:.:. . .
CCDS40 QAALIRGQDSTI-AASEQQVAARILDSNDQATVNPVEFNTEVATP-PFSLLETSNETDF-
3020 3030 3040 3050 3060 3070
570 580 590 600 610 620
pF1KB8 GGPELSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQP
: :. .:: : ::. ::. :. : : :.: :. :: .
CCDS40 ----LIGI----NEE--SVEGTAIYLPG---PD--RCKMNPCL-NGGTCYPTETSY-VCT
3080 3090 3100 3110
630 640 650 660 670 680
pF1KB8 VLPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCN
.: :... . .: .::.::.::.. . ::::::.: : ::. . :.
CCDS40 CVPGYSGDQCELDF----DECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCD
3120 3130 3140 3150 3160 3170
690 700 710 720 730 740
pF1KB8 PGWDAFQGACYKHFSTRRSWEEAETQCRMYGAHLASISTPEEQDFINNRYREYQWIGLND
:: ::: :::.:. ::.:. :: .::. ::::.:: . ::: :.: ..::::::::
CCDS40 YGWHKFQGQCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLND
3180 3190 3200 3210 3220 3230
750 760 770 780 790 800
pF1KB8 RTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCK
. .: :: :.:: : :::: :.::::.: .::.:::..::..:::.::::::::.::::
CCDS40 KMFEHDFRWTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCK
3240 3250 3260 3270 3280 3290
810 820 830 840 850 860
pF1KB8 MGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQI
: :.:: :: . :..::. . :::.....::.:..:. ::.:: ::: :::: :.:
CCDS40 KGTVACGQPPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKI
3300 3310 3320 3330 3340 3350
870 880 890 900 910
pF1KB8 SCVPRRPARALHPEEDPEGRQGRLLGRWKALLIPPSSPMPGP
.:.
CCDS40 TCMNPSAYQRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
3360 3370 3380 3390
>>CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409 aa)
initn: 2178 init1: 1021 opt: 1093 Z-score: 574.7 bits: 119.0 E(32554): 1.1e-25
Smith-Waterman score: 1182; 33.6% identity (60.9% similar) in 654 aa overlap (36-649:23-657)
10 20 30 40 50 60
pF1KB8 LPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPP
.:... . :..: :.: ...::: .
CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMPTL
10 20 30 40 50
70 80 90 100 110
pF1KB8 PSRRAVLGSPRVKWTFL---SRGR---EAEVLVARGVRVKVNEAYRFRVALPAYPASLTD
: . :.::. . . :. :. ::::.. .:... :. ::..:..: .. :
CCDS54 PPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAVGD
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 VSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEAC
.::.. .: .:.:.:::.:..::.:..:.: . : :::: :: ...::...: .::.::
CCDS54 ASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQKAC
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 ARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGV
.:: :::::::.::: :.::::::::.::::::::..:: .:::: : :::.::
CCDS54 LDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTYGF
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 VDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDGGLD
.:.. ::::::.. :.:..: : :.:.::: :... :..::.:.: ::: .:.:
CCDS54 RSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNGFD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 HCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQP
.:. :::.:.:::.:... .::::: ::.::. : :::::: :::..:::. .
CCDS54 QCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKRRMSD
300 310 320 330 340 350
360 370 380 390 400
pF1KB8 SAI---P--------EASNPASNPASDGLEAIVTVTETLEELQL--PQEATESESRGA--
.. : : . ..:. : . :. . :..: .: : : . :
CCDS54 LSVIGHPIDSESKEDEPCSEETDPVHDLMAEILPEFPDIIEIDLYHSEENEEEEEECANA
360 370 380 390 400 410
410 420 430 440 450
pF1KB8 --IYSIPIMEDGGGG---SSTPEDPAEAPRTLLEFETQSMVPPTGFSEEEGKALEEE--E
. . : .. .: ...:.:: : .:: :..: .::. . .
CCDS54 TDVTTTPSVQYINGKHLVTTVPKDPEAAEARRGQFE--SVAPSQNFSDSSESDTHPFVIA
420 430 440 450 460 470
460 470 480 490 500 510
pF1KB8 KYEDEEEKEEEEEEEEVED-EALW---AWP--SELSSPGPEASLPTEPAAQEKSLSQAPA
: : . .: : .:. :. : ..: :: : : .:: : .: . :
CCDS54 KTELSTAVQPNESTETTESLEVTWKPETYPETSEHFSGGEPDVFPTVPFHEEFESGTA--
480 490 500 510 520
520 530 540 550 560 570
pF1KB8 RAVLQPGASPLPDGESEASRPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATGG
. :: . . ..:... . : :. .: ..: . : . .. :.: :
CCDS54 ----KKGAESVTERDTEVGHQAHEHTEPVSLFPEESSGEIAIDQESQKIAFARATEVTFG
530 540 550 560 570 580
580 590 600 610 620
pF1KB8 PELSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEA------PSEDNSGRTAPAGTSV
:. :.. : .:...:.. : . : :: : :. : . :
CCDS54 EEV--------EKSTSVTYTPTIVPSS-ASAYVSEEEAVTLIGNPWPDDLLSTKESW--V
590 600 610 620 630
630 640 650 660 670 680
pF1KB8 QAQPVLPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGL
.: : .. .. ... .. .::.
CCDS54 EATPRQVVELSGSSSIPITEGSGEAEEDEDTMFTMVTDLSQRNTTDTLITLDTSRIITES
640 650 660 670 680 690
>--
initn: 1227 init1: 1006 opt: 1065 Z-score: 560.4 bits: 116.3 E(32554): 6.8e-25
Smith-Waterman score: 1073; 35.1% identity (60.0% similar) in 573 aa overlap (329-872:1827-2366)
300 310 320 330 340 350
pF1KB8 DHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVYCFRDSAQ
:.:. . .:: :. : ...: ...
CCDS54 TTHLMDQSVTEVPDVMEGSNPPYYTDTTLAVSTFAKLSSQT--PS--SPLTIYSGSEASG
1800 1810 1820 1830 1840 1850
360 370 380 390 400 410
pF1KB8 PSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGS
. ::. :.. :. : .... ....:... ::: . : . : : . .
CCDS54 HTEIPQ---PSALPGIDVGSSVMSPQDSFKEIHVNIEATFKPSSEEY--LHITEPPSLSP
1860 1870 1880 1890 1900
420 430 440 450 460
pF1KB8 STPEDPAE---APRTLLEFETQS--MVPPTG------FSEEE-----GKALEEEEKYEDE
.: .:.: :. : :.:.. .. : :... :.:.. .
CCDS54 DTKLEPSEDDGKPELLEEMEASPTELIAVEGTEILQDFQNKTDGQVSGEAIKMFPTIKTP
1910 1920 1930 1940 1950 1960
470 480 490 500 510
pF1KB8 EEKEEEEEEEEVEDEALWAWPSELSSP---GPEASL-P-TEPAAQEK-SLSQAP-----A
: .:.: :. :: :. : ::.. : : ..:. .::..: .
CCDS54 EAGTVITTADEIELEGATQWPHSTSASATYGVEAGVVPWLSPQTSERPTLSSSPEINPET
1970 1980 1990 2000 2010 2020
520 530 540 550 560
pF1KB8 RAVLQPGASPLPDGESEASRPPRVHGPPTETLPTPRERN--LASPSPSTLVEAREVGEAT
.:.: : . . :: . :. .. .: : : .:.: : .:.:. . .
CCDS54 QAALIRGQDSTI-AASEQQVAARILDSNDQATVNPVEFNTEVATP-PFSLLETSNETDF-
2030 2040 2050 2060 2070 2080
570 580 590 600 610 620
pF1KB8 GGPELSGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAPSEDNSGRTAPAGTSVQAQP
: :. .:: : ::. ::. :. : : :.: :. :: .
CCDS54 ----LIGI----NEE--SVEGTAIYLPG---PD--RCKMNPCL-NGGTCYPTETSY-VCT
2090 2100 2110 2120
630 640 650 660 670 680
pF1KB8 VLPTDSASRGGVAVVPASGDCVPSPCHNGGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCN
.: :... . .: .::.::.::.. . ::::::.: : ::. . :.
CCDS54 CVPGYSGDQCELDF----DECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCD
2130 2140 2150 2160 2170 2180
690 700 710 720 730 740
pF1KB8 PGWDAFQGACYKHFSTRRSWEEAETQCRMYGAHLASISTPEEQDFINNRYREYQWIGLND
:: ::: :::.:. ::.:. :: .::. ::::.:: . ::: :.: ..::::::::
CCDS54 YGWHKFQGQCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLND
2190 2200 2210 2220 2230 2240
750 760 770 780 790 800
pF1KB8 RTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCK
. .: :: :.:: : :::: :.::::.: .::.:::..::..:::.::::::::.::::
CCDS54 KMFEHDFRWTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCK
2250 2260 2270 2280 2290 2300
810 820 830 840 850 860
pF1KB8 MGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQI
: :.:: :: . :..::. . :::.....::.:..:. ::.:: ::: :::: :.:
CCDS54 KGTVACGQPPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKI
2310 2320 2330 2340 2350 2360
870 880 890 900 910
pF1KB8 SCVPRRPARALHPEEDPEGRQGRLLGRWKALLIPPSSPMPGP
.:.
CCDS54 TCMNPSAYQRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR
2370 2380 2390 2400
>>CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 (360 aa)
initn: 670 init1: 510 opt: 821 Z-score: 445.5 bits: 92.3 E(32554): 1.7e-18
Smith-Waterman score: 821; 44.0% identity (66.1% similar) in 327 aa overlap (37-354:47-358)
10 20 30 40 50 60
pF1KB8 PLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVL---GGALTIPCHVHYLR
:... ..: . .. :... .::. .:
CCDS10 GLPFYNGFYYSNSANDQNLGNGHGKDLLNGVKLVVETPEETLFTYQGASVILPCRYRYEP
20 30 40 50 60 70
70 80 90 100 110 120
pF1KB8 PPPSRRAVLGSPRVKWTFLSRGR--EAEVLVARGVRVKVNEAYRFRVALPAYPASLTDVS
: : : :::: ::.. : .:::: :.: . :. :: : . :::
CCDS10 ALVSPRRV----RVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHL--RQDKEHDVS
80 90 100 110 120 130
130 140 150 160 170 180
pF1KB8 LALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACAR
: ...:: .: : ::::: :..: : ::....:::: :. ..:: :.: .:..::.
CCDS10 LEIQDLRLEDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAE
140 150 160 170 180 190
190 200 210 220 230 240
pF1KB8 IGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGF-PGVRNYGVV
.: .:. :::. :. : . :.::::.: ::.:::. ::. : : :. ::::.::
CCDS10 QAAVVASFEQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGP--GLAPGVRSYGPR
200 210 220 230 240
250 260 270 280 290
pF1KB8 DPD-DLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWD-GGL
:::.:.: :.:... . :::::: ::: ::: : :: .:::.::: ::
CCDS10 HRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAAWKFHGL
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB8 DHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSR-FNVYCFRDSA
:.:. :::::::::::.: : :: :::... :::. .:: ..:::.:
CCDS10 DRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSF-------GFPDPQSRLYGVYCYRQH
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB8 QPSAIPEASNPASNPASDGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGG
911 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 16:44:45 2016 done: Sat Nov 5 16:44:45 2016
Total Scan time: 4.400 Total Display time: 0.380
Function used was FASTA [36.3.4 Apr, 2011]