FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1926, 402 aa
1>>>pF1KA1926 402 - 402 aa - 402 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.3727+/-0.000788; mu= 13.3526+/- 0.047
mean_var=117.1175+/-24.172, 0's: 0 Z-trim(112.1): 52 B-trim: 0 in 0/51
Lambda= 0.118512
statistics sampled from 12846 (12895) to 12846 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.728), E-opt: 0.2 (0.396), width: 16
Scan time: 2.870
The best scores are: opt bits E(32554)
CCDS12398.1 HAPLN4 gene_id:404037|Hs108|chr19 ( 402) 2874 502.0 3.9e-142
CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 ( 354) 779 143.8 2.4e-34
CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 360) 695 129.4 5.1e-30
CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 422) 695 129.5 5.7e-30
CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 ( 340) 566 107.4 2.1e-23
CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 ( 671) 407 80.4 5.4e-15
CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 ( 911) 407 80.5 6.8e-15
CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321) 406 80.5 1e-14
CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 ( 655) 388 77.2 5.1e-14
CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431) 387 77.5 1.5e-13
CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530) 387 77.5 1.6e-13
CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642) 382 76.5 2.1e-13
CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409) 382 76.6 2.8e-13
CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396) 382 76.7 3.6e-13
>>CCDS12398.1 HAPLN4 gene_id:404037|Hs108|chr19 (402 aa)
initn: 2874 init1: 2874 opt: 2874 Z-score: 2665.3 bits: 502.0 E(32554): 3.9e-142
Smith-Waterman score: 2874; 100.0% identity (100.0% similar) in 402 aa overlap (1-402:1-402)
10 20 30 40 50 60
pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 GGTIVLPCRYHYEAAAHGHDGVRLKWTKVVDPLAFTDVFVALGPQHRAFGSYRGRAELQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GGTIVLPCRYHYEAAAHGHDGVRLKWTKVVDPLAFTDVFVALGPQHRAFGSYRGRAELQG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG
310 320 330 340 350 360
370 380 390 400
pF1KA1 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
::::::::::::::::::::::::::::::::::::::::::
CCDS12 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
370 380 390 400
>>CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 (354 aa)
initn: 916 init1: 646 opt: 779 Z-score: 730.1 bits: 143.8 E(32554): 2.4e-34
Smith-Waterman score: 1216; 50.9% identity (76.8% similar) in 336 aa overlap (35-366:28-352)
10 20 30 40 50 60
pF1KA1 RAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS-VVVQTAPGQVVSHRGGT
...:. ..:.: ..:.. ..: :::::.
CCDS40 MKSLLLLVLISICWADHLSDNYTLDHDRAIHI-QAENGPHLLVEAEQAKVFSHRGGN
10 20 30 40 50
70 80 90 100 110 120
pF1KA1 IVLPCRYHYEAAAHGHD--GVRLKWTKVV-DPLAFTDVFVALGPQHRAFGSYRGRAELQG
..:::... . .: : .:.::::.. : : .::::..: .....:.:.::. :.:
CCDS40 VTLPCKFYRDPTAFGSGIHKIRIKWTKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKG
60 70 80 90 100 110
130 140 150 160 170 180
pF1KA1 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE
. .:::::. ..::.:::::.::: . ::::. .: :::.:::::: :: :::.:.: :
CCDS40 GSDSDASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHE
120 130 140 150 160 170
190 200 210 220 230 240
pF1KA1 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG
::.:: .::...:: .::. ::: :::::::::: :::::::...::::::
CCDS40 AQQACLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPCG---------
180 190 200 210 220
250 260 270 280 290 300
pF1KA1 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV
: .. :.::::. . . :::.::::::. :: ..: . .. :..:: :: .
CCDS40 -GQNTVPGVRNYGFWDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQI
230 240 250 260 270 280
310 320 330 340 350 360
pF1KA1 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG
:::::.:::::. ::: ::::::::.:::: :: ::. . .:: .:::: ..:.:
CCDS40 AKVGQIFAAWKILGYDRCDAGWLADGSVRYPISRPRRRCSPTEAAVRFVGFPDKKHKLYG
290 300 310 320 330 340
370 380 390 400
pF1KA1 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
:::.::
CCDS40 VYCFRAYN
350
>>CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 (360 aa)
initn: 725 init1: 591 opt: 695 Z-score: 652.4 bits: 129.4 E(32554): 5.1e-30
Smith-Waterman score: 1165; 51.2% identity (76.6% similar) in 320 aa overlap (47-365:49-358)
20 30 40 50 60 70
pF1KA1 AWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRYHYEAAA
.::.: . ...:....:::::.:: :
CCDS10 PFYNGFYYSNSANDQNLGNGHGKDLLNGVKLVVETPEETLFTYQGASVILPCRYRYEPAL
20 30 40 50 60 70
80 90 100 110 120 130
pF1KA1 HGHDGVRLKWTKVVDPLA-FTDVFVALGPQHRAFGSYRGRAELQGDGPGDASLVLRNVTL
. ::.:: :. . : ::.::.: .::.::.:.::..:. : :.:: .... :
CCDS10 VSPRRVRVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHLRQDKEHDVSLEIQDLRL
80 90 100 110 120 130
140 150 160 170 180 190
pF1KA1 QDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQDGILASA
.:::::.::: . :::..:.:.:.:.::::::. .:::...: :.:..:::: ...::
CCDS10 EDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAEQAAVVASF
140 150 160 170 180 190
200 210 220 230 240 250
pF1KA1 EQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGLRNYGYR
::: ::..::::::::::.:..::::. ::.:::: : :.:.:: :
CCDS10 EQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGPG----------LAPGVRSYGPR
200 210 220 230 240
260 270 280 290 300 310
pF1KA1 HNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAAWKLQLL
: .:::.:::.. : :::..:. . . .. : .:: :..:::::::::::.. :
CCDS10 HRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAAWKFHGL
250 260 270 280 290 300
320 330 340 350 360 370
pF1KA1 DRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFGVYCYRAPGAPDPAPG
::: ::::::::.:::.:.:. :: .:::::.:::: ::.::::::
CCDS10 DRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSFGFPDPQSRLYGVYCYRQH
310 320 330 340 350 360
380 390 400
pF1KA1 GWGWGWAGGGGWAGGARDPAAWTPLHV
>>CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 (422 aa)
initn: 745 init1: 591 opt: 695 Z-score: 651.5 bits: 129.5 E(32554): 5.7e-30
Smith-Waterman score: 1168; 46.4% identity (69.4% similar) in 386 aa overlap (2-365:47-420)
10 20
pF1KA1 MVCARAALGPGALWAAAWGVLLL--------
:: : ::. : :.:::
CCDS76 QDAVCPAPIPSPGLSAQTGLQKIWGTIHCQVCPGAPAWPGSPWHEEMGLLLLVPLLLLPG
20 30 40 50 60 70
30 40 50 60 70
pF1KA1 ------------TAPAGAQR-GRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRY
. :. : : . .:.: . .::.: . ...:....:::::
CCDS76 SYGLPFYNGFYYSNSANDQNLGNGHGKDLLNGVK--LVVETPEETLFTYQGASVILPCRY
80 90 100 110 120 130
80 90 100 110 120
pF1KA1 HYEAAAHGHDGVRLKWTKVVDPLA-FTDVFVALGPQHRAFGSYRGRAELQGDGPGDASLV
.:: : . ::.:: :. . : ::.::.: .::.::.:.::..:. : :.::
CCDS76 RYEPALVSPRRVRVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHLRQDKEHDVSLE
140 150 160 170 180 190
130 140 150 160 170 180
pF1KA1 LRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQD
.... :.:::::.::: . :::..:.:.:.:.::::::. .:::...: :.:..::::
CCDS76 IQDLRLEDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAEQA
200 210 220 230 240 250
190 200 210 220 230 240
pF1KA1 GILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGL
...:: ::: ::..::::::::::.:..::::. ::.:::: : :.
CCDS76 AVVASFEQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGPG----------LAPGV
260 270 280 290 300
250 260 270 280 290 300
pF1KA1 RNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAA
:.:: :: .:::.:::.. : :::..:. . . .. : .:: :..:::::::::
CCDS76 RSYGPRHRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAA
310 320 330 340 350 360
310 320 330 340 350 360
pF1KA1 WKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFGVYCYRAPGA
::.. :::: ::::::::.:::.:.:. :: .:::::.:::: ::.::::::
CCDS76 WKFHGLDRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSFGFPDPQSRLYGVYCYRQH
370 380 390 400 410 420
370 380 390 400
pF1KA1 PDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
>>CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 (340 aa)
initn: 867 init1: 488 opt: 566 Z-score: 533.6 bits: 107.4 E(32554): 2.1e-23
Smith-Waterman score: 996; 49.7% identity (70.3% similar) in 310 aa overlap (58-364:47-337)
30 40 50 60 70 80
pF1KA1 GAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRYHYEAAAHGHDGVRLKWT
::::.: .::: .. ...:.
CCDS11 AFTIFHKAQGDPASHPGPHYLLPPIHEVIHSHRGATATLPCVLGTTPPSY-----KVRWS
20 30 40 50 60 70
90 100 110 120 130 140
pF1KA1 KVVDP--LAFTDVFVALGPQHRAFGSYRGRAELQGDGPGDASLVLRNVTLQDYGRYECEV
:: .: : : .... : . :..: :::... :::::. .: :.: :::.::.
CCDS11 KV-EPGELRETLILITNGLHARGYGPLGGRARMRRGHRLDASLVIAGVRLEDEGRYRCEL
80 90 100 110 120 130
150 160 170 180 190 200
pF1KA1 TNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQDGILASAEQLHAAWRDG
: .::.. . :.::::::::.: :::.... ::..:: :::: ::. ::. :: .:
CCDS11 INGIEDESVALTLSLEGVVFPYQPSRGRYQFNYYEAKQACEEQDGRLATYSQLYQAWTEG
140 150 160 170 180 190
210 220 230 240 250 260
pF1KA1 LDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGLRNYGYRHNAEERYDAF
::::::::: .:::.::: : :::: : :.:.:: : ..:::::
CCDS11 LDWCNAGWLLEGSVRYPVLTARAPCGGRG-----------RPGIRSYGPRDRMRDRYDAF
200 210 220 230
270 280 290 300 310 320
pF1KA1 CFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAAWKLQLLDRCTAGWLAD
:::: : :.:::. : : . .: : :: :::.:::::.:.::::.. ::.: .:::::
CCDS11 CFTSALAGQVFFV-PGR-LTLSEAHAACRRRGAVVAKVGHLYAAWKFSGLDQCDGGWLAD
240 250 260 270 280 290
330 340 350 360 370 380
pF1KA1 GSARYPIVNPRARCGGR-RPGVRSLGFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGG
::.:.::..:: :::: :::::.::: . .:.:::
CCDS11 GSVRFPITTPRPRCGGLPDPGVRSFGFPRPQQAAYGTYCYAEN
300 310 320 330 340
390 400
pF1KA1 GGWAGGARDPAAWTPLHV
>>CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 (671 aa)
initn: 695 init1: 318 opt: 407 Z-score: 382.6 bits: 80.4 E(32554): 5.4e-15
Smith-Waterman score: 749; 37.4% identity (62.6% similar) in 374 aa overlap (22-374:8-363)
10 20 30 40 50
pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS------VVVQTAPG
::.: . :: . .. ::::.:. .. ::
CCDS11 MAQLFLPLLAALVLAQ-APAALADVLEGDSSEDRAFRVRIAGDAPL
10 20 30 40
60 70 80 90 100 110
pF1KA1 QVVSHRGGTIVLPCRYHYEAAAHGHDGV----RLKWTKVVDPLAFTDVFVALGPQHRAFG
: : ::....::. :: .. .: :.::: .. ..:.:: : . ..
CCDS11 QGV--LGGALTIPCHVHYLRPPPSRRAVLGSPRVKWT-FLSRGREAEVLVARGVRVKVNE
50 60 70 80 90 100
120 130 140 150 160
pF1KA1 SYRGRAELQGDGPG--DASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYH
.:: :. : . . :.::.: .. .: : :.::: . ..:.. :.. ..:::: :.
CCDS11 AYRFRVALPAYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYR
110 120 130 140 150 160
170 180 190 200 210 220
pF1KA1 PRGGRYKLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPRE
..:: ..:. ::.:::. . .:. :::.::. : . :.:::: : .:.::.. :::
CCDS11 EGSARYAFSFSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPRE
170 180 190 200 210 220
230 240 250 260 270 280
pF1KA1 PCGGLGGTGSAGGGGDANG--GLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPF
: :: .: :.:::: . .. ::..:.. .: :..:. : . . .
CCDS11 AC-----------YGDMDGFPGVRNYGVV-DPDDLYDVYCYAEDLNGELFLGDPPEKLTL
230 240 250 260 270
290 300 310 320 330 340
pF1KA1 SGAARACAARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGV
: : ::: .: .:::.::: ::.:. :::::::.:::::.: :::: :::
CCDS11 EEARAYCQERGAEIATTGQLYAAWD-GGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGV
280 290 300 310 320
350 360 370 380 390
pF1KA1 RSL-------GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTP
..: :::. : :.:::.: . :. :
CCDS11 KTLFLFPNQTGFPNKHSR-FNVYCFRDSAQPSAIPEASNPASNPASDGLEAIVTVTETLE
330 340 350 360 370 380
400
pF1KA1 LHV
CCDS11 ELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEE
390 400 410 420 430 440
>>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 (911 aa)
initn: 695 init1: 318 opt: 407 Z-score: 380.8 bits: 80.5 E(32554): 6.8e-15
Smith-Waterman score: 749; 37.4% identity (62.6% similar) in 374 aa overlap (22-374:8-363)
10 20 30 40 50
pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS------VVVQTAPG
::.: . :: . .. ::::.:. .. ::
CCDS11 MAQLFLPLLAALVLAQ-APAALADVLEGDSSEDRAFRVRIAGDAPL
10 20 30 40
60 70 80 90 100 110
pF1KA1 QVVSHRGGTIVLPCRYHYEAAAHGHDGV----RLKWTKVVDPLAFTDVFVALGPQHRAFG
: : ::....::. :: .. .: :.::: .. ..:.:: : . ..
CCDS11 QGV--LGGALTIPCHVHYLRPPPSRRAVLGSPRVKWT-FLSRGREAEVLVARGVRVKVNE
50 60 70 80 90 100
120 130 140 150 160
pF1KA1 SYRGRAELQGDGPG--DASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYH
.:: :. : . . :.::.: .. .: : :.::: . ..:.. :.. ..:::: :.
CCDS11 AYRFRVALPAYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYR
110 120 130 140 150 160
170 180 190 200 210 220
pF1KA1 PRGGRYKLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPRE
..:: ..:. ::.:::. . .:. :::.::. : . :.:::: : .:.::.. :::
CCDS11 EGSARYAFSFSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPRE
170 180 190 200 210 220
230 240 250 260 270 280
pF1KA1 PCGGLGGTGSAGGGGDANG--GLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPF
: :: .: :.:::: . .. ::..:.. .: :..:. : . . .
CCDS11 AC-----------YGDMDGFPGVRNYGVV-DPDDLYDVYCYAEDLNGELFLGDPPEKLTL
230 240 250 260 270
290 300 310 320 330 340
pF1KA1 SGAARACAARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGV
: : ::: .: .:::.::: ::.:. :::::::.:::::.: :::: :::
CCDS11 EEARAYCQERGAEIATTGQLYAAWD-GGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGV
280 290 300 310 320
350 360 370 380 390
pF1KA1 RSL-------GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTP
..: :::. : :.:::.: . :. :
CCDS11 KTLFLFPNQTGFPNKHSR-FNVYCFRDSAQPSAIPEASNPASNPASDGLEAIVTVTETLE
330 340 350 360 370 380
400
pF1KA1 LHV
CCDS11 ELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEE
390 400 410 420 430 440
>>CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321 aa)
initn: 680 init1: 276 opt: 406 Z-score: 377.7 bits: 80.5 E(32554): 1e-14
Smith-Waterman score: 777; 36.2% identity (62.3% similar) in 401 aa overlap (8-394:1-385)
10 20 30 40 50 60
pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHR
.: .:: . .: . .....: . .. . .: : . . . :.: .
CCDS12 MGAPFVWALGLLMLQMLLFVAGEQGTQDITDA--SERGLHMQKLGSGSVQAAL
10 20 30 40 50
70 80 90 100 110
pF1KA1 GGTIVLPCRYHYEA-AAHGHDGVRLKWTKVVDPLAFTD---VFVALGPQHRAFGSYRGRA
. ..::: . . . ..:. :.::::: . . ..:: :. :..::.
CCDS12 AELVALPCLFTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KA1 ELQGDGP---GDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGR
: . : ..:.:.: . .: : :.:.:. .::. .: :.. :::: :. :
CCDS12 SLPSY-PRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDR
120 130 140 150 160 170
180 190 200 210 220 230
pF1KA1 YKLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGL
: :::::::.:: ...:.:. ..:.::..::.: :.:::: : .:.::... : :
CCDS12 YALTFAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGC--Y
180 190 200 210 220
240 250 260 270 280 290
pF1KA1 GGTGSAGGGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARAC
: .: : .:.:: :.: .: ::..::. .: :.::.. : : . ..:: :
CCDS12 GDRSSLPG-------VRSYG-RRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQC
230 240 250 260 270 280
300 310 320 330 340
pF1KA1 AARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL----
.:::.:.:::: ::. . ::.: :::::::.:::: .:: :::: ::::..
CCDS12 RRQGAALASVGQLHLAWH-EGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFA
290 300 310 320 330
350 360 370 380 390 400
pF1KA1 ---GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
:::. ..: : .::.:: : : .: : .:. :
CCDS12 NRTGFPSPAER-FDAYCFRAHH-PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEE
340 350 360 370 380 390
CCDS12 EVVTPDFQEPLVSSGEEETLILEEKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSD
400 410 420 430 440 450
>>CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 (655 aa)
initn: 584 init1: 333 opt: 388 Z-score: 365.2 bits: 77.2 E(32554): 5.1e-14
Smith-Waterman score: 694; 36.3% identity (61.1% similar) in 350 aa overlap (36-367:17-349)
10 20 30 40 50 60
pF1KA1 AALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIV
:.:.:. .: : .: : . .: .
CCDS47 MFINIKSILWMCSTLIVTHALH----KVKVGKSP-PVRGSLSGKVS
10 20 30 40
70 80 90 100 110
pF1KA1 LPCRYH----YEAAAHGHDGVRLKWTKV-VDP----LAFTDVFVALGPQHRAFGSYRGRA
:::.. . . . .:.::.:. :: : : :.:: . . . .:.::.
CCDS47 LPCHFSTMPTLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRV
50 60 70 80 90 100
120 130 140 150 160 170
pF1KA1 EL--QGDGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRY
. . .. :::::.. .. .: : :.:.: .:: :.: ..:::: :. .::
CCDS47 SVPTHPEAVGDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRY
110 120 130 140 150 160
180 190 200 210 220 230
pF1KA1 KLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLG
:.: ::.:: . ...:. ::: ::..::.. :.:::: : .:.::. :: : :
CCDS47 TLNFEAAQKACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYG-D
170 180 190 200 210 220
240 250 260 270 280 290
pF1KA1 GTGSAGGGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACA
:.:: .:.::.: . .: ::..:....: : :: : : ::. :
CCDS47 KMGKAG--------VRTYGFR-SPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECE
230 240 250 260 270
300 310 320 330 340
pF1KA1 ARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL-----
. : .: ::.: :::. . .:.: :::.:.:.:.:.. ::.::: :::.:
CCDS47 NQDARLATVGELQAAWR-NGFDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFEN
280 290 300 310 320 330
350 360 370 380 390 400
pF1KA1 --GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
::: : : .::.. :
CCDS47 QTGFPPPDSR-FDAYCFKRPDRCKMNPCLNGGTCYPTETSYVCTCVPGYSGDQCELDFDE
340 350 360 370 380
>>CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431 aa)
initn: 666 init1: 347 opt: 387 Z-score: 356.6 bits: 77.5 E(32554): 1.5e-13
Smith-Waterman score: 678; 34.5% identity (61.5% similar) in 348 aa overlap (48-380:33-365)
20 30 40 50 60 70
pF1KA1 WGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRY----HYE
. : .: .:. : ....:: . :
CCDS53 TLLWVFVTLRVITAAVTVETSDHDNSLSVSIPQPSPLRVL--LGTSLTIPCYFIDPMHPV
10 20 30 40 50 60
80 90 100 110 120
pF1KA1 AAAHGHDGV--RLKWTKVVDPLAFTDVFVALGPQHRAFGSYRGRAELQGDG--PGDASLV
..: . . :.::..: . ..:: . :. ..:. .. : . :.::.:
CCDS53 TTAPSTAPLAPRIKWSRVSKEKEVV-LLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLE
70 80 90 100 110
130 140 150 160 170 180
pF1KA1 LRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQD
.... .: : :.::: . .::. . ... ..:.:: :. . :: : : .::::: ...
CCDS53 VQSLRSNDSGVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNS
120 130 140 150 160 170
190 200 210 220 230 240
pF1KA1 GILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGL
.:.:. :::.::..::. :.:::: : .:.::.. ::: : : : :.
CCDS53 AIIATPEQLQAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYG---------DKDEFPGV
180 190 200 210 220 230
250 260 270 280 290 300
pF1KA1 RNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAA
:.:: : ...: ::..::. .. :.::. . :. :: : :: .: .:::. :
CCDS53 RTYGIR-DTNETYDVYCFAEEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLA
240 250 260 270 280
310 320 330 340 350 360
pF1KA1 WKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL-------GFPDATRRLFGVY
:. . : :.:::::: :.:::: . : ::: :::.. :.:: . : . .
CCDS53 WQAGM-DMCSAGWLADRSVRYPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSR-YDAI
290 300 310 320 330 340
370 380 390 400
pF1KA1 CYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
:: . : . .: :
CCDS53 CYTGEDFVDIPENFFGVGGEEDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEV
350 360 370 380 390 400
>--
initn: 629 init1: 282 opt: 652 Z-score: 601.4 bits: 122.8 E(32554): 3.5e-27
Smith-Waterman score: 652; 46.2% identity (68.8% similar) in 221 aa overlap (162-375:477-684)
140 150 160 170 180 190
pF1KA1 NVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQDGI
:::: :.: ::.::: :::.:: . ..
CCDS53 TPGLGPATAFTSEDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAV
450 460 470 480 490 500
200 210 220 230 240 250
pF1KA1 LASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGLRN
.:: :::.::.. : . :.:::::: .:.::. :: :: : :.. :.:.
CCDS53 IASPEQLQAAYEAGYEQCDAGWLRDQTVRYPIVSPRTPCVG---------DKDSSPGVRT
510 520 530 540 550
260 270 280 290 300 310
pF1KA1 YGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAAWK
:: : ..: ::..::.. : :.::: :. :. : . : ...:..: .:::.:::.
CCDS53 YGVRPSTET-YDVYCFVDRLEGEVFFATRLEQFTFQEALEFCESHNATLATTGQLYAAWS
560 570 580 590 600 610
320 330 340 350 360
pF1KA1 LQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL-------GFPDATRRLFGVYCY
. ::.: :::::::: :::::.:: ::: .::::.. :.:: : ..:.
CCDS53 -RGLDKCYAGWLADGSLRYPIVTPRPACGGDKPGVRTVYLYPNQTGLPDPLSR-HHAFCF
620 630 640 650 660 670
370 380 390 400
pF1KA1 RAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV
:. .: :.::
CCDS53 RGISAV-PSPGEEEGGTPTSPSGVEEWIVTQVVPGVAAVPVEEETTAVPSGETTAILEFT
680 690 700 710 720 730
402 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 06:59:16 2016 done: Sat Nov 5 06:59:16 2016
Total Scan time: 2.870 Total Display time: 0.040
Function used was FASTA [36.3.4 Apr, 2011]