FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1926, 402 aa 1>>>pF1KA1926 402 - 402 aa - 402 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.3727+/-0.000788; mu= 13.3526+/- 0.047 mean_var=117.1175+/-24.172, 0's: 0 Z-trim(112.1): 52 B-trim: 0 in 0/51 Lambda= 0.118512 statistics sampled from 12846 (12895) to 12846 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.728), E-opt: 0.2 (0.396), width: 16 Scan time: 2.870 The best scores are: opt bits E(32554) CCDS12398.1 HAPLN4 gene_id:404037|Hs108|chr19 ( 402) 2874 502.0 3.9e-142 CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 ( 354) 779 143.8 2.4e-34 CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 360) 695 129.4 5.1e-30 CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 422) 695 129.5 5.7e-30 CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 ( 340) 566 107.4 2.1e-23 CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 ( 671) 407 80.4 5.4e-15 CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 ( 911) 407 80.5 6.8e-15 CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321) 406 80.5 1e-14 CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 ( 655) 388 77.2 5.1e-14 CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431) 387 77.5 1.5e-13 CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530) 387 77.5 1.6e-13 CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642) 382 76.5 2.1e-13 CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409) 382 76.6 2.8e-13 CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396) 382 76.7 3.6e-13 >>CCDS12398.1 HAPLN4 gene_id:404037|Hs108|chr19 (402 aa) initn: 2874 init1: 2874 opt: 2874 Z-score: 2665.3 bits: 502.0 E(32554): 3.9e-142 Smith-Waterman score: 2874; 100.0% identity (100.0% similar) in 402 aa overlap (1-402:1-402) 10 20 30 40 50 60 pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 GGTIVLPCRYHYEAAAHGHDGVRLKWTKVVDPLAFTDVFVALGPQHRAFGSYRGRAELQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GGTIVLPCRYHYEAAAHGHDGVRLKWTKVVDPLAFTDVFVALGPQHRAFGSYRGRAELQG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG 310 320 330 340 350 360 370 380 390 400 pF1KA1 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV :::::::::::::::::::::::::::::::::::::::::: CCDS12 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV 370 380 390 400 >>CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 (354 aa) initn: 916 init1: 646 opt: 779 Z-score: 730.1 bits: 143.8 E(32554): 2.4e-34 Smith-Waterman score: 1216; 50.9% identity (76.8% similar) in 336 aa overlap (35-366:28-352) 10 20 30 40 50 60 pF1KA1 RAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS-VVVQTAPGQVVSHRGGT ...:. ..:.: ..:.. ..: :::::. CCDS40 MKSLLLLVLISICWADHLSDNYTLDHDRAIHI-QAENGPHLLVEAEQAKVFSHRGGN 10 20 30 40 50 70 80 90 100 110 120 pF1KA1 IVLPCRYHYEAAAHGHD--GVRLKWTKVV-DPLAFTDVFVALGPQHRAFGSYRGRAELQG ..:::... . .: : .:.::::.. : : .::::..: .....:.:.::. :.: CCDS40 VTLPCKFYRDPTAFGSGIHKIRIKWTKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KA1 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE . .:::::. ..::.:::::.::: . ::::. .: :::.:::::: :: :::.:.: : CCDS40 GSDSDASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHE 120 130 140 150 160 170 190 200 210 220 230 240 pF1KA1 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG ::.:: .::...:: .::. ::: :::::::::: :::::::...:::::: CCDS40 AQQACLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPCG--------- 180 190 200 210 220 250 260 270 280 290 300 pF1KA1 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV : .. :.::::. . . :::.::::::. :: ..: . .. :..:: :: . CCDS40 -GQNTVPGVRNYGFWDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQI 230 240 250 260 270 280 310 320 330 340 350 360 pF1KA1 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG :::::.:::::. ::: ::::::::.:::: :: ::. . .:: .:::: ..:.: CCDS40 AKVGQIFAAWKILGYDRCDAGWLADGSVRYPISRPRRRCSPTEAAVRFVGFPDKKHKLYG 290 300 310 320 330 340 370 380 390 400 pF1KA1 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV :::.:: CCDS40 VYCFRAYN 350 >>CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 (360 aa) initn: 725 init1: 591 opt: 695 Z-score: 652.4 bits: 129.4 E(32554): 5.1e-30 Smith-Waterman score: 1165; 51.2% identity (76.6% similar) in 320 aa overlap (47-365:49-358) 20 30 40 50 60 70 pF1KA1 AWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRYHYEAAA .::.: . ...:....:::::.:: : CCDS10 PFYNGFYYSNSANDQNLGNGHGKDLLNGVKLVVETPEETLFTYQGASVILPCRYRYEPAL 20 30 40 50 60 70 80 90 100 110 120 130 pF1KA1 HGHDGVRLKWTKVVDPLA-FTDVFVALGPQHRAFGSYRGRAELQGDGPGDASLVLRNVTL . ::.:: :. . : ::.::.: .::.::.:.::..:. : :.:: .... : CCDS10 VSPRRVRVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHLRQDKEHDVSLEIQDLRL 80 90 100 110 120 130 140 150 160 170 180 190 pF1KA1 QDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQDGILASA .:::::.::: . :::..:.:.:.:.::::::. .:::...: :.:..:::: ...:: CCDS10 EDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAEQAAVVASF 140 150 160 170 180 190 200 210 220 230 240 250 pF1KA1 EQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGLRNYGYR ::: ::..::::::::::.:..::::. ::.:::: : :.:.:: : CCDS10 EQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGPG----------LAPGVRSYGPR 200 210 220 230 240 260 270 280 290 300 310 pF1KA1 HNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAAWKLQLL : .:::.:::.. : :::..:. . . .. : .:: :..:::::::::::.. : CCDS10 HRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAAWKFHGL 250 260 270 280 290 300 320 330 340 350 360 370 pF1KA1 DRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFGVYCYRAPGAPDPAPG ::: ::::::::.:::.:.:. :: .:::::.:::: ::.:::::: CCDS10 DRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSFGFPDPQSRLYGVYCYRQH 310 320 330 340 350 360 380 390 400 pF1KA1 GWGWGWAGGGGWAGGARDPAAWTPLHV >>CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 (422 aa) initn: 745 init1: 591 opt: 695 Z-score: 651.5 bits: 129.5 E(32554): 5.7e-30 Smith-Waterman score: 1168; 46.4% identity (69.4% similar) in 386 aa overlap (2-365:47-420) 10 20 pF1KA1 MVCARAALGPGALWAAAWGVLLL-------- :: : ::. : :.::: CCDS76 QDAVCPAPIPSPGLSAQTGLQKIWGTIHCQVCPGAPAWPGSPWHEEMGLLLLVPLLLLPG 20 30 40 50 60 70 30 40 50 60 70 pF1KA1 ------------TAPAGAQR-GRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRY . :. : : . .:.: . .::.: . ...:....::::: CCDS76 SYGLPFYNGFYYSNSANDQNLGNGHGKDLLNGVK--LVVETPEETLFTYQGASVILPCRY 80 90 100 110 120 130 80 90 100 110 120 pF1KA1 HYEAAAHGHDGVRLKWTKVVDPLA-FTDVFVALGPQHRAFGSYRGRAELQGDGPGDASLV .:: : . ::.:: :. . : ::.::.: .::.::.:.::..:. : :.:: CCDS76 RYEPALVSPRRVRVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHLRQDKEHDVSLE 140 150 160 170 180 190 130 140 150 160 170 180 pF1KA1 LRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQD .... :.:::::.::: . :::..:.:.:.:.::::::. .:::...: :.:..:::: CCDS76 IQDLRLEDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAEQA 200 210 220 230 240 250 190 200 210 220 230 240 pF1KA1 GILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGL ...:: ::: ::..::::::::::.:..::::. ::.:::: : :. CCDS76 AVVASFEQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGPG----------LAPGV 260 270 280 290 300 250 260 270 280 290 300 pF1KA1 RNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAA :.:: :: .:::.:::.. : :::..:. . . .. : .:: :..::::::::: CCDS76 RSYGPRHRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAA 310 320 330 340 350 360 310 320 330 340 350 360 pF1KA1 WKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFGVYCYRAPGA ::.. :::: ::::::::.:::.:.:. :: .:::::.:::: ::.:::::: CCDS76 WKFHGLDRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSFGFPDPQSRLYGVYCYRQH 370 380 390 400 410 420 370 380 390 400 pF1KA1 PDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV >>CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 (340 aa) initn: 867 init1: 488 opt: 566 Z-score: 533.6 bits: 107.4 E(32554): 2.1e-23 Smith-Waterman score: 996; 49.7% identity (70.3% similar) in 310 aa overlap (58-364:47-337) 30 40 50 60 70 80 pF1KA1 GAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRYHYEAAAHGHDGVRLKWT ::::.: .::: .. ...:. CCDS11 AFTIFHKAQGDPASHPGPHYLLPPIHEVIHSHRGATATLPCVLGTTPPSY-----KVRWS 20 30 40 50 60 70 90 100 110 120 130 140 pF1KA1 KVVDP--LAFTDVFVALGPQHRAFGSYRGRAELQGDGPGDASLVLRNVTLQDYGRYECEV :: .: : : .... : . :..: :::... :::::. .: :.: :::.::. CCDS11 KV-EPGELRETLILITNGLHARGYGPLGGRARMRRGHRLDASLVIAGVRLEDEGRYRCEL 80 90 100 110 120 130 150 160 170 180 190 200 pF1KA1 TNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQDGILASAEQLHAAWRDG : .::.. . :.::::::::.: :::.... ::..:: :::: ::. ::. :: .: CCDS11 INGIEDESVALTLSLEGVVFPYQPSRGRYQFNYYEAKQACEEQDGRLATYSQLYQAWTEG 140 150 160 170 180 190 210 220 230 240 250 260 pF1KA1 LDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGLRNYGYRHNAEERYDAF ::::::::: .:::.::: : :::: : :.:.:: : ..::::: CCDS11 LDWCNAGWLLEGSVRYPVLTARAPCGGRG-----------RPGIRSYGPRDRMRDRYDAF 200 210 220 230 270 280 290 300 310 320 pF1KA1 CFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAAWKLQLLDRCTAGWLAD :::: : :.:::. : : . .: : :: :::.:::::.:.::::.. ::.: .::::: CCDS11 CFTSALAGQVFFV-PGR-LTLSEAHAACRRRGAVVAKVGHLYAAWKFSGLDQCDGGWLAD 240 250 260 270 280 290 330 340 350 360 370 380 pF1KA1 GSARYPIVNPRARCGGR-RPGVRSLGFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGG ::.:.::..:: :::: :::::.::: . .:.::: CCDS11 GSVRFPITTPRPRCGGLPDPGVRSFGFPRPQQAAYGTYCYAEN 300 310 320 330 340 390 400 pF1KA1 GGWAGGARDPAAWTPLHV >>CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 (671 aa) initn: 695 init1: 318 opt: 407 Z-score: 382.6 bits: 80.4 E(32554): 5.4e-15 Smith-Waterman score: 749; 37.4% identity (62.6% similar) in 374 aa overlap (22-374:8-363) 10 20 30 40 50 pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS------VVVQTAPG ::.: . :: . .. ::::.:. .. :: CCDS11 MAQLFLPLLAALVLAQ-APAALADVLEGDSSEDRAFRVRIAGDAPL 10 20 30 40 60 70 80 90 100 110 pF1KA1 QVVSHRGGTIVLPCRYHYEAAAHGHDGV----RLKWTKVVDPLAFTDVFVALGPQHRAFG : : ::....::. :: .. .: :.::: .. ..:.:: : . .. CCDS11 QGV--LGGALTIPCHVHYLRPPPSRRAVLGSPRVKWT-FLSRGREAEVLVARGVRVKVNE 50 60 70 80 90 100 120 130 140 150 160 pF1KA1 SYRGRAELQGDGPG--DASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYH .:: :. : . . :.::.: .. .: : :.::: . ..:.. :.. ..:::: :. CCDS11 AYRFRVALPAYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYR 110 120 130 140 150 160 170 180 190 200 210 220 pF1KA1 PRGGRYKLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPRE ..:: ..:. ::.:::. . .:. :::.::. : . :.:::: : .:.::.. ::: CCDS11 EGSARYAFSFSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPRE 170 180 190 200 210 220 230 240 250 260 270 280 pF1KA1 PCGGLGGTGSAGGGGDANG--GLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPF : :: .: :.:::: . .. ::..:.. .: :..:. : . . . CCDS11 AC-----------YGDMDGFPGVRNYGVV-DPDDLYDVYCYAEDLNGELFLGDPPEKLTL 230 240 250 260 270 290 300 310 320 330 340 pF1KA1 SGAARACAARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGV : : ::: .: .:::.::: ::.:. :::::::.:::::.: :::: ::: CCDS11 EEARAYCQERGAEIATTGQLYAAWD-GGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGV 280 290 300 310 320 350 360 370 380 390 pF1KA1 RSL-------GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTP ..: :::. : :.:::.: . :. : CCDS11 KTLFLFPNQTGFPNKHSR-FNVYCFRDSAQPSAIPEASNPASNPASDGLEAIVTVTETLE 330 340 350 360 370 380 400 pF1KA1 LHV CCDS11 ELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEE 390 400 410 420 430 440 >>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 (911 aa) initn: 695 init1: 318 opt: 407 Z-score: 380.8 bits: 80.5 E(32554): 6.8e-15 Smith-Waterman score: 749; 37.4% identity (62.6% similar) in 374 aa overlap (22-374:8-363) 10 20 30 40 50 pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS------VVVQTAPG ::.: . :: . .. ::::.:. .. :: CCDS11 MAQLFLPLLAALVLAQ-APAALADVLEGDSSEDRAFRVRIAGDAPL 10 20 30 40 60 70 80 90 100 110 pF1KA1 QVVSHRGGTIVLPCRYHYEAAAHGHDGV----RLKWTKVVDPLAFTDVFVALGPQHRAFG : : ::....::. :: .. .: :.::: .. ..:.:: : . .. CCDS11 QGV--LGGALTIPCHVHYLRPPPSRRAVLGSPRVKWT-FLSRGREAEVLVARGVRVKVNE 50 60 70 80 90 100 120 130 140 150 160 pF1KA1 SYRGRAELQGDGPG--DASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYH .:: :. : . . :.::.: .. .: : :.::: . ..:.. :.. ..:::: :. CCDS11 AYRFRVALPAYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYR 110 120 130 140 150 160 170 180 190 200 210 220 pF1KA1 PRGGRYKLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPRE ..:: ..:. ::.:::. . .:. :::.::. : . :.:::: : .:.::.. ::: CCDS11 EGSARYAFSFSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPRE 170 180 190 200 210 220 230 240 250 260 270 280 pF1KA1 PCGGLGGTGSAGGGGDANG--GLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPF : :: .: :.:::: . .. ::..:.. .: :..:. : . . . CCDS11 AC-----------YGDMDGFPGVRNYGVV-DPDDLYDVYCYAEDLNGELFLGDPPEKLTL 230 240 250 260 270 290 300 310 320 330 340 pF1KA1 SGAARACAARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGV : : ::: .: .:::.::: ::.:. :::::::.:::::.: :::: ::: CCDS11 EEARAYCQERGAEIATTGQLYAAWD-GGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGV 280 290 300 310 320 350 360 370 380 390 pF1KA1 RSL-------GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTP ..: :::. : :.:::.: . :. : CCDS11 KTLFLFPNQTGFPNKHSR-FNVYCFRDSAQPSAIPEASNPASNPASDGLEAIVTVTETLE 330 340 350 360 370 380 400 pF1KA1 LHV CCDS11 ELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEFETQSMVPPTGFSEE 390 400 410 420 430 440 >>CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321 aa) initn: 680 init1: 276 opt: 406 Z-score: 377.7 bits: 80.5 E(32554): 1e-14 Smith-Waterman score: 777; 36.2% identity (62.3% similar) in 401 aa overlap (8-394:1-385) 10 20 30 40 50 60 pF1KA1 MVCARAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHR .: .:: . .: . .....: . .. . .: : . . . :.: . CCDS12 MGAPFVWALGLLMLQMLLFVAGEQGTQDITDA--SERGLHMQKLGSGSVQAAL 10 20 30 40 50 70 80 90 100 110 pF1KA1 GGTIVLPCRYHYEA-AAHGHDGVRLKWTKVVDPLAFTD---VFVALGPQHRAFGSYRGRA . ..::: . . . ..:. :.::::: . . ..:: :. :..::. CCDS12 AELVALPCLFTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KA1 ELQGDGP---GDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGR : . : ..:.:.: . .: : :.:.:. .::. .: :.. :::: :. : CCDS12 SLPSY-PRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA1 YKLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGL : :::::::.:: ...:.:. ..:.::..::.: :.:::: : .:.::... : : CCDS12 YALTFAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGC--Y 180 190 200 210 220 240 250 260 270 280 290 pF1KA1 GGTGSAGGGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARAC : .: : .:.:: :.: .: ::..::. .: :.::.. : : . ..:: : CCDS12 GDRSSLPG-------VRSYG-RRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQC 230 240 250 260 270 280 300 310 320 330 340 pF1KA1 AARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL---- .:::.:.:::: ::. . ::.: :::::::.:::: .:: :::: ::::.. CCDS12 RRQGAALASVGQLHLAWH-EGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFA 290 300 310 320 330 350 360 370 380 390 400 pF1KA1 ---GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV :::. ..: : .::.:: : : .: : .:. : CCDS12 NRTGFPSPAER-FDAYCFRAHH-PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEE 340 350 360 370 380 390 CCDS12 EVVTPDFQEPLVSSGEEETLILEEKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSD 400 410 420 430 440 450 >>CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 (655 aa) initn: 584 init1: 333 opt: 388 Z-score: 365.2 bits: 77.2 E(32554): 5.1e-14 Smith-Waterman score: 694; 36.3% identity (61.1% similar) in 350 aa overlap (36-367:17-349) 10 20 30 40 50 60 pF1KA1 AALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIV :.:.:. .: : .: : . .: . CCDS47 MFINIKSILWMCSTLIVTHALH----KVKVGKSP-PVRGSLSGKVS 10 20 30 40 70 80 90 100 110 pF1KA1 LPCRYH----YEAAAHGHDGVRLKWTKV-VDP----LAFTDVFVALGPQHRAFGSYRGRA :::.. . . . .:.::.:. :: : : :.:: . . . .:.::. CCDS47 LPCHFSTMPTLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRV 50 60 70 80 90 100 120 130 140 150 160 170 pF1KA1 EL--QGDGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRY . . .. :::::.. .. .: : :.:.: .:: :.: ..:::: :. .:: CCDS47 SVPTHPEAVGDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRY 110 120 130 140 150 160 180 190 200 210 220 230 pF1KA1 KLTFAEAQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLG :.: ::.:: . ...:. ::: ::..::.. :.:::: : .:.::. :: : : CCDS47 TLNFEAAQKACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYG-D 170 180 190 200 210 220 240 250 260 270 280 290 pF1KA1 GTGSAGGGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACA :.:: .:.::.: . .: ::..:....: : :: : : ::. : CCDS47 KMGKAG--------VRTYGFR-SPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECE 230 240 250 260 270 300 310 320 330 340 pF1KA1 ARGAAVAKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL----- . : .: ::.: :::. . .:.: :::.:.:.:.:.. ::.::: :::.: CCDS47 NQDARLATVGELQAAWR-NGFDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFEN 280 290 300 310 320 330 350 360 370 380 390 400 pF1KA1 --GFPDATRRLFGVYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV ::: : : .::.. : CCDS47 QTGFPPPDSR-FDAYCFKRPDRCKMNPCLNGGTCYPTETSYVCTCVPGYSGDQCELDFDE 340 350 360 370 380 >>CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431 aa) initn: 666 init1: 347 opt: 387 Z-score: 356.6 bits: 77.5 E(32554): 1.5e-13 Smith-Waterman score: 678; 34.5% identity (61.5% similar) in 348 aa overlap (48-380:33-365) 20 30 40 50 60 70 pF1KA1 WGVLLLTAPAGAQRGRKKVVHVLEGESGSVVVQTAPGQVVSHRGGTIVLPCRY----HYE . : .: .:. : ....:: . : CCDS53 TLLWVFVTLRVITAAVTVETSDHDNSLSVSIPQPSPLRVL--LGTSLTIPCYFIDPMHPV 10 20 30 40 50 60 80 90 100 110 120 pF1KA1 AAAHGHDGV--RLKWTKVVDPLAFTDVFVALGPQHRAFGSYRGRAELQGDG--PGDASLV ..: . . :.::..: . ..:: . :. ..:. .. : . :.::.: CCDS53 TTAPSTAPLAPRIKWSRVSKEKEVV-LLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLE 70 80 90 100 110 130 140 150 160 170 180 pF1KA1 LRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQD .... .: : :.::: . .::. . ... ..:.:: :. . :: : : .::::: ... CCDS53 VQSLRSNDSGVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KA1 GILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGL .:.:. :::.::..::. :.:::: : .:.::.. ::: : : : :. CCDS53 AIIATPEQLQAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYG---------DKDEFPGV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KA1 RNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAA :.:: : ...: ::..::. .. :.::. . :. :: : :: .: .:::. : CCDS53 RTYGIR-DTNETYDVYCFAEEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLA 240 250 260 270 280 310 320 330 340 350 360 pF1KA1 WKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL-------GFPDATRRLFGVY :. . : :.:::::: :.:::: . : ::: :::.. :.:: . : . . CCDS53 WQAGM-DMCSAGWLADRSVRYPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSR-YDAI 290 300 310 320 330 340 370 380 390 400 pF1KA1 CYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV :: . : . .: : CCDS53 CYTGEDFVDIPENFFGVGGEEDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEV 350 360 370 380 390 400 >-- initn: 629 init1: 282 opt: 652 Z-score: 601.4 bits: 122.8 E(32554): 3.5e-27 Smith-Waterman score: 652; 46.2% identity (68.8% similar) in 221 aa overlap (162-375:477-684) 140 150 160 170 180 190 pF1KA1 NVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAEAQRACAEQDGI :::: :.: ::.::: :::.:: . .. CCDS53 TPGLGPATAFTSEDLVVQVTAVPGQPHLPGGVVFHYRPGPTRYSLTFEEAQQACLRTGAV 450 460 470 480 490 500 200 210 220 230 240 250 pF1KA1 LASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAGGGGDANGGLRN .:: :::.::.. : . :.:::::: .:.::. :: :: : :.. :.:. CCDS53 IASPEQLQAAYEAGYEQCDAGWLRDQTVRYPIVSPRTPCVG---------DKDSSPGVRT 510 520 530 540 550 260 270 280 290 300 310 pF1KA1 YGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAVAKVGQLFAAWK :: : ..: ::..::.. : :.::: :. :. : . : ...:..: .:::.:::. CCDS53 YGVRPSTET-YDVYCFVDRLEGEVFFATRLEQFTFQEALEFCESHNATLATTGQLYAAWS 560 570 580 590 600 610 320 330 340 350 360 pF1KA1 LQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSL-------GFPDATRRLFGVYCY . ::.: :::::::: :::::.:: ::: .::::.. :.:: : ..:. CCDS53 -RGLDKCYAGWLADGSLRYPIVTPRPACGGDKPGVRTVYLYPNQTGLPDPLSR-HHAFCF 620 630 640 650 660 670 370 380 390 400 pF1KA1 RAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV :. .: :.:: CCDS53 RGISAV-PSPGEEEGGTPTSPSGVEEWIVTQVVPGVAAVPVEEETTAVPSGETTAILEFT 680 690 700 710 720 730 402 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 06:59:16 2016 done: Sat Nov 5 06:59:16 2016 Total Scan time: 2.870 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]