FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5236, 354 aa 1>>>pF1KB5236 354 - 354 aa - 354 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6604+/-0.000894; mu= 14.1713+/- 0.053 mean_var=71.8134+/-15.081, 0's: 0 Z-trim(106.0): 43 B-trim: 253 in 1/50 Lambda= 0.151346 statistics sampled from 8711 (8751) to 8711 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.644), E-opt: 0.2 (0.269), width: 16 Scan time: 2.550 The best scores are: opt bits E(32554) CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 ( 354) 2486 552.1 2.5e-157 CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 360) 1285 289.9 2.2e-78 CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 422) 1285 289.9 2.6e-78 CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 ( 340) 1093 248.0 8.9e-66 CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 ( 671) 804 185.0 1.6e-46 CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 ( 911) 804 185.1 2.1e-46 CCDS12398.1 HAPLN4 gene_id:404037|Hs108|chr19 ( 402) 779 179.4 4.5e-45 CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 ( 655) 780 179.8 5.8e-45 CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642) 780 179.9 1.3e-44 CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409) 780 180.0 1.8e-44 CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396) 780 180.1 2.4e-44 CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321) 759 175.3 2.6e-43 CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431) 760 175.7 3.7e-43 CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530) 760 175.7 3.8e-43 >>CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 (354 aa) initn: 2486 init1: 2486 opt: 2486 Z-score: 2937.9 bits: 552.1 E(32554): 2.5e-157 Smith-Waterman score: 2486; 100.0% identity (100.0% similar) in 354 aa overlap (1-354:1-354) 10 20 30 40 50 60 pF1KB5 MKSLLLLVLISICWADHLSDNYTLDHDRAIHIQAENGPHLLVEAEQAKVFSHRGGNVTLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 MKSLLLLVLISICWADHLSDNYTLDHDRAIHIQAENGPHLLVEAEQAKVFSHRGGNVTLP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 CKFYRDPTAFGSGIHKIRIKWTKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKGGSDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 CKFYRDPTAFGSGIHKIRIKWTKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKGGSDS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 DASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHEAQQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 DASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHEAQQA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 CLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPCGGQNTVPGVRNYGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 CLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPCGGQNTVPGVRNYGF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 WDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAWKILG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 WDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAWKILG 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 YDRCDAGWLADGSVRYPISRPRRRCSPTEAAVRFVGFPDKKHKLYGVYCFRAYN :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 YDRCDAGWLADGSVRYPISRPRRRCSPTEAAVRFVGFPDKKHKLYGVYCFRAYN 310 320 330 340 350 >>CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 (360 aa) initn: 1518 init1: 1185 opt: 1285 Z-score: 1520.6 bits: 289.9 E(32554): 2.2e-78 Smith-Waterman score: 1285; 55.0% identity (78.3% similar) in 318 aa overlap (36-353:45-360) 10 20 30 40 50 60 pF1KB5 LLVLISICWADHLSDNYTLDHDRAIHIQAENGPHLLVEAEQAKVFSHRGGNVTLPCKFYR :: .:.::. . .:...:..: :::.. CCDS10 SYGLPFYNGFYYSNSANDQNLGNGHGKDLLNGVKLVVETPEETLFTYQGASVILPCRYRY 20 30 40 50 60 70 70 80 90 100 110 120 pF1KB5 DPTAFGSGIHKIRIKWTKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKGGSDSDASLV .:. . ...:.:: ::. . : ::.:..: .....: ::::: :. .. :.:: CCDS10 EPALVSP--RRVRVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHLRQDKEHDVSLE 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB5 ITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHEAQQACLDQD : :: :::::::.::::.::::.. .: :.:.:::::: :::..::::.::.: .: CCDS10 IQDLRLEDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAEQA 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB5 AVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPCGGQNTVPGVRNYGFWDKDK ::.:::.::. ::. ::::::::::.:..::::: ::.:::: . .::::.:: . CCDS10 AVVASFEQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGPGLAPGVRSYGPRHRRL 200 210 220 230 240 250 250 260 270 280 290 300 pF1KB5 SRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAWKILGYDRCD :::::::.. ..:: ::: :: ::: :: .:: .: : ::::::.:::::. : :::: CCDS10 HRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAAWKFHGLDRCD 260 270 280 290 300 310 310 320 330 340 350 pF1KB5 AGWLADGSVRYPISRPRRRCSPTEAAVRFVGFPDKKHKLYGVYCFRAYN ::::::::::::. .:. :.: : .:: :::: . .::::::.: . CCDS10 AGWLADGSVRYPVVHPHPNCGPPEPGVRSFGFPDPQSRLYGVYCYRQH 320 330 340 350 360 >>CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 (422 aa) initn: 1518 init1: 1185 opt: 1285 Z-score: 1519.5 bits: 289.9 E(32554): 2.6e-78 Smith-Waterman score: 1285; 55.0% identity (78.3% similar) in 318 aa overlap (36-353:107-422) 10 20 30 40 50 60 pF1KB5 LLVLISICWADHLSDNYTLDHDRAIHIQAENGPHLLVEAEQAKVFSHRGGNVTLPCKFYR :: .:.::. . .:...:..: :::.. CCDS76 SYGLPFYNGFYYSNSANDQNLGNGHGKDLLNGVKLVVETPEETLFTYQGASVILPCRYRY 80 90 100 110 120 130 70 80 90 100 110 120 pF1KB5 DPTAFGSGIHKIRIKWTKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKGGSDSDASLV .:. . ...:.:: ::. . : ::.:..: .....: ::::: :. .. :.:: CCDS76 EPALVSP--RRVRVKWWKLSENGAPEKDVLVAIGLRHRSFGDYQGRVHLRQDKEHDVSLE 140 150 160 170 180 190 130 140 150 160 170 180 pF1KB5 ITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHEAQQACLDQD : :: :::::::.::::.::::.. .: :.:.:::::: :::..::::.::.: .: CCDS76 IQDLRLEDYGRYRCEVIDGLEDESGLVELELRGVVFPYQSPNGRYQFNFHEGQQVCAEQA 200 210 220 230 240 250 190 200 210 220 230 240 pF1KB5 AVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPCGGQNTVPGVRNYGFWDKDK ::.:::.::. ::. ::::::::::.:..::::: ::.:::: . .::::.:: . CCDS76 AVVASFEQLFRAWEEGLDWCNAGWLQDATVQYPIMLPRQPCGGPGLAPGVRSYGPRHRRL 260 270 280 290 300 310 250 260 270 280 290 300 pF1KB5 SRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAWKILGYDRCD :::::::.. ..:: ::: :: ::: :: .:: .: : ::::::.:::::. : :::: CCDS76 HRYDVFCFATALKGRVYYLEHPEKLTLTEAREACQEDDATIAKVGQLFAAWKFHGLDRCD 320 330 340 350 360 370 310 320 330 340 350 pF1KB5 AGWLADGSVRYPISRPRRRCSPTEAAVRFVGFPDKKHKLYGVYCFRAYN ::::::::::::. .:. :.: : .:: :::: . .::::::.: . CCDS76 AGWLADGSVRYPVVHPHPNCGPPEPGVRSFGFPDPQSRLYGVYCYRQH 380 390 400 410 420 >>CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 (340 aa) initn: 1028 init1: 527 opt: 1093 Z-score: 1294.4 bits: 248.0 E(32554): 8.9e-66 Smith-Waterman score: 1097; 44.7% identity (70.5% similar) in 349 aa overlap (7-350:5-337) 10 20 30 40 50 pF1KB5 MKSLLLLVLISIC----WADHLSDNYTLDHDRAIHIQAENGPHLLVEAEQAKVFSHRGGN :.: ..: :: .:. : .. ::: :. . . ::::.. CCDS11 MPGWLTLPTLCRFLLWA------FTIFHKAQGDPASHPGPHYLLPPIHEVIHSHRGAT 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 VTLPCKFYRDPTAFGSGIHKIRIKWTKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKG .:::: . : .. ...:.:. :.:. .... : : . :: ::. .. CCDS11 ATLPCVLGTTPPSY-------KVRWSKVEPGELRETLILITNGLHARGYGPLGGRARMRR 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 GSDSDASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHE : ::::::. . ::: :::.::.:.:.::..:...:.:.:::::: : :::..:..: CCDS11 GHRLDASLVIAGVRLEDEGRYRCELINGIEDESVALTLSLEGVVFPYQPSRGRYQFNYYE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 AQQACLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPCGGQNTVPGVR :.::: .::. .:...:::.:: :::::::::: .:::.::. : ::::.. ::.: CCDS11 AKQACEEQDGRLATYSQLYQAWTEGLDWCNAGWLLEGSVRYPVLTARAPCGGRGR-PGIR 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 NYGFWDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAW .:: :. ..:::.::::: . :. ... : .:: .:: :: :: .::::...::: CCDS11 SYGPRDRMRDRYDAFCFTSALAGQVFFV--PGRLTLSEAHAACRRRGAVVAKVGHLYAAW 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 KILGYDRCDAGWLADGSVRYPISRPRRRCSPT-EAAVRFVGFPDKKHKLYGVYCFRAYN :. : :.::.:::::::::.::. :: ::. . .:: ::: .. ::.::. CCDS11 KFSGLDQCDGGWLADGSVRFPITTPRPRCGGLPDPGVRSFGFPRPQQAAYGTYCYAEN 290 300 310 320 330 340 >>CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 (671 aa) initn: 675 init1: 469 opt: 804 Z-score: 948.8 bits: 185.0 E(32554): 1.6e-46 Smith-Waterman score: 804; 42.6% identity (67.4% similar) in 310 aa overlap (54-351:50-354) 30 40 50 60 70 80 pF1KB5 LDHDRAIHIQAENGPHLLVEAEQAKVFSHRGGNVTLPCK--FYRDPTAFGSGIHKIRIKW :: .:.::. . : : . . . . :.:: CCDS11 ALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPPPSRRAVLGSPRVKW 20 30 40 50 60 70 90 100 110 120 130 pF1KB5 TKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKG--GSDSDASLVITDLTLEDYGRYKC : :. .:..:.:. : . :. .:. :: : . .: .:.::....: .: : :.: CCDS11 TFLSRG--REAEVLVARGVRVKVNEAYRFRVALPAYPASLTDVSLALSELRPNDSGIYRC 80 90 100 110 120 130 140 150 160 170 180 190 pF1KB5 EVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHEAQQACLDQDAVIASFDQLYDAWR :: .:..:.. .: . ..:::: : .:: ..: ::.:: : ::. .::: :. CCDS11 EVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACARIGAHIATPEQLYAAYL 140 150 160 170 180 190 200 210 220 230 240 250 pF1KB5 GGLDWCNAGWLSDGSVQYPITKPREPC-GGQNTVPGVRNYGFWDKDKSRYDVFCFTSNFN :: . :.:::::: .:.::: ::: : : .. ::::::: : : . :::.:.. ..: CCDS11 GGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVVDPD-DLYDVYCYAEDLN 200 210 220 230 240 250 260 270 280 290 300 310 pF1KB5 GRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAWKILGYDRCDAGWLADGSVRYPI :... : ::: .:: : . ::.:: .::..::: : :.:. :::::::::::: CCDS11 GELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDG-GLDHCSPGWLADGSVRYPI 260 270 280 290 300 310 320 330 340 350 pF1KB5 SRPRRRCSPTEAAVRFV-------GFPDKKHKLYGVYCFRAYN : .::. .:. . :::.: :. ..::::: CCDS11 VTPSQRCGGGLPGVKTLFLFPNQTGFPNK-HSRFNVYCFRDSAQPSAIPEASNPASNPAS 320 330 340 350 360 370 CCDS11 DGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEF 380 390 400 410 420 430 >>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 (911 aa) initn: 675 init1: 469 opt: 804 Z-score: 946.8 bits: 185.1 E(32554): 2.1e-46 Smith-Waterman score: 804; 42.6% identity (67.4% similar) in 310 aa overlap (54-351:50-354) 30 40 50 60 70 80 pF1KB5 LDHDRAIHIQAENGPHLLVEAEQAKVFSHRGGNVTLPCK--FYRDPTAFGSGIHKIRIKW :: .:.::. . : : . . . . :.:: CCDS11 ALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTIPCHVHYLRPPPSRRAVLGSPRVKW 20 30 40 50 60 70 90 100 110 120 130 pF1KB5 TKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKG--GSDSDASLVITDLTLEDYGRYKC : :. .:..:.:. : . :. .:. :: : . .: .:.::....: .: : :.: CCDS11 TFLSRG--REAEVLVARGVRVKVNEAYRFRVALPAYPASLTDVSLALSELRPNDSGIYRC 80 90 100 110 120 130 140 150 160 170 180 190 pF1KB5 EVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHEAQQACLDQDAVIASFDQLYDAWR :: .:..:.. .: . ..:::: : .:: ..: ::.:: : ::. .::: :. CCDS11 EVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFSFSGAQEACARIGAHIATPEQLYAAYL 140 150 160 170 180 190 200 210 220 230 240 250 pF1KB5 GGLDWCNAGWLSDGSVQYPITKPREPC-GGQNTVPGVRNYGFWDKDKSRYDVFCFTSNFN :: . :.:::::: .:.::: ::: : : .. ::::::: : : . :::.:.. ..: CCDS11 GGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGFPGVRNYGVVDPD-DLYDVYCYAEDLN 200 210 220 230 240 250 260 270 280 290 300 310 pF1KB5 GRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAWKILGYDRCDAGWLADGSVRYPI :... : ::: .:: : . ::.:: .::..::: : :.:. :::::::::::: CCDS11 GELFLGDPPEKLTLEEARAYCQERGAEIATTGQLYAAWDG-GLDHCSPGWLADGSVRYPI 260 270 280 290 300 310 320 330 340 350 pF1KB5 SRPRRRCSPTEAAVRFV-------GFPDKKHKLYGVYCFRAYN : .::. .:. . :::.: :. ..::::: CCDS11 VTPSQRCGGGLPGVKTLFLFPNQTGFPNK-HSRFNVYCFRDSAQPSAIPEASNPASNPAS 320 330 340 350 360 370 CCDS11 DGLEAIVTVTETLEELQLPQEATESESRGAIYSIPIMEDGGGGSSTPEDPAEAPRTLLEF 380 390 400 410 420 430 >>CCDS12398.1 HAPLN4 gene_id:404037|Hs108|chr19 (402 aa) initn: 916 init1: 646 opt: 779 Z-score: 922.7 bits: 179.4 E(32554): 4.5e-45 Smith-Waterman score: 1216; 50.9% identity (76.8% similar) in 336 aa overlap (28-352:35-366) 10 20 30 40 50 pF1KB5 MKSLLLLVLISICWADHLSDNYTLDHDRAIHI-QAENGPHLLVEAEQAKVFSHRGGN ...:. ..:.: ..:.. ..: :::::. CCDS12 RAALGPGALWAAAWGVLLLTAPAGAQRGRKKVVHVLEGESGS-VVVQTAPGQVVSHRGGT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 VTLPCKFYRDPTAFGSGIHKIRIKWTKLTSDYLKEVDVFVSMGYHKKTYGGYQGRVFLKG ..:::... . .: : .:.::::.. : : .::::..: .....:.:.::. :.: CCDS12 IVLPCRYHYEAAAHGH--DGVRLKWTKVV-DPLAFTDVFVALGPQHRAFGSYRGRAELQG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 GSDSDASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHE . .:::::. ..::.:::::.::: . ::::. .: :::.:::::: :: :::.:.: : CCDS12 DGPGDASLVLRNVTLQDYGRYECEVTNELEDDAGMVKLDLEGVVFPYHPRGGRYKLTFAE 130 140 150 160 170 180 180 190 200 210 220 pF1KB5 AQQACLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPCGGQ------- ::.:: .::...:: .::. ::: :::::::::: :::::::...::::::: CCDS12 AQRACAEQDGILASAEQLHAAWRDGLDWCNAGWLRDGSVQYPVNRPREPCGGLGGTGSAG 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB5 ---NTVPGVRNYGFWDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQI .. :.::::. . . :::.::::::. :: ..: . .. :..:: :: . CCDS12 GGGDANGGLRNYGYRHNAEERYDAFCFTSNLPGRVFFLKPLRPVPFSGAARACAARGAAV 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB5 AKVGQIFAAWKILGYDRCDAGWLADGSVRYPISRPRRRCSPTEAAVRFVGFPDKKHKLYG :::::.:::::. ::: ::::::::.:::: :: ::. . .:: .:::: ..:.: CCDS12 AKVGQLFAAWKLQLLDRCTAGWLADGSARYPIVNPRARCGGRRPGVRSLGFPDATRRLFG 310 320 330 340 350 360 350 pF1KB5 VYCFRAYN :::.:: CCDS12 VYCYRAPGAPDPAPGGWGWGWAGGGGWAGGARDPAAWTPLHV 370 380 390 400 >>CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 (655 aa) initn: 700 init1: 505 opt: 780 Z-score: 920.6 bits: 179.8 E(32554): 5.8e-45 Smith-Waterman score: 782; 39.5% identity (66.3% similar) in 332 aa overlap (39-351:19-347) 10 20 30 40 50 60 pF1KB5 LISICWADHLSDNYTLDHDRAIHIQAENGPHLLVEAEQAKVFSHRG---GNVTLPCKFYR : : ... .: :: :.:.:::.: CCDS47 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFST 10 20 30 40 70 80 90 100 110 pF1KB5 DPTAFGSGIHK--IRIKWTKLTSDY----LKEVDVFVSMGYHKKTYGGYQGRVFLKGGSD :: : . .::::.:. : :::. :.:... . : :.::: . . CCDS47 MPTLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPE 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 S--DASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHEA . ::::... : : : :.:.:. :.:: .:.: ..:::: : .::.:::. : CCDS47 AVGDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAA 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 QQACLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPC-GGQNTVPGVR :.:::: ::::. .::. :.. :.. :.::::.: .:.::: :: : : . ::: CCDS47 QKACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVR 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 NYGFWDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAW .::: . ... :::.:......: ..: :.:.:..::.. : :. :..: ::.. ::: CCDS47 TYGFRSPQET-YDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAW 230 240 250 260 270 280 300 310 320 330 340 pF1KB5 KILGYDRCDAGWLADGSVRYPISRPRRRCSPTEAAVRFV-------GFPDKKHKLYGVYC . :.:.:: :::.:.:::.:.. : .:. .:: . ::: . . .:: CCDS47 RN-GFDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSR-FDAYC 290 300 310 320 330 340 350 pF1KB5 FRAYN :. CCDS47 FKRPDRCKMNPCLNGGTCYPTETSYVCTCVPGYSGDQCELDFDECHSNPCRNGATCVDGF 350 360 370 380 390 400 >>CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642 aa) initn: 666 init1: 505 opt: 780 Z-score: 914.5 bits: 179.9 E(32554): 1.3e-44 Smith-Waterman score: 782; 39.5% identity (66.3% similar) in 332 aa overlap (39-351:19-347) 10 20 30 40 50 60 pF1KB5 LISICWADHLSDNYTLDHDRAIHIQAENGPHLLVEAEQAKVFSHRG---GNVTLPCKFYR : : ... .: :: :.:.:::.: CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFST 10 20 30 40 70 80 90 100 110 pF1KB5 DPTAFGSGIHK--IRIKWTKLTSDY----LKEVDVFVSMGYHKKTYGGYQGRVFLKGGSD :: : . .::::.:. : :::. :.:... . : :.::: . . CCDS54 MPTLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPE 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 S--DASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHEA . ::::... : : : :.:.:. :.:: .:.: ..:::: : .::.:::. : CCDS54 AVGDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAA 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 QQACLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPC-GGQNTVPGVR :.:::: ::::. .::. :.. :.. :.::::.: .:.::: :: : : . ::: CCDS54 QKACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVR 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 NYGFWDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAW .::: . ... :::.:......: ..: :.:.:..::.. : :. :..: ::.. ::: CCDS54 TYGFRSPQET-YDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAW 230 240 250 260 270 280 300 310 320 330 340 pF1KB5 KILGYDRCDAGWLADGSVRYPISRPRRRCSPTEAAVRFV-------GFPDKKHKLYGVYC . :.:.:: :::.:.:::.:.. : .:. .:: . ::: . . .:: CCDS54 RN-GFDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSR-FDAYC 290 300 310 320 330 340 350 pF1KB5 FRAYN :. CCDS54 FKPKEATTIDLSILAETASPSLSKEPQMVSDRTTPIIPLVDELPVIPTEFPPVGNIVSFE 350 360 370 380 390 400 >>CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409 aa) initn: 666 init1: 505 opt: 780 Z-score: 911.9 bits: 180.0 E(32554): 1.8e-44 Smith-Waterman score: 782; 39.5% identity (66.3% similar) in 332 aa overlap (39-351:19-347) 10 20 30 40 50 60 pF1KB5 LISICWADHLSDNYTLDHDRAIHIQAENGPHLLVEAEQAKVFSHRG---GNVTLPCKFYR : : ... .: :: :.:.:::.: CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFST 10 20 30 40 70 80 90 100 110 pF1KB5 DPTAFGSGIHK--IRIKWTKLTSDY----LKEVDVFVSMGYHKKTYGGYQGRVFLKGGSD :: : . .::::.:. : :::. :.:... . : :.::: . . CCDS54 MPTLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPE 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 S--DASLVITDLTLEDYGRYKCEVIEGLEDDTVVVALDLQGVVFPYFPRLGRYNLNFHEA . ::::... : : : :.:.:. :.:: .:.: ..:::: : .::.:::. : CCDS54 AVGDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAA 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 QQACLDQDAVIASFDQLYDAWRGGLDWCNAGWLSDGSVQYPITKPREPC-GGQNTVPGVR :.:::: ::::. .::. :.. :.. :.::::.: .:.::: :: : : . ::: CCDS54 QKACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVR 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 NYGFWDKDKSRYDVFCFTSNFNGRFYYLIHPTKLTYDEAVQACLNDGAQIAKVGQIFAAW .::: . ... :::.:......: ..: :.:.:..::.. : :. :..: ::.. ::: CCDS54 TYGFRSPQET-YDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAW 230 240 250 260 270 280 300 310 320 330 340 pF1KB5 KILGYDRCDAGWLADGSVRYPISRPRRRCSPTEAAVRFV-------GFPDKKHKLYGVYC . :.:.:: :::.:.:::.:.. : .:. .:: . ::: . . .:: CCDS54 RN-GFDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSR-FDAYC 290 300 310 320 330 340 350 pF1KB5 FRAYN :. CCDS54 FKRRMSDLSVIGHPIDSESKEDEPCSEETDPVHDLMAEILPEFPDIIEIDLYHSEENEEE 350 360 370 380 390 400 354 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 06:31:13 2016 done: Sat Nov 5 06:31:13 2016 Total Scan time: 2.550 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]