FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB1499, 1321 aa 1>>>pF1KB1499 1321 - 1321 aa - 1321 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.5200+/-0.00117; mu= 1.4860+/- 0.070 mean_var=424.9245+/-84.930, 0's: 0 Z-trim(113.1): 136 B-trim: 53 in 1/53 Lambda= 0.062218 statistics sampled from 13661 (13795) to 13661 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.736), E-opt: 0.2 (0.424), width: 16 Scan time: 6.360 The best scores are: opt bits E(32554) CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321) 9266 847.6 0 CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409) 1376 139.7 9.2e-32 CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396) 1376 139.9 1.1e-31 CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 ( 655) 1319 133.9 1.4e-30 CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642) 1327 135.1 1.5e-30 CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431) 1191 123.1 9.2e-27 CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530) 1191 123.1 9.4e-27 CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 ( 671) 1144 118.2 7.4e-26 CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 ( 911) 1144 118.4 9e-26 CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 360) 827 89.5 1.8e-17 CCDS76790.1 HAPLN3 gene_id:145864|Hs108|chr15 ( 422) 827 89.6 2e-17 CCDS1148.1 HAPLN2 gene_id:60484|Hs108|chr1 ( 340) 766 84.0 7.7e-16 CCDS4061.1 HAPLN1 gene_id:1404|Hs108|chr5 ( 354) 759 83.4 1.2e-15 >>CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321 aa) initn: 9266 init1: 9266 opt: 9266 Z-score: 4514.4 bits: 847.6 E(32554): 0 Smith-Waterman score: 9266; 100.0% identity (100.0% similar) in 1321 aa overlap (1-1321:1-1321) 10 20 30 40 50 60 pF1KB1 MGAPFVWALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MGAPFVWALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB1 FTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB1 PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEEETLILE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEEETLILE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB1 EKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTDPMPRRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 EKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTDPMPRRR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB1 GRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSRSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSRSP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB1 WADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAEGPSARPATP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 WADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAEGPSARPATP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB1 DLFWSPLEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEANRVEAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DLFWSPLEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEANRVEAH 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB1 GEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAE 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB1 HSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 HSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQD 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB1 PWPSVYSKGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PWPSVYSKGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB1 SGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPE 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB1 PEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLL 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB1 PVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHG 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB1 GTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSF 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB1 CEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGH 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB1 ENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPC 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB1 NYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRS 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB1 NGKWDRPQIVCTKPRRSHRMRRHHHHHQHHHQHHHHKSRKERRKHKKHPTEDWEKDEGNF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NGKWDRPQIVCTKPRRSHRMRRHHHHHQHHHQHHHHKSRKERRKHKKHPTEDWEKDEGNF 1270 1280 1290 1300 1310 1320 pF1KB1 C : CCDS12 C >>CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409 aa) initn: 2414 init1: 1237 opt: 1376 Z-score: 683.8 bits: 139.7 E(32554): 9.2e-32 Smith-Waterman score: 1386; 35.2% identity (62.7% similar) in 668 aa overlap (674-1304:1765-2409) 650 660 670 680 690 700 pF1KB1 LPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRA : : .. : :. : ..: . ..: CCDS54 SSTLSDGQAIADQSEIIPTLGQFERTQEEYEDKKHAGP-SFQPEFSSGAEEALVDHTPYL 1740 1750 1760 1770 1780 1790 710 720 730 740 750 760 pF1KB1 DFRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVG-FVPTETATEPTGLRGIPGSESGV .. : . : ..: . ..:. :. . . ..::. :. . : . : :::.. CCDS54 SIATTHLMDQSVTEVPDVMEGSNPPYYT-DTTLAVSTFAKLSSQTPSSPLTIYSGSEASG 1800 1810 1820 1830 1840 1850 770 780 790 800 810 pF1KB1 FDTAESPTS--GLQATVDEVQDPWPSVYSKGLDASSPSAPLGSPGVFLV--PKVTPN--L .:.. :... . :..: : .. . : . . .. :...:. : CCDS54 HTEIPQPSALPGIDVG-SSVMSPQDSFKEIHVNIEATFKPSSEEYLHITEPPSLSPDTKL 1860 1870 1880 1890 1900 1910 820 830 840 850 860 870 pF1KB1 EPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQVALDTSIVTP-L :: . :.: . . .:.. .. :...... .. : . ::. .. . : . CCDS54 EP--SEDDGKP--ELLEEMEASPTELIAV--EGTEILQDFQNKT-DGQVSGEAIKMFPTI 1920 1930 1940 1950 1960 880 890 900 910 920 pF1KB1 TTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVP---PHQSS-PL--GKPA : : : . . : .... :: . : :. .. :: :. : : ..: CCDS54 KTPEAGTVITTADEIELEGATQWPHSTSASA--TYGVEAGVVPWLSPQTSERPTLSSSPE 1970 1980 1990 2000 2010 2020 930 940 950 960 970 pF1KB1 VPPGTPTAASVGESASVSSGEPTVPW-----DPSSTLLPVTLGIE----DFEL-EVLAGS . : : .: :........: : . ..:. :: .. : : : :. . CCDS54 INPETQAALIRGQDSTIAASEQQVAARILDSNDQATVNPVEFNTEVATPPFSLLETSNET 2030 2040 2050 2060 2070 2080 980 990 1000 1010 1020 1030 pF1KB1 PGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQG . .. :: . : ::: : : :. ::::.:::: . : : :.: : CCDS54 DFLIGINEESVEGTAIYLPG-P----------DRCKMNPCLNGGTCYPTETSYVCTCVPG 2090 2100 2110 2120 2130 1040 1050 1060 1070 1080 1090 pF1KB1 FAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQG ..:..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: ::::::: CCDS54 YSGDQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQG 2140 2150 2160 2170 2180 2190 1100 1110 1120 1130 1140 1150 pF1KB1 HCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQ .::.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.::. CCDS54 QCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFR 2200 2210 2220 2230 2240 2250 1160 1170 1180 1190 1200 1210 pF1KB1 WTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGP :::.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: :: CCDS54 WTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQ 2260 2270 2280 2290 2300 2310 1220 1230 1240 1250 1260 1270 pF1KB1 PPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP--- ::.::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .: CCDS54 PPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAY 2320 2330 2340 2350 2360 2370 1280 1290 1300 1310 1320 pF1KB1 RRSHRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC .:.. :. .. . . .: :. ::. : :. CCDS54 QRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR 2380 2390 2400 >-- initn: 1110 init1: 1059 opt: 1173 Z-score: 585.3 bits: 121.5 E(32554): 2.8e-26 Smith-Waterman score: 1189; 29.6% identity (55.1% similar) in 1020 aa overlap (37-954:21-1015) 10 20 30 40 50 60 pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP :: :.: : :...:. :.::: :. .: CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP 10 20 30 40 50 70 80 90 100 110 120 pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR :: . . ::::.:... .. . .. .:::... ........::::.:..:. CCDS54 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE ..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::. CCDS54 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY :: .:.::.:..: ::.::::..::::::.:.:::::: : :::::. . :::.: CCDS54 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG : :.::: :::::.. .: :.::.. ..:. : .:. : : ::.::.:. ::..: CCDS54 GFRSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH .:::: :::.:.:::.:. . : .::: ::::.::: :.:::: : :::::::. . CCDS54 FDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKRRM 300 310 320 330 340 350 370 380 390 400 410 pF1KB1 PTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQE-PLVSSGEEETLIL . : . : : : : ::..: . : ::. : : : :.: CCDS54 SDLSVIGHPIDSESKEDEPCSEETDPVHDLMAEILPE---FPDIIEIDLYHSEENEEEEE 360 370 380 390 400 420 430 440 450 460 pF1KB1 EEKQESQQTLSPT-------------PGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASS : . .. : .:. : :: : :. . .:::: .... .. ... CCDS54 ECANATDVTTTPSVQYINGKHLVTTVPKDPEAAEARRGQ--FESVAPS-QNFSDSSESDT 410 420 430 440 450 460 470 480 490 pF1KB1 H----------TEVAPTD-------------P--MPRRRGRFKGLNGRYFQ----QQEPE : : : :.. : .:. .:.: . : ..: : CCDS54 HPFVIAKTELSTAVQPNESTETTESLEVTWKPETYPETSEHFSGGEPDVFPTVPFHEEFE 470 480 490 500 510 520 500 510 520 530 540 550 pF1KB1 PGL-QGGMEASAQPPTSEA-AVNQMEPPLAMAVTEMLG----SGQSRSPWADLTNEVDMP : . : :. .. : . ... :... : : . .:.. ..:: . CCDS54 SGTAKKGAESVTERDTEVGHQAHEHTEPVSLFPEESSGEIAIDQESQKIAFARATEVTF- 530 540 550 560 570 580 560 570 580 590 600 pF1KB1 GAGSAGGKSSPEPWLWPPTMVPPSISGH-SRAPVLELEKAEGPSARPATPDLFW---SPL : ::. . ::.:: : :.. :. .. : :. .: . : .: CCDS54 --GEEVEKSTSVTY--TPTIVPSSASAYVSEEEAVTLIGNPWPDDLLSTKES-WVEATPR 590 600 610 620 630 610 620 630 640 650 660 pF1KB1 EAT-VSAPSPAPW-EAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEANRV--EAHGEA ... .:. : : :. : . :..:. .. : :. ...:. :. :. CCDS54 QVVELSGSSSIPITEGSGEAEEDEDTMFTMVTDLSQRNTTD-TLITLDTSRIITESFFEV 640 650 660 670 680 690 670 680 690 700 710 720 pF1KB1 TATA--PPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPAQVNKAEH ::. : : .:: .: ... . .: . .: . .: : :. : CCDS54 PATTIYPVSEQPSAKV--VPTKFVSETDTSEWISSTTVEEKKRKEEEGTTGTA------- 700 710 720 730 740 730 740 750 760 770 780 pF1KB1 SSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDP :. . :..:. . ..: : . .. . :.... : . .::.. . .: . CCDS54 STFEVYSSTQRSDQL-ILPFELESPNVATSSDSGTRKS-FMSLTTPTQSEREMTDSTPVF 750 760 770 780 790 800 790 800 810 820 830 pF1KB1 WPSVYSKGLDA-SSPSAPLGSPGVFLVPKVTPNLEPWVATDEGP---TVNPMDSTVTP-- . ..: : .. . . .::: . : : ..: ...: .::. CCDS54 TETNTLENLGAQTTEHSSIHQPGVQEGLTTLPRSPASVFMEQGSGEAAADPETTTVSSFS 810 820 830 840 850 860 840 850 860 870 880 pF1KB1 --------APSDASGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQ----GDKVG : ....: : .. .: : : ....: .. .: . ....: CCDS54 LNVEYAIQAEKEVAGTLSPHVETTFSTEPTGLVLSTVMDRVVAENITQTSREIVISERLG 870 880 890 900 910 920 890 900 910 920 pF1KB1 VPAMSTL--GSSSSQP----------------HP-EPEDQVETQGTSGASVPPHQSSPLG : ... : :.. : :: :. : .:.. :. :.:: CCDS54 EPNYGAEIRGFSTGFPLEEDFSGDFREYSTVSHPIAKEETVMMEGSGDAAFRDTQTSPST 930 940 950 960 970 980 930 940 950 960 970 980 pF1KB1 KPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAGSPGVESFW :. . . : : :... : . ::. CCDS54 VPTSVHISHISDSEGPSSTMVS-TSAFPWEEFTSSAEGSGEQLVTVSSSVVPVLPSAVQK 990 1000 1010 1020 1030 1040 >>CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396 aa) initn: 2404 init1: 1237 opt: 1376 Z-score: 682.0 bits: 139.9 E(32554): 1.1e-31 Smith-Waterman score: 1386; 35.2% identity (62.7% similar) in 668 aa overlap (674-1304:2752-3396) 650 660 670 680 690 700 pF1KB1 LPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRA : : .. : :. : ..: . ..: CCDS40 SSTLSDGQAIADQSEIIPTLGQFERTQEEYEDKKHAGP-SFQPEFSSGAEEALVDHTPYL 2730 2740 2750 2760 2770 2780 710 720 730 740 750 760 pF1KB1 DFRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVG-FVPTETATEPTGLRGIPGSESGV .. : . : ..: . ..:. :. . . ..::. :. . : . : :::.. CCDS40 SIATTHLMDQSVTEVPDVMEGSNPPYYT-DTTLAVSTFAKLSSQTPSSPLTIYSGSEASG 2790 2800 2810 2820 2830 770 780 790 800 810 pF1KB1 FDTAESPTS--GLQATVDEVQDPWPSVYSKGLDASSPSAPLGSPGVFLV--PKVTPN--L .:.. :... . :..: : .. . : . . .. :...:. : CCDS40 HTEIPQPSALPGIDVG-SSVMSPQDSFKEIHVNIEATFKPSSEEYLHITEPPSLSPDTKL 2840 2850 2860 2870 2880 2890 820 830 840 850 860 870 pF1KB1 EPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQVALDTSIVTP-L :: . :.: . . .:.. .. :...... .. : . ::. .. . : . CCDS40 EP--SEDDGKP--ELLEEMEASPTELIAV--EGTEILQDFQNKT-DGQVSGEAIKMFPTI 2900 2910 2920 2930 2940 2950 880 890 900 910 920 pF1KB1 TTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVP---PHQSS-PL--GKPA : : : . . : .... :: . : :. .. :: :. : : ..: CCDS40 KTPEAGTVITTADEIELEGATQWPHSTSASA--TYGVEAGVVPWLSPQTSERPTLSSSPE 2960 2970 2980 2990 3000 930 940 950 960 970 pF1KB1 VPPGTPTAASVGESASVSSGEPTVPW-----DPSSTLLPVTLGIE----DFEL-EVLAGS . : : .: :........: : . ..:. :: .. : : : :. . CCDS40 INPETQAALIRGQDSTIAASEQQVAARILDSNDQATVNPVEFNTEVATPPFSLLETSNET 3010 3020 3030 3040 3050 3060 980 990 1000 1010 1020 1030 pF1KB1 PGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQG . .. :: . : ::: : : :. ::::.:::: . : : :.: : CCDS40 DFLIGINEESVEGTAIYLPG-P----------DRCKMNPCLNGGTCYPTETSYVCTCVPG 3070 3080 3090 3100 3110 1040 1050 1060 1070 1080 1090 pF1KB1 FAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQG ..:..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: ::::::: CCDS40 YSGDQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQG 3120 3130 3140 3150 3160 3170 1100 1110 1120 1130 1140 1150 pF1KB1 HCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQ .::.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.::. CCDS40 QCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFR 3180 3190 3200 3210 3220 3230 1160 1170 1180 1190 1200 1210 pF1KB1 WTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGP :::.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: :: CCDS40 WTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQ 3240 3250 3260 3270 3280 3290 1220 1230 1240 1250 1260 1270 pF1KB1 PPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP--- ::.::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .: CCDS40 PPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAY 3300 3310 3320 3330 3340 3350 1280 1290 1300 1310 1320 pF1KB1 RRSHRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC .:.. :. .. . . .: :. ::. : :. CCDS40 QRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR 3360 3370 3380 3390 >-- initn: 1100 init1: 1049 opt: 1202 Z-score: 597.6 bits: 124.3 E(32554): 5.8e-27 Smith-Waterman score: 1216; 30.2% identity (55.9% similar) in 1024 aa overlap (37-991:21-999) 10 20 30 40 50 60 pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP :: :.: : :...:. :.::: :. .: CCDS40 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP 10 20 30 40 50 70 80 90 100 110 120 pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR :: . . ::::.:... .. . .. .:::... ........::::.:..:. CCDS40 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE ..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::. CCDS40 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY :: .:.::.:..: ::.::::..::::::.:.:::::: : :::::. . :::.: CCDS40 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG : :.::: :::::.. .: :.::.. ..:. : .:. : : ::.::.:. ::..: CCDS40 GFRSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH .:::: :::.:.:::.:. . : .::: ::::.::: :.:::: : :::::::. .. CCDS40 FDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKE 300 310 320 330 340 350 370 380 390 400 410 pF1KB1 PT----SQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQE--PLVSSGEE : : .. .:: . : ...: . :. : ..: :. .: .:: .. CCDS40 ATTIDLSILAETASPSLSKEPQMVSDRTTPII---PLVDELPVIPTEFPPVGNIVSFEQK 360 370 380 390 400 420 430 440 450 460 pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASW-----------PTGEVWLSTVAPSPSDMGAGTA :. . .: : ::: : : :.. .: . .. .:. CCDS40 ATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKE---EVLQSTT 410 420 430 440 450 460 470 480 490 500 510 pF1KB1 ASSHTEVAPTDPMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAV------ . :: . : . . . .... ..: : : : .:: . :..: : CCDS40 GVSHYATDSWDGVVEDKQTQESVT--QIEQIEVGP-LVTSMEILKHIPSKEFPVTETPLV 470 480 490 500 510 520 520 530 540 550 560 570 pF1KB1 -------NQMEPPLAMAVTEMLGSGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPT .. : .. .:.:.. .:. : .: : . ..:. : . : CCDS40 TARMILESKTEKKMVSTVSELVTTGHYGF---TLGEEDDEDRTLTVGSDESTLIFDQIPE 530 540 550 560 570 580 590 600 610 620 pF1KB1 MVPPSISGHSRAPV-LELEKAEGPSARPATPDLFWSPL-EATVSAPSPAPWEAFPVATSP .. ..: :. . .:: :. :: .. ::: .. : :: .. CCDS40 VI--TVSKTSEDTIHTHLEDLESVSASTTV-----SPLIMPDNNGSSMDDWEERQTSGRI 580 590 600 610 620 630 630 640 650 660 670 680 pF1KB1 DLPMMAMLRGPKEWMLPHPTPIST---EANRVEAHGEATATAPPSPAAETKVYSLPLSLT ... . . : : : .... ..: .:. : . :. .: CCDS40 TEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTETLI 640 650 660 670 680 690 690 700 710 720 pF1KB1 P-------TGQGGEAMPTTPESPRADFR-------ETGETSPAQVNKA--EHSSSSPWPS : : . : . .: ... . :. . : .:... : ..: .:. CCDS40 PEMRTDTYTDEIQEEITKSPFMGKTEEEVFSGMKLSTSLSEPIHVTESSVEMTKSFDFPT 700 710 720 730 740 750 730 740 750 760 770 780 pF1KB1 VNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQAT-VDEVQDPWPSVYSK . .... :::. . . ::. . .: :. :. : : . :. : .: CCDS40 LITKLSAE--PTEVRDMEEDFTATPGTTK--YD--ENITTVLLAHGTLSVEAATVSKWSW 760 770 780 790 800 790 800 810 820 830 840 pF1KB1 GLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGS : .. : :: : :... .: : . : : .: :. . :: . : :. CCDS40 DEDNTT-SKPLESTE----PSASSKLPPALLTTVG--MNGKDKDI---PS----FTEDGA 810 820 830 840 850 850 860 870 880 890 900 pF1KB1 QVFEEA-ESTTLSPQVALDTSIVTP---LTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQ . : .:: . . . : .:.. .. ..:. ::: .:... . : . CCDS40 DEFTLIPDSTQKQLEEVTDEDIAAHGKFTIRFQPTTSTGIAEKSTLRDSTTEEKVPPITS 860 870 880 890 900 910 910 920 930 940 950 pF1KB1 VETQ---GTSGASVPPHQSSPLGKPA--VPPGTPTAASVGES-ASVSSG-EPTVPWDPSS .: : :... .. :.::. :: . :. : . .: :: :::. : : CCDS40 TEGQVYATMEGSALGEVEDVDLSKPVSTVPQFAHTSEVEGLAFVSYSSTQEPTTYVDSSH 920 930 940 950 960 970 960 970 980 990 1000 1010 pF1KB1 TLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPC :. :... : . ::. :.: : :. . :: CCDS40 TI-PLSV-IPKTDWGVLV--PSVPS--EDEVLGEPSQDILVIDQTRLEATISPETMRTTK 980 990 1000 1010 1020 1020 1030 1040 1050 1060 1070 pF1KB1 LHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYG CCDS40 ITEGTTQEEFPWKEQTAEKPVPALSSTAWTPKEAVTPLDEQEGDGSAYTVSEDELLTGSE 1030 1040 1050 1060 1070 1080 >>CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 (655 aa) initn: 2399 init1: 1237 opt: 1319 Z-score: 662.7 bits: 133.9 E(32554): 1.4e-30 Smith-Waterman score: 1325; 41.4% identity (66.7% similar) in 490 aa overlap (833-1304:178-655) 810 820 830 840 850 860 pF1KB1 GVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQ : .: . . .: : ::. .. :. : CCDS47 DGVVFHYRAATSRYTLNFEAAQKACLDVGAVIATPEQLFAAYEDG---FEQCDAGWLADQ 150 160 170 180 190 200 870 880 890 900 910 920 pF1KB1 VALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQVE-TQGTS-GASVPPHQS . . : .: . :::.: .. : : : : . :. .: .:: . . CCDS47 T-VRYPIRAPRVGC-YGDKMGKAGVRTYGFRSPQETYDVYCYVDHLDGDVFHLTVPSKFT 210 220 230 240 250 260 930 940 950 960 970 pF1KB1 SPLGKPAVPPGTPTAASVGE-SASVSSG--EPTVPW-DPSSTLLPVTLGIEDFELEVLAG . :.::: .:. .: . : . .:. :::.. . . .: CCDS47 FEEAAKECENQDARLATVGELQAAWRNGFDQCDYGWLSDASVRHPVTVA----RAQCGGG 270 280 290 300 310 980 990 1000 1010 1020 1030 pF1KB1 SPGVESFWE-EVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCD ::..... : .: : : . ..: . . : :. ::::.:::: . : : :.: CCDS47 LLGVRTLYRFENQTGFPP--PDSRFDAYCFK-RPDRCKMNPCLNGGTCYPTETSYVCTCV 320 330 340 350 360 370 1040 1050 1060 1070 1080 1090 pF1KB1 QGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKF :..:..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: ::::: CCDS47 PGYSGDQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKF 380 390 400 410 420 430 1100 1110 1120 1130 1140 1150 pF1KB1 QGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERD ::.::.::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.: CCDS47 QGQCYKYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHD 440 450 460 470 480 490 1160 1170 1180 1190 1200 1210 pF1KB1 FQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLC :.:::.. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: : CCDS47 FRWTDGSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVAC 500 510 520 530 540 550 1220 1230 1240 1250 1260 1270 pF1KB1 GPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP- : ::.::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .: CCDS47 GQPPVVENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPS 560 570 580 590 600 610 1280 1290 1300 1310 1320 pF1KB1 --RRSHRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC .:.. :. .. . . .: :. ::. : :. CCDS47 AYQRTYSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR 620 630 640 650 >>CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642 aa) initn: 2404 init1: 1237 opt: 1327 Z-score: 661.9 bits: 135.1 E(32554): 1.5e-30 Smith-Waterman score: 1369; 36.8% identity (60.3% similar) in 665 aa overlap (662-1304:1039-1642) 640 650 660 670 680 pF1KB1 MMAMLRGPKEWMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPT---- : :: : :: . ... ..:: CCDS54 QTRLEATISPETMRTTKITEGTTQEEFPWKEQTAEKP-VPALSSTAWTPKEAVTPLDEQE 1010 1020 1030 1040 1050 1060 690 700 710 720 730 740 pF1KB1 GQGGEAMPTTPESPRADFR-ETGETSPAQVNKAEHSSSSPWPSVNRN-VAVGFVPTETAT :.:. . : .. : . ::.: :.: .:: : : .:... : . : : : CCDS54 GDGSAYTVSEDELLTGSERVPVLETTP--VGKIDHSVSYPPGAVTEHKVKTDEVVTLTPR 1070 1080 1090 1100 1110 1120 750 760 770 780 790 800 pF1KB1 EPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLD--ASSPSAPLGSPG . :: :. ..: : :.:. .... . ... . .: . ::: : CCDS54 IGPKVSLSPGPEQK-YETEGSSTTGFTSSLSPFSTHITQLMEETTTEKTSLEDIDLGS-G 1130 1140 1150 1160 1170 1180 810 820 830 840 850 860 pF1KB1 VFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTTLSPQV .: ::.: .: . . :: ::: . . :.: . .....:. CCDS54 LFEKPKATELIE----------FSTIKVTV---PSDITTAF---SSVDRLHTTSAFKPSS 1190 1200 1210 1220 870 880 890 900 910 920 pF1KB1 ALDTSIVTPLTTLEQGDKVGVPAMSTLGSSSSQPHPEP-EDQV--ETQGTSGASVPPHQS :. . :: : :... . : .: :.:. : :: : ::. .: CCDS54 AITKK--PPLIDREPGEET-TSDMVIIGESTSHVPPTTLEDIVAKETETDIDREYFTTSS 1230 1240 1250 1260 1270 1280 930 940 950 960 970 980 pF1KB1 SPLGKPAVPPGTPTAASVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAGSPGV : .:. :: . . : .: .:. .: :.:: . : . CCDS54 PPATQPTRPPTVEDKEAFGPQA-LSTPQP-----PASTKF----------------HPDI 1290 1300 1310 1320 990 1000 1010 1020 1030 1040 pF1KB1 ESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAG . . :: :. . : : :. ::::.:::: . : : :.: :..: CCDS54 NVYIIEVR--ENKTGP-------------DRCKMNPCLNGGTCYPTETSYVCTCVPGYSG 1330 1340 1350 1360 1050 1060 1070 1080 1090 1100 pF1KB1 ENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCY ..::.:.:.: .::.::.::.: : : ::::::: :..::.::: :: :::::::.:: CCDS54 DQCELDFDECHSNPCRNGATCVDGFNTFRCLCLPSYVGALCEQDTETCDYGWHKFQGQCY 1370 1380 1390 1400 1410 1420 1110 1120 1130 1140 1150 1160 pF1KB1 RYFAHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTD .::::::.:. ::..:: ...::::. : ::. :.: ::. ::::::.. :.::.::: CCDS54 KYFAHRRTWDAAERECRLQGAHLTSILSHEEQMFVNRVGHDYQWIGLNDKMFEHDFRWTD 1430 1440 1450 1460 1470 1480 1170 1180 1190 1200 1210 1220 pF1KB1 NTGLQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPA .. ::.:::: ::::.::..::::::.. ::.:.::::::::.: :.:::::: :: ::. CCDS54 GSTLQYENWRPNQPDSFFSAGEDCVVIIWHENGQWNDVPCNYHLTYTCKKGTVACGQPPV 1490 1500 1510 1520 1530 1540 1230 1240 1250 1260 1270 pF1KB1 VENASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKP---RRS ::::. .: : .:.... .::.:..:: :.:. :::: .::.: :.:.: .: .:. CCDS54 VENAKTFGKMKPRYEINSLIRYHCKDGFIQRHLPTIRCLGNGRWAIPKITCMNPSAYQRT 1550 1560 1570 1580 1590 1600 1280 1290 1300 1310 1320 pF1KB1 HRMRRHHHHHQ------HHHQHHHHKSRK--ERRKHKKHPTEDWEKDEGNFC . :. .. . . .: :. ::. : :. CCDS54 YSMKYFKNSSSAKDNSINTSKHDHRWSRRWQESRR 1610 1620 1630 1640 >-- initn: 1085 init1: 1049 opt: 1202 Z-score: 601.3 bits: 123.9 E(32554): 3.6e-27 Smith-Waterman score: 1216; 30.2% identity (55.9% similar) in 1024 aa overlap (37-991:21-999) 10 20 30 40 50 60 pF1KB1 WALGLLMLQMLLFVAGEQGTQDITDASERGLHMQKLG-SGSVQAALAELVALPCLFTLQP :: :.: : :...:. :.::: :. .: CCDS54 MFINIKSILWMCSTLIVTHALHKVKVGKSPPVRGSLSGKVSLPCHFSTMP 10 20 30 40 50 70 80 90 100 110 120 pF1KB1 R--PS-AARDAPRIKWTKVRTASGQR--QDLPILVAKDNVVRVAKSWQGRVSLPSYPRRR :: . . ::::.:... .. . .. .:::... ........::::.:..:. CCDS54 TLPPSYNTSEFLRIKWSKIEVDKNGKDLKETTVLVAQNGNIKIGQDYKGRVSVPTHPEAV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB1 ANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQE ..:.: . : :::.:::::.:. :::: :: : : : :::::::.: .::.:.: ::. CCDS54 GDASLTVVKLLASDAGLYRCDVMYGIEDTQDTVSLTVDGVVFHYRAATSRYTLNFEAAQK 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB1 ACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSY :: .:.::.:..: ::.::::..::::::.:.:::::: : :::::. . :::.: CCDS54 ACLDVGAVIATPEQLFAAYEDGFEQCDAGWLADQTVRYPIRAPRVGCYGDKMGKAGVRTY 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB1 GRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEG : :.::: :::::.. .: :.::.. ..:. : .:. : : ::.::.:. ::..: CCDS54 GFRSPQETYDVYCYVDHLDGDVFHLTVPSKFTFEEAAKECENQDARLATVGELQAAWRNG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB1 LDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHH .:::: :::.:.:::.:. . : .::: ::::.::: :.:::: : :::::::. .. CCDS54 FDQCDYGWLSDASVRHPVTVARAQCGGGLLGVRTLYRFENQTGFPPPDSRFDAYCFKPKE 300 310 320 330 340 350 370 380 390 400 410 pF1KB1 PT----SQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQE--PLVSSGEE : : .. .:: . : ...: . :. : ..: :. .: .:: .. CCDS54 ATTIDLSILAETASPSLSKEPQMVSDRTTPII---PLVDELPVIPTEFPPVGNIVSFEQK 360 370 380 390 400 420 430 440 450 460 pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASW-----------PTGEVWLSTVAPSPSDMGAGTA :. . .: : ::: : : :.. .: . .. .:. CCDS54 ATVQPQAITDSLATKLPTPTGSTKKPWDMDDYSPSASGPLGKLDISEIKE---EVLQSTT 410 420 430 440 450 460 470 480 490 500 510 pF1KB1 ASSHTEVAPTDPMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAV------ . :: . : . . . .... ..: : : : .:: . :..: : CCDS54 GVSHYATDSWDGVVEDKQTQESVT--QIEQIEVGP-LVTSMEILKHIPSKEFPVTETPLV 470 480 490 500 510 520 520 530 540 550 560 570 pF1KB1 -------NQMEPPLAMAVTEMLGSGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPT .. : .. .:.:.. .:. : .: : . ..:. : . : CCDS54 TARMILESKTEKKMVSTVSELVTTGHYGF---TLGEEDDEDRTLTVGSDESTLIFDQIPE 530 540 550 560 570 580 590 600 610 620 pF1KB1 MVPPSISGHSRAPV-LELEKAEGPSARPATPDLFWSPL-EATVSAPSPAPWEAFPVATSP .. ..: :. . .:: :. :: .. ::: .. : :: .. CCDS54 VI--TVSKTSEDTIHTHLEDLESVSASTTV-----SPLIMPDNNGSSMDDWEERQTSGRI 580 590 600 610 620 630 630 640 650 660 670 680 pF1KB1 DLPMMAMLRGPKEWMLPHPTPIST---EANRVEAHGEATATAPPSPAAETKVYSLPLSLT ... . . : : : .... ..: .:. : . :. .: CCDS54 TEEFLGKYLSTTPFPSQHRTEIELFPYSGDKILVEGISTVIYPSLQTEMTHRRERTETLI 640 650 660 670 680 690 690 700 710 720 pF1KB1 P-------TGQGGEAMPTTPESPRADFR-------ETGETSPAQVNKA--EHSSSSPWPS : : . : . .: ... . :. . : .:... : ..: .:. CCDS54 PEMRTDTYTDEIQEEITKSPFMGKTEEEVFSGMKLSTSLSEPIHVTESSVEMTKSFDFPT 700 710 720 730 740 750 730 740 750 760 770 780 pF1KB1 VNRNVAVGFVPTETATEPTGLRGIPGSESGVFDTAESPTSGLQAT-VDEVQDPWPSVYSK . .... :::. . . ::. . .: :. :. : : . :. : .: CCDS54 LITKLSAE--PTEVRDMEEDFTATPGTTK--YD--ENITTVLLAHGTLSVEAATVSKWSW 760 770 780 790 800 790 800 810 820 830 840 pF1KB1 GLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGS : .. : :: : :... .: : . : : .: :. . :: . : :. CCDS54 DEDNTT-SKPLESTE----PSASSKLPPALLTTVG--MNGKDKDI---PS----FTEDGA 810 820 830 840 850 850 860 870 880 890 900 pF1KB1 QVFEEA-ESTTLSPQVALDTSIVTP---LTTLEQGDKVGVPAMSTLGSSSSQPHPEPEDQ . : .:: . . . : .:.. .. ..:. ::: .:... . : . CCDS54 DEFTLIPDSTQKQLEEVTDEDIAAHGKFTIRFQPTTSTGIAEKSTLRDSTTEEKVPPITS 860 870 880 890 900 910 910 920 930 940 950 pF1KB1 VETQ---GTSGASVPPHQSSPLGKPA--VPPGTPTAASVGES-ASVSSG-EPTVPWDPSS .: : :... .. :.::. :: . :. : . .: :: :::. : : CCDS54 TEGQVYATMEGSALGEVEDVDLSKPVSTVPQFAHTSEVEGLAFVSYSSTQEPTTYVDSSH 920 930 940 950 960 970 960 970 980 990 1000 1010 pF1KB1 TLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSDPCENNPC :. :... : . ::. :.: : :. . :: CCDS54 TI-PLSV-IPKTDWGVLV--PSVPS--EDEVLGEPSQDILVIDQTRLEATISPETMRTTK 980 990 1000 1010 1020 1020 1030 1040 1050 1060 1070 pF1KB1 LHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVCLCLPSYG CCDS54 ITEGTTQEEFPWKEQTAEKPVPALSSTAWTPKEAVTPLDEQEGDGSAYTVSEDELLTGSE 1030 1040 1050 1060 1070 1080 >>CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431 aa) initn: 1796 init1: 1047 opt: 1191 Z-score: 594.0 bits: 123.1 E(32554): 9.2e-27 Smith-Waterman score: 1259; 31.7% identity (54.2% similar) in 1058 aa overlap (51-1003:43-1051) 30 40 50 60 70 pF1KB1 AGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCLFT--LQP---RPSAARDAPR :. ...:: : ..: ::.: ::: CCDS53 VITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFIDPMHPVTTAPSTAPLAPR 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB1 IKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRRANATLLLGPLRASDS :::..: ...... .::: .. ::: ...: .::::.:: ..::: . ::..:: CCDS53 IKWSRV----SKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLEVQSLRSNDS 80 90 100 110 120 140 150 160 170 180 190 pF1KB1 GLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQEACRLSSAIIAAPRHL :.:::.:..:::: . . . : :.:::::. ::.: : .::.:: .:::::.:..: CCDS53 GVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNSAIIATPEQL 130 140 150 160 170 180 200 210 220 230 240 250 pF1KB1 QAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSYGRRNPQELYDVYCFA :::.:::: .::::::.:.:::::: : :::::.. .::::.:: :. .: ::::::: CCDS53 QAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRTYGIRDTNETYDVYCFA 190 200 210 220 230 240 260 270 280 290 300 310 pF1KB1 RELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEGLDQCDPGWLADGSVR .:. :::::. ...:. : .::: :: ::..:::.:::. :.:.:. ::::: ::: CCDS53 EEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQAGMDMCSAGWLADRSVR 250 260 270 280 290 300 320 330 340 350 360 370 pF1KB1 YPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHGDLETPSSGD :::. : ::: :::::: ::.::.:.:. :.:: :. .. . :. : CCDS53 YPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYTGEDFV----DIPENFFGV 310 320 330 340 350 360 380 390 400 410 420 430 pF1KB1 EGEILSAEGPPVRELEPTLEEEEVVTPDFQEPL---VSSGEEE-TLILEEKQESQQTLSP :: . . :. ::.. :: .. :: . ..:: : . . :: CCDS53 GGE-------------EDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEVSPSP 370 380 390 400 410 440 450 460 470 pF1KB1 T-PGDPMLASWPTGEVWLSTVA------------PSPSDMGAGTAASSHTEVAPTDPMPR : .:. . : . .. : :.:. .: .:: .:. :. . .: CCDS53 LEPEEPFTFAPEIGATAFAEVENETGEATRPWGFPTPG-LGPATAFTSEDLVVQVTAVP- 420 430 440 450 460 480 490 500 510 520 530 pF1KB1 RRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSR :. . .: :. . : : . :: .... : .:. : : : CCDS53 --GQPHLPGGVVFHYR-PGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYEA-GYEQCD 470 480 490 500 510 520 540 550 560 570 580 pF1KB1 SPWA-DLTNEVDM--PGAGSAGGK-SSPEPWLW---PPTMVPPSISGHSR-------APV . : : : . . : . .: : ::: . : : . .: : CCDS53 AGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTETYDVYCFVDRLEGEVFFATR 530 540 550 560 570 580 590 600 610 620 630 pF1KB1 LE-------LEKAEGPSARPATPDLFWSPLEATVSAPSPAPWEA-----FPVATSPDLPM :: :: :. .: :: ... .. : : : .:..: : CCDS53 LEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDK-CYAGWLADGSLRYPIVT-PRPAC 590 600 610 620 630 640 640 650 660 670 680 pF1KB1 MAMLRGPKE-WMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTG--- . : . .. :. : . .: .: .: :::. : . : : :.: CCDS53 GGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEEEG--GTPTS--PSGVEE 650 660 670 680 690 690 700 710 720 730 740 pF1KB1 -------QGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPT : :.:. :. . .:::. .: ... : . ..:. CCDS53 WIVTQVVPGVAAVPVEEETTAVP---SGETTAILEFTTEPENQTEWEPA-------YTPV 700 710 720 730 740 750 760 770 780 790 800 pF1KB1 ETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLDASSPSA-PLG :. : : : . ... ...:.:.. ...: .: :: . ::: :. CCDS53 GTSPLPGILPTWPPTGAATEESTEGPSATEVPSASE--EPSPSEVPFPSEEPSPSEEPF- 750 760 770 780 790 800 810 820 830 840 850 pF1KB1 SPGVFLVPKVT--PNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTT :.: :.: :. ::. . . .:. .: : .:: : . ::. . CCDS53 -PSVRPFPSVELFPSEEPFPSKEPSPSEEPSASEEPYTPSPPVPSWTELPSSGEESGAPD 810 820 830 840 850 860 860 870 880 890 900 pF1KB1 LSPQV--ALDTSIVTPLTTLEQGDKV-GVPA--------MSTLGSS----SSQPHPEPED .: . . :.: .. .::.. :.:. ::.::. :. : . :. CCDS53 VSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTSTVGSGLPVESGLPSGD-EE 870 880 890 900 910 920 910 920 930 940 pF1KB1 QVETQGT-------SGASVPPHQSSPLGK-PAVPPGT---PTAASVGESASVSSGE---P ..: .: ::: . ..: .: ..: : .:..::. ... ::: CCDS53 RIEWPSTPTVGELPSGAEILEGSASGVGDLSGLPSGEVLETSASGVGDLSGLPSGEVLET 930 940 950 960 970 980 950 960 970 980 990 pF1KB1 TVPW--D----PSSTLLPVTL-GIEDFEL----EVLAGS-PGVESFWEEVASGE--EPAL :.: : ::. .: .: :.::. ::: . ::::.. . ::: : . CCDS53 TAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDI-SGLPSGEVLETTA 990 1000 1010 1020 1030 1040 1000 1010 1020 1030 1040 1050 pF1KB1 PGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPC ::. .: CCDS53 PGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETAAPGV 1050 1060 1070 1080 1090 1100 >-- initn: 822 init1: 660 opt: 761 Z-score: 385.4 bits: 84.5 E(32554): 3.8e-15 Smith-Waterman score: 765; 27.4% identity (52.6% similar) in 919 aa overlap (338-1212:1542-2406) 310 320 330 340 350 360 pF1KB1 WLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHG- :.. .:.:: .: ... .:. : CCDS53 GEGLETSASGVEDLSRLPSGEEVLEISASGFGDLSGLPSGGEGLET-------SASEVGT 1520 1530 1540 1550 1560 370 380 390 400 410 pF1KB1 DLETPSSGDEGEILSAEGPPVRELEPTLEEEEV--VTPDFQEPLVSSGE------EETLI :: :: :: :: : :. .:. : .. :.. . :: :: CCDS53 DLSGLPSGREGLETSASGAEDLSGLPSGKEDLVGSASGDLDLGKLPSGTLGSGQAPETSG 1570 1580 1590 1600 1610 1620 420 430 440 450 460 470 pF1KB1 LEEKQESQQT-----LSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT : .. . .: : : ... :.: . ::. : . ..::. .:. CCDS53 LPSGFSGEYSGVDLGSGPPSGLPDFSGLPSG---FPTVSLVDSTLVEVVTASTASELEGR 1630 1640 1650 1660 1670 1680 480 490 500 510 520 530 pF1KB1 DPMP-RRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEML . :...:: . .. . :: .: : :.: : : .. . .. CCDS53 GTIGISGAGEISGLPSSELDISGRASGLPSGTELSGQASGS--------PDVSGEIPGLF 1690 1700 1710 1720 1730 540 550 560 570 580 590 pF1KB1 G-SGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAE : ::: : . : ..:.. :. .: :: .: .:::.. . . . CCDS53 GVSGQP-SGFPDTSGETS--GVTELSGLSSGQP----------GISGEASGVLYGTSQPF 1740 1750 1760 1770 1780 600 610 620 630 640 pF1KB1 GPS----ARPATPDLFWSP--LEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLP : . ..::: .: : . .: : .: . .:: . .. . CCDS53 GITDLSGETSGVPDLSGQPSGLPGFSGATSGVP-DLVSGTTSGSGESSGITFVDTSLVEV 1790 1800 1810 1820 1830 650 660 670 680 690 700 pF1KB1 HPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGG-EAMPTTPESPRAD :: .. : :. : . .. :: :. . : .... .: .. : ..:. . CCDS53 APTTFKEE----EGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQTPEFS 1840 1850 1860 1870 1880 1890 710 720 730 740 750 760 pF1KB1 FRETG--ETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPTETATEPTGLRGIPGSESGVFD .: :.: .. ..:: .:: : . . . . :: . .. : .... . .. . CCDS53 GLPSGIAEVS-GESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQ-E 1900 1910 1920 1930 1940 1950 770 780 790 800 810 820 pF1KB1 TAESPTSGLQATVDEVQDPWPSVYSKG-LDASSPSAPLGSPGVFLVPKVTPNLEPWVATD ..:.:.. :. . . : : .: :: : : . .. :. : :. . : CCDS53 AGEGPSGILELSGAHSGAPDMSGEHSGFLDLS------GLQSGLIEPSGEPPGTPYFSGD 1960 1970 1980 1990 2000 830 840 850 860 870 pF1KB1 EGPTVN-PMDSTVTPAPS-DASGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQG . :.: .:.:. . : .:::. : . : .:..: : .. . . :.: : CCDS53 FASTTNVSGESSVAMGTSGEASGLPEVTLITSEFVEGVT-EPTISQELGQRPPVTHTPQL 2010 2020 2030 2040 2050 2060 880 890 900 910 920 930 pF1KB1 -DKVGVPAMSTLGSSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTA--A .. : .:: :. :. : . ::. .::: .: . : . :. .: : CCDS53 FESSG--KVSTAGDISGATPVLPGSGVEV-----SSVPESSSETSAYPEAGFGASAAPEA 2070 2080 2090 2100 2110 940 950 960 970 980 990 pF1KB1 SVGESASVSSGEPTVPWDPSSTLLPVTLGIEDFELEVLAG----SPGV--ESFWEEVASG : .:.: . .: : . .. ::. : : .: : :: .. CCDS53 SREDSGSPDLSETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSDVGT 2120 2130 2140 2150 2160 2170 1000 1010 1020 1030 1040 pF1KB1 EEPALPG-TPMNAGAE-EVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDID : :.::. :: .: . :. .: .. : .. . : : . ::. . CCDS53 EAPGLPSATPTASGDRTEISGDLSGHTSQLGVVISTSIPESEWTQQTQRPAETHLEIESS 2180 2190 2200 2210 2220 2230 1050 1060 1070 1080 1090 1100 pF1KB1 DCLCSPCENGGTCIDEVNGFVCLCLPSYG-----GSFCEKDTEGCDRGWHKFQGHCYRYF . : : :. .. ... . .:. . : : :..::.:.::::::.: CCDS53 SLLYSGEETH--TVETATSPTDASIPASPEWKRESESTAADQEVCEEGWNKYQGHCYRHF 2240 2250 2260 2270 2280 2290 1110 1120 1130 1140 1150 1160 pF1KB1 AHRRAWEDAEKDCRRRSGHLTSVHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTG :..: :::. ::....::.:. .:::. :.:. ... ::::::: .: ::.:.:. CCDS53 PDRETWVDAERRCREQQSHLSSIVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHP 2300 2310 2320 2330 2340 2350 1170 1180 1190 1200 1210 1220 pF1KB1 LQFENWRENQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVEN .:::::: ::::::::.:::::::. ::.:.::::::::.::..::::: CCDS53 MQFENWRPNQPDNFFAAGEDCVVMIWHEKGEWNDVPCNYHLPFTCKKGTATTYKRRLQKR 2360 2370 2380 2390 2400 2410 1230 1240 1250 1260 1270 1280 pF1KB1 ASLIGARKAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRH CCDS53 SSRHPRRSRPSTAH 2420 2430 >>CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530 aa) initn: 2152 init1: 1047 opt: 1191 Z-score: 593.8 bits: 123.1 E(32554): 9.4e-27 Smith-Waterman score: 1259; 31.7% identity (54.2% similar) in 1058 aa overlap (51-1003:43-1051) 30 40 50 60 70 pF1KB1 AGEQGTQDITDASERGLHMQKLGSGSVQAALAELVALPCLFT--LQP---RPSAARDAPR :. ...:: : ..: ::.: ::: CCDS53 VITAAVTVETSDHDNSLSVSIPQPSPLRVLLGTSLTIPCYFIDPMHPVTTAPSTAPLAPR 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB1 IKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLPSYPRRRANATLLLGPLRASDS :::..: ...... .::: .. ::: ...: .::::.:: ..::: . ::..:: CCDS53 IKWSRV----SKEKEVVLLVATEGRVRVNSAYQDKVSLPNYPAIPSDATLEVQSLRSNDS 80 90 100 110 120 140 150 160 170 180 190 pF1KB1 GLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALTFAEAQEACRLSSAIIAAPRHL :.:::.:..:::: . . . : :.:::::. ::.: : .::.:: .:::::.:..: CCDS53 GVYRCEVMHGIEDSEATLEVVVKGIVFHYRAISTRYTLDFDRAQRACLQNSAIIATPEQL 130 140 150 160 170 180 200 210 220 230 240 250 pF1KB1 QAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSLPGVRSYGRRNPQELYDVYCFA :::.:::: .::::::.:.:::::: : :::::.. .::::.:: :. .: ::::::: CCDS53 QAAYEDGFHQCDAGWLADQTVRYPIHTPREGCYGDKDEFPGVRTYGIRDTNETYDVYCFA 190 200 210 220 230 240 260 270 280 290 300 310 pF1KB1 RELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLHLAWHEGLDQCDPGWLADGSVR .:. :::::. ...:. : .::: :: ::..:::.:::. :.:.:. ::::: ::: CCDS53 EEMEGEVFYATSPEKFTFQEAANECRRLGARLATTGQLYLAWQAGMDMCSAGWLADRSVR 250 260 270 280 290 300 320 330 340 350 360 370 pF1KB1 YPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHGDLETPSSGD :::. : ::: :::::: ::.::.:.:. :.:: :. .. . :. : CCDS53 YPISKARPNCGGNLLGVRTVYVHANQTGYPDPSSRYDAICYTGEDFV----DIPENFFGV 310 320 330 340 350 360 380 390 400 410 420 430 pF1KB1 EGEILSAEGPPVRELEPTLEEEEVVTPDFQEPL---VSSGEEE-TLILEEKQESQQTLSP :: . . :. ::.. :: .. :: . ..:: : . . :: CCDS53 GGE-------------EDITVQTVTWPDMELPLPRNITEGEARGSVILTVKPIFEVSPSP 370 380 390 400 410 440 450 460 470 pF1KB1 T-PGDPMLASWPTGEVWLSTVA------------PSPSDMGAGTAASSHTEVAPTDPMPR : .:. . : . .. : :.:. .: .:: .:. :. . .: CCDS53 LEPEEPFTFAPEIGATAFAEVENETGEATRPWGFPTPG-LGPATAFTSEDLVVQVTAVP- 420 430 440 450 460 480 490 500 510 520 530 pF1KB1 RRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGSGQSR :. . .: :. . : : . :: .... : .:. : : : CCDS53 --GQPHLPGGVVFHYR-PGPTRYSLTFEEAQQACLRTGAVIASPEQLQAAYEA-GYEQCD 470 480 490 500 510 520 540 550 560 570 580 pF1KB1 SPWA-DLTNEVDM--PGAGSAGGK-SSPEPWLW---PPTMVPPSISGHSR-------APV . : : : . . : . .: : ::: . : : . .: : CCDS53 AGWLRDQTVRYPIVSPRTPCVGDKDSSPGVRTYGVRPSTETYDVYCFVDRLEGEVFFATR 530 540 550 560 570 580 590 600 610 620 630 pF1KB1 LE-------LEKAEGPSARPATPDLFWSPLEATVSAPSPAPWEA-----FPVATSPDLPM :: :: :. .: :: ... .. : : : .:..: : CCDS53 LEQFTFQEALEFCESHNATLATTGQLYAAWSRGLDK-CYAGWLADGSLRYPIVT-PRPAC 590 600 610 620 630 640 640 650 660 670 680 pF1KB1 MAMLRGPKE-WMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTG--- . : . .. :. : . .: .: .: :::. : . : : :.: CCDS53 GGDKPGVRTVYLYPNQTGLPDPLSRHHAFCFRGISAVPSPGEEEG--GTPTS--PSGVEE 650 660 670 680 690 690 700 710 720 730 740 pF1KB1 -------QGGEAMPTTPESPRADFRETGETSPAQVNKAEHSSSSPWPSVNRNVAVGFVPT : :.:. :. . .:::. .: ... : . ..:. CCDS53 WIVTQVVPGVAAVPVEEETTAVP---SGETTAILEFTTEPENQTEWEPA-------YTPV 700 710 720 730 740 750 760 770 780 790 800 pF1KB1 ETATEPTGLRGIPGSESGVFDTAESPTSGLQATVDEVQDPWPSVYSKGLDASSPSA-PLG :. : : : . ... ...:.:.. ...: .: :: . ::: :. CCDS53 GTSPLPGILPTWPPTGAATEESTEGPSATEVPSASE--EPSPSEVPFPSEEPSPSEEPF- 750 760 770 780 790 800 810 820 830 840 850 pF1KB1 SPGVFLVPKVT--PNLEPWVATDEGPTVNPMDSTVTPAPSDASGIWEPGSQVFEEAESTT :.: :.: :. ::. . . .:. .: : .:: : . ::. . CCDS53 -PSVRPFPSVELFPSEEPFPSKEPSPSEEPSASEEPYTPSPPVPSWTELPSSGEESGAPD 810 820 830 840 850 860 860 870 880 890 900 pF1KB1 LSPQV--ALDTSIVTPLTTLEQGDKV-GVPA--------MSTLGSS----SSQPHPEPED .: . . :.: .. .::.. :.:. ::.::. :. : . :. CCDS53 VSGDFTGSGDVSGHLDFSGQLSGDRASGLPSGDLDSSGLTSTVGSGLPVESGLPSGD-EE 870 880 890 900 910 920 910 920 930 940 pF1KB1 QVETQGT-------SGASVPPHQSSPLGK-PAVPPGT---PTAASVGESASVSSGE---P ..: .: ::: . ..: .: ..: : .:..::. ... ::: CCDS53 RIEWPSTPTVGELPSGAEILEGSASGVGDLSGLPSGEVLETSASGVGDLSGLPSGEVLET 930 940 950 960 970 980 950 960 970 980 990 pF1KB1 TVPW--D----PSSTLLPVTL-GIEDFEL----EVLAGS-PGVESFWEEVASGE--EPAL :.: : ::. .: .: :.::. ::: . ::::.. . ::: : . CCDS53 TAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDI-SGLPSGEVLETTA 990 1000 1010 1020 1030 1040 1000 1010 1020 1030 1040 1050 pF1KB1 PGTPMNAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPC ::. .: CCDS53 PGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETTAPGVEDISGLPSGEVLETAAPGV 1050 1060 1070 1080 1090 1100 >-- initn: 1269 init1: 1016 opt: 1125 Z-score: 561.7 bits: 117.2 E(32554): 5.7e-25 Smith-Waterman score: 1188; 29.1% identity (55.0% similar) in 1043 aa overlap (338-1296:1542-2530) 310 320 330 340 350 360 pF1KB1 WLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAYCFRAHHPTSQHG- :.. .:.:: .: ... .:. : CCDS53 GEGLETSASGVEDLSRLPSGEEVLEISASGFGDLSGLPSGGEGLET-------SASEVGT 1520 1530 1540 1550 1560 370 380 390 400 410 pF1KB1 DLETPSSGDEGEILSAEGPPVRELEPTLEEEEV--VTPDFQEPLVSSGE------EETLI :: :: :: :: : :. .:. : .. :.. . :: :: CCDS53 DLSGLPSGREGLETSASGAEDLSGLPSGKEDLVGSASGDLDLGKLPSGTLGSGQAPETSG 1570 1580 1590 1600 1610 1620 420 430 440 450 460 470 pF1KB1 LEEKQESQQT-----LSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPT : .. . .: : : ... :.: . ::. : . ..::. .:. CCDS53 LPSGFSGEYSGVDLGSGPPSGLPDFSGLPSG---FPTVSLVDSTLVEVVTASTASELEGR 1630 1640 1650 1660 1670 1680 480 490 500 510 520 530 pF1KB1 DPMP-RRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEML . :...:: . .. . :: .: : :.: : : .. . .. CCDS53 GTIGISGAGEISGLPSSELDISGRASGLPSGTELSGQASGS--------PDVSGEIPGLF 1690 1700 1710 1720 1730 540 550 560 570 580 590 pF1KB1 G-SGQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAE : ::: : . : ..:.. :. .: :: .: .:::.. . . . CCDS53 GVSGQP-SGFPDTSGETS--GVTELSGLSSGQP----------GISGEASGVLYGTSQPF 1740 1750 1760 1770 1780 600 610 620 630 640 pF1KB1 GPS----ARPATPDLFWSP--LEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLP : . ..::: .: : . .: : .: . .:: . .. . CCDS53 GITDLSGETSGVPDLSGQPSGLPGFSGATSGVP-DLVSGTTSGSGESSGITFVDTSLVEV 1790 1800 1810 1820 1830 650 660 670 680 690 700 pF1KB1 HPTPISTEAN--RVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPES--- :: .. : . :: : .. : : . : .: : ..: .. ::: CCDS53 APTTFKEEEGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQ--TPEFSGL 1840 1850 1860 1870 1880 1890 710 720 730 740 pF1KB1 PRADFRETGETSPAQVNK-----AEHSSSSP--WPSV---NRNVAVGFVPTETATE---- : . . .::.: :.... : ..:..: .:.: .:... . . . :: : CCDS53 PSGIAEVSGESSRAEIGSSLPSGAYYGSGTPSSFPTVSLVDRTLVESVTQAPTAQEAGEG 1900 1910 1920 1930 1940 1950 750 760 770 780 790 pF1KB1 PTGLRGIPGSESGVFDTAESPT-----SGLQA-TVDEVQDPWPSVYSKGLDASSP----- :.:. . :..::. : . . ::::. .. .: . : .: ::. CCDS53 PSGILELSGAHSGAPDMSGEHSGFLDLSGLQSGLIEPSGEPPGTPYFSGDFASTTNVSGE 1960 1970 1980 1990 2000 2010 800 810 820 830 pF1KB1 -SAPLGSPG-VFLVPKVT--------PNLEPWVATDEG--PTVN--PM---DSTVTPAPS :. .:. : . .:.:: :: .. . : : :. :. .: . . . CCDS53 SSVAMGTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQLFESSGKVSTAG 2020 2030 2040 2050 2060 2070 840 850 860 870 880 890 pF1KB1 DASGIWE--PGS-----QVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTLG : :: ::: .: : . :. :.... .: ..: .. :.. : : .: CCDS53 DISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGAS-AAPEASREDS---GSPDLS--- 2080 2090 2100 2110 2120 2130 900 910 920 930 940 950 pF1KB1 SSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVG-ESASVSSGEPT ..: : .. :.::... ... . : : . :...:: :. .. :. :: CCDS53 ETTSAFHEANLERSSGLGVSGSTLTFQEGEASAAPEVSGESTTTSDVGTEAPGLPSATPT 2140 2150 2160 2170 2180 2190 960 970 980 990 1000 pF1KB1 VPWDPSSTLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPA-----LPGTPMNAGAE . : : . :. . .: :. .. :: : . . ..:: . .. . ..: CCDS53 ASGD--RTEISGDLSGHTSQLGVVISTSIPESEWTQ--QTQRPAETHLEIESSSLLYSGE 2200 2210 2220 2230 2240 1010 1020 1030 1040 1050 1060 pF1KB1 EVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEV :.:. ..: ..... . . . . .: :: ..::: . CCDS53 ETHTVETATSP--------TDASIPASPEWKRESESTAAAPARSCAEEPC-GAGTCKETE 2250 2260 2270 2280 2290 1070 1080 1090 1100 1110 1120 pF1KB1 NGFVCLCLPSYGGSFCEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTS . .::: :.: : :. : : :..::.:.::::::.: :..: :::. ::....::.: CCDS53 GHVICLCPPGYTGEHCNIDQEVCEEGWNKYQGHCYRHFPDRETWVDAERRCREQQSHLSS 2300 2310 2320 2330 2340 2350 1130 1140 1150 1160 1170 1180 pF1KB1 VHSPEEHSFINSFGHENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCV . .:::. :.:. ... ::::::: .: ::.:.:. .:::::: ::::::::.::::: CCDS53 IVTPEEQEFVNNNAQDYQWIGLNDRTIEGDFRWSDGHPMQFENWRPNQPDNFFAAGEDCV 2360 2370 2380 2390 2400 2410 1190 1200 1210 1220 1230 1240 pF1KB1 VMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCN ::. ::.:.::::::::.::..:::::: :: ::.::.: .: .: .:.... :::::. CCDS53 VMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPVVEHARTFGQKKDRYEINSLVRYQCT 2420 2430 2440 2450 2460 2470 1250 1260 1270 1280 1290 1300 pF1KB1 EGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHR--MRRHHHHHQHHHQHHHHKSRKERR :::.:.:. ::::. .:.:..:::.:: : .: ..: .: .. . : CCDS53 EGFVQRHMPTIRCQPSGHWEEPQITCTDPTTYKRRLQKRSSRHPRRSRPSTAH 2480 2490 2500 2510 2520 2530 1310 1320 pF1KB1 KHKKHPTEDWEKDEGNFC >>CCDS1150.1 BCAN gene_id:63827|Hs108|chr1 (671 aa) initn: 1072 init1: 1037 opt: 1144 Z-score: 577.7 bits: 118.2 E(32554): 7.4e-26 Smith-Waterman score: 1168; 36.2% identity (60.0% similar) in 660 aa overlap (9-638:4-639) 10 20 30 40 50 pF1KB1 MGAPFVWALGLLMLQMLLFVAGEQGTQDIT--DASE-RGLHMQKLGSGSVQAALAELVAL : : .: :... . . :. :.:: :..... :.. .:..:. ... CCDS11 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTI 10 20 30 40 50 60 70 80 90 100 110 pF1KB1 PC-LFTLQPRPS--AARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLP :: . :.: :: :. .::.::: . . :.. . .:::. :.: .... ::.:: CCDS11 PCHVHYLRPPPSRRAVLGSPRVKWTFL--SRGREAE--VLVARGVRVKVNEAYRFRVALP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB1 SYPRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALT .:: ....: :. :: .:::.:::.: .::.: .: : ..: :::: :: . :::.. CCDS11 AYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB1 FAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSL :. ::::: .: ::.:..: ::. :...::::::::.:::::: : .:::: ... CCDS11 FSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB1 PGVRSYGRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLH ::::.:: .:..::::::.:..:.::.: : ..::: ::: :...:: .:..:::. CCDS11 PGVRNYGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLY 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB1 LAWHEGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAY :: :::.:.::::::::::::: :: .:::: :::.:.. : :.::::. ::..: CCDS11 AAWDGGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVY 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB1 CFRAHHPTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEE ::: : . .:.:. .. : : . . :::: .. :. : : CCDS11 CFRDSAQPSAIPEASNPASNPASDGLEA----IVTVTETLEELQL--PQEATESESRGAI 360 370 380 390 400 420 430 440 450 460 470 pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTD .. . : . : :: :: : : ....: :. .. . . . : : CCDS11 YSIPIMEDGGGG---SSTPEDPAEAPRTLLEFETQSMVP-PTGFSEEEGKALEEEEKYED 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB1 PMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMA-VTEMLG ... . . : . : ::: :: :: .: :..: . .: CCDS11 EEEKEEEEEEEEVEDEALWAWPSELSSPGPEASL--PTEPAA---QEESLSQAPARAVLQ 470 480 490 500 510 540 550 560 570 pF1KB1 SGQSRSPWADLTNEVDMPG-AGSAGGKSSPEPWLW------PPTMVP----------PSI : : : : .:.. : . . .. : : : :.: : . CCDS11 PGAS--PLPDGESEASRPPRVHGPPTETLPTPRERNLASPSPSTLVEAREVGEATGGPEL 520 530 540 550 560 570 580 590 600 610 620 630 pF1KB1 SGHSRAPVLELEKAEG-PSARPAT--PD---LFWSPLEATVSAPSPAPWEAFPVATSPDL :: :. : ..:: :: ::: :. . .: : . . .:: . : ..: : CCDS11 SGVPRGESEETGSSEGAPSLLPATRAPEGTRELEAPSEDNSGRTAPA---GTSVQAQPVL 580 590 600 610 620 630 640 650 660 670 680 690 pF1KB1 PMMAMLRGPKEWMLPHPTPISTEANRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQG : . :: CCDS11 PTDSASRGGVAVVPASGNSAQGSTALSILLLFFPLQLWVT 640 650 660 670 >>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 (911 aa) initn: 2021 init1: 1037 opt: 1144 Z-score: 576.2 bits: 118.4 E(32554): 9e-26 Smith-Waterman score: 1609; 31.1% identity (49.0% similar) in 1281 aa overlap (9-1279:4-878) 10 20 30 40 50 pF1KB1 MGAPFVWALGLLMLQMLLFVAGEQGTQDIT--DASE-RGLHMQKLGSGSVQAALAELVAL : : .: :... . . :. :.:: :..... :.. .:..:. ... CCDS11 MAQLFLPLLAALVLAQAPAALADVLEGDSSEDRAFRVRIAGDAPLQGVLGGALTI 10 20 30 40 50 60 70 80 90 100 110 pF1KB1 PC-LFTLQPRPS--AARDAPRIKWTKVRTASGQRQDLPILVAKDNVVRVAKSWQGRVSLP :: . :.: :: :. .::.::: . . :.. . .:::. :.: .... ::.:: CCDS11 PCHVHYLRPPPSRRAVLGSPRVKWTFL--SRGREAE--VLVARGVRVKVNEAYRFRVALP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB1 SYPRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVVFHYRSARDRYALT .:: ....: :. :: .:::.:::.: .::.: .: : ..: :::: :: . :::.. CCDS11 AYPASLTDVSLALSELRPNDSGIYRCEVQHGIDDSSDAVEVKVKGVVFLYREGSARYAFS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB1 FAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPITQSRPGCYGDRSSL :. ::::: .: ::.:..: ::. :...::::::::.:::::: : .:::: ... CCDS11 FSGAQEACARIGAHIATPEQLYAAYLGGYEQCDAGWLSDQTVRYPIQTPREACYGDMDGF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB1 PGVRSYGRRNPQELYDVYCFARELGGEVFYVGPARRLTLAGARAQCRRQGAALASVGQLH ::::.:: .:..::::::.:..:.::.: : ..::: ::: :...:: .:..:::. CCDS11 PGVRNYGVVDPDDLYDVYCYAEDLNGELFLGDPPEKLTLEEARAYCQERGAEIATTGQLY 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB1 LAWHEGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFANRTGFPSPAERFDAY :: :::.:.::::::::::::: :: .:::: :::.:.. : :.::::. ::..: CCDS11 AAWDGGLDHCSPGWLADGSVRYPIVTPSQRCGGGLPGVKTLFLFPNQTGFPNKHSRFNVY 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB1 CFRAHHPTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEEVVTPDFQEPLVSSGEE ::: : . .:.:. .. : : . . :::: .: : CCDS11 CFRDSAQPSAIPEASNPASNPASDGLEA----IVTVTETLEE-------LQLP------- 360 370 380 390 420 430 440 450 460 470 pF1KB1 ETLILEEKQESQQTLSPTPGDPMLASWPTGEVWLSTVAPSPSDMGAGTAASSHTEVAPTD ::. .. : : .. : : :.:... : : CCDS11 --------QEATESES------------RGAIY---SIPIMEDGGGGSST-------PED 400 410 420 480 490 500 510 520 530 pF1KB1 PMPRRRGRFKGLNGRYFQQQEPEPGLQGGMEASAQPPTSEAAVNQMEPPLAMAVTEMLGS : : .. :. : : :::. . : :. : . CCDS11 PAEAPRTLLE------FETQ------------SMVPPTGFSE----EEGKALEEEEKYED 430 440 450 460 540 550 560 570 580 590 pF1KB1 GQSRSPWADLTNEVDMPGAGSAGGKSSPEPWLWPPTMVPPSISGHSRAPVLELEKAEGPS . . . .::. . : :: . : :: CCDS11 EEEKEE-EEEEEEVE-----------DEALWAWPSELSSP-----------------GP- 470 480 490 600 610 620 630 640 650 pF1KB1 ARPATPDLFWSPLEATVSAPSPAPWEAFPVATSPDLPMMAMLRGPKEWMLPHPTPISTEA ::.. . : :.. : : :.:. : .:. CCDS11 -------------EASLPTEPAAQEESLSQA-----PARAVLQ-------PGASPLPD-- 500 510 520 660 670 680 690 700 710 pF1KB1 NRVEAHGEATATAPPSPAAETKVYSLPLSLTPTGQGGEAMPTTPESPRADFRETGETSPA ::. :. :: .:.. : :..:: :: CCDS11 ------GESEASRPP------RVHGPPT---------ETLPT----PR------------ 530 540 720 730 740 750 760 770 pF1KB1 QVNKAEHSSSSPWPSVNRNVAVGFVPTETATEPTG---LRGIPGSESGVFDTAESPTSGL :.. .:: ::. .: .. . : :: : :.: .:: ..:. : : CCDS11 -----ERNLASPSPST-------LVEAREVGEATGGPELSGVPRGESEETGSSEGAPSLL 550 560 570 580 590 780 790 800 810 820 830 pF1KB1 QATVDEVQDPWPSVYSKGLDASSPSAPLGSPGVFLVPKVTPNLEPWVATDEGPTVNPMDS :: :: : : .:: CCDS11 PAT---------------------RAPEG----------TRELE---------------- 600 840 850 860 870 880 890 pF1KB1 TVTPAPS-DASGIWEPGSQVFEEAESTTLSPQVALDTSIVTPLTTLEQGDKVGVPAMSTL ::: : :: : CCDS11 ----APSEDNSGRTAP-------------------------------------------- 610 620 900 910 920 930 940 950 pF1KB1 GSSSSQPHPEPEDQVETQGTSGASVPPHQSSPLGKPAVPPGTPTAASVGESASVSSGEPT .:.:: :..:. :: .::: .: . CCDS11 --------------------AGTSV---QAQPV--------LPT-----DSAS-RGGVAV 630 640 960 970 980 990 1000 1010 pF1KB1 VPWDPSSTLLPVTLGIEDFELEVLAGSPGVESFWEEVASGEEPALPGTPMNAGAEEVHSD :: ::: CCDS11 VP-----------------------------------ASG-------------------- 1020 1030 1040 1050 1060 1070 pF1KB1 PCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDCLCSPCENGGTCIDEVNGFVC ::. :::.:::::..: .: : CCDS11 --------------------------------------DCVPSPCHNGGTCLEEEEGVRC 650 660 670 1080 1090 1100 1110 1120 1130 pF1KB1 LCLPSYGGSFCEKDTEGCDRGWHKFQGHCYRYFAHRRAWEDAEKDCRRRSGHLTSVHSPE ::::.:::..:. . :. :: ::: ::..:. ::.::.:: .:: ..::.:. .:: CCDS11 LCLPGYGGDLCDVGLRFCNPGWDAFQGACYKHFSTRRSWEEAETQCRMYGAHLASISTPE 680 690 700 710 720 730 1140 1150 1160 1170 1180 1190 pF1KB1 EHSFINSFGHENTWIGLNDRIVERDFQWTDNTGLQFENWRENQPDNFFAGGEDCVVMVAH :..:::. .: ::::::: .: :: :.:.. : .::: .:::..: .::.::::: : CCDS11 EQDFINNRYREYQWIGLNDRTIEGDFLWSDGVPLLYENWNPGQPDSYFLSGENCVVMVWH 740 750 760 770 780 790 1200 1210 1220 1230 1240 1250 pF1KB1 ESGRWNDVPCNYNLPYVCKKGTVLCGPPPAVENASLIGARKAKYNVHATVRYQCNEGFAQ ..:.:.::::::.: :.:: : : ::::: . :...: . .:.: ...::.: ::.:: CCDS11 DQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRLRYEVDTVLRYRCREGLAQ 800 810 820 830 840 850 1260 1270 1280 1290 1300 1310 pF1KB1 HHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRHHHHHQHHHQHHHHKSRKERRKHKKHPT ... :::. ::.:. ::: :. ::: : CCDS11 RNLPLIRCQENGRWEAPQISCV-PRRPARALHPEEDPEGRQGRLLGRWKALLIPPSSPMP 860 870 880 890 900 >>CCDS10346.1 HAPLN3 gene_id:145864|Hs108|chr15 (360 aa) initn: 652 init1: 475 opt: 827 Z-score: 427.1 bits: 89.5 E(32554): 1.8e-17 Smith-Waterman score: 828; 39.9% identity (62.5% similar) in 373 aa overlap (9-359:1-360) 10 20 30 40 pF1KB1 MGAPFVWALGLLMLQMLLFVAGEQG---------TQDITDASERGLHMQKLGSGS---VQ .:::.: ::.. : : ... .: . . : . : .: :. CCDS10 MGLLLLVPLLLLPGSYGLPFYNGFYYSNSANDQNLGNGHGKDLLNGVKLVVE 10 20 30 40 50 50 60 70 80 90 100 pF1KB1 AALAEL-------VALPCLFTLQPRPSAARDAPRIKWTKVRTASGQRQDLPILVAKDNVV . : : ::: . .: . : . :.:: :. .. ..: .::: CCDS10 TPEETLFTYQGASVILPCRYRYEPALVSPRRV-RVKWWKLSENGAPEKD--VLVAIGLRH 60 70 80 90 100 110 120 130 140 150 160 pF1KB1 RVAKSWQGRVSLPSYPRRRANATLLLGPLRASDSGLYRCQVVRGIEDEQDLVPLEVTGVV : ..:::: : .. ...: . :: : : :::.:. :.:::. :: ::. ::: CCDS10 RSFGDYQGRVHL--RQDKEHDVSLEIQDLRLEDYGRYRCEVIDGLEDESGLVELELRGVV 110 120 130 140 150 160 170 180 190 200 210 220 pF1KB1 FHYRSARDRYALTFAEAQEACRLSSAIIAAPRHLQAAFEDGFDNCDAGWLSDRTVRYPIT : :.: :: ..: :.:..: ..:..:. ..: :.:.:.: :.::::.: ::.::: CCDS10 FPYQSPNGRYQFNFHEGQQVCAEQAAVVASFEQLFRAWEEGLDWCNAGWLQDATVQYPIM 170 180 190 200 210 220 230 240 250 260 270 280 pF1KB1 QSRPGCYGDRSSLPGVRSYGRRNPQ-ELYDVYCFARELGGEVFYVGPARRLTLAGARAQC : : : . ::::::: :. . . :::.::: : :.:.:. ..:::. :: : CCDS10 LPRQPC-GGPGLAPGVRSYGPRHRRLHRYDVFCFATALKGRVYYLEHPEKLTLTEAREAC 230 240 250 260 270 280 290 300 310 320 330 pF1KB1 RRQGAALASVGQLHLAWH-EGLDQCDPGWLADGSVRYPIQTPRRRCGGPAPGVRTVYRFA ... :..:.:::: ::. .:::.:: :::::::::::. :. :: : ::::. CCDS10 QEDDATIAKVGQLFAAWKFHGLDRCDAGWLADGSVRYPVVHPHPNCGPPEPGVRSF---- 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB1 NRTGFPSPAER-FDAYCFRAHHPTSQHGDLETPSSGDEGEILSAEGPPVRELEPTLEEEE :::.: : . .::.: : CCDS10 ---GFPDPQSRLYGVYCYRQH 350 360 1321 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 11:56:11 2016 done: Thu Nov 3 11:56:12 2016 Total Scan time: 6.360 Total Display time: 0.750 Function used was FASTA [36.3.4 Apr, 2011]