FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1783, 3096 aa
1>>>pF1KSDA1783 3096 - 3096 aa - 3096 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 13.4471+/-0.00114; mu= -9.2530+/- 0.069
mean_var=473.0123+/-95.416, 0's: 0 Z-trim(114.7): 94 B-trim: 0 in 0/54
Lambda= 0.058971
statistics sampled from 15163 (15251) to 15163 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.744), E-opt: 0.2 (0.468), width: 16
Scan time: 9.000
The best scores are: opt bits E(32554)
CCDS42271.1 MYO15A gene_id:51168|Hs108|chr17 (3530) 1850 174.1 1.3e-41
CCDS53685.1 MYO7A gene_id:4647|Hs108|chr11 (1178) 1277 125.1 2.7e-27
CCDS53684.1 MYO7A gene_id:4647|Hs108|chr11 (2175) 1277 125.2 4.3e-27
CCDS53683.1 MYO7A gene_id:4647|Hs108|chr11 (2215) 1277 125.3 4.4e-27
CCDS42494.1 MYO1F gene_id:4542|Hs108|chr19 (1098) 1168 115.8 1.6e-24
CCDS32254.1 MYO1E gene_id:4643|Hs108|chr15 (1108) 1160 115.1 2.5e-24
CCDS53826.1 MYO1H gene_id:283446|Hs108|chr12 (1022) 1076 107.9 3.3e-22
CCDS46405.1 MYO7B gene_id:4648|Hs108|chr2 (2116) 1052 106.1 2.5e-21
CCDS54834.1 MYO10 gene_id:4651|Hs108|chr5 (2058) 1038 104.9 5.5e-21
CCDS11003.1 MYO1C gene_id:4641|Hs108|chr17 (1028) 1025 103.6 6.8e-21
CCDS45562.1 MYO1C gene_id:4641|Hs108|chr17 (1044) 1025 103.6 6.9e-21
CCDS42226.1 MYO1C gene_id:4641|Hs108|chr17 (1063) 1025 103.6 7e-21
CCDS46010.1 MYO9B gene_id:4650|Hs108|chr19 (2022) 1017 103.1 1.9e-20
CCDS13927.1 MYH9 gene_id:4627|Hs108|chr22 (1960) 1012 102.7 2.4e-20
CCDS11144.1 MYH10 gene_id:4628|Hs108|chr17 (1976) 1004 102.0 3.9e-20
CCDS10566.1 MYH11 gene_id:4629|Hs108|chr16 (1938) 977 99.7 1.9e-19
CCDS10565.1 MYH11 gene_id:4629|Hs108|chr16 (1972) 977 99.7 1.9e-19
CCDS59411.1 MYH14 gene_id:79784|Hs108|chr19 (1995) 964 98.6 4.2e-19
CCDS9601.1 MYH7 gene_id:4625|Hs108|chr14 (1935) 934 96.0 2.4e-18
CCDS42436.1 MYO5B gene_id:4645|Hs108|chr18 (1848) 930 95.7 2.9e-18
CCDS9600.1 MYH6 gene_id:4624|Hs108|chr14 (1939) 913 94.2 8.3e-18
CCDS43127.1 MYH15 gene_id:22989|Hs108|chr3 (1946) 905 93.6 1.3e-17
CCDS45262.1 MYO5A gene_id:4644|Hs108|chr15 (1828) 902 93.3 1.5e-17
CCDS42037.1 MYO5A gene_id:4644|Hs108|chr15 (1855) 902 93.3 1.5e-17
CCDS42036.1 MYO5C gene_id:55930|Hs108|chr15 (1742) 901 93.2 1.6e-17
CCDS11153.1 MYH8 gene_id:4626|Hs108|chr17 (1937) 901 93.2 1.7e-17
CCDS45613.1 MYH13 gene_id:8735|Hs108|chr17 (1938) 871 90.7 9.9e-17
CCDS8929.1 MYO1A gene_id:4640|Hs108|chr12 (1043) 840 87.9 3.8e-16
CCDS54112.1 MYO19 gene_id:80179|Hs108|chr17 ( 970) 828 86.8 7.2e-16
CCDS11155.1 MYH1 gene_id:4619|Hs108|chr17 (1939) 825 86.8 1.5e-15
CCDS76991.1 MYO1D gene_id:4642|Hs108|chr17 ( 961) 811 85.4 2e-15
CCDS32615.1 MYO1D gene_id:4642|Hs108|chr17 (1006) 811 85.4 2e-15
CCDS11157.1 MYH3 gene_id:4621|Hs108|chr17 (1940) 816 86.0 2.5e-15
CCDS76992.1 MYO1D gene_id:4642|Hs108|chr17 ( 436) 752 80.1 3.4e-14
CCDS11156.1 MYH2 gene_id:4620|Hs108|chr17 (1941) 752 80.5 1.1e-13
CCDS11154.1 MYH4 gene_id:4622|Hs108|chr17 (1939) 745 80.0 1.7e-13
CCDS42869.1 MYH7B gene_id:57644|Hs108|chr20 (1983) 726 78.3 5.2e-13
CCDS46446.1 MYO3B gene_id:140469|Hs108|chr2 (1314) 720 77.7 5.4e-13
CCDS42773.1 MYO3B gene_id:140469|Hs108|chr2 (1341) 720 77.7 5.4e-13
CCDS34629.1 MYO1G gene_id:64005|Hs108|chr7 (1018) 671 73.5 7.9e-12
CCDS7148.1 MYO3A gene_id:53904|Hs108|chr10 (1616) 662 72.8 1.9e-11
>>CCDS42271.1 MYO15A gene_id:51168|Hs108|chr17 (3530 aa)
initn: 2096 init1: 839 opt: 1850 Z-score: 860.3 bits: 174.1 E(32554): 1.3e-41
Smith-Waterman score: 4749; 33.7% identity (59.0% similar) in 3049 aa overlap (198-3091:725-3517)
170 180 190 200 210 220
pF1KSD QESGSQRGTARELRPTPEPTDMGSEGTKTGPESALEPSSDGLDSDWPHADTRG-REGSSG
: . : : : :. . :: :. ...
CCDS42 GSLRRHPPPWAAPAHVPPAPQASWWAFVEPPAVSPEVPPDLLAFPGPRPSFRGSRRRGAA
700 710 720 730 740 750
230 240 250 260 270
pF1KSD TGPLGASEHSGGDSDSSPLGT-------GPGRGSRAAMASRTFEDSSRAPRDTGPAKDAS
: ::: ... :::.. .:: : . .: . . : : ::: .
CCDS42 FGFPGASPRASRRRAWSPLASPQPSLRSSPGLGYCSPLAPPSPQLSLR----TGPFQPPF
760 770 780 790 800 810
280 290 300 310 320 330
pF1KSD DNRAQRGAEPETMQASTARAPRHQVGKAVGQVPAAAGEGEAGAAAGAGPEDPAP-LAALL
:.: :...: : : :: .:.:.. : :. ..:. :.: :.
CCDS42 LPPARR---PRSLQESPA--PR----RAAGRL------GPPGSPLPGSPRPPSPPLGLCH
820 830 840 850
340 350 360 370 380 390
pF1KSD VVRR----LLARPPPGAASQAVGPRRAGLKERLLSVARALGLLRWLRRRLRLR---RRPP
:: : .: : . : :: . : : : : :. : :.:
CCDS42 SPRRSSLNLPSRLPHTWRRLSEPPTRAVKPQVRLPFHRPPRAGAW-RAPLEHRESPREPE
860 870 880 890 900 910
400 410 420 430 440 450
pF1KSD EGEGQGTGPRASEGWGRRKPDEGRGHGRGSKGRGRGKADEGRGHERGDEGRGRGKADEGR
..: : : . .: : : : : : : .:: .: ..
CCDS42 DSETPWTVPPLAPSWDVDMPPTQRPP---SPWPG------GAGSRRG-FSRPPPVPENPF
920 930 940 950 960
460 470 480 490 500 510
pF1KSD GHERGYEGRGCGKADEGRGHERGDEGRDHQRGYEGWGREPGLRHRLALRLAGLAGLGGMP
. : . . : . : : . : .::: . . :: .
CCDS42 LQLLGPVPSPTLQPE--------DPAADMTRVFLGRHHEPGPGQ--LTKSAGPTPEKPEE
970 980 990 1000 1010
520 530 540 550 560
pF1KSD RASPGGRSPQVPTSPVPGDPFDQEDETPDPKFAVVFPR--IHRAGRASSSRSSEEASADA
.:. : .::.:. : : .: :: :: .. :. . . : : :. :
CCDS42 EATLG--DPQLPAETKPPTPAPPKDVTP-PK-DITPPKDVLPEQKTLRPSLSYPLAACDQ
1020 1030 1040 1050 1060 1070
570 580 590 600 610 620
pF1KSD PTGEGRGWPRAGVGGHSEGCRTSGEGVSGLRRGSLLAPTAPDG-----PSLDESGSSSEA
. : : :. .. . . .. : .:. .:: : ... .: ...
CCDS42 TRATWPPWHRWGTLPQAAAPLAPIRAPEPLPKGGERRQAAPGRFAVVMPRVQKLSSFQRV
1080 1090 1100 1110 1120 1130
630 640 650 660 670
pF1KSD ELETLNDEPPVRWAQGSGPHEGP--------RLGAAVLLPRLSLETRLQQEGDPG-----
:: .: :. : :. : : ::. . . . : ::
CCDS42 GPATL--KPQVQPIQDPKPRACSLRWSCLWLRADAYGPWPRVHTHPQSCHLG-PGAACLS
1140 1150 1160 1170 1180
680 690 700 710 720 730
pF1KSD LRGSLRELWEPEDEDEAVLERDLELSLRPGLEAPPFPGAKGRSLGDGLEDMEDLARLRLV
:::: .:. : ... :.: :.: : .:. ::.::: .: :.
CCDS42 LRGSWEEVGPPSWRNKMHSIRNLP-SMR-------FREQHGE---DGVEDMTQLEDLQ--
1190 1200 1210 1220 1230
740 750 760 770 780 790
pF1KSD CDSSVLLCLKKRFHLGRIYTFGGPVLLVLNPHRSLPLFSPEVQASYHPRKALSTTPHIFA
...:: :: ::. . :::. : .:. .::.. . ...:: .:. : . ::.::
CCDS42 -ETTVLSNLKIRFERNLIYTYIGSILVSVNPYQMFGIYGPEQVQQYNGRALGENPPHLFA
1240 1250 1260 1270 1280 1290
800 810 820 830 840 850
pF1KSD IVASAYDLAQNTGQDPCILLCSSHCSGHSGSGKTEAAKKIMQFLSSLEQDQTGNRECQVE
.. :. .. :. ::.. ::.::::::::.: :...:....: . .. ..
CCDS42 VANLAFAKMLDAKQNQCIII-----SGESGSGKTEATKLILRYLAAMNQKREVMQQIKIL
1300 1310 1320 1330 1340
860 870 880 890 900 910
pF1KSD DMLPILSSFGHAKTILNANASRFGQVFCLYLQQGVIVGASVSHYLLETSRVVFQAQAERS
. :.: :::.:::. : :.::::. ..:. ::: :: .:.:::: ::.::::. ::.
CCDS42 EATPLLESFGNAKTVRNDNSSRFGKFVEIFLEGGVISGAITSQYLLEKSRIVFQAKNERN
1350 1360 1370 1380 1390 1400
920 930 940 950 960 970
pF1KSD FHVFYELLAGLDSIERERLSLQGPETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLC
.:.:::::::: . :. .::: ::::::::: :.. :: ::.::. :: :.. ::.
CCDS42 YHIFYELLAGLPAQLRQAFSLQEAETYYYLNQGGNCEIAGKSDADDFRRLLAAMEVLGFS
1410 1420 1430 1440 1450 1460
980 990 1000 1010 1020 1030
pF1KSD PEELNAVWAVLAAILQLGNICFSSSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVT
:. .... .::.::.:::. : . : ..::::.: : ::...:.::.. :: :. :.:
CCDS42 SEDQDSIFRILASILHLGNVYFEKYETDAQEVASVVSAREIQAVAELLQISPEGLQKAIT
1470 1480 1490 1500 1510 1520
1040 1050 1060 1070 1080 1090
pF1KSD RRVTETPYGQVSRSLPVESAVDARDALAKALYSRLFHRLLRRTNARLAPPGEGGSIGTVT
.:::: .. : ::::::::::.::.::. :: :. :.:: ..: . ::.
CCDS42 FKVTETMREKIFTPLTVESAVDARDAIAKVLYALLFSWLITRVNALVSPRQDTLSIA---
1530 1540 1550 1560 1570 1580
1100 1110 1120 1130 1140 1150
pF1KSD VVDAYGFEALRVNGLEQLCNNLASERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRES
..: :::: : :..:::: : :.: :: . ..... .:.:: :: ..: . .
CCDS42 ILDIYGFEDLSFNSFEQLCINYANENLQYLFNKIVFQEEQEEYIREQIDWQEITFADNQP
1590 1600 1610 1620 1630 1640
1160 1170 1180 1190 1200 1210
pF1KSD CLDLLVDQPHSLLSILDAQTWLSQATDHTFLQKSHYHHGDHPSYAKPRLPLPVFTVRHYA
:..:. .:...: ::: : . :::::::::: ::::: .: :.::..::: ::..:::
CCDS42 CINLISLKPYGILRILDDQCCFPQATDHTFLQKCHYHHGANPLYSKPKMPLPEFTIKHYA
1650 1660 1670 1680 1690 1700
1220 1230 1240 1250 1260
pF1KSD GTVTYQVHKFLNRNRDQLDPAVVEMLGQSQLQLVGSLFQEAEPQS---RGGRGRP-----
: :::::::::..:.::. :.... .:. ..:. ::. ::. : :..
CCDS42 GKVTYQVHKFLDKNHDQVRQDVLDLFVRSRTRVVAHLFSSHAPQAAPQRLGKSSSVTRLY
1710 1720 1730 1740 1750 1760
1270 1280 1290 1300 1310 1320
pF1KSD ---TLASRFQQALEDLIARLGRSHVYFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAV
:.:..:::.: ::. .. : . :..:: :: : ::::. : ::. ...::.:
CCDS42 KAHTVAAKFQQSLLDLVEKMERCNPLFMRCLKPNHKKEPGLFEPDVVMAQLRYSGVLETV
1770 1780 1790 1800 1810 1820
1330 1340 1350 1360 1370 1380
pF1KSD GTRSANFPVRVPFEAFLASFQALGSEGQEDLSDREKCGAVLSQVLGAESPLYHLGATKVL
:. .::::.::..:. . : . .. .. . : .:::.. . .:..:..:..
CCDS42 RIRKEGFPVRLPFQGFIDRYCCLVALKHDLPANGDMCVSVLSRLCKVMPNMYRVGVSKLF
1830 1840 1850 1860 1870 1880
1390 1400 1410 1420 1430
pF1KSD LQEQGWQRLEELRDQQRSQALVDLHRSFHTCISRQRV------LPRMQARMRGFQARKRY
:.:. .: :: .:.. . : . :.: .. . ..: . .:.: ::. ::.::
CCDS42 LKEHLYQLLESMREHVLNLAALTLQRCLRGFFIKRRFRSLRHKIILLQSRARGYLARQRY
1890 1900 1910 1920 1930 1940
1440 1450 1460 1470 1480
pF1KSD LRRRAALGQLNTILLVAQPLLQRRQRLQL-GRW----QG---WHSSERALERVPSMELGR
. : .: .. ... . ..::. :.: ..: .: :.. : : . . .:.
CCDS42 QQMRRSLVKFRSLV---HAYVSRRRYLKLRAEWRCQVEGALLWEQEE--LSKREVVAVGH
1950 1960 1970 1980 1990 2000
1490 1500 1510 1520 1530 1540
pF1KSD LEIPAELAVMLKTAESHRDALAGSITECLPPEVPARPSLTLPADIDLFPFSSFVAIGFQE
::.::::: .:... . : . ... :.. :.: .::: ::. .:...:: :.:
CCDS42 LEVPAELAGLLQAVAGLGLAQVPQVAPVRTPRLQAEPRVTLPLDINNYPMAKFVQCHFKE
2010 2020 2030 2040 2050 2060
1550 1560 1570 1580 1590 1600
pF1KSD PSLPRPGQPLAKPLTQLDGDNPQRALDINKVMLRLLGDGSLESWQRQIMGAYLVRQGQCW
:.. :: ::::: ... .:..: :..::..:: :.. ...:.: :.:..:
CCDS42 PAFGMLTVPLRTPLTQLPAEHHAEAVSIFKLILRFMGDPHLHGARENIFGNYIVQKGLAV
2070 2080 2090 2100 2110 2120
1610 1620 1630 1640 1650 1660
pF1KSD PGLRNELFSQLVAQLWQNPDEQQSQRGWALMAVLLSAFPPLPVLQKPLLKFVSDQAPRGM
: ::.:...::. :.:.: . ....::: :.:. ::.: : : ..: ::::::: . :.
CCDS42 PELRDEILAQLANQVWHNHNAHNAERGWLLLAACLSGFAPSPCFNKYLLKFVSDYGRNGF
2130 2140 2150 2160 2170 2180
1670 1680 1690 1700 1710 1720
pF1KSD AALCQHKLLGALEQSQL-ASGATRAHPPTQLEWLAGWRRGRMALDVFTFSEECYSAEVES
:.:::.:. :. ..: .:::.:. ::::::: : .... ::::: :. . .: :.:
CCDS42 QAVCQHRLMQAMGRAQQQGSGAARTLPPTQLEWTATYEKASMALDVGCFNGDQFSCPVHS
2190 2200 2210 2220 2230 2240
1730 1740 1750 1760 1770 1780
pF1KSD WTTGEQLAGWILQSRGLEAPPRGWSVSLHSRDAWQDLAGCDFVLDLISQTEDLGDPARPR
:.:::..:: ::. ::: :::.:.... : .::: :.::::.:. : : : : .
CCDS42 WSTGEEVAGDILRHRGLADGWRGWTVAMKNGVQWAELAGHDYVLDLVSDLELLRDFPRQK
2250 2260 2270 2280 2290 2300
1790 1800 1810 1820
pF1KSD SYPIT----PLGSAEAIPLAPGIQAPSLPP-GPPPGPAPTLP---------SRDHTG---
:: :. : .: . .. : . : . : : .: :... :
CCDS42 SYFIVGTEGPAASRGGPKVVFGNSWDSDEDMSTRPQPQEHMPKVLDSDGYSSHNQDGTNG
2310 2320 2330 2340 2350 2360
1830 1840 1850 1860
pF1KSD --EVQRSGS-----------------LDGFLDQIFQPVISSGLSDLEQSWALSSRMKGGG
:.::. . :: .::..:.::.: : .:::. :.. ::::::
CCDS42 ETEAQRGTATHQESDSLGEPAVPHKGLDCYLDSLFDPVLSYGDADLEKPTAIAYRMKGGG
2370 2380 2390 2400 2410 2420
1870 1880 1890 1900 1910 1920
pF1KSD AIGPTQQGYPMVYPGMIQMPAYQPGMVPAPMPMMPAMGTVPAMPAMVVPPQP-PLPSLDA
::: . :: . : ::.: :.:.:::
CCDS42 ----------------------QPGG-------GSSSGTEDT-PRR--PPEPKPIPGLDA
2430 2440
1930 1940 1950 1960 1970 1980
pF1KSD GQLAVQQQNFIQQQALILAQQMTAQAMSLSLEQQMQQRQQQARASEAASQASPSAVTSKP
. ::.:: ::..::..::..:: :: .: ::: . :: .. :.
CCDS42 STLALQQA-FIHKQAVLLAREMTLQATAL---------QQQPLS--AALRSLPA------
2450 2460 2470 2480 2490
1990 2000 2010 2020 2030 2040
pF1KSD RKPPTPPEKPQRDLGSEGGCLRETSEEAEDRPYQPKSFQQKRNYFQRMGQPQITVRTMKP
.:::.: .: ..:. : :
CCDS42 EKPPAPEAQPT-SVGT-G-----------------------------------------P
2500
2050 2060 2070 2080 2090 2100
pF1KSD PAKVHIPQGEAQEEEEEEEEEEEQEEQEVETRAVPSP-PPPPIVKKP-LKQGGAKAPKEA
::: : : ::.:.: : :..: : : . :: :
CCDS42 PAK---P---------------------VLLRATPKPLAPAPLAKAPRLPIKPVAAPVLA
2510 2520 2530 2540
2110 2120 2130 2140 2150 2160
pF1KSD EAEPAKETAAKGHGQGPAQGRGTVVRSSDSKPKRPQPSREIGNIIRMYQSRP--GPVPVP
. . . ::.. . : : ... : . :::...: ::.:.:: .: : :
CCDS42 QDQASPETTSPS----PELVRYSTLNSE----HFPQPTQQIKNIVRQYQ-QPFRGGRPEA
2550 2560 2570 2580 2590
2170 2180 2190 2200 2210 2220
pF1KSD VQPSRPPKAFLRKIDPKDEALAKLGINGAHSSPPMLSPSPGKGPPPAVAPRPKAPLQLGP
.. . :.:... ::..::: : . .: :. .::
CCDS42 LRKD-GGKVFMKRPDPHEEALMILKGQMTH-----LAAAPG-------------------
2600 2610 2620
2230 2240 2250 2260 2270 2280
pF1KSD SSSIKEKQGPLLDLFGQKLPIAHTPPPPPAPPLPLPEDPGTLSAERRCLTQPVE-DQGVS
...... :. :.. .: : :: :: : : : : :
CCDS42 -TQVSREAVALVK------PVTSAPRPSMAPTSALPS---------RSLEPPEELTQTRL
2630 2640 2650 2660 2670
2290 2300 2310 2320 2330 2340
pF1KSD TQLLAPSGSVCFSYTGTPWKLFLRKEVFYPRENFSHPYYLRLLCEQILRDTFSESCIRIS
.:. :. ..: .:::.:::::::::....::: : :: .:::.::.::.:.:::
CCDS42 HRLINPN---FYGYQDAPWKIFLRKEVFYPKDSYSHPVQLDLLFRQILHDTLSEACLRIS
2680 2690 2700 2710 2720 2730
2350 2360 2370 2380 2390 2400
pF1KSD QNERRKMKDLLGGLEVDLDSLTTTEDSVKKRIVVAARDNWANYFSRFFPVSGESGSDVQL
..:: .:: :.. ..: .. .:: :::. .: .:::.: ::::.::..: :. :::
CCDS42 EDERLRMKALFAQNQLDTQKPLVTE-SVKRAVVSTARDTWEVYFSRIFPATGSVGTGVQL
2740 2750 2760 2770 2780
2410 2420 2430 2440 2450 2460
pF1KSD LAVSHRGLRLLKVTQGPGLRPDQLKILCSYSFAEVLGVECRGGSTLELSLKSEQLVLHTA
::::: :..::....: ::..: .::::..: : . . ::..: ::...: .:
CCDS42 LAVSHVGIKLLRMVKGGQEAGGQLRVLRAYSFADILFVTMPSQNMLEFNLASEKVILFSA
2790 2800 2810 2820 2830 2840
2470 2480 2490 2500 2510
pF1KSD RARAIEALVELFLNELKKDSGYVIALRSYITDNCSLLSFHRGDLIKLLP-----------
::. ...::. :. :::::: ::.:.:... .. .::.::.::.:.: :
CCDS42 RAHQVKTLVDDFILELKKDSDYVVAVRNFLPEDPALLAFHKGDIIHLQPLEPPRVGYSAG
2850 2860 2870 2880 2890 2900
2520 2530 2540 2550
pF1KSD ------VATLE------P--GWQFGSAGGRSGLFPADIVQPAAAPDF-SFSKEQRSGWHK
:. :: : ::.::. :: : ::...::::::::: .. : : .
CCDS42 CVVRRKVVYLEELRRRGPDFGWRFGTIHGRVGRFPSELVQPAAAPDFLQLPTEPGRG-RA
2910 2920 2930 2940 2950 2960
2560 2570 2580 2590 2600 2610
pF1KSD GQLSNGEPGLARWDRASERPAHPWSQAHSDDSEATSLSSVAYAFLPDSHSYTMQEFARRY
. .. . . : .....: : .:.: : .:. :: ::: :::..:
CCDS42 AAVAAAVASAAAAQEVGRRREGPPVRARSADHGEDALA------LPP---YTMLEFAQKY
2970 2980 2990 3000 3010
2620 2630 2640 2650 2660 2670
pF1KSD FRRSQ-----ALLGQTDGGAAGKDTDSLVQYTKAPIQESLLSLSDD-VSKLAVASFLALM
:: : .: .. .. .... .::.:.::::. :::. .::.:. :::.:
CCDS42 FRDPQRRPQDGLRLKSKEPRESRTLEDMLCFTKTPLQESLIELSDSSLSKMATDMFLAVM
3020 3030 3040 3050 3060 3070
2680 2690 2700 2710 2720
pF1KSD RFMGDQSKPRGKDEMDLLYELLKLC-QQEKLRDEIYCQVIKQVTGHP--RPEHCTRGWSF
::::: . .:....:.: .::::: ..: .::: ::::.::.: . . . : ::: .
CCDS42 RFMGD-APLKGQSDLDVLCNLLKLCGDHEVMRDECYCQVVKQITDNTSSKQDSCQRGWRL
3080 3090 3100 3110 3120 3130
2730 2740 2750 2760 2770 2780
pF1KSD LSLLTGFFPPSTRLMPYLTKFLQDSG-----PSQELARSSQEHLQRTVKYGGRRRMPPPG
: ..:.. : : :.::.:::: . : : .:.. ...::.:...::: ..:
CCDS42 LYIVTAYHSCSEVLHPHLTRFLQDVSRTPGLPFQGIAKACEQNLQKTLRFGGRLELPSSI
3140 3150 3160 3170 3180 3190
2790 2800 2810 2820 2830 2840
pF1KSD EMKAFLKGQAIRLLLIHLPGGVDYRTNIQTFTVAAEVQEELCRQMGITEPQEVQEFALFL
:..:.: :.. . :. ::::.. . .:.: ::: .: ::.: .:..:.:. .:...:.
CCDS42 ELRAMLAGRSSKRQLFLLPGGLERHLKIKTCTVALDVVEEICAEMALTRPEAFNEYVIFV
3200 3210 3220 3230 3240 3250
2850 2860 2870 2880 2890
pF1KSD IKEKSQLVRPLQPAEYLNSVV-----VDQDVSLHSRRLHWETPLHFDNSTYISTHYSQVL
. ...: : ::. :. .:. :: : ::. :. ::.:.: :.. ::.:::
CCDS42 VTNRGQHVCPLSRRAYILDVASEMEQVDGGYMLWFRRVLWDQPLKFENELYVTMHYNQVL
3260 3270 3280 3290 3300 3310
2900 2910 2920 2930 2940 2950
pF1KSD WDYLQG---KLPVSAKADA---QLARLAALQHLSKANRNTPSGQDLLAYVPKQLQRQVNT
:::.: ..:.: .. :...::.::: .: . :: ... :.: :: : .
CCDS42 PDYLKGLFSSVPASRPSEQLLQQVSKLASLQHRAKDHFYLPSVREVQEYIPAQLYRTTAG
3320 3330 3340 3350 3360 3370
2960 2970 2980 2990 3000 3010
pF1KSD ASIKNLMGQELRRLEGHSPQEAQISFIEAMSQLPLFGYTVYGVLRVSMQALSGPTLLGLN
.. ::..:. .. .. ::..:. .:. .: ::.:: . . . : :. .: .:..:
CCDS42 STWLNLVSQHRQQTQALSPHQARAQFLGLLSALPMFGSSFFFIQSCSNIAVPAPCILAIN
3380 3390 3400 3410 3420 3430
3020 3030 3040 3050 3060 3070
pF1KSD RQHLILMDPSSQSLYCRIALKSLQRLHLLSPLEEKGPPGLEVNYGSADNPQTIWFELPQA
.. : ... .. :. .. :: .: . : ... : .:. :.. .:. ..: :.
CCDS42 HNGLNFLSTETHELMVKFPLKEIQSTRTQRPTANSSYPYVEIALGDVAAQRTLQLQLEQG
3440 3450 3460 3470 3480 3490
3080 3090
pF1KSD QELLYTTVFLIDSSASCTEWPSIN
:: ... ... : :
CCDS42 LELCRVVAVHVENLLSAHEKRLTLPPSEITLL
3500 3510 3520 3530
>>CCDS53685.1 MYO7A gene_id:4647|Hs108|chr11 (1178 aa)
initn: 1183 init1: 418 opt: 1277 Z-score: 603.6 bits: 125.1 E(32554): 2.7e-27
Smith-Waterman score: 1284; 32.4% identity (62.7% similar) in 769 aa overlap (722-1475:67-826)
700 710 720 730 740 750
pF1KSD RDLELSLRPGLEAPPFPGAKGRSLGDGLEDMEDLARLRLVCDSSVLLCLKKRFHLGRIYT
.::. :: . ....: : :.. :::
CCDS53 QVVDDEDNEHWISPQNATHIKPMHPTSVHGVEDMIRLGDLNEAGILRNLLIRYRDHLIYT
40 50 60 70 80 90
760 770 780 790 800 810
pF1KSD FGGPVLLVLNPHRSLPLFSPEVQASYHPRKALSTTPHIFAIVASAYDLAQNTGQDPCILL
. : .:...::.. : ..::: .: .: ::::::. . : . ...: : ..
CCDS53 YTGSILVAVNPYQLLSIYSPEHIRQYTNKKIGEMPPHIFAIADNCYFNMKRNSRDQCCII
100 110 120 130 140 150
820 830 840 850 860 870
pF1KSD CSSHCSGHSGSGKTEAAKKIMQFLSSLEQDQTGNRECQVEDMLPILSSFGHAKTILNANA
::.::.::::..: :.:::... . : . : :: . ::: .::.:::: : :.
CCDS53 -----SGESGAGKTESTKLILQFLAAI-SGQHSWIEQQVLEATPILEAFGNAKTIRNDNS
160 170 180 190 200 210
880 890 900 910 920 930
pF1KSD SRFGQVFCLYL-QQGVIVGASVSHYLLETSRVVFQAQAERSFHVFYELLAGLDSIERERL
::::. . ... ..:.: ::.. .:::: ::: :: ::..:::: .: :.. ....:
CCDS53 SRFGKYIDIHFNKRGAIEGAKIEQYLLEKSRVCRQALDERNYHVFYCMLEGMSEDQKKKL
220 230 240 250 260 270
940 950 960 970 980 990
pF1KSD SLQGPETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLCPEELNAVWAVLAAILQLGN
.: : :: .:. .:. :.:.. .. .:.. : . : . .:::::.:::
CCDS53 GLGQASDYNYLAMGNCITCEGRVDSQEYANIRSAMKVLMFTDTENWEISKLLAAILHLGN
280 290 300 310 320 330
1000 1010 1020 1030 1040 1050
pF1KSD ICFSSSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVTRRVTETPYGQVSRSLPVES
. . . :. .. : . ::: ::.: : : . .: :. : :: : :.
CCDS53 LQYEARTFENLDACEVLFSPSLATAASLLEVNPPDLMSCLTSRTLITRGETVSTPLSREQ
340 350 360 370 380 390
1060 1070 1080 1090 1100
pF1KSD AVDARDALAKALYSRLFHRLLRRTNARL-APPGEG--GSIGTVTVVDAYGFEALRVNGLE
:.:.:::..:..:.::: .. . :: . ::.. .: .. ..: .::: . ::..:
CCDS53 ALDVRDAFVKGIYGRLFVWIVDKINAAIYKPPSQDVKNSRRSIGLLDIFGFENFAVNSFE
400 410 420 430 440 450
1110 1120 1130 1140 1150 1160
pF1KSD QLCNNLASERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRESCLDLLVDQPHSLLSIL
::: :.:.:.:: : . .. :.:: : ..:. . .. ::.....: ...:..
CCDS53 QLCINFANEHLQQFFVRHVFKLEQEEYDLESIDWLHIEFTDNQDALDMIANKPMNIISLI
460 470 480 490 500 510
1170 1180 1190 1200 1210 1220
pF1KSD DAQTWLSQATDHTFLQKSHYHHGDHPSYAKPRLPLPV-FTVRHYAGTVTYQVHKFLNRNR
: .. . ..:: :.:.: . .: . .: :. . : . :.:: : :... ::..::
CCDS53 DEESKFPKGTDTTMLHKLNSQHKLNANYIPPKNNHETQFGINHFAGIVYYETQGFLEKNR
520 530 540 550 560 570
1230 1240 1250 1260 1270 1280
pF1KSD DQLDPAVVEMLGQSQLQLVGSLFQEAEPQSRGGRGR-PTLASRFQQALEDLIARLGRSHV
: : ..... .:. ... ..:: .. : : :::.:.:...:: :. :: .
CCDS53 DTLHGDIIQLVHSSRNKFIKQIFQADVAMGAETRKRSPTLSSQFKRSLELLMRTLGACQP
580 590 600 610 620 630
1290 1300 1310 1320 1330 1340
pF1KSD YFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAVGTRSANFPVRVPFEAFLASFQAL--
.:..:. :: : : ::: ..::. ....:.. : :..:.: : :. ...:
CCDS53 FFVRCIKPNEFKKPMLFDRHLCVRQLRYSGMMETIRIRRAGYPIRYSFVEFVERYRVLLP
640 650 660 670 680 690
1350 1360 1370 1380 1390 1400
pF1KSD GSEGQEDLSD-REKCGAVLSQVLGAESPLYHLGATKVLLQEQGWQRLEELRDQQRSQALV
: . .: : : . :::... ...: ::..:... . :: ::. .. ..
CCDS53 GVKPAYKQGDLRGTCQRMAEAVLGTHDD-WQIGKTKIFLKDHHDMLLEVERDKAITDRVI
700 710 720 730 740
1410 1420 1430 1440 1450
pF1KSD DLHRSFHTCISRQRVLPR------MQARMRGFQARKRYLRRRAALGQLNTILLVAQPLLQ
:.. .. .:. : .: . :: . :: : : :: : : . :.
CCDS53 LLQKVIRGFKDRSNFLKLKNAATLIQRHWRGHNCRKNYGLMR--LGFLRLQALHRSRKLH
750 760 770 780 790 800
1460 1470 1480 1490 1500 1510
pF1KSD RRQRLQLGRWQGWHSSERALERVPSMELGRLEIPAELAVMLKTAESHRDALAGSITECLP
.. :: : ... ::
CCDS53 QQYRLARQRIIQFQARCRAYLVRKAFRHRLWAVLTVQAYARGMIARRLHQRLRAEYLWRL
810 820 830 840 850 860
>>CCDS53684.1 MYO7A gene_id:4647|Hs108|chr11 (2175 aa)
initn: 1358 init1: 418 opt: 1277 Z-score: 599.8 bits: 125.2 E(32554): 4.3e-27
Smith-Waterman score: 1457; 24.0% identity (49.7% similar) in 2370 aa overlap (722-3026:67-2108)
700 710 720 730 740 750
pF1KSD RDLELSLRPGLEAPPFPGAKGRSLGDGLEDMEDLARLRLVCDSSVLLCLKKRFHLGRIYT
.::. :: . ....: : :.. :::
CCDS53 QVVDDEDNEHWISPQNATHIKPMHPTSVHGVEDMIRLGDLNEAGILRNLLIRYRDHLIYT
40 50 60 70 80 90
760 770 780 790 800 810
pF1KSD FGGPVLLVLNPHRSLPLFSPEVQASYHPRKALSTTPHIFAIVASAYDLAQNTGQDPCILL
. : .:...::.. : ..::: .: .: ::::::. . : . ...: : ..
CCDS53 YTGSILVAVNPYQLLSIYSPEHIRQYTNKKIGEMPPHIFAIADNCYFNMKRNSRDQCCII
100 110 120 130 140 150
820 830 840 850 860 870
pF1KSD CSSHCSGHSGSGKTEAAKKIMQFLSSLEQDQTGNRECQVEDMLPILSSFGHAKTILNANA
::.::.::::..: :.:::... . : . : :: . ::: .::.:::: : :.
CCDS53 -----SGESGAGKTESTKLILQFLAAI-SGQHSWIEQQVLEATPILEAFGNAKTIRNDNS
160 170 180 190 200 210
880 890 900 910 920 930
pF1KSD SRFGQVFCLYL-QQGVIVGASVSHYLLETSRVVFQAQAERSFHVFYELLAGLDSIERERL
::::. . ... ..:.: ::.. .:::: ::: :: ::..:::: .: :.. ....:
CCDS53 SRFGKYIDIHFNKRGAIEGAKIEQYLLEKSRVCRQALDERNYHVFYCMLEGMSEDQKKKL
220 230 240 250 260 270
940 950 960 970 980 990
pF1KSD SLQGPETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLCPEELNAVWAVLAAILQLGN
.: : :: .:. .:. :.:.. .. .:.. : . : . .:::::.:::
CCDS53 GLGQASDYNYLAMGNCITCEGRVDSQEYANIRSAMKVLMFTDTENWEISKLLAAILHLGN
280 290 300 310 320 330
1000 1010 1020 1030 1040 1050
pF1KSD ICFSSSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVTRRVTETPYGQVSRSLPVES
. . . :. .. : . ::: ::.: : : . .: :. : :: : :.
CCDS53 LQYEARTFENLDACEVLFSPSLATAASLLEVNPPDLMSCLTSRTLITRGETVSTPLSREQ
340 350 360 370 380 390
1060 1070 1080 1090 1100
pF1KSD AVDARDALAKALYSRLFHRLLRRTNARL-APPGEG--GSIGTVTVVDAYGFEALRVNGLE
:.:.:::..:..:.::: .. . :: . ::.. .: .. ..: .::: . ::..:
CCDS53 ALDVRDAFVKGIYGRLFVWIVDKINAAIYKPPSQDVKNSRRSIGLLDIFGFENFAVNSFE
400 410 420 430 440 450
1110 1120 1130 1140 1150 1160
pF1KSD QLCNNLASERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRESCLDLLVDQPHSLLSIL
::: :.:.:.:: : . .. :.:: : ..:. . .. ::.....: ...:..
CCDS53 QLCINFANEHLQQFFVRHVFKLEQEEYDLESIDWLHIEFTDNQDALDMIANKPMNIISLI
460 470 480 490 500 510
1170 1180 1190 1200 1210 1220
pF1KSD DAQTWLSQATDHTFLQKSHYHHGDHPSYAKPRLPLPV-FTVRHYAGTVTYQVHKFLNRNR
: .. . ..:: :.:.: . .: . .: :. . : . :.:: : :... ::..::
CCDS53 DEESKFPKGTDTTMLHKLNSQHKLNANYIPPKNNHETQFGINHFAGIVYYETQGFLEKNR
520 530 540 550 560 570
1230 1240 1250 1260 1270 1280
pF1KSD DQLDPAVVEMLGQSQLQLVGSLFQEAEPQSRGGRGR-PTLASRFQQALEDLIARLGRSHV
: : ..... .:. ... ..:: .. : : :::.:.:...:: :. :: .
CCDS53 DTLHGDIIQLVHSSRNKFIKQIFQADVAMGAETRKRSPTLSSQFKRSLELLMRTLGACQP
580 590 600 610 620 630
1290 1300 1310 1320 1330 1340
pF1KSD YFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAVGTRSANFPVRVPFEAFLASFQAL--
.:..:. :: : : ::: ..::. ....:.. : :..:.: : :. ...:
CCDS53 FFVRCIKPNEFKKPMLFDRHLCVRQLRYSGMMETIRIRRAGYPIRYSFVEFVERYRVLLP
640 650 660 670 680 690
1350 1360 1370 1380 1390 1400
pF1KSD GSEGQEDLSD-REKCGAVLSQVLGAESPLYHLGATKVLLQEQGWQRLEELRDQQRSQALV
: . .: : : . :::... ...: ::..:... . :: :: .:..
CCDS53 GVKPAYKQGDLRGTCQRMAEAVLGTHDD-WQIGKTKIFLKDHHDMLLEVERD----KAIT
700 710 720 730 740
1410 1420 1430 1440 1450 1460
pF1KSD DLHRSFHTCISRQRVLPRMQARMRGFQARKRYLRRRAALGQLNTILLVAQPLLQRRQRLQ
: ::. .: .:::. :. .:. . : :.::.
CCDS53 D------------RVI-LLQKVIRGFKDRSNFLKLKNA-----------ATLIQRH----
750 760 770
1470 1480 1490 1500 1510 1520
pF1KSD LGRWQGWHSSERALERVPSMELGRLEIPAELAVMLKTAESHRDALAGSITECLPPEVPAR
:.: :. .. :.:: :.. : . .. . :
CCDS53 ---WRG-HNCRK---NYGLMRLGFLRLQA----LHRSRKLH-------------------
780 790 800
1530 1540 1550 1560 1570 1580
pF1KSD PSLTLPADIDLFPFSSFVAIGFQEPSLPRPGQPLAKPLTQLDGDNPQRALDINKVMLRLL
:. : : :: .
CCDS53 ----------------------QQYRLAR-----------------QRII----------
810
1590 1600 1610 1620 1630 1640
pF1KSD GDGSLESWQRQIMGAYLVRQGQCWPGLRNELFSQLVAQLWQNPDEQQSQRGWALMAVLLS
.... : :::::.. .:..: ::...:
CCDS53 ---QFQARCR----AYLVRKA-----FRHRL--------------------WAVLTVQAY
820 830 840
1650 1660 1670 1680 1690 1700
pF1KSD AFPPLPVLQKPLLKFVSDQAPRGMAALCQHKLLGALEQSQLASGATRAHPPTQLEWLAGW
: ::: : :. : : .: . : ::
CCDS53 A--------------------RGMIARRLHQRLRAEYLWRLEAEKMR---------LAEE
850 860 870
1710 1720 1730 1740 1750 1760
pF1KSD RRGRMALDVFTFSEECYSAEVESWTTGEQLAGWILQSRGLEAPPRGWSVSLHSRDAWQDL
.. : ... .:: :: . ::: : : :. ..: .
CCDS53 EKLRKEMSAKKAKEE---AERKHQERLAQLAR--------EDAER----ELKEKEAARRK
880 890 900 910 920
1770 1780 1790 1800 1810 1820
pF1KSD AGCDFVLDLISQTEDLGDPARPRSYPITPLGSAEAIPLAPGIQAPSLPPGPPPGPAPTLP
.:. : : : : :. . .. . :. . : : :: :
CCDS53 K------ELLEQME------RARHEPV---NHSDMVDKMFGFLGTS---GGLPGQEGQAP
930 940 950 960
1830 1840 1850 1860 1870 1880
pF1KSD SRDHTGEVQRSGSLDGFLDQIFQPVISSGLSDL-EQSWALSSRMKGGGAIGPTQQGYPMV
: . : : .. :: . :. . :: : ..: . :. . :.
CCDS53 SGFEDLERGRREMVEEDLDAAL-PLPDEDEEDLSEYKFAKFAATYFQGTTTHSYTRRPLK
970 980 990 1000 1010 1020
1890 1900 1910 1920 1930 1940
pF1KSD YPGMIQMP-AYQPGMVPAPMPMMPAMGTVPAMPAMVVPPQPPLPSLDAGQLAVQQQNFIQ
: . . . : . . . . .. :: .: : : . .. :. . .
CCDS53 QPLLYHDDEGDQLAALAVWITILRFMGDLPE------PKYHTAMSDGSEKIPVMTKIYET
1030 1040 1050 1060 1070
1950 1960 1970 1980 1990 2000
pF1KSD QQALILAQQMTAQAMSLSLEQQMQQRQQQARASEAASQASPSAVTSKPRKPPTPPEKPQR
... ::.. : :. . :.. :.. . : .: :. .
CCDS53 LGKKTYKREL--QALQGEGEAQLPEGQKK-------SSVRHKLVHLTLKKKSKLTEEVTK
1080 1090 1100 1110 1120
2010 2020 2030 2040 2050 2060
pF1KSD DLGSEGGCLRETSEEAEDRPYQPKSFQQKRNYFQRMGQPQITVRTMKPPAKVHIPQGEAQ
: .: . . :::: : .: ... : ..: . .: ..
CCDS53 RL-HDGESTVQGNSMLEDRP---TSNLEKLHFIIGNG-------ILRPALRDEIYCQISK
1130 1140 1150 1160 1170
2070 2080 2090 2100 2110
pF1KSD EEEEEEEEEEEQEEQEVETRAVPSPPPPPIVKKPLK---QGGAKAPKEAEAEPAKETAAK
. .. . . . . : : : :. .:: . : ..: ..
CCDS53 QLTHNPSKSSYARGWILVSLCVGCFAPSEKFVKYLRNFIHGGPPGYAPYCEERLRRTFVN
1180 1190 1200 1210 1220 1230
2120 2130 2140 2150 2160 2170
pF1KSD GHGQGPAQGRGTVVRSSDSKPKRP--QPSREIGNIIRMYQSRPGPVPVPVQPSRPPKAFL
: : . .. . .: :.: : . . . . . . . .:.
CCDS53 GTRTQPP----SWLELQATKSKKPIMLPVTFMDGTTKTLLTDSATTAKELC-----NALA
1240 1250 1260 1270 1280
2180 2190 2200 2210 2220 2230
pF1KSD RKIDPKDEALAKLGINGAHSSPPMLSPSPGKGPPPAVAPRPKAPLQLGPSSSIKEKQGPL
::. :: ..:.. . .: : :.: .. . : . .. .:...:
CCDS53 DKISLKD----RFGFSLYIALFDKVS-SLGSGSDHVMDAISQCE-QYAKEQGAQERNAPW
1290 1300 1310 1320 1330 1340
2240 2250 2260 2270 2280 2290
pF1KSD LDLFGQKLPIA-HTPPPPPAPPLPLPEDP--GTLSAERRCLTQPVEDQGVSTQLLAPSGS
.: ... :.: . . .. :. .: :: . . .: : .. ::
CCDS53 RLFFRKEVFTPWHSPSEDNVATNLIYQQVVRGVKFGEYRCEKEDDLAELASQQYFVDYGS
1350 1360 1370 1380 1390 1400
2300 2310 2320 2330 2340 2350
pF1KSD VCFSYTGTPWKLFLRKEVFYPRENFSHPYYLRLLCEQILRDTFSESCIRISQNERRKMKD
...:.. . :. : :. :. . . . :. ...
CCDS53 ----------EMILERLL-----NLV-PTYIPDREITPLKTLEKWAQLAIAAHKK-----
1410 1420 1430 1440
2360 2370 2380 2390 2400
pF1KSD LLGGLEVDLDSLTTTEDSVKKRIVVAARDNWANYFSRFFPVSGESG-----SDVQLLAVS
:. .. : ..::. .: :: .: ::::. . :: .:: ..::.
CCDS53 ---GIYAQ---RRTDAQKVKEDVVSYARFKWPLLFSRFYEAYKFSGPSLPKNDV-IVAVN
1450 1460 1470 1480 1490
2410 2420 2430 2440 2450 2460
pF1KSD HRGLRLLKVTQGPGLRPDQLKILCSYSFAEVLGVEC-RGGSTLELS-----LKSEQLVLH
:. .. .: ..: :: :...: ::..: : .:... ..
CCDS53 WTGVYFVD---------EQEQVLLELSFPEIMAVSSSRGAKTTAPSFTLATIKGDEYTFT
1500 1510 1520 1530 1540
2470 2480 2490 2500 2510
pF1KSD TARARAIEALVELFLNELKKDSGYVIALRSYIT---DNCSLLSFHRGDLIKL---LPVAT
.. :. :. :: ::. :.: : ::.::.. . .. ..::: .:::: : .
CCDS53 SSNAEDIRDLVVTFLEGLRKRSKYVVALQDNPNPAGEESGFLSFAKGDLIILDHDTGEQV
1550 1560 1570 1580 1590 1600
2520 2530 2540 2550 2560 2570
pF1KSD LEPGWQFG--SAGGRSGLFPADIVQPAAAPDFSFSKEQRSGWHKGQLSNGEPGLARWD--
.. :: : . : ::.: : . : .. .. . : . : : :
CCDS53 MNSGWANGINERTKQRGDFPTDSVY--VMPTVTMPPREIVA-----LVTMTPD-QRQDVV
1610 1620 1630 1640 1650
2580 2590 2600 2610 2620
pF1KSD RASE-RPAHPWSQAHSDDSEATSLSSVAYAFLPDSHSYTMQEFARRYFRR--SQALLGQT
: . : :.: .:. : ::..::. ::: ...:
CCDS53 RLLQLRTAEPEVRAK-----------------P----YTLEEFSYDYFRPPPKHTLSRVM
1660 1670 1680 1690
2630 2640 2650 2660 2670 2680
pF1KSD DGGAAGKDTDSLVQYTKAPIQESLLSL---SDDVSKLAVASFLALMRFMGDQSKPRGKDE
. : ::: : ..:. :....::. :...:. : .:.:....::: . : ..
CCDS53 VSKARGKD--RLWSHTREPLKQALLKKLLGSEELSQEACLAFIAVLKYMGDYPSKRTRSV
1700 1710 1720 1730 1740 1750
2690 2700 2710 2720 2730 2740
pF1KSD MDLLYELLKL-CQQEKLRDEIYCQVIKQVT-GHPRPEHCTRGWSFLSLLTGFFPPSTRLM
.: .... . : :.:: : :..::.: .: : . ::: .: : ::.::::. :.
CCDS53 NELTDQIFEGPLKAEPLKDEAYVQILKQLTDNHIRYSE-ERGWELLWLCTGLFPPSNILL
1760 1770 1780 1790 1800 1810
2750 2760 2770 2780 2790 2800
pF1KSD PYLTKFLQDSGPSQELARSSQEHLQRTVKYGGRRRMPPPGEMKAFLKGQAIRLLLIHLPG
:.. .::: : :: . ..::.... :.:. : :..:. . . . ...:
CCDS53 PHVQRFLQ-SRKHCPLAIDCLQRLQKALRNGSRKYPPHLVEVEAIQHKTTQIFHKVYFPD
1820 1830 1840 1850 1860 1870
2810 2820 2830 2840
pF1KSD GVDYRTNIQTFTVAAEVQEELCRQMGITEPQ-------------EVQEFALFL--IKEKS
.: .... : : . ... .. . . : : .:. ... .
CCDS53 DTDEAFEVESSTKAKDFCQNIATRLLLKSSEGFSLFVKIADKVLSVPENDFFFDFVRHLT
1880 1890 1900 1910 1920 1930
2850 2860 2870 2880 2890 2900
pF1KSD QLVRPLQPAEYLNSVVVDQDVSLHSRRLHWETPLHFDNSTYIST-HYSQVLWDYLQGKLP
. .. .: . ...: . .. . : : . . : :: : : ::.:
CCDS53 DWIKKARPIK--DGIVPSLTYQVFFMKKLWTTTVPGKDPMADSIFHYYQELPKYLRGYHK
1940 1950 1960 1970 1980 1990
2910 2920 2930 2940 2950 2960
pF1KSD VSAKADAQLARLAALQHLSKANRNTPSGQDLL-AYVPKQLQRQVNTASIKNLMGQELRRL
. . ::. : .. . . :: :: ::..: :::. . : . . .
CCDS53 CTREEVLQLGALIYRVKFEEDKSYFPSIPKLLRELVPQDLIRQVSPDDWKRSIVAYFNKH
2000 2010 2020 2030 2040 2050
2970 2980 2990 3000 3010 3020
pF1KSD EGHSPQEAQISFIEAMSQLPLFGYTVYGVLRVSMQALSGPTLLGLNRQHLILMDPSSQSL
:.: .::...:.. . . : :: . . ... . :...:. . :.::.....
CCDS53 AGKSKEEAKLAFLKLIFKWPTFGSAFF--EQTTEPNFPEILLIAINKYGVSLIDPKTKDI
2060 2070 2080 2090 2100
3030 3040 3050 3060 3070 3080
pF1KSD YCRIALKSLQRLHLLSPLEEKGPPGLEVNYGSADNPQTIWFELPQAQELLYTTVFLIDSS
CCDS53 LTTHPFTKISNWSSGNTYFHITIGNLVRGSKLLCETSLGYKMDDLLTSYISQMLTAMSKQ
2110 2120 2130 2140 2150 2160
>>CCDS53683.1 MYO7A gene_id:4647|Hs108|chr11 (2215 aa)
initn: 1358 init1: 418 opt: 1277 Z-score: 599.7 bits: 125.3 E(32554): 4.4e-27
Smith-Waterman score: 1435; 23.7% identity (50.4% similar) in 2381 aa overlap (722-3026:67-2148)
700 710 720 730 740 750
pF1KSD RDLELSLRPGLEAPPFPGAKGRSLGDGLEDMEDLARLRLVCDSSVLLCLKKRFHLGRIYT
.::. :: . ....: : :.. :::
CCDS53 QVVDDEDNEHWISPQNATHIKPMHPTSVHGVEDMIRLGDLNEAGILRNLLIRYRDHLIYT
40 50 60 70 80 90
760 770 780 790 800 810
pF1KSD FGGPVLLVLNPHRSLPLFSPEVQASYHPRKALSTTPHIFAIVASAYDLAQNTGQDPCILL
. : .:...::.. : ..::: .: .: ::::::. . : . ...: : ..
CCDS53 YTGSILVAVNPYQLLSIYSPEHIRQYTNKKIGEMPPHIFAIADNCYFNMKRNSRDQCCII
100 110 120 130 140 150
820 830 840 850 860 870
pF1KSD CSSHCSGHSGSGKTEAAKKIMQFLSSLEQDQTGNRECQVEDMLPILSSFGHAKTILNANA
::.::.::::..: :.:::... . : . : :: . ::: .::.:::: : :.
CCDS53 -----SGESGAGKTESTKLILQFLAAI-SGQHSWIEQQVLEATPILEAFGNAKTIRNDNS
160 170 180 190 200 210
880 890 900 910 920 930
pF1KSD SRFGQVFCLYL-QQGVIVGASVSHYLLETSRVVFQAQAERSFHVFYELLAGLDSIERERL
::::. . ... ..:.: ::.. .:::: ::: :: ::..:::: .: :.. ....:
CCDS53 SRFGKYIDIHFNKRGAIEGAKIEQYLLEKSRVCRQALDERNYHVFYCMLEGMSEDQKKKL
220 230 240 250 260 270
940 950 960 970 980 990
pF1KSD SLQGPETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLCPEELNAVWAVLAAILQLGN
.: : :: .:. .:. :.:.. .. .:.. : . : . .:::::.:::
CCDS53 GLGQASDYNYLAMGNCITCEGRVDSQEYANIRSAMKVLMFTDTENWEISKLLAAILHLGN
280 290 300 310 320 330
1000 1010 1020 1030 1040 1050
pF1KSD ICFSSSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVTRRVTETPYGQVSRSLPVES
. . . :. .. : . ::: ::.: : : . .: :. : :: : :.
CCDS53 LQYEARTFENLDACEVLFSPSLATAASLLEVNPPDLMSCLTSRTLITRGETVSTPLSREQ
340 350 360 370 380 390
1060 1070 1080 1090 1100
pF1KSD AVDARDALAKALYSRLFHRLLRRTNARL-APPGEG--GSIGTVTVVDAYGFEALRVNGLE
:.:.:::..:..:.::: .. . :: . ::.. .: .. ..: .::: . ::..:
CCDS53 ALDVRDAFVKGIYGRLFVWIVDKINAAIYKPPSQDVKNSRRSIGLLDIFGFENFAVNSFE
400 410 420 430 440 450
1110 1120 1130 1140 1150 1160
pF1KSD QLCNNLASERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRESCLDLLVDQPHSLLSIL
::: :.:.:.:: : . .. :.:: : ..:. . .. ::.....: ...:..
CCDS53 QLCINFANEHLQQFFVRHVFKLEQEEYDLESIDWLHIEFTDNQDALDMIANKPMNIISLI
460 470 480 490 500 510
1170 1180 1190 1200 1210 1220
pF1KSD DAQTWLSQATDHTFLQKSHYHHGDHPSYAKPRLPLPV-FTVRHYAGTVTYQVHKFLNRNR
: .. . ..:: :.:.: . .: . .: :. . : . :.:: : :... ::..::
CCDS53 DEESKFPKGTDTTMLHKLNSQHKLNANYIPPKNNHETQFGINHFAGIVYYETQGFLEKNR
520 530 540 550 560 570
1230 1240 1250 1260 1270 1280
pF1KSD DQLDPAVVEMLGQSQLQLVGSLFQEAEPQSRGGRGR-PTLASRFQQALEDLIARLGRSHV
: : ..... .:. ... ..:: .. : : :::.:.:...:: :. :: .
CCDS53 DTLHGDIIQLVHSSRNKFIKQIFQADVAMGAETRKRSPTLSSQFKRSLELLMRTLGACQP
580 590 600 610 620 630
1290 1300 1310 1320 1330 1340
pF1KSD YFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAVGTRSANFPVRVPFEAFLASFQAL--
.:..:. :: : : ::: ..::. ....:.. : :..:.: : :. ...:
CCDS53 FFVRCIKPNEFKKPMLFDRHLCVRQLRYSGMMETIRIRRAGYPIRYSFVEFVERYRVLLP
640 650 660 670 680 690
1350 1360 1370 1380 1390 1400
pF1KSD GSEGQEDLSD-REKCGAVLSQVLGAESPLYHLGATKVLLQEQGWQRLEELRDQQRSQALV
: . .: : : . :::... ...: ::..:... . :: :: .:..
CCDS53 GVKPAYKQGDLRGTCQRMAEAVLGTHDD-WQIGKTKIFLKDHHDMLLEVERD----KAIT
700 710 720 730 740
1410 1420 1430 1440 1450 1460
pF1KSD DLHRSFHTCISRQRVLPRMQARMRGFQARKRYLRRRAALGQLNTILLVAQPLLQRRQRLQ
: ::. .: .:::. :. .:. . : :.::.
CCDS53 D------------RVI-LLQKVIRGFKDRSNFLKLKNA-----------ATLIQRH----
750 760 770
1470 1480 1490 1500 1510 1520
pF1KSD LGRWQGWHSSERALERVPSMELGRLEIPAELAVMLKTAESHRDALAGSITECLPPEVPAR
:.: :. .. :.:: :.. : . .. . :
CCDS53 ---WRG-HNCRK---NYGLMRLGFLRLQA----LHRSRKLH-------------------
780 790 800
1530 1540 1550 1560 1570 1580
pF1KSD PSLTLPADIDLFPFSSFVAIGFQEPSLPRPGQPLAKPLTQLDGDNPQRALDINKVML-RL
:. : : . . :... :: . :.. ::
CCDS53 ----------------------QQYRLAR------QRIIQFQARC--RAYLVRKAFRHRL
810 820 830
1590 1600 1610 1620 1630 1640
pF1KSD LGDGSLESWQRQIMGAYLVRQGQCWPGLRNELFSQLVAQLWQNPDEQQSQRGWALMAVLL
. ..... : ... : .. :: : . .: :. . .:.. .. .
CCDS53 WAVLTVQAYARGMIARRLHQR------LRAEYLWRLEAEKMRLAEEEKLRK-------EM
840 850 860 870 880
1650 1660 1670 1680 1690 1700
pF1KSD SAFPPLPVLQKPLLKFVSDQAPRGMAALCQHKLLGALEQSQLASGATRAHPPTQLEWLAG
:: : ....: : :..: .::: : .:. .
CCDS53 SA------------KKAKEEAERKH----QERL------AQLA----REDAERELKEKEA
890 900 910
1710 1720 1730 1740 1750
pF1KSD WRRGRMALDVFTFSEECYSAEVESWTTGEQLAGWILQSRGLEAP----PRGWSVSLHSRD
:: . :. . :. :. ... :.. : :: . : :. ..:
CCDS53 ARRKKELLEQM---ERARHEPVNHSDMVDKMFGFLGTSGGLPGQEGQAPSGFEDLERGRR
920 930 940 950 960 970
1760 1770 1780 1790 1800 1810
pF1KSD AW--QDLAGCDFVLDLISQTE-DLGDPARPRSYPITPLGSAEAIPLAPGIQAPSLPPGPP
.:: : .: : .. : ::.. : .. . : : . : :
CCDS53 EMVEEDL---DAALPLPDEDEEDLSE------YKFAKF----AATYFQGTTTHSYTRRPL
980 990 1000 1010 1020
1820 1830 1840 1850 1860 1870
pF1KSD PGPAPTLPSR-DHTGEVQRSGSLDGFLDQIFQPVISSGLSDLEQSWALSSRM-KGGGAIG
: .. :. . . .. :. .. .: ...:: .. . ... . :
CCDS53 KQPLLYHDDEGDQLAALAVWITILRFMGDLPEPKYHTAMSDGSEKIPVMTKIYETLGKKT
1030 1040 1050 1060 1070 1080
1880 1890 1900 1910 1920 1930
pF1KSD PTQQGYPMVYPGMIQMPAYQPGMVPAPMPMMPAMGTVPAMPAMVVPPQPPLPSLDAGQLA
.. . : :.: :. . . . :. .. . : :. .
CCDS53 YKRELQALQGEGEAQLPE---GQKKSSVRHKLVHLTLKKKSKLT---EEVTKRLHDGEST
1090 1100 1110 1120 1130
1940 1950 1960 1970 1980 1990
pF1KSD VQQQNFIQQQALILAQQMTAQAMSLSLEQQMQQRQQQARASEAASQASPSAVTSKPRKPP
:: ....... ... . :. ... : : : . .: .: :
CCDS53 VQGNSMLEDRPTSNLEKLHFIIGNGILRPALRD--------EIYCQISKQ-LTHNPSK--
1140 1150 1160 1170 1180
2000 2010 2020 2030 2040 2050
pF1KSD TPPEKPQRDLGSEGGCLRETSEEAEDRPYQPKSFQQKRNYFQRMGQPQITVRTMKPPAKV
. . .. ::. :: : . ::... : : :.
CCDS53 SSYARGWILVSLCVGCF-APSE---------KFVKYLRNFIH--GGP---------PG--
1190 1200 1210 1220
2060 2070 2080 2090 2100 2110
pF1KSD HIPQGEAQEEEEEEEEEEEQEEQEVETRAVPSPPPPPIVKKPLKQGGAKAPKEAEAEPAK
. : : . .. . . : . .: .:. : : .. . .: .:. : ::
CCDS53 YAPYCEERLRRTFVNGTRTQPPSWLELQATKSKKPI-MLPVTFMDGTTKTLLTDSATTAK
1230 1240 1250 1260 1270 1280
2120 2130 2140 2150 2160
pF1KSD ETAAKGHGQGPAQGR---GTVVRSSDSKPKRPQPSREIGNII---RMYQSRPGPVPVPVQ
: . . : . . :. . . : .. . : ..: .. : .
CCDS53 ELCNALADKISLKDRFGFSLYIALFDKVSSLGSGSDHVMDAISQCEQYAKEQGAQ----E
1290 1300 1310 1320 1330
2170 2180 2190 2200 2210 2220
pF1KSD PSRPPKAFLRKIDPKDEALAKLGINGAHSSPPMLSPSPGKGPPPAVAPRPKAPLQLGPSS
. : . :.:: :... : ::: . . . ...:
CCDS53 RNAPWRLFFRK-----EVFT-----------PWHSPSEDNVATNLIYQQVVRGVKFGEYR
1340 1350 1360 1370 1380
2230 2240 2250 2260 2270
pF1KSD SIKEKQGPLLDLFGQKLPIAHTPPPP-----PAPPLPLPE---DPGTLSAERRCLTQPVE
::. : .: .:. . . : .:. : . :. ..
CCDS53 C--EKEDDLAELASQQYFVDYGSEMILERLLNLVPTYIPDREITPLKTLEKWAQLAIAAH
1390 1400 1410 1420 1430
2280 2290 2300 2310 2320 2330
pF1KSD DQGVSTQLLAPSGSV---CFSYTGTPWKLFLRKEVFYPRENFSHPYYLRLLCEQILRDTF
.:. .: . . .: ::. : :.. . :: .:: : : .... .
CCDS53 KKGIYAQRRTDAQKVKEDVVSYARFKWPLLFSR--FYEAYKFSGP---SLPKNDVIVAVN
1440 1450 1460 1470 1480 1490
2340 2350 2360 2370 2380 2390
pF1KSD SESCIRISQNERRKMKDLLGGLEVDLDSLTTTEDSVKKRIVVAARDNWANYFSRFFPVSG
. ....:. .: ::... . .. .: . :. : .
CCDS53 WTGVYFVDEQEQ-----VL--LELSFPEIMAVSSSRECRV-------WLSL---------
1500 1510 1520 1530
2400 2410 2420 2430 2440 2450
pF1KSD ESGSDVQLLAVSHRGLRLLKVTQGPGLRPDQLKILCSYSFAEVLGVECRGGSTLELS---
. ::. :. : : : . :: :: .. :::..: :
CCDS53 -GCSDLGC-AAPHSGWAGL-TPAGP----------CSPCWS------CRGAKTTAPSFTL
1540 1550 1560 1570
2460 2470 2480 2490 2500
pF1KSD --LKSEQLVLHTARARAIEALVELFLNELKKDSGYVIALRSYIT---DNCSLLSFHRGDL
.:... .. .. :. :. :: ::. :.: : ::.::.. . .. ..::: .:::
CCDS53 ATIKGDEYTFTSSNAEDIRDLVVTFLEGLRKRSKYVVALQDNPNPAGEESGFLSFAKGDL
1580 1590 1600 1610 1620 1630
2510 2520 2530 2540 2550 2560
pF1KSD IKL---LPVATLEPGWQFG--SAGGRSGLFPADIVQPAAAPDFSFSKEQRSGWHKGQLSN
: : ... :: : . : ::.: : . : .. .. . : .
CCDS53 IILDHDTGEQVMNSGWANGINERTKQRGDFPTDSVY--VMPTVTMPPREIVA-----LVT
1640 1650 1660 1670 1680
2570 2580 2590 2600 2610
pF1KSD GEPGLARWD--RASE-RPAHPWSQAHSDDSEATSLSSVAYAFLPDSHSYTMQEFARRYFR
: : : : . : :.: .:. : ::..::. :::
CCDS53 MTPD-QRQDVVRLLQLRTAEPEVRAK-----------------P----YTLEEFSYDYFR
1690 1700 1710 1720
2620 2630 2640 2650 2660 2670
pF1KSD R--SQALLGQTDGGAAGKDTDSLVQYTKAPIQESLLSL---SDDVSKLAVASFLALMRFM
...: . : ::: : ..:. :....::. :...:. : .:.:....:
CCDS53 PPPKHTLSRVMVSKARGKD--RLWSHTREPLKQALLKKLLGSEELSQEACLAFIAVLKYM
1730 1740 1750 1760 1770 1780
2680 2690 2700 2710 2720 2730
pF1KSD GDQSKPRGKDEMDLLYELLKL-CQQEKLRDEIYCQVIKQVT-GHPRPEHCTRGWSFLSLL
:: . : .. .: .... . : :.:: : :..::.: .: : . ::: .: :
CCDS53 GDYPSKRTRSVNELTDQIFEGPLKAEPLKDEAYVQILKQLTDNHIRYSE-ERGWELLWLC
1790 1800 1810 1820 1830 1840
2740 2750 2760 2770 2780 2790
pF1KSD TGFFPPSTRLMPYLTKFLQDSGPSQELARSSQEHLQRTVKYGGRRRMPPPGEMKAFLKGQ
::.::::. :.:.. .::: : :: . ..::.... :.:. : :..:. .
CCDS53 TGLFPPSNILLPHVQRFLQ-SRKHCPLAIDCLQRLQKALRNGSRKYPPHLVEVEAIQHKT
1850 1860 1870 1880 1890
2800 2810 2820 2830
pF1KSD AIRLLLIHLPGGVDYRTNIQTFTVAAEVQEELCRQMGITEPQ-------------EVQEF
. . ...: .: .... : : . ... .. . . : :
CCDS53 TQIFHKVYFPDDTDEAFEVESSTKAKDFCQNIATRLLLKSSEGFSLFVKIADKVLSVPEN
1900 1910 1920 1930 1940 1950
2840 2850 2860 2870 2880 2890
pF1KSD ALFL--IKEKSQLVRPLQPAEYLNSVVVDQDVSLHSRRLHWETPLHFDNSTYIST-HYSQ
.:. ... .. .. .: . ...: . .. . : : . . : :: :
CCDS53 DFFFDFVRHLTDWIKKARPIK--DGIVPSLTYQVFFMKKLWTTTVPGKDPMADSIFHYYQ
1960 1970 1980 1990 2000 2010
2900 2910 2920 2930 2940 2950
pF1KSD VLWDYLQGKLPVSAKADAQLARLAALQHLSKANRNTPSGQDLL-AYVPKQLQRQVNTASI
: ::.: . . ::. : .. . . :: :: ::..: :::. .
CCDS53 ELPKYLRGYHKCTREEVLQLGALIYRVKFEEDKSYFPSIPKLLRELVPQDLIRQVSPDDW
2020 2030 2040 2050 2060 2070
2960 2970 2980 2990 3000 3010
pF1KSD KNLMGQELRRLEGHSPQEAQISFIEAMSQLPLFGYTVYGVLRVSMQALSGPTLLGLNRQH
: . . . :.: .::...:.. . . : :: . . : ... . :...:.
CCDS53 KRSIVAYFNKHAGKSKEEAKLAFLKLIFKWPTFGSAFFEVKQTTEPNFPEILLIAINKYG
2080 2090 2100 2110 2120 2130
3020 3030 3040 3050 3060 3070
pF1KSD LILMDPSSQSLYCRIALKSLQRLHLLSPLEEKGPPGLEVNYGSADNPQTIWFELPQAQEL
. :.::.....
CCDS53 VSLIDPKTKDILTTHPFTKISNWSSGNTYFHITIGNLVRGSKLLCETSLGYKMDDLLTSY
2140 2150 2160 2170 2180 2190
>>CCDS42494.1 MYO1F gene_id:4542|Hs108|chr19 (1098 aa)
initn: 680 init1: 362 opt: 1168 Z-score: 553.9 bits: 115.8 E(32554): 1.6e-24
Smith-Waterman score: 1168; 31.9% identity (61.1% similar) in 740 aa overlap (722-1443:19-737)
700 710 720 730 740 750
pF1KSD RDLELSLRPGLEAPPFPGAKGRSLGDGLEDMEDLARLRLVCDSSVLLCLKKRFHLGRIYT
..:.. : . .... :.::: :.:
CCDS42 MGSKERFHWQSHNVKQSGVDDMVLLPQITEDAIAANLRKRFMDDYIFT
10 20 30 40
760 770 780 790 800 810
pF1KSD FGGPVLLVLNPHRSLPLFSPEVQASYHPRKALSTTPHIFAIVASAYDLAQNTGQDPCILL
. : ::. .:: ...: :. . :. . :::.:.. . : .. :...
CCDS42 YIGSVLISVNPFKQMPYFTDREIDLYQGAAQYENPPHIYALTDNMYRNMLIDCENQCVII
50 60 70 80 90 100
820 830 840 850 860
pF1KSD CSSHCSGHSGSGKTEAAKKIMQFLSSLEQDQTGNRECQVEDML----PILSSFGHAKTIL
::.::.::: ::: :: ..:.. :.. .:.:.. :.: .::.:::.
CCDS42 -----SGESGAGKTVAAKYIMGYISKVSGG--GEKVQHVKDIILQSNPLLEAFGNAKTVR
110 120 130 140 150 160
870 880 890 900 910 920
pF1KSD NANASRFGQVFCLYLQQG-VIVGASVSHYLLETSRVVFQAQAERSFHVFYELLAGLDSIE
: :.::::. : . ...: :...:..::: ::::.: . ::.::..:.:: : .. .
CCDS42 NNNSSRFGKYFEIQFSRGGEPDGGKISNFLLEKSRVVMQNENERNFHIYYQLLEGASQEQ
170 180 190 200 210 220
930 940 950 960 970 980
pF1KSD RERLSLQGPETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLCPEELNAVWAVLAAIL
:. :.:. :. ::::::... ...: .: .:: :.:.: .:. : . : ..:.::
CCDS42 RQNLGLMTPDYYYYLNQSDTYQVDGTDDRSDFGETLSAMQVIGIPPSIQQLVLQLVAGIL
230 240 250 260 270 280
990 1000 1010 1020 1030 1040
pF1KSD QLGNICFSSSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVTRRVTETPYGQVSRS-
.:::: : :. . : : : . : :: . :. .: : .. .: :.:
CCDS42 HLGNISFC----EDGNYARVESVDLLAFPAYLLGIDSGRLQEKLTSRKMDSRWGGRSESI
290 300 310 320 330
1050 1060 1070 1080 1090 1100
pF1KSD ---LPVESAVDARDALAKALYSRLFHRLLRRTNARLAPPGEGGSIGTVTVVDAYGFEALR
: ::.:. .::::::.::.::: :.. : . : : ::: :.: :::: ..
CCDS42 NVTLNVEQAAYTRDALAKGLYARLFDFLVEAINRAMQKPQEEYSIG---VLDIYGFEIFQ
340 350 360 370 380 390
1110 1120 1130 1140 1150 1160
pF1KSD VNGLEQLCNNLASERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRESCLDLLVDQ--P
::.::.: :...:.:: . .. : :.:: .: . :.:. . ::. .. :
CCDS42 KNGFEQFCINFVNEKLQQIFIELTLKAEQEEYVQEGIRWTPIQYFNNKVVCDLIENKLSP
400 410 420 430 440 450
1170 1180 1190 1200 1210
pF1KSD HSLLSILDAQTWLSQAT----DHTFLQKSHYHHGDHPSYAKPRLPLPVFTVRHYAGTVTY
...:.:: .:: :.:.::: . : : . . :...:::: :.:
CCDS42 PGIMSVLDDVCATMHATGGGADQTLLQKLQAAVGTHEHFNSWSAG---FVIHHYAGKVSY
460 470 480 490 500 510
1220 1230 1240 1250 1260 1270
pF1KSD QVHKFLNRNRDQLDPAVVEMLGQSQLQLVGSLFQEAEPQSRGGRGRPTLA-SRFQQALED
.: : .:::: : ..:.. :. .. :: : .. .:::. : :.... .:
CCDS42 DVSGFCERNRDVLFSDLIELMQTSEQAFLRMLFPEKLDGDK--KGRPSTAGSKIKKQAND
520 530 540 550 560
1280 1290 1300 1310 1320 1330
pF1KSD LIARLGRSHVYFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAVGTRSANFPVRVPFEA
:.: : : ..:.:. :: : : .. ..: .:.. .. : . .: :.: : :
CCDS42 LVATLMRCTPHYIRCIKPNETKRPRDWEENRVKHQVEYLGLKENIRVRRAGFAYRRQFAK
570 580 590 600 610 620
1340 1350 1360 1370 1380 1390
pF1KSD FLASFQALGSEGQEDLSDREKCGAV-LSQVLGAESPLYHLGATKVLLQE-QGWQRLEELR
:: . : : :. :. : .... : :..:.:::.... .. :::.:
CCDS42 FLQRYAILTPETWPRWRGDERQGVQHLLRAVNMEPDQYQMGSTKVFVKNPESLFLLEEVR
630 640 650 660 670 680
1400 1410 1420 1430 1440 1450
pF1KSD DQQRSQALVDLHRSFHTCISRQRVLPRMQARMRGFQARKRYLRRRAALGQLNTILLVAQP
... . ...... .. .. .:. . .. :. ::: ....
CCDS42 ERKFDGFARTIQKAWRRHVAVRKY-EEMREEASNILLNKKE-RRRNSINRNFVGDYLGLE
690 700 710 720 730 740
1460 1470 1480 1490 1500 1510
pF1KSD LLQRRQRLQLGRWQGWHSSERALERVPSMELGRLEIPAELAVMLKTAESHRDALAGSITE
CCDS42 ERPELRQFLGKRERVDFADSVTKYDRRFKPIKRDLILTPKCVYVIGREKVKKGPEKGQVC
750 760 770 780 790 800
>>CCDS32254.1 MYO1E gene_id:4643|Hs108|chr15 (1108 aa)
initn: 687 init1: 318 opt: 1160 Z-score: 550.2 bits: 115.1 E(32554): 2.5e-24
Smith-Waterman score: 1160; 30.6% identity (62.2% similar) in 757 aa overlap (722-1457:21-756)
700 710 720 730 740 750
pF1KSD RDLELSLRPGLEAPPFPGAKGRSLGDGLEDMEDLARLRLVCDSSVLLCLKKRFHLGRIYT
..:.. : . ..:.. ::::. :.:
CCDS32 MGSKGVYQYHWQSHNVKHSGVDDMVLLSKITENSIVENLKKRYMDDYIFT
10 20 30 40 50
760 770 780 790 800 810
pF1KSD FGGPVLLVLNPHRSLPLFSPEVQASYHPRKALSTTPHIFAIVASAYDLAQNTGQDPCILL
. : ::. .:: ...: :. . :. . :::.:.. . : .. :...
CCDS32 YIGSVLISVNPFKQMPYFGEKEIEMYQGAAQYENPPHIYALADNMYRNMIIDRENQCVII
60 70 80 90 100 110
820 830 840 850 860
pF1KSD CSSHCSGHSGSGKTEAAKKIMQFLSSLEQDQTGNRECQVEDML----PILSSFGHAKTIL
::.::.::: ::: ::...: . . :.. .:.:.. :.: .::.:::.
CCDS32 -----SGESGAGKTVAAKYIMSYISRV--SGGGTKVQHVKDIILQSNPLLEAFGNAKTVR
120 130 140 150 160
870 880 890 900 910 920
pF1KSD NANASRFGQVFCLYLQQG-VIVGASVSHYLLETSRVVFQAQAERSFHVFYELLAGLDSIE
: :.::::. : . .. : :...:..::: ::::.. .:::::.::.:. : .. .
CCDS32 NNNSSRFGKYFEIQFSPGGEPDGGKISNFLLEKSRVVMRNPGERSFHIFYQLIEGASAEQ
170 180 190 200 210 220
930 940 950 960 970 980
pF1KSD RERLSLQGPETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLCPEELNAVWAVLAAIL
.. :.. . . ::::. . . ... .: ..:. :.:.. .:. :: . : ..:.::
CCDS32 KHSLGITSMDYYYYLSLSGSYKVDDIDDRREFQETLHAMNVIGIFAEEQTLVLQIVAGIL
230 240 250 260 270 280
990 1000 1010 1020 1030 1040
pF1KSD QLGNICFSSSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVTRRVTETPYGQVSRS-
.:::: : .: . ::: : . : :: . . :. .: : .. .: :.:
CCDS32 HLGNISF----KEVGNYAAVESEEFLAFPAYLLGINQDRLKEKLTSRQMDSKWGGKSESI
290 300 310 320 330
1050 1060 1070 1080 1090 1100
pF1KSD ---LPVESAVDARDALAKALYSRLFHRLLRRTNARLAPPGEGGSIGTVTVVDAYGFEALR
: ::.: .::::::::..:.: :. : . : .:: :.: :::: ..
CCDS32 HVTLNVEQACYTRDALAKALHARVFDFLVDSINKAMEKDHEEYNIG---VLDIYGFEIFQ
340 350 360 370 380 390
1110 1120 1130 1140 1150 1160
pF1KSD VNGLEQLCNNLASERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRESCLDLLVDQ--P
::.::.: :...:.:: . .. : :.:: .: . :.:. . ::. .. :
CCDS32 KNGFEQFCINFVNEKLQQIFIELTLKAEQEEYVQEGIRWTPIEYFNNKIVCDLIENKVNP
400 410 420 430 440 450
1170 1180 1190 1200 1210
pF1KSD HSLLSILD----AQTWLSQATDHTFLQKSHYHHGDHPSYAKPRLPLPVFTVRHYAGTVTY
...:::: .. .....:.:.::: ... :.: . . : ..:::: :.:
CCDS32 PGIMSILDDVCATMHAVGEGADQTLLQKLQMQIGSHEHFNSWNQG---FIIHHYAGKVSY
460 470 480 490 500 510
1220 1230 1240 1250 1260 1270
pF1KSD QVHKFLNRNRDQLDPAVVEMLGQSQLQLVGSLFQEAEPQSRGGRGRPTLA-SRFQQALED
.. : .:::: : ..:.. .:.: .. ::: : .. .:::: : :.... .:
CCDS32 DMDGFCERNRDVLFMDLIELMQSSELPFIKSLFPENLQADK--KGRPTTAGSKIKKQAND
520 530 540 550 560 570
1280 1290 1300 1310 1320 1330
pF1KSD LIARLGRSHVYFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAVGTRSANFPVRVPFEA
:.. : . ..:.:. :: : : .. ..: .:.. .. : . .: :.. : :.
CCDS32 LVSTLMKCTPHYIRCIKPNETKKPRDWEESRVKHQVEYLGLKENIRVRRAGYAYRRIFQK
580 590 600 610 620 630
1340 1350 1360 1370 1380 1390
pF1KSD FLASFQALGSEGQEDLSDREKCGAV-LSQVLGAESPLYHLGATKVLLQE-QGWQRLEELR
:: . : . . . .:: :.. : : .. .: ..:: .::... .. :::.:
CCDS32 FLQRYAILTKATWPSWQGEEKQGVLHLLQSVNMDSDQFQLGRSKVFIKAPESLFLLEEMR
640 650 660 670 680 690
1400 1410 1420 1430 1440 1450
pF1KSD DQQRSQALVDLHRSFHTCISRQRVLPRMQARMRGFQARKRYLRRRAALGQL---NTILLV
... . ...:.. ..:.. . .:. . . :. ::: .... . : .
CCDS32 ERKYDGYARVIQKSWRKFVARKKYV-QMREEASDLLLNKKE-RRRNSINRNFIGDYIGME
700 710 720 730 740
1460 1470 1480 1490 1500 1510
pF1KSD AQPLLQRRQRLQLGRWQGWHSSERALERVPSMELGRLEIPAELAVMLKTAESHRDALAGS
.: ::.
CCDS32 EHPELQQFVGKREKIDFADTVTKYDRRFKGVKRDLLLTPKCLYLIGREKVKQGPDKGLVK
750 760 770 780 790 800
>>CCDS53826.1 MYO1H gene_id:283446|Hs108|chr12 (1022 aa)
initn: 665 init1: 160 opt: 1076 Z-score: 512.1 bits: 107.9 E(32554): 3.3e-22
Smith-Waterman score: 1090; 31.0% identity (60.1% similar) in 735 aa overlap (733-1441:25-744)
710 720 730 740 750 760
pF1KSD EAPPFPGAKGRSLGDGLEDMEDLARLRLVCDSSVLLCLKKRFHLGRIYTFGGPVLLVLNP
.:. . :.::: . :::. : .:. .::
CCDS53 MEGALTARDKVGVQDFVLLDAYTSESAFVDNLRKRFSENLIYTYIGTLLVSVNP
10 20 30 40 50
770 780 790 800 810 820
pF1KSD HRSLPLFSPEVQASYHPRKALSTTPHIFAIVASAYDLAQNTGQDPCILLCSSHCSGHSGS
.. : ... . :. . . ::..::. .:: . .. ::. ::.::.
CCDS53 YQELGIYTVSQMELYQGVNFFELPPHVYAIADNAYRMMCAELNNHFILI-----SGESGA
60 70 80 90 100
830 840 850 860 870
pF1KSD GKTEAAKKIMQFLSSLEQDQTGNRECQVEDML---PILSSFGHAKTILNANASRFGQVFC
:::::.:::..... . .: . . . .: :.: .::.:.:. : :.::::. .
CCDS53 GKTEASKKILEYFA-VTCPMTQSLQIARDRLLFSNPVLEAFGNARTLRNDNSSRFGKYMD
110 120 130 140 150 160
880 890 900 910 920 930
pF1KSD LYLQ-QGVIVGASVSHYLLETSRVVFQAQAERSFHVFYELLAGLDSIERERLSLQG----
. .. ::. ::. . ::.: ::::.: ..::.::.::.:::: :.:::: :
CCDS53 IQFDFQGIPVGGHIISYLIEKSRVVYQNEGERNFHIFYQLLAGG---EEERLSYLGLERD
170 180 190 200 210 220
940 950 960 970 980 990
pF1KSD PETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLCPEELNAVWAVLAAILQLGNICFS
:. : ::.::. . .. : .:.. . .:.. . . .:. .....:..:.:::: :
CCDS53 PQLYKYLSQGHCAKESSISDKNDWKTVSNAFSVIDFTEADLENLFGIIASVLHLGNIGF-
230 240 250 260 270 280
1000 1010 1020 1030 1040 1050
pF1KSD SSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVTRRVTETPYGQVSRSLPVESAVDA
:...: :.. . ::. :.:: : : : :.:.: :. .: : .: .: :
CCDS53 --EEDDQGCATIPDTHEIKWIAKLLGVHPSVLLEALTHRKIEAKTEEVICPLTLELSVYA
290 300 310 320 330 340
1060 1070 1080 1090 1100 1110
pF1KSD RDALAKALYSRLFHRLLRRTNARLAPPGEGGSIGTVTVVDAYGFEALRVNGLEQLCNNLA
:::.:::.:.: : :. . :. :. . .. ..: ::::.. ::.::.: :
CCDS53 RDAMAKAVYGRTFTWLVNKINSSLVNK-DFTRKTVIGLLDIYGFEVFDKNGFEQFCINYC
350 360 370 380 390 400
1120 1130 1140 1150 1160 1170
pF1KSD SERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRESCLDLLVDQPHSLLSILDAQTWL-
.:.:: . . : :. : . : . : :. . ::. .. ....:::: .
CCDS53 NEKLQQLLIERTLKAEQAEYEMEGIEWEPIKYFNNKIICDLVEERHKGIISILDEECIRP
410 420 430 440 450 460
1180 1190 1200 1210 1220
pF1KSD SQATDHTFLQKSHYHHGDHPSYAKPRLPLPV---------FTVRHYAGTVTYQVHKFLNR
. ::: .::.: . . : : . .: : : . :::: ::: .. ::..
CCDS53 GPATDLSFLEKLEEKVGKHAHFETRKLAGPKGRKRIGWMEFRLLHYAGEVTYCTKGFLEK
470 480 490 500 510 520
1230 1240 1250 1260 1270 1280
pF1KSD NRDQLDPAVVEMLGQSQLQLVGSLFQEAEPQSRGGRGRPTLASRFQQALEDLIARLGRSH
: : : . :.: .:. .. : :: ..: : ::....:...: .:. : ..
CCDS53 NNDLLYRHLKEVLCKSKNIILRECFLLAELENR--RRPPTVGTQFKNSLSSLLETLISKE
530 540 550 560 570
1290 1300 1310 1320 1330 1340
pF1KSD VYFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAVGTRSANFPVRVPFEAFLASFQALG
.:.:. :: : :. :: . .:.. ...: . .: :.: : .: :: ...:
CCDS53 PSYIRCIKPNDRKEPSKFDDFLIRHQIKYLGLMEHLRVRRAGFAYRRKYEHFLQRYKSLC
580 590 600 610 620 630
1350 1360 1370 1380 1390 1400
pF1KSD SEGQEDLSDREKCGAV-LSQVLGAESPLYHLGATKVLLQ-EQGWQRLEELRDQQRSQALV
. :. : . .: . :.:: ::.... . :. . .. : ..
CCDS53 PDTWPHWHGPPAEGVERLIKYIGYKPEEYKLGKTKIFIRFPRTLFATEDAFEFSKHQLVA
640 650 660 670 680 690
1410 1420 1430 1440 1450
pF1KSD DLHRSFHTCISRQRVLPRMQARM------RGFQARKRYLRRRAALGQLNTILLVAQPLLQ
.. ... :..:.. . . :: . :: ::: ::. :.
CCDS53 RIQATYKRCLGRREYVKKRQAAIKLEAHWRGALARKAIQRRKWAVRIIRKFIKGFISRNK
700 710 720 730 740 750
1460 1470 1480 1490 1500 1510
pF1KSD RRQRLQLGRWQGWHSSERALERVPSMELGRLEIPAELAVMLKTAESHRDALAGSITECLP
CCDS53 PLCPDNEEFIVFVRKNYILNLRYHLPKTVLDKSWLRPPGILENASDLLRKMCVRNLVQKY
760 770 780 790 800 810
>>CCDS46405.1 MYO7B gene_id:4648|Hs108|chr2 (2116 aa)
initn: 1399 init1: 423 opt: 1052 Z-score: 496.5 bits: 106.1 E(32554): 2.5e-21
Smith-Waterman score: 1420; 24.5% identity (49.4% similar) in 2405 aa overlap (717-3026:62-2045)
690 700 710 720 730 740
pF1KSD EAVLERDLELSLRPGLEAPPFPGAKGRSLGDGLEDMEDLARLRLVCDSSVLLCLKKRFHL
.... ..:. :: . ..... : :..
CCDS46 KPGKVLVEDDEGKEHWIRAEDFGVLSPMHPNSVQGVDDMIRLGDLNEAGMVHNLLIRYQQ
40 50 60 70 80 90
750 760 770 780 790 800
pF1KSD GRIYTFGGPVLLVLNPHRSLPLFSPEVQASYHPRKALSTTPHIFAIVASAYDLAQNTGQD
.:::. : .:...:: . :::.. : :. :. ::.:::. . : . . .:
CCDS46 HKIYTYTGSILVAVNPFQVLPLYTLEQVQLYYSRHMGELPPHVFAIANNCYFSMKRNKRD
100 110 120 130 140 150
810 820 830 840 850 860
pF1KSD PCILLCSSHCSGHSGSGKTEAAKKIMQFLSSLEQDQTGNRECQVEDMLPILSSFGHAKTI
: .. ::.::.::::..: :.:::... . : . : :: . ::: .::.::::
CCDS46 QCCII-----SGESGAGKTETTKLILQFLATI-SGQHSWIEQQVLEANPILEAFGNAKTI
160 170 180 190 200
870 880 890 900 910 920
pF1KSD LNANASRFGQVFCLYLQ-QGVIVGASVSHYLLETSRVVFQAQAERSFHVFYELLAGLDSI
: :.::::. . .:.. .::: :: . ..::: ::: :: ::..:.:: .: :...
CCDS46 RNDNSSRFGKYIDIYFNPSGVIEGARIEQFLLEKSRVCRQAPEERNYHIFYCMLMGVSAE
210 220 230 240 250 260
930 940 950 960 970 980
pF1KSD ERERLSLQGPETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLCPEELNAVWAVLAAI
... ::: : :.::..:. .: .::.:. . .:.. : . : : .::::
CCDS46 DKQLLSLGTPSEYHYLTMGNCTSCEGLNDAKDYAHIRSAMKILQFSDSESWDVIKLLAAI
270 280 290 300 310 320
990 1000 1010 1020 1030 1040
pF1KSD LQLGNICFSSSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVTRRVTETPYGQ-VSR
:.:::. : .: :. ... : . :. .::.: . :. . .. : :. :.:
CCDS46 LHLGNVGFMASVFENLDASDVMETPAFPTVMKLLEVQHQELRDCLIKH-TILIRGEFVTR
330 340 350 360 370 380
1050 1060 1070 1080 1090 1100
pF1KSD SLPVESAVDARDALAKALYSRLFHRLLRRTNARL-APPGEGGSI--GTVTVVDAYGFEAL
:: . .:.: :::..:..:..:: .... :: . .::.. . .. ..: .::: .
CCDS46 SLNIAQAADRRDAFVKGIYGHLFLWIVKKINAAIFTPPAQDPKNVRRAIGLLDIFGFENF
390 400 410 420 430 440
1110 1120 1130 1140 1150 1160
pF1KSD RVNGLEQLCNNLASERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRESCLDLLVDQPH
. :..:::: :.:.:.:: : : ....:.:: : : .:: . . ::::. .:
CCDS46 ENNSFEQLCINFANEHLQQFFVQHVFTMEQEEYRSENISWDYIHYTDNRPTLDLLALKPM
450 460 470 480 490 500
1170 1180 1190 1200 1210 1220
pF1KSD SLLSILDAQTWLSQATDHTFLQKSHYHHGDHPSYAKPR-LPLPVFTVRHYAGTVTYQVHK
:..:.:: .. . :.:: :.::: . :... .. .:. . : . :.:: : ::..
CCDS46 SIISLLDEESRFPQGTDLTMLQKLNSVHANNKAFLQPKNIHDARFGIAHFAGEVYYQAEG
510 520 530 540 550 560
1230 1240 1250 1260
pF1KSD FLNRNRDQLDPAVVEMLGQSQLQLVGSLFQEAEPQSRGGRG-------------------
::..::: :. .. .. .:. ... .:. ... :.:
CCDS46 FLEKNRDVLSTDILTLVYSSKNKFLREIFNLELAETKLGHGTIRQAKAGNHLFKSADSNK
570 580 590 600 610 620
1270 1280 1290 1300 1310 1320
pF1KSD RP-TLASRFQQALEDLIARLGRSHVYFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAV
:: ::.:.:.:.:..:. : . :::.:. :: : : ::: .::. ....:.:
CCDS46 RPSTLGSQFKQSLDQLMKILTNCQPYFIRCIKPNEYKKPLLFDRELCLRQLRYSGMMETV
630 640 650 660 670 680
1330 1340 1350 1360 1370 1380
pF1KSD GTRSANFPVRVPFEAFLASFQALGSEGQEDLSDREKCGAVLSQVLGAESPLYHLGATKVL
:...::.: :: : : .: : . :. :. : . :: : :
CCDS46 HIRKSGFPIRYTFEEFSQRFGVL-------LPN-----AMRMQLQGKLRQMT-LGITDV-
690 700 710 720 730
1390 1400 1410 1420 1430
pF1KSD LQEQGWQRLEELRDQQRSQALVDLHRSFHTCISRQRVLPR----MQARMRGFQARKRYLR
: : .. ... .. :.. ..:..:: : .: .::.. ::..::
CCDS46 -----WLRTDKDWKAGKTKIFLRDHQDTLLEVQRSQVLDRAALSIQKVLRGYRYRKEFLR
740 750 760 770 780
1440 1450 1460 1470 1480 1490
pF1KSD RRAALGQLNTILLVAQPLLQRRQRLQLGRWQGWHSSERALERVPSMELGRLEIPAELAVM
::: . : : . ..: .. . . . ::. :. .
CCDS46 -------------------QRRAAVTLQAWWRGYCNRRNFKLI-LVGFERLQAIARSQPL
790 800 810 820
1500 1510 1520 1530 1540 1550
pF1KSD LKTAESHRDALAGSITECLPPEVPARPSLTLPADIDLFPFSSFVAI--GFQEPSLPRPGQ
. .. :. . . : : . . : . . . .: .::. . .
CCDS46 ARQYQAMRQRTVQLQALCRGYLVRQQVQAKRRAVVVIQAHARGMAARRNFQQR---KANA
830 840 850 860 870 880
1560 1570 1580 1590 1600 1610
pF1KSD PLAKPLTQLDGDNPQRALDINKVMLRLLGDGSLESWQRQIMGAYLVRQGQCWPGLRNELF
::. : .:.. : :: .: : . : .. . . . ..: . : . :
CCDS46 PLVIPA---EGQKSQGALPAKKR--RSIYDTVTDTEMVEKVFGFLPAMIGGQEGQASPHF
890 900 910 920 930
1620 1630 1640 1650 1660 1670
pF1KSD SQLVAQLWQNPDEQQSQRGWALMAVLLSAFPPLPVLQKPLLKFVSDQAPRGMAALCQHKL
.: :...:. :. : :.. .:. ..: .. :.: :.
CCDS46 EDL---------ESKTQK---LLEVDLDT---VPMAEEP------EEDVDGLAEYTFPKF
940 950 960 970
1680 1690 1700 1710 1720 1730
pF1KSD LGALEQSQLASGATRAHPPTQLEWLAGWRRGRMALDVFTFSEECYSAEVESWTTGEQLAG
:. : ... :. . : :. : . .: .: : :..
CCDS46 --AVTYFQKSASHTHIRRPL-----------RYPLLYHEDDTDCLAALV-IWNV------
980 990 1000 1010
1740 1750 1760 1770 1780 1790
pF1KSD WILQSRGLEAPPRGWSVSLHSRDAWQDLAGCDFVLDLISQTEDLGDPARPRSYPITPLGS
::. : : :..:.. : . . : ... . : . :: .. .
CCDS46 -ILRFMGDLPEP-----VLYARSSQQGSSVMRQIHDTLGREHGAQVPQHSRSAQVASQLN
1020 1030 1040 1050 1060 1070
1800 1810 1820 1830 1840 1850
pF1KSD AEAIPLAP-GIQAPSLPPGPPPGPAPTLPSRDH--TG-EVQRSGSLDGFLDQIFQPVISS
: : :. : : .: . : .: . : . : . :: . . .
CCDS46 IGEEALEPDGLGADR--------PMSNLE-KVHFIVGYAILRPSLRDEIYCQICKQLSEN
1080 1090 1100 1110 1120
1860 1870 1880 1890 1900
pF1KSD -GLSDLEQSWALSSRMKGGGAIGPTQQGYPMVYPGMIQMPAYQPGMVPAPMPMMPAMGTV
:.: ..: : : : . :... . .. . : :: . . : : :
CCDS46 FKTSSLARGWILLSLCL--GCFPPSERFMKYLLNFIGQGPATYGPFCAERLRRTYANG-V
1130 1140 1150 1160 1170
1910 1920 1930 1940 1950 1960
pF1KSD PAMPAMVVPPQPPLPSLDAGQLAVQQQNFIQQQALILAQQMTAQAMSLSLEQQMQQRQQQ
: : :. : ::.... : : .::: :...... ..
CCDS46 RAEP----------PTWLELQ-AVKSKKHIPIQ-VILA---TGESLTVPVD---------
1180 1190 1200 1210
1970 1980 1990 2000 2010 2020
pF1KSD ARASEAASQASPSAVTSKPRKPPTPPEKPQRDLGSEGGCLRETSEEAEDRPYQPKSFQQK
:: :: :.. :.. . .:
CCDS46 ------------SASTS-------------REM-----CMH---------------IAHK
1220
2030 2040 2050 2060 2070 2080
pF1KSD RNYFQRMG-QPQITVRTMKPPAKVHIPQGEAQEEEEEEEEEEEQEEQEVETRAVPSPPPP
.. ...: . :..: : .... . . :: ::
CCDS46 QGLSDHLGFSLQVAVYDK------FWSLGSGRDHMMDAIARCEQMAQE------------
1230 1240 1250 1260 1270
2090 2100 2110 2120 2130 2140
pF1KSD PIVKKPLKQGGAKAPKEAEAEPAKETAAKGHGQGPAQGRGTVVRSSDSKPKRPQPSREIG
:: :.: : : .:.
CCDS46 --------------------------------------RGESQRQS---PWRIYFRKEF-
1280
2150 2160 2170 2180 2190 2200
pF1KSD NIIRMYQSRPGPVPVPVQPSRPPKAFLRKIDPKDEALAKLGINGAHSSPPMLSPSPGKGP
. ..:: :: . . . :.. . :. :
CCDS46 -FTPWHDSREDPVSTEL--------IYRQV-----------LRGVWS-------------
1290 1300 1310
2210 2220 2230 2240 2250 2260
pF1KSD PPAVAPRPKAPLQLGPSSSIKEKQGPLLDLFGQKLPIAHTPPPPPAPPLPLPEDPGTLSA
: : ::.. :..:..
CCDS46 --------------GEYSFEKEEE--LVELLA----------------------------
1320 1330
2270 2280 2290 2300 2310 2320
pF1KSD ERRCLTQ-PVEDQGVSTQLLAPSGSVCFSYTGTPWKLFLRKEVFYPRENFSHPYYLRLLC
:.: .: . .. ..: : :: :. : ::. : : . ..
CCDS46 -RHCYVQLGASAESKAVQELLPS---CI-----PHKLYRTK----PPDRWA---------
1340 1350 1360 1370
2330 2340 2350 2360 2370 2380
pF1KSD EQILRDTFSESCIRISQNERRKMKDLLGGLEVDLDSLTTTEDSVKKRIVVAARDNWANYF
. . .: . .... .: .:....: ::: .: :
CCDS46 -----SLVTAACAKAPYTQKQ-----------------VTPLAVREQVVDAARLQWPLLF
1380 1390 1400
2390 2400 2410 2420 2430 2440
pF1KSD SRFFPV---SGESGSDVQL-LAVSHRGLRLLKVTQGPGLRPDQLKILCSYSFAEVLGV--
::.: : :: .:: :::. .:: .: .: :.: :: ::.:.
CCDS46 SRLFEVITLSGPRLPKTQLILAVNWKGLCFLD---------QQEKMLLELSFPEVMGLAT
1410 1420 1430 1440 1450
2450 2460 2470 2480 2490
pF1KSD --ECRGGSTLELSLKSEQLVLHTARARAIEALVELFLNELKKDSGYVIALRSY-ITDNCS
: .::. : :: :. . . . :: :: :::. ::. : ...::.. ::. .
CCDS46 NREAQGGQRLLLSTMHEEYEFVSPSSVAIAELVALFLEGLKERSIFAMALQDRKATDDTT
1460 1470 1480 1490 1500 1510
2500 2510 2520 2530 2540
pF1KSD LLSFHRGDLIKLLPVATL--EPGWQFGSAG--GRSGLFPA-------DIVQPAAA--PDF
::.:..:::. : : .: .:. :..:: : ...:.: .
CCDS46 LLAFKKGDLLVLTKKQGLLASENWTLGQNDRTGKTGLVPMACLYTIPTVTKPSAQLLSLL
1520 1530 1540 1550 1560 1570
2550 2560 2570 2580 2590 2600
pF1KSD SFSKEQRS-GWHKGQLSNGEPGLARWDRASERPAHPWSQAHSDDSEATSLSSVAYAFLPD
..: :.:. . ..::.. :: :: .: :
CCDS46 AMSPEKRKLAAQEGQFT--EP----------RPEEP----------------------PK
1580 1590 1600
2610 2620 2630 2640 2650 2660
pF1KSD SHSYTMQEFARRYFRRSQALLGQTDGGAAGKDTDSLVQYTKAPIQESLLS---LSDDVSK
. .:..::. ..:: . . . .. : :. :... ::. . :.
CCDS46 EKLHTLEEFSYEFFRAPEKDMVSMAVLPLARARGHLWAYSCEPLRQPLLKRVHANVDLWD
1610 1620 1630 1640 1650 1660
2670 2680 2690 2700 2710 2720
pF1KSD LAVASFLALMRFMGDQSKPRGKDEMDLLYELLKLC-QQEKLRDEIYCQVIKQVTGHPRPE
.: :.:..:.::: . .. ..: ... : :. :.::.:::..::.: : .
CCDS46 IACQIFVAILRYMGDYPSRQAWPTLELTDQIFTLALQHPALQDEVYCQILKQLT-HNSNR
1670 1680 1690 1700 1710 1720
2730 2740 2750 2760 2770
pF1KSD HCT-RGWSFLSLLTGFFPPSTRLMPYLTKFLQDSGPSQELARSSQEHLQRTVKYGGRRRM
: :::..: : ::.:::: :.:. ::. :. .. :: . ....:.... : :..
CCDS46 HSEERGWQLLWLCTGLFPPSKGLLPHAQKFI-DTRRGKLLAPDCSRRIQKVLRTGPRKQ-
1730 1740 1750 1760 1770 1780
2780 2790 2800 2810 2820
pF1KSD PPPGEMKAFLKGQAIRLLL--IHLPGGVDYRTNIQTFT--------VAAEVQE---ELCR
:: .... : . . :..:. .. .. . : .:...: : :
CCDS46 -PPHQVEVEAAEQNVSRICHKIYFPNDTSEMLEVVANTRVRDVCDSIATRLQLASWEGCS
1790 1800 1810 1820 1830 1840
2830 2840 2850 2860 2870 2880
pF1KSD Q-MGITEP---QEVQEFALFLIKEKSQLVRPLQPAEYLNSVVVDQDVSLHSRRLHWE--T
. :.. :. .: . ..: :. :. .: . :.. .: . :.: : .
CCDS46 LFIKISDKVISQKEGDFFFDSLREVSDWVKKNKPQKEGAPVTLPYQVYFM-RKL-WLNIS
1850 1860 1870 1880 1890
2890 2900 2910 2920 2930 2940
pF1KSD PLHFDNSTYISTHYSQVLWDYLQGKLPVSAKADAQLARLAALQHLSKANRNTPSGQDLLA
: . :. : :: : : ::.: . .. :: .::.: . ::. :. .: ::
CCDS46 PGKDVNADTI-LHYHQELPKYLRG-FHKCSREDA--IHLAGL--IYKAQFNNDRSQ--LA
1900 1910 1920 1930 1940 1950
2950 2960 2970 2980 2990
pF1KSD YVPKQLQRQVNTASIKNLMGQE------LRRLEGHSPQ---EAQISFIEAMSQLPLFGYT
::: : :.. .. ::..: : . :. . ::...:.. . . : :: .
CCDS46 SVPKIL-RELVPENLTRLMSSEEWKKSILLAYDKHKDKTVEEAKVAFLKWICRWPTFGSA
1960 1970 1980 1990 2000 2010
3000 3010 3020 3030 3040 3050
pF1KSD VYGVLRVSMQALSGPTLLGLNRQHLILMDPSSQSLYCRIALKSLQRLHLLSPLEEKGPPG
. : ..: . :...::. ..:. :....:
CCDS46 FFEVKQTSEPSYPDVILIAINRHGVLLIHPKTKDLLTTYPFTKISSWSSGSTYFHMALGS
2020 2030 2040 2050 2060 2070
3060 3070 3080 3090
pF1KSD LEVNYGSADNPQTIWFELPQAQELLYTTVFLIDSSASCTEWPSIN
CCDS46 LGRGSRLLCETSLGYKMDDLLTSYVQQLLSAMNKQRGSKAPALAST
2080 2090 2100 2110
>>CCDS54834.1 MYO10 gene_id:4651|Hs108|chr5 (2058 aa)
initn: 1029 init1: 283 opt: 1038 Z-score: 490.3 bits: 104.9 E(32554): 5.5e-21
Smith-Waterman score: 1326; 34.2% identity (64.5% similar) in 746 aa overlap (720-1441:63-793)
690 700 710 720 730 740
pF1KSD LERDLELSLRPGLEAPPFPGAKGRSLGDGLEDMEDLARLRLVCDSSVLLCLKKRFHLGRI
: ..:.: : . .:.. : .:.. ..:
CCDS54 VFRTDYGQVFTYKQSTITHQKVTAMHPTNEEGVDDMASLTELHGGSIMYNLFQRYKRNQI
40 50 60 70 80 90
750 760 770 780 790 800
pF1KSD YTFGGPVLLVLNPHRSLP-LFSPEVQASYHPRKALSTTPHIFAIVASAYDLAQNTGQDPC
::. : .: .::.. . :. : .. .: :. ::::::. : . .. :
CCDS54 YTYIGSILASVNPYQPIAGLYEPATMEQYSRRHLGELPPHIFAIANECYRCLWKRHDNQC
100 110 120 130 140 150
810 820 830 840 850 860
pF1KSD ILLCSSHCSGHSGSGKTEAAKKIMQFLS-----SLE---QDQTGNRECQVEDMLPILSSF
::. ::.::.::::..: :..::: ::: ...:. : . . ::. .:
CCDS54 ILI-----SGESGAGKTESTKLILKFLSVISQQSLELSLKEKTSCVERAILESSPIMEAF
160 170 180 190 200
870 880 890 900 910
pF1KSD GHAKTILNANASRFGQVFCLYL-QQGVIVGASVSHYLLETSRVVFQAQAERSFHVFYELL
:.:::. : :.::::. : . :.: : :. . :::: .::: : .::..:.:: ::
CCDS54 GNAKTVYNNNSSRFGKFVQLNICQKGNIQGGRIVDYLLEKNRVVRQNPGERNYHIFYALL
210 220 230 240 250 260
920 930 940 950 960 970
pF1KSD AGLDSIERERLSLQGPETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLCPEELNAVW
:::. :::.. :. ::.:.::::. . . : ..:. .. :.. . . ::. :
CCDS54 AGLEHEEREEFYLSTPENYHYLNQSGCVEDKTISDQESFREVITAMDVMQFSKEEVREVS
270 280 290 300 310 320
980 990 1000 1010 1020 1030
pF1KSD AVLAAILQLGNICFSSSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVTRRVTETPY
.::.::.:::: : .. : :: . . .:.:: . : : :.:.:
CCDS54 RLLAGILHLGNIEFITAGG-----AQVSFKTALGRSAELLGLDPTQLTDALTQRSMFLRG
330 340 350 360 370 380
1040 1050 1060 1070 1080 1090
pF1KSD GQVSRSLPVESAVDARDALAKALYSRLFHRLLRRTNARLAPPGEGGSIGTVTVVDAYGFE
.. : :..:::.::.:: :::. :. .... :.:. . ::: ..: .:::
CCDS54 EEILTPLNVQQAVDSRDSLAMALYACCFEWVIKKINSRIKGNEDFKSIG---ILDIFGFE
390 400 410 420 430
1100 1110 1120 1130 1140 1150
pF1KSD ALRVNGLEQLCNNLASERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRESCLDLLVDQ
..:: .::. : :.:.:: . .. ... :. : :: : : . :::: ...
CCDS54 NFEVNHFEQFNINYANEKLQEYFNKHIFSLEQLEYSREGLVWEDIDWIDNGECLDL-IEK
440 450 460 470 480 490
1160 1170 1180 1190 1200 1210
pF1KSD PHSLLSILDAQTWLSQATDHTFLQKSHYHHGDHPSYAKPRLPLPVFTVRHYAGTVTYQVH
.::.... .. . :::: :.:.: : .:... :.:::. . : :.:::: : :.:.
CCDS54 KLGLLALINEESHFPQATDSTLLEKLHSQHANNHFYVKPRVAVNNFGVKHYAGEVQYDVR
500 510 520 530 540 550
1220 1230 1240 1250 1260 1270
pF1KSD KFLNRNRDQLDPAVVEMLGQSQLQLVGSLFQEAEPQSR------GGRGR-PTLASRFQQA
.:..::: . ....: .:..... .::... .. :.. : ::..:.:...
CCDS54 GILEKNRDTFRDDLLNLLRESRFDFIYDLFEHVSSRNNQDTLKCGSKHRRPTVSSQFKDS
560 570 580 590 600 610
1280 1290 1300 1310 1320 1330
pF1KSD LEDLIARLGRSHVYFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAVGTRSANFPVRVP
:..:.: :. :. .:..:. :: :.: :: . : .::. ...::.: :.:.. :: :
CCDS54 LHSLMATLSSSNPFFVRCIKPNMQKMPDQFDQAVVLNQLRYSGMLETVRIRKAGYAVRRP
620 630 640 650 660 670
1340 1350 1360 1370 1380 1390
pF1KSD FEAFLASFQALGSEGQEDLSDREKCGAVLSQVLGAESPLYHLGATKVLLQEQGWQRLEEL
:. : ...: . . : :: ..: :. : . ..:: :::.:.:. :.::.
CCDS54 FQDFYKRYKVLMRNLALPEDVRGKCTSLL-QLYDASNSEWQLGKTKVFLRESLEQKLEKR
680 690 700 710 720 730
1400 1410 1420 1430 1440
pF1KSD RDQQRSQALVDLHRSFHTCISRQ---RVLPR---MQARMRGFQARKRYLR-RRAALGQLN
:... :.: . .. ..:. .:: .: .:.: :.:.:. ..::.
CCDS54 REEEVSHAAMVIRAHVLGFLARKQYRKVLYCVVIIQKNYRAFLLRRRFLHLKKAAIVFQK
740 750 760 770 780 790
1450 1460 1470 1480 1490 1500
pF1KSD TILLVAQPLLQRRQRLQLGRWQGWHSSERALERVPSMELGRLEIPAELAVMLKTAESHRD
CCDS54 QLRGQIARRVYRQLLAEKREQEEKKKQEEEEKKKREEEERERERERREAELRAQQEEETR
800 810 820 830 840 850
>>CCDS11003.1 MYO1C gene_id:4641|Hs108|chr17 (1028 aa)
initn: 954 init1: 159 opt: 1025 Z-score: 488.6 bits: 103.6 E(32554): 6.8e-21
Smith-Waterman score: 1153; 32.5% identity (62.6% similar) in 744 aa overlap (722-1441:13-727)
700 710 720 730 740 750
pF1KSD RDLELSLRPGLEAPPFPGAKGRSLGDGLEDMEDLARLR-LVCDSSVLLCLKKRFHLGRIY
..:.. :. .. ... . :..::. . ::
CCDS11 MESALTARDRVGVQDFVLLENFTSEAAFIENLRRRFRENLIY
10 20 30 40
760 770 780 790 800 810
pF1KSD TFGGPVLLVLNPHRSLPLFSPEVQASYHPRKALSTTPHIFAIVASAYDLAQNTGQDPCIL
:. ::::. .::.:.: ..: . . :. . . ::.::.. ..: .. .: ..
CCDS11 TYIGPVLVSVNPYRDLQIYSRQHMERYRGVSFYEVPPHLFAVADTVYRALRTERRDQAVM
50 60 70 80 90 100
820 830 840 850 860
pF1KSD LCSSHCSGHSGSGKTEAAKKIMQFLSSLEQDQTGNRECQVEDML----PILSSFGHAKTI
. ::.::.:::::.:...:: . : . .: :.: : :.: .::.:::.
CCDS11 I-----SGESGAGKTEATKRLLQFYA--ETCPAPERGGAVRDRLLQSNPVLEAFGNAKTL
110 120 130 140 150
870 880 890 900 910 920
pF1KSD LNANASRFGQVFCLYLQ-QGVIVGASVSHYLLETSRVVFQAQAERSFHVFYELLAGLDSI
: :.::::. . . .. .:. ::. . :::: :::: : ..::.::.::.:: : .
CCDS11 RNDNSSRFGKYMDVQFDFKGAPVGGHILSYLLEKSRVVHQNHGERNFHIFYQLLEGGEEE
160 170 180 190 200 210
930 940 950 960 970 980
pF1KSD ERERLSLQ-GPETYYYLNQGQACRLQGKEDAQDFEGLLKALQGLGLCPEELNAVWAVLAA
.::.:. .:..: :: .:: .... .: .:.. . ::: . . .:.. . ...:.
CCDS11 TLRRLGLERNPQSYLYLVKGQCAKVSSINDKSDWKVVRKALTVIDFTEDEVEDLLSIVAS
220 230 240 250 260 270
990 1000 1010 1020 1030 1040
pF1KSD ILQLGNICFSSSERESQEVAAVSSWAEIHTAARLLRVPPECLEGAVTRRVTETPYGQVSR
.:.:::: :...: ::. : :.. ... .::: : :. :.:.: . ..
CCDS11 VLHLGNIHFAANE-ESN--AQVTTENQLKYLTRLLSVEGSTLREALTHRKIIAKGEELLS
280 290 300 310 320 330
1050 1060 1070 1080 1090 1100
pF1KSD SLPVESAVDARDALAKALYSRLFHRLLRRTNARLAPPG-EGGSIGTVTVV---DAYGFEA
: .:.:. ::::::::.::: : :. . : :: :. : ..::. : ::::.
CCDS11 PLNLEQAAYARDALAKAVYSRTFTWLVGKINRSLASKDVESPSWRSTTVLGLLDIYGFEV
340 350 360 370 380 390
1110 1120 1130 1140 1150 1160
pF1KSD LRVNGLEQLCNNLASERLQLFSSQMLLAQEEEECRRELLSWVPVPQPPRESCLDLLVDQP
.. :..::.: : .:.:: . .. : .:.:: . : ..: :: . ::. ..
CCDS11 FQHNSFEQFCINYCNEKLQQLFIELTLKSEQEEYEAEGIAWEPVQYFNNKIICDLVEEKF
400 410 420 430 440 450
1170 1180 1190 1200 1210
pF1KSD HSLLSILDAQTWL-SQATDHTFLQKSHYHHGDHPSY---------AKPRLPLPVFTVRHY
....:::: . ..::: :::.: . :: . .. : : . ::
CCDS11 KGIISILDEECLRPGEATDLTFLEKLEDTVKHHPHFLTHKLADQRTRKSLGRGEFRLLHY
460 470 480 490 500 510
1220 1230 1240 1250 1260
pF1KSD AGTVTYQVHKFLNRNRDQLDPAVVEMLGQSQLQLVGSLFQEAEPQSRGGRGRP-TLASRF
:: :::.: ::..: : : . : . .:. .... :...: ... :: :.:..:
CCDS11 AGEVTYSVTGFLDKNNDLLFRNLKETMCSSKNPIMSQCFDRSELSDKK---RPETVATQF
520 530 540 550 560
1270 1280 1290 1300 1310 1320
pF1KSD QQALEDLIARLGRSHVYFIQCLTPNPGKLPGLFDVGHVTEQLHQAAILEAVGTRSANFPV
...: .:. : .. ...:. :: .: :: :: . .:.. ..:: . .: :.:
CCDS11 KMSLLQLVEILQSKEPAYVRCIKPNDAKQPGRFDEVLIRHQVKYLGLLENLRVRRAGFAY
570 580 590 600 610 620
1330 1340 1350 1360 1370 1380
pF1KSD RVPFEAFLASFQALGSEGQEDLSDREKCG-AVLSQVLGAESPLYHLGATKVLLQEQGWQR
: .:::: ...: : . : . : ::: . :: . :..: ::.... .
CCDS11 RRKYEAFLQRYKSLCPETWPTWAGRPQDGVAVLVRHLGYKPEEYKMGRTKIFIRFP--KT
630 640 650 660 670 680
1390 1400 1410 1420 1430 1440
pF1KSD LEELRDQQRSQALVDLHRSFHTCISRQRVLPRMQARMRGFQARKRYLR-RRAALGQLNTI
: .: . . :: . ..:: :::. :...:: .:.:.
CCDS11 LFATEDALE--------------VRRQSLATKIQAAWRGFHWRQKFLRVKRSAICIQSWW
690 700 710 720 730
1450 1460 1470 1480 1490 1500
pF1KSD LLVAQPLLQRRQRLQLGRWQGWHSSERALERVPSMELGRLEIPAELAVMLKTAESHRDAL
CCDS11 RGTLGRRKAAKRKWAAQTIRRLIRGFVLRHAPRCPENAFFLDHVRTSFLLNLRRQLPQNV
740 750 760 770 780 790
3096 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 07:18:14 2016 done: Thu Nov 3 07:18:16 2016
Total Scan time: 9.000 Total Display time: 1.610
Function used was FASTA [36.3.4 Apr, 2011]