FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0337, 509 aa
1>>>pF1KE0337 509 - 509 aa - 509 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6551+/-0.000766; mu= 17.8820+/- 0.046
mean_var=93.4402+/-18.621, 0's: 0 Z-trim(111.0): 28 B-trim: 0 in 0/51
Lambda= 0.132681
statistics sampled from 11999 (12024) to 11999 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.733), E-opt: 0.2 (0.369), width: 16
Scan time: 3.540
The best scores are: opt bits E(32554)
CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 3545 688.7 4.2e-198
CCDS46736.1 ARSA gene_id:410|Hs108|chr22 ( 423) 2972 578.9 3.8e-165
CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 958 193.5 5e-49
CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 709 145.8 1.1e-34
CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 517 109.0 1.1e-23
CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 517 109.1 1.3e-23
CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 422 90.9 4.2e-18
CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 422 90.9 4.3e-18
CCDS14127.1 STS gene_id:412|Hs108|chrX ( 583) 421 90.7 4.7e-18
CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 401 86.9 6.6e-17
CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 390 84.8 2.9e-16
CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 384 83.6 6.5e-16
CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 368 80.6 5.3e-15
CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 ( 599) 361 79.2 1.4e-14
CCDS75949.1 ARSE gene_id:415|Hs108|chrX ( 544) 304 68.3 2.5e-11
>>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa)
initn: 3545 init1: 3545 opt: 3545 Z-score: 3670.1 bits: 688.7 E(32554): 4.2e-198
Smith-Waterman score: 3545; 100.0% identity (100.0% similar) in 509 aa overlap (1-509:1-509)
10 20 30 40 50 60
pF1KE0 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEVTVAEVLAARGYLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEVTVAEVLAARGYLT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 GMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQGLVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQGLVP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 IPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFSGQSF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 IPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFSGQSF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 AERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGCSGLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 AERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGCSGLL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 RCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLDGFDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 RCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLDGFDL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 SPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 SLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGPSQVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGPSQVA
430 440 450 460 470 480
490 500
pF1KE0 RGEDPALQICCHPGCTPRPACCHCPDPHA
:::::::::::::::::::::::::::::
CCDS14 RGEDPALQICCHPGCTPRPACCHCPDPHA
490 500
>>CCDS46736.1 ARSA gene_id:410|Hs108|chr22 (423 aa)
initn: 2972 init1: 2972 opt: 2972 Z-score: 3078.4 bits: 578.9 E(32554): 3.8e-165
Smith-Waterman score: 2972; 100.0% identity (100.0% similar) in 423 aa overlap (87-509:1-423)
60 70 80 90 100 110
pF1KE0 GGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEVTVAEVLAAR
::::::::::::::::::::::::::::::
CCDS46 MGMYPGVLVPSSRGGLPLEEVTVAEVLAAR
10 20 30
120 130 140 150 160 170
pF1KE0 GYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQ
40 50 60 70 80 90
180 190 200 210 220 230
pF1KE0 GLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFS
100 110 120 130 140 150
240 250 260 270 280 290
pF1KE0 GQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGC
160 170 180 190 200 210
300 310 320 330 340 350
pF1KE0 SGLLRCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SGLLRCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLD
220 230 240 250 260 270
360 370 380 390 400 410
pF1KE0 GFDLSPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPAC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GFDLSPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPAC
280 290 300 310 320 330
420 430 440 450 460 470
pF1KE0 HASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 HASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGP
340 350 360 370 380 390
480 490 500
pF1KE0 SQVARGEDPALQICCHPGCTPRPACCHCPDPHA
:::::::::::::::::::::::::::::::::
CCDS46 SQVARGEDPALQICCHPGCTPRPACCHCPDPHA
400 410 420
>>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa)
initn: 709 init1: 323 opt: 958 Z-score: 993.7 bits: 193.5 E(32554): 5e-49
Smith-Waterman score: 968; 37.1% identity (59.9% similar) in 534 aa overlap (9-506:13-512)
10 20 30 40 50
pF1KE0 MSMGAPRSLLLAL-AAGLAVA---RPPNIVLIFADDLGYGDLGCYGHPSSTTPNLD
:::.: :::.... .::::.:.. ::.:.:::: ::.:: :::::
CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD
10 20 30 40 50 60
60 70 80 90 100
pF1KE0 QLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYP------GVLVPSS-RGGLPLE
..:: :: : .:: ::.::::::::::::.: :.: .. .:. ::.:
CCDS10 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE0 EVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFP
: . :.: ::.. ..:::::: :. : : ..:: ...: : : :: .: .
CCDS10 EQLLPELLKKAGYVSKIVGKWHLGHRPQ--FHPLKHGFDEWFGSPNCH-FGPYDNKA--R
130 140 150 160 170
170 180 190 200 210 220
pF1KE0 PATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEAR----YMAFAHDLMADAQRQDRPF
: : : .: . : : : :: :. : :.. :. .::
CCDS10 PNIPVYR--DWEMV------GRYYEEFPINLKTGEANLTQIYLQEALDFIKRQARH-HPF
180 190 200 210 220
230 240 250 260 270 280
pF1KE0 FLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFT
:::.: :: : .... : : :: .::.. :.: ..: .. . :: . ..:.:.::
CCDS10 FLYWAVDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFT
230 240 250 260 270 280
290 300 310 320 330
pF1KE0 ADNGPETMRMS-RGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAPG-VTHELASSLDLL
.::: . .:: .: . ::: ::.:::.::::::.::::.. : :.:.:.: .::.
CCDS10 SDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLF
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE0 PTLAALAG-APLPNVTLDGFDLSPLLLGTGKSPRQSLFFYPSYPDEVRG--VFAVRTGKY
: :::: .: . ..::..: : :: :. . .:.: :: ..:. :..
CCDS10 TTSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRPIFYY-------RGDTLMAATLGQH
350 360 370 380 390
400 410 420 430 440
pF1KE0 KAHFFTQGSAHSDTTAD-PACHAS--SSLTAH------EPPLLYDLSKDPGENYNLLGGV
::::.: .. . : .. :..:.: . ::.. :..:::: . :
CCDS10 KAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPL----
400 410 420 430 440 450
450 460 470 480 490 500
pF1KE0 AGATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQIC-------CHPGCTPRPA
. :. : .::... . : . :.. :.: : :..: :::
CCDS10 SFASAEYQEALSRITSVVQQHQEALV--PAQ------PQLNVCNWAVMNWAPPGCEKLGK
460 470 480 490 500
pF1KE0 CCHCPDPHA
: :.
CCDS10 CLTPPESIPKKCLWSH
510 520
>>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa)
initn: 716 init1: 259 opt: 709 Z-score: 736.1 bits: 145.8 E(32554): 1.1e-34
Smith-Waterman score: 972; 36.6% identity (60.1% similar) in 519 aa overlap (15-504:28-522)
10 20 30 40
pF1KE0 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSST
.: . .. ::.:.:.:::.:.:::: ..
CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE0 TPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEV
: :::..:. :.::.::.. .: :.::::.:::::: .: :. . : .: :::::.:.
CCDS11 TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAV-TSVGGLPLNET
70 80 90 100 110
110 120 130 140 150 160
pF1KE0 TVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCF--P
:.:::: ::.::. ::::: : .:.. : .:: ..:::::::.: : . . :
CCDS11 TLAEVLQQAGYVTGIIGKWHL--GHHGSYHPNFRGFDYYFGIPYSHDMG-CTDTPGYNHP
120 130 140 150 160 170
170 180 190 200 210
pF1KE0 PATPCDGG----------CDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQ
: : : : : .:: ::.. :: : .: .: : ... :.
CCDS11 PCPACPQGDGPSRNLQRDCYTD-VALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRAS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE0 RQDRPFFLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEE
. :::.:: : : : : : : ::. .: .: :.:. :: . . : . :.
CCDS11 TSGRPFLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKEN
240 250 260 270 280 290
280 290 300 310 320
pF1KE0 TLVIFTADNGPETMRM----SRGGCSGLLRCGKG------TTYEGGVREPALAFWPGHIA
:.. ::.:::: ... : : .:. . .: ::.::: : ::::.:::..
CCDS11 TFLWFTGDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVP
300 310 320 330 340 350
330 340 350 360 370 380
pF1KE0 PGVTHE-LASSLDLLPTLAALAGAPLPN-VTLDGFDLSPLLLGTGKSPRQSLFFYPSY--
.:: : : ::..::..::: : ::. .:: :.: .:.: .. : . ..:.:.
CCDS11 VNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGA
360 370 380 390 400 410
390 400 410 420 430 440
pF1KE0 PDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENY
: .. .:: .::: ..: :. : .. : . :. ::...: : .:
CCDS11 AGEFGALQTVRLERYKAFYITGGARACDGSTGPELQ-------HKFPLIFNLEDDTAEAV
420 430 440 450 460
450 460 470 480 490
pF1KE0 NLLGGVA---GATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPR
: : : .. ::: ..: .. :. .. . :.. .::.. ::. :
CCDS11 PLERGGAEYQAVLPEVRKVLADV------LQDIANDNISSADYTQDPSVTPCCN----PY
470 480 490 500 510
500
pF1KE0 PACCHCPDPHA
:.:
CCDS11 QIACRCQAA
520
>>CCDS43334.1 ARSB gene_id:411|Hs108|chr5 (413 aa)
initn: 533 init1: 197 opt: 517 Z-score: 538.9 bits: 109.0 E(32554): 1.1e-23
Smith-Waterman score: 551; 32.5% identity (55.7% similar) in 397 aa overlap (6-383:25-401)
10 20 30
pF1KE0 MSMGAPRSLLLALA---AGLAVARPPNIVLIFADDLGYGDL
: ::: :: .: ...:::..:...:::::..:.
CCDS43 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 GCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS
: .: ::.:: :::::. . ..:. ::::::. ::::: .: :. .. : .
CCDS43 GFHGS-RIRTPHLDALAAGGVLLDNYYTQ-PLCTPSRSQLLTGRYQIRTGLQHQIIWPCQ
70 80 90 100 110
100 110 120 130 140 150
pF1KE0 RGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGI------PYS
. .::.: . ..: :: : :.::::::. . :: ..:: ..: ::
CCDS43 PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY-RKECLPTRRGFDTYFGYLLGSEDYYS
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE0 HDQGPCQNLTCFPPATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMA
:.. : . . .: : .: :. . : .:. .
CCDS43 HER--CTLIDALN-VTRCALDFRDGEEVATGYKNMYSTNI------FTKRAIALITN---
180 190 200 210 220
220 230 240 250 260
pF1KE0 DAQRQDRPFFLYYASHHTHYP------QFSGQSFAERSGRGPFGDSLMELDAAVGTLMTA
. ..:.::: : . .: : .. .: . ..: .. . .: :::.. .:
CCDS43 --HPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAA
230 240 250 260 270 280
270 280 290 300 310 320
pF1KE0 IGDLGLLEETLVIFTADNGPETMRMSRGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAP
. . :: ..:. ::..::: .:. :: . :: : . .::::: ... :
CCDS43 LKSSGLWNNTVFIFSTDNGGQTLA---GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQK
290 300 310 320 330 340
330 340 350 360 370 380
pF1KE0 GVTH-ELASSLDLLPTLAALA-GAPLPNVTLDGFDLSPLLLGTGKSPRQSLFFY--PSYP
:: . :: : ::::. :: : . :::::. . . ::: :. :..
CCDS43 GVKNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFV
350 360 370 380 390 400
390 400 410 420 430 440
pF1KE0 DEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENYN
:
CCDS43 DSSPYWPECSLLL
410
>>CCDS4043.1 ARSB gene_id:411|Hs108|chr5 (533 aa)
initn: 533 init1: 197 opt: 517 Z-score: 537.4 bits: 109.1 E(32554): 1.3e-23
Smith-Waterman score: 569; 30.0% identity (53.8% similar) in 526 aa overlap (6-485:25-523)
10 20 30
pF1KE0 MSMGAPRSLLLALA---AGLAVARPPNIVLIFADDLGYGDL
: ::: :: .: ...:::..:...:::::..:.
CCDS40 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 GCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS
: .: ::.:: :::::. . ..:. ::::::. ::::: .: :. .. : .
CCDS40 GFHGS-RIRTPHLDALAAGGVLLDNYYTQ-PLCTPSRSQLLTGRYQIRTGLQHQIIWPCQ
70 80 90 100 110
100 110 120 130 140 150
pF1KE0 RGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGI------PYS
. .::.: . ..: :: : :.::::::. . :: ..:: ..: ::
CCDS40 PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY-RKECLPTRRGFDTYFGYLLGSEDYYS
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE0 HDQGPCQNLTCFPPATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMA
:.. : . . .: : .: :. . : .:. .
CCDS40 HER--CTLIDALN-VTRCALDFRDGEEVATGYKNMYSTNI------FTKRAIALITN---
180 190 200 210 220
220 230 240 250 260
pF1KE0 DAQRQDRPFFLYYASHHTHYP------QFSGQSFAERSGRGPFGDSLMELDAAVGTLMTA
. ..:.::: : . .: : .. .: . ..: .. . .: :::.. .:
CCDS40 --HPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAA
230 240 250 260 270 280
270 280 290 300 310 320
pF1KE0 IGDLGLLEETLVIFTADNGPETMRMSRGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAP
. . :: ..:. ::..::: .:. :: . :: : . .::::: ... :
CCDS40 LKSSGLWNNTVFIFSTDNGGQTLA---GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQK
290 300 310 320 330 340
330 340 350 360 370 380
pF1KE0 GVTH-ELASSLDLLPTLAALA-GAPLPNVTLDGFDLSPLLLGTGKSPRQSLFFY--PSYP
:: . :: : ::::. :: : . :::::. . . ::: :. :..
CCDS40 GVKNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFV
350 360 370 380 390 400
390 400 410 420
pF1KE0 DEV---RGVFA-----VRTGKYKAHFFTQGSA--HSD---TTADPAC---------HASS
: :. .: .:.: . .: :.. :. :.: . :
CCDS40 DSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVS
410 420 430 440 450 460
430 440 450 460 470
pF1KE0 SLTAHEPPL----LYDLSKDPGENYNLLGGVAGATPEVL-QALKQLQLLKAQLDAAVTFG
. . .:: :.:...:: : ..: . :... . :..::. . . .. : :
CCDS40 EIPSSDPPTKTLWLFDIDRDPEERHDL----SREYPHIVTKLLSRLQFYHKH-SVPVYF-
470 480 490 500 510
480 490 500
pF1KE0 PSQVARGEDPALQICCHPGCTPRPACCHCPDPHA
:.: : ::
CCDS40 PAQDPRC-DPKATGVWGPWM
520 530
>>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa)
initn: 814 init1: 292 opt: 422 Z-score: 438.5 bits: 90.9 E(32554): 4.2e-18
Smith-Waterman score: 794; 33.0% identity (57.4% similar) in 528 aa overlap (8-462:20-542)
10 20 30 40
pF1KE0 MSMGAPRSLLLALA----AGLAVARPPNIVLIFADDLGYGDLGCYGHP
..::.:: . ....:: ::.:..::::: ::.::::.
CCDS14 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRP-NILLLMADDLGIGDIGCYGNN
10 20 30 40 50
50 60 70 80 90
pF1KE0 SSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLV-----PSSR
. :::.:.:: :...:. .:::::::::.:::: ::: :: .. ..
CCDS14 TMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS
60 70 80 90 100 110
100 110 120 130 140 150
pF1KE0 GGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGA----FLPPHQGFHRFLGIPYSHDQ
:::: .:.: :..: .:: ::. ::::::.. :.: : :.:: .: :.:.: .
CCDS14 GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSL-M
120 130 140 150 160 170
160 170 180 190
pF1KE0 GPCQNLTCFPPATPCDGGCD-----QGLVPIPLLANLSVEAQP-PWLPG----------L
: : . . . .:: . :.:. .. : :.: :
CCDS14 GDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLL
180 190 200 210 220 230
200 210 220
pF1KE0 EARYMAFAHDLMADA---------------QR----------------QDRPFFLYYASH
. :.. : . :: :: . ::.:. .
CCDS14 ASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFL
240 250 260 270 280 290
230 240 250 260 270 280
pF1KE0 HTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGP--
:.: : .. ..: .: .: .::.. :.: :: .. .. :: . ::. ::.:.:
CCDS14 HVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSL
300 310 320 330 340 350
290 300 310 320 330 340
pF1KE0 --ETMRMSRGGCSGLLRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTL
. . :: .:. . ::: .:::.: :.. ::: . : : : .: .:..::.
CCDS14 ENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTV
360 370 380 390 400 410
350 360 370 380 390
pF1KE0 AALAGAPLP-NVTLDGFDLSPLLLGTGK-SPRQSLFFY-PSYPDEVRGVFAVRTGKYKAH
. :::. .: . ..:: :: ::::::.. : .. :. : . .: : .:.:
CCDS14 VRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVH
420 430 440 450 460 470
400 410 420 430 440 450
pF1KE0 FFT---QGSAHSDTTADPACHA-SSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVL
: : : . . . .: . ... :.::::.:::.::.:.. : . .. :
CCDS14 FVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHIL---TPASEPVFY
480 490 500 510 520 530
460 470 480 490 500
pF1KE0 QALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA
:.....:
CCDS14 QVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
540 550 560 570 580
>>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa)
initn: 814 init1: 292 opt: 422 Z-score: 438.3 bits: 90.9 E(32554): 4.3e-18
Smith-Waterman score: 794; 33.0% identity (57.4% similar) in 528 aa overlap (8-462:45-567)
10 20 30
pF1KE0 MSMGAPRSLLLALA----AGLAVARPPNIVLIFADDL
..::.:: . ....:: ::.:..::::
CCDS75 LMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRP-NILLLMADDL
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE0 GYGDLGCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGV
: ::.::::. . :::.:.:: :...:. .:::::::::.:::: ::: :: ..
CCDS75 GIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSI
80 90 100 110 120 130
100 110 120 130 140
pF1KE0 LV-----PSSRGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGA----FLPPHQGFH
.. :::: .:.: :..: .:: ::. ::::::.. :.: : :.::
CCDS75 GYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFD
140 150 160 170 180 190
150 160 170 180 190
pF1KE0 RFLGIPYSHDQGPCQNLTCFPPATPCDGGCD-----QGLVPIPLLANLSVEAQP-PWLPG
.: :.:.: .: : . . . .:: . :.:. .. : :.:
CCDS75 HFYGMPFSL-MGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPV
200 210 220 230 240 250
200 210
pF1KE0 ----------LEARYMAFAHDLMADA---------------QR----------------Q
: . :.. : . :: :: .
CCDS75 IWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNK
260 270 280 290 300 310
220 230 240 250 260 270
pF1KE0 DRPFFLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETL
::.:. . :.: : .. ..: .: .: .::.. :.: :: .. .. :: . ::
CCDS75 HGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTL
320 330 340 350 360 370
280 290 300 310 320 330
pF1KE0 VIFTADNGP----ETMRMSRGGCSGLLRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHE
. ::.:.: . . :: .:. . ::: .:::.: :.. ::: . : : :
CCDS75 IYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGE
380 390 400 410 420 430
340 350 360 370 380
pF1KE0 LASSLDLLPTLAALAGAPLP-NVTLDGFDLSPLLLGTGK-SPRQSLFFY-PSYPDEVRGV
.: .:..::.. :::. .: . ..:: :: ::::::.. : .. :. : . .:
CCDS75 PTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWH
440 450 460 470 480 490
390 400 410 420 430 440
pF1KE0 FAVRTGKYKAHFFT---QGSAHSDTTADPACHA-SSSLTAHEPPLLYDLSKDPGENYNLL
: .:.:: : : . . . .: . ... :.::::.:::.::.:.. :
CCDS75 QRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHIL-
500 510 520 530 540 550
450 460 470 480 490 500
pF1KE0 GGVAGATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHC
. .. : :.....:
CCDS75 --TPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLR
560 570 580 590 600
>>CCDS14127.1 STS gene_id:412|Hs108|chrX (583 aa)
initn: 905 init1: 293 opt: 421 Z-score: 437.5 bits: 90.7 E(32554): 4.7e-18
Smith-Waterman score: 861; 35.3% identity (58.0% similar) in 533 aa overlap (3-462:6-531)
10 20 30 40 50
pF1KE0 MSMGAPRSLLLAL--AAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLA
: : ::. : : . :..:: ::.:..::::: :: ::::. . :::.:.::
CCDS14 MPLRKMKIPFLLLFFLWEAESHAASRP-NIILVMADDLGIGDPGCYGNKTIRTPNIDRLA
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 AGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGM----YPGV-LVPSSRGGLPLEEVTVA
.::...:. . ::::::::..::: ::: :: :: : .: :::: .:.: :
CCDS14 SGGVKLTQHLAASPLCTPSRAAFMTGRYPVRSGMASWSRTGVFLFTASSGGLPTDEITFA
60 70 80 90 100 110
120 130 140 150 160
pF1KE0 EVLAARGYLTGMAGKWHLGVG--PEGAFL--PPHQGFHRFLGIPYSH--DQGPCQN----
..: .:: :.. ::::::.. . : : :.::. : :: .. : : ..
CCDS14 KLLKDQGYSTALIGKWHLGMSCHSKTDFCHHPLHHGFNYFYGISLTNLRDCKPGEGSVFT
120 130 140 150 160 170
170 180
pF1KE0 -----LTCFP-----------PATPCDG------------------------GCDQGLVP
:. .: : : : : . . :
CCDS14 TGFKRLVFLPLQIVGVTLLTLAALNCLGLLHVPLGVFFSLLFLAALILTLFLGFLHYFRP
180 190 200 210 220 230
190 200 210 220 230
pF1KE0 IP--LLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQ-DRPFFLYYASHHTHYPQFSG
. .. : . :: .: : . : ... ::. . ::.: . :.: ::.
CCDS14 LNCFMMRNYEIIQQPMSYDNLTQRLTVEAAQFI---QRNTETPFLLVLSYLHVHTALFSS
240 250 260 270 280 290
240 250 260 270 280 290
pF1KE0 QSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMS-----
..:: .: .: .::.. :.: .:: ... . .: : ..::. ::.:.: .. ..:
CCDS14 KDFAGKSQHGVYGDAVEEMDWSVGQILNLLDELRLANDTLIYFTSDQGAHVEEVSSKGEI
300 310 320 330 340 350
300 310 320 330 340 350
pF1KE0 RGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAPGVT-HELASSLDLLPTLAALAGAPLP
.:: .:. . ::....:::.: :.. :: : : : .:..:..::.: :::::::
CCDS14 HGGSNGIYKGGKANNWEGGIRVPGILRWPRVIQAGQKIDEPTSNMDIFPTVAKLAGAPLP
360 370 380 390 400 410
360 370 380 390 400
pF1KE0 -NVTLDGFDLSPLLLG-TGKSPRQSLFFY-PSYPDEVRGVFAVRTGKYKAHFFTQGSAHS
. .:: :: ::: : . .: .. :: : .: . :: :. .:: ::: .
CCDS14 EDRIIDGRDLMPLLEGKSQRSDHEFLFHYCNAYLNAVRWHPQNSTSIWKAFFFTPNFNPV
420 430 440 450 460 470
410 420 430 440 450 460
pF1KE0 DTTADPACHA----SSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLL
... : :. .: .: :.::::.:.:::: : : . .. :. . :: .:
CCDS14 GSNGCFATHVCFCFGSYVTHHDPPLLFDISKDPRERNPL---TPASEPRFYEILKVMQEA
480 490 500 510 520 530
470 480 490 500
pF1KE0 KAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA
CCDS14 ADRHTQTLPEVPDQFSWNNFLWKPWLQLCCPSTGLSCQCDREKQDKRLSR
540 550 560 570 580
>>CCDS35198.1 ARSH gene_id:347527|Hs108|chrX (562 aa)
initn: 791 init1: 295 opt: 401 Z-score: 417.1 bits: 86.9 E(32554): 6.6e-17
Smith-Waterman score: 777; 34.3% identity (57.3% similar) in 490 aa overlap (23-443:7-495)
10 20 30 40 50 60
pF1KE0 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR
:::::..::::: ::: :::. : .:::.:.::. :.:
CCDS35 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVR
10 20 30 40
70 80 90 100 110
pF1KE0 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS------RGGLPLEEVTVAEVLA
.:. . .:.:::::::.:::: :.: :: . . . :::: .:.: :..:
CCDS35 LTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQ
50 60 70 80 90 100
120 130 140 150 160
pF1KE0 ARGYLTGMAGKWHLGVG----PEGAFLPPHQGFHRFLGIPYSHDQGPCQ-----NLTCFP
::: ::. ::::::.. . . : ..::: : :.:.. . :: .: .
CCDS35 HRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGL-LSDCQASKTPELHRWL
110 120 130 140 150 160
170 180 190 200
pF1KE0 PATPCDGGCDQGLVP----IPLLAN-LSVEAQ-------------PPWLP--GLEARY--
. .::: :: .: .:: . : :. :.
CCDS35 RIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNC
170 180 190 200 210 220
210 220 230 240
pF1KE0 -MAFAHDLMADAQRQDR-------------------PFFLYYASHHTHYPQFSGQSFAER
. :... . ..... ::.:... :.: : .: ..:. :
CCDS35 ILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGR
230 240 250 260 270 280
250 260 270 280 290
pF1KE0 SGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNG----PETMRMSRGGCSGL
: : .::.. :.: :: .. :. . : ..::: ::.::: : .. :: .:.
CCDS35 SKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGI
290 300 310 320 330 340
300 310 320 330 340 350
pF1KE0 LRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTLAALAGAPLP-NVTLD
. ::: .:::.: :.. ::. . : : .: .: .:. :::. ..:. : . ..:
CCDS35 YKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVID
350 360 370 380 390 400
360 370 380 390 400 410
pF1KE0 GFDLSPLLLG-TGKSPRQSLFFYPS-YPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTA--
: .: ::: : ...: .. :: : . : :: . .:::. : : :
CCDS35 GQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACY
410 420 430 440 450 460
420 430 440 450 460 470
pF1KE0 -DPACHASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAA
. : :...: :.::::.:.:.::.: :
CCDS35 GSGICSCSGDVTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTP
470 480 490 500 510 520
480 490 500
pF1KE0 VTFGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA
CCDS35 VPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
530 540 550 560
509 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 15:20:22 2016 done: Thu Nov 3 15:20:23 2016
Total Scan time: 3.540 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]