FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1001, 525 aa
1>>>pF1KSDA1001 525 - 525 aa - 525 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.9331+/-0.000812; mu= 15.7079+/- 0.049
mean_var=80.9163+/-16.061, 0's: 0 Z-trim(109.3): 24 B-trim: 0 in 0/49
Lambda= 0.142579
statistics sampled from 10749 (10773) to 10749 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.696), E-opt: 0.2 (0.331), width: 16
Scan time: 3.560
The best scores are: opt bits E(32554)
CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 3629 756.1 2.2e-218
CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 709 155.5 1.4e-37
CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 487 109.8 7.9e-24
CCDS46736.1 ARSA gene_id:410|Hs108|chr22 ( 423) 410 93.9 3.9e-19
CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 394 90.7 5e-18
CCDS75949.1 ARSE gene_id:415|Hs108|chrX ( 544) 393 90.5 5.4e-18
CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 376 87.0 6.3e-17
CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 376 87.0 6.6e-17
CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 354 82.5 1.5e-15
CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 354 82.5 1.6e-15
CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 334 78.3 1.9e-14
CCDS14127.1 STS gene_id:412|Hs108|chrX ( 583) 336 78.8 1.9e-14
CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 334 78.3 2.4e-14
CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 ( 599) 319 75.3 2.2e-13
CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 307 72.8 1.2e-12
>>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa)
initn: 3629 init1: 3629 opt: 3629 Z-score: 4034.2 bits: 756.1 E(32554): 2.2e-218
Smith-Waterman score: 3629; 99.8% identity (99.8% similar) in 525 aa overlap (1-525:1-525)
10 20 30 40 50 60
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGGLPLNETT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGGLPLNETT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNHPPCPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNHPPCPA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD CPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 CPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD FLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVDHTVKENTFLWFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 FLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVDHTVKENTFLWFT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD GDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTST
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD ALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPGHRVLFHPNSGAAGEFGAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPGHRVLFHPNSGAAGEFGAL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD QTVRLERYKAFYITGGARACDGSTGPELQHKFPLIFNLEDDTAEAVPLERGGAEYQAVLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QTVRLERYKAFYITGGARACDGSTGPELQHKFPLIFNLEDDTAEAVPLERGGAEYQAVLP
430 440 450 460 470 480
490 500 510 520
pF1KSD EVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA
:::::::::::::::::::: ::::::::::::::::::::::::
CCDS11 EVRKVLADVLQDIANDNISSADYTQDPSVTPCCNPYQIACRCQAA
490 500 510 520
>>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa)
initn: 716 init1: 259 opt: 709 Z-score: 788.2 bits: 155.5 E(32554): 1.4e-37
Smith-Waterman score: 972; 36.6% identity (60.3% similar) in 519 aa overlap (28-522:15-504)
10 20 30 40 50 60
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
.: . .. ::.:.:.:::.:.:::: ..
CCDS14 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSST
10 20 30 40
70 80 90 100 110
pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAV-TSVGGLPLNET
: :::..:. :.::.::.. .: :.::::.:::::: .: :. . : .: :::::.:.
CCDS14 TPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEV
50 60 70 80 90 100
120 130 140 150 160 170
pF1KSD TLAEVLQQAGYVTGIIGKWHLG--HHGSYHPNFRGFDYYFGIPYSHDMG-CTDTPGYNHP
:.:::: ::.::. :::::: .:.. : .:: ..:::::::.: : . . :
CCDS14 TVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCF--P
110 120 130 140 150 160
180 190 200 210 220 230
pF1KSD PCPACPQGDGPSRNLQRDCYTD-VALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRAS
: : : : : .:: ::.. :: : .: .: : ... :.
CCDS14 PATPCDGG----------CDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQ
170 180 190 200 210
240 250 260 270 280 290
pF1KSD TSGRPFLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKEN
. :::.:: : : : : : : ::. .: .: :.:. :: . . : . :.
CCDS14 RQDRPFFLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEE
220 230 240 250 260 270
300 310 320 330 340 350
pF1KSD TFLWFTGDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVP
:.. ::.:::: ... : : .:. . .: ::.::: : ::::.:::..
CCDS14 TLVIFTADNGPETMRM----SRGGCSGLLRCGKG------TTYEGGVREPALAFWPGHIA
280 290 300 310 320
360 370 380 390 400 410
pF1KSD VNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGA
.:: : : ::..::..::: : ::. .:: :.: .:.: .. : . ..:.:.
CCDS14 PGVTHE-LASSLDLLPTLAALAGAPLPN-VTLDGFDLSPLLLGTGKSPRQSLFFYPSY--
330 340 350 360 370 380
420 430 440 450 460
pF1KSD AGEFGALQTVRLERYKAFYITGGARACDGSTGPELQ-------HKFPLIFNLEDDTAEAV
: .. .:: .::: ..: :. : .. : . :. ::...: : .:
CCDS14 PDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENY
390 400 410 420 430 440
470 480 490 500 510
pF1KSD PLERGGAEYQAVLPEVRKVLADV--LQDIANDNIS-SPDYT---QDPSVTPCCNP----Y
: : : .. ::: ..: .. :. . .. .:. . .::.. ::.:
CCDS14 NLLGGVA---GATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPR
450 460 470 480 490
520
pF1KSD QIACRCQAA
:.:
CCDS14 PACCHCPDPHA
500
>>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa)
initn: 892 init1: 284 opt: 487 Z-score: 541.3 bits: 109.8 E(32554): 7.9e-24
Smith-Waterman score: 862; 37.8% identity (61.4% similar) in 479 aa overlap (34-486:29-472)
10 20 30 40 50 60
pF1KSD LFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKDTAN
: ::....: :::::::::. ...: :
CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPN
10 20 30 40 50
70 80 90 100 110
pF1KSD LDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGV------TRNFAVTS---VGGL
::.::.::. : .:..: ::::::.:::::: .::: .:: : : :::.
CCDS10 LDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARN-AYTPQEIVGGI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD PLNETTLAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYN
: .: : :.:..::::. :.:::::::. ..:: .::: .:: : : .: : :.
CCDS10 PDSEQLLPELLKKAGYVSKIVGKWHLGHRPQFHPLKHGFDEWFGSPNCH-FG----P-YD
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD HPPCPACPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSS----LAQKYAEKATQF
. : : . :: ... :: : :.::.. :.: : ..: .:
CCDS10 NKARPNIP--------VYRD--WEMVGRYYE-----EFPINLKTGEANLTQIYLQEALDF
180 190 200 210
240 250 260 270 280
pF1KSD IQRASTSGRPFLLYVALAHMHVPLPVTQ--LPAAPRGRSLYGAGLWEMDSLVGQIKDKV-
:.: . .::.:: :. :.:. ... : .. ::: :: .. :.:. .:.: . .
CCDS10 IKRQARH-HPFFLYWAVDATHAPVYASKPFLGTSQRGR--YGDAVREIDDSIGKILELLQ
220 230 240 250 260 270
290 300 310 320 330 340
pF1KSD DHTVKENTFLWFTGDNGP-WAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPAL
: : .:::..::.::: . : .:: ::: .::::.::: : :::
CCDS10 DLHVADNTFVFFTSDNGAALISAPEQGGSNGPFLC----------GKQTTFEGGMREPAL
280 290 300 310 320
350 360 370 380 390 400
pF1KSD AYWPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLF-GRSQPGHRV
:.:::.: .. .: : :..:.: : .::: . :. : .::... .:. :: .
CCDS10 AWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDRPIF
330 340 350 360 370 380
410 420 430 440 450
pF1KSD LFHPNSGAAGEFGALQ------TVRLERYKAFYITGGARACDGSTGPELQ-H-KFPLIFN
.. .. :. .: . : : .. .. .: : .:. : :.::::.
CCDS10 YYRGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFH
390 400 410 420 430 440
460 470 480 490 500 510
pF1KSD LEDDTAEAVPLERGGAEYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQ
: : .: :: ..:::: .: .. .:.
CCDS10 LGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEK
450 460 470 480 490 500
>>CCDS46736.1 ARSA gene_id:410|Hs108|chr22 (423 aa)
initn: 609 init1: 171 opt: 410 Z-score: 457.1 bits: 93.9 E(32554): 3.9e-19
Smith-Waterman score: 735; 35.2% identity (58.4% similar) in 449 aa overlap (96-522:1-418)
70 80 90 100 110 120
pF1KSD KMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGGLPLNETTLAEVL
.:. :: .. .: :::::.:.:.::::
CCDS46 MGMYPGV---LVPSSRGGLPLEEVTVAEVL
10 20
130 140 150 160 170 180
pF1KSD QQAGYVTGIIGKWHLG--HHGSYHPNFRGFDYYFGIPYSHDMG-CTDTPGYNHPPCPACP
::.::. :::::: .:.. : .:: ..:::::::.: : . . : :: :
CCDS46 AARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCF--P--PATP
30 40 50 60 70 80
190 200 210 220 230 240
pF1KSD QGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFL
: ...: : .:: ::.. :: : .: .: : ... :. . :::.
CCDS46 CDGGCDQGL-------VPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFF
90 100 110 120 130
250 260 270 280 290 300
pF1KSD LYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKENTFLWFTG
:: : : : : : : ::. .: .: :.:. :: . . : . :.:.. ::.
CCDS46 LYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTA
140 150 160 170 180 190
310 320 330 340 350 360
pF1KSD DNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTA
:::: ... : : .:. : : : ::.::: : ::::.:::.. .::
CCDS46 DNGPETMRM----SRGGCSGL--LRCG----KGTTYEGGVREPALAFWPGHIAPGVTHE-
200 210 220 230 240
370 380 390 400 410 420
pF1KSD LLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGAAGEFGAL
: : ::..::..::: : ::. .:: :.: .:.: .. : . ..:.:. : ..
CCDS46 LASSLDLLPTLAALAGAPLPN-VTLDGFDLSPLLLGTGKSPRQSLFFYPSY--PDEVRGV
250 260 270 280 290 300
430 440 450 460 470
pF1KSD QTVRLERYKAFYITGGARACDGSTGPELQ-------HKFPLIFNLEDDTAEAVPLERGGA
.:: .::: ..: :. : .. : . :. ::...: : .: : : :
CCDS46 FAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENYNLLGGVA
310 320 330 340 350 360
480 490 500 510 520
pF1KSD EYQAVLPEVRKVLADV--LQDIANDNIS-SPDYT---QDPSVTPCCNP----YQIACRCQ
.. ::: ..: .. :. . .. .:. . .::.. ::.: :.:
CCDS46 ---GATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHCP
370 380 390 400 410
pF1KSD AA
CCDS46 DPHA
420
>>CCDS14123.1 ARSF gene_id:416|Hs108|chrX (590 aa)
initn: 763 init1: 250 opt: 394 Z-score: 437.1 bits: 90.7 E(32554): 5e-18
Smith-Waterman score: 782; 32.3% identity (58.4% similar) in 526 aa overlap (15-468:9-519)
10 20 30 40 50 60
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
: ... :.. : . ... .:::.:.:..::.: :::: .:
CCDS14 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMR
10 20 30 40 50
70 80 90 100 110
pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNG--------VTRNFAVTSVG
: ..:..: ::.:... .::: :::::...:::: .:.: : .:.:: .
CCDS14 TPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPA--
60 70 80 90 100 110
120 130 140 150 160
pF1KSD GLPLNETTLAEVLQQAGYVTGIIGKWHLGHHGS------YHPNFRGFDYYFGIPYSHDMG
:::::::::: .:.. :: ::.::::: : . . .:: :::::.:.:.. .
CCDS14 GLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDS
120 130 140 150 160 170
170 180 190
pF1KSD CTDTPGYN-----HPPCPACPQ---------GDGPSRN------------------LQRD
: :. : . : : : . :
CCDS14 CWPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYA
180 190 200 210 220 230
200 210 220 230 240
pF1KSD CYTDVALPLYENL------NIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALA
... . ::: . .:.:::.. .. ....: .:..: : . :::. ..
CCDS14 WFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSK--ETFLLFFSFL
240 250 260 270 280 290
250 260 270 280 290 300
pF1KSD HMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVDHT-VKENTFLWFTGDNGPWA
:.:.:::.:. .. ..::: .. ::::.::.: : .: ...::...::.:.:
CCDS14 HVHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHL
300 310 320 330 340 350
310 320 330 340 350 360
pF1KSD QKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVLD
. . ...: ..:... .: . :::: :::... :::.::.. :..:
CCDS14 EARRGHAQLGGWNGIYKGGKG-----MGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMD
360 370 380 390 400
370 380 390 400 410 420
pF1KSD IFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPG-HRVLFHPNSGAAGEFGALQTVR-L
:.:::.... .:::: : .:: :. .: : . . :. ::: : . :..:: .
CCDS14 ILPTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFH----YCGSY--LHAVRWI
410 420 430 440 450
430 440 450 460
pF1KSD ER------YKAFYIT--------GGARA---CDGSTGPELQHKFPLIFNLEDDTAEAVPL
. .:: :.: :: . : :. ::.:.: : .:..::
CCDS14 PKDDSGSVWKAHYVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPL
460 470 480 490 500 510
470 480 490 500 510 520
pF1KSD ERGGAEYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA
CCDS14 TPATEPLHDFVIKKVANALKEHQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEE
520 530 540 550 560 570
>>CCDS75949.1 ARSE gene_id:415|Hs108|chrX (544 aa)
initn: 646 init1: 200 opt: 393 Z-score: 436.5 bits: 90.5 E(32554): 5.4e-18
Smith-Waterman score: 664; 30.3% identity (55.3% similar) in 535 aa overlap (61-522:18-537)
40 50 60 70 80 90
pF1KSD TRGQKPNFVIILADDMGWGDLGANWAETKDTANLDKMASEGMRFVDFHAAASTCSPSRAS
: :.:..: .:..... .::: :.::::.
CCDS75 MSGSRERDNMLHLHHSWTPNIDRLAEDGVKLTQHISAASLCTPSRAA
10 20 30 40
100 110 120 130 140
pF1KSD LLTGRLGLRNGVTRNFAVTSV------GGLPLNETTLAEVLQQAGYVTGIIGKWHLGHH-
.:::: .:.:.. ... . :::: ::::.:..:.. ::.::.::::::: .
CCDS75 FLTGRYPVRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNC
50 60 70 80 90 100
150 160 170
pF1KSD -----GSYHPNFRGFDYYFGIPYSHDMGC----------------------------TDT
.:: .:::...:.:.: : : .
CCDS75 ESASDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLV
110 120 130 140 150 160
180 190 200 210 220
pF1KSD PG-YNH-PPCPACP--QGDGPSRNLQRDCYTDVALP------LYENLNIVEQPVNLSSLA
: .: : : . . : . : :: :..: .:.:::. .. .
CCDS75 AGKLTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTT
170 180 190 200 210 220
230 240 250 260 270 280
pF1KSD QKYAEKATQFIQRASTSGRPFLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLV
.....:..: . : ::::.:.. :.:.:: . . . ..::: .. ::: .:
CCDS75 PLILQEVASFLKR-NKHG-PFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMV
230 240 250 260 270 280
290 300 310 320 330
pF1KSD GQIKDKVD-HTVKENTFLWFTGDNGPWAQKCELAGS-VGPFTGFWQTRQGGSPAKQTTWE
:.: : .: . ....:...::.:.: . . .:... : ..:... .: . ::
CCDS75 GRILDTLDVEGLSNSTLIYFTSDHGG-SLENQLGNTQYGGWNGIYKGGKG-----MGGWE
290 300 310 320 330
340 350 360 370 380 390
pF1KSD GGHRVPALAYWPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGR
:: :::.. ::: .:.. . :..:.::::: :: . .:: : .:: :. .:.:
CCDS75 GGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGT
340 350 360 370 380 390
400 410 420 430 440
pF1KSD SQPG-HRVLFHPNSGAAGEFGALQTVRLERYKAFYITG-----GARACDGST-----GPE
.: . :. :.: : : .:. ..: :: :: : : .
CCDS75 AQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEK
400 410 420 430 440 450
450 460 470 480 490 500
pF1KSD L-QHKFPLIFNLEDDTAEAVPLERGGAEYQAVLPEVRKVLADVLQDI-ANDNISSPDYTQ
. .: ::.:.: : .:. : : : .:. : : . .. :: :
CCDS75 VVHHDPPLLFDLSRDPSETHILT------PASEPVFYQVMERVQQAVWEHQRTLSPVPLQ
460 470 480 490 500 510
510 520
pF1KSD -D-------PSVTPCCNPYQIACRCQAA
: : . :::.:. . : :
CCDS75 LDRLGNIWRPWLQPCCGPFPL-CWCLREDDPQ
520 530 540
>>CCDS35198.1 ARSH gene_id:347527|Hs108|chrX (562 aa)
initn: 798 init1: 244 opt: 376 Z-score: 417.4 bits: 87.0 E(32554): 6.3e-17
Smith-Waterman score: 741; 31.9% identity (59.1% similar) in 508 aa overlap (31-468:2-495)
10 20 30 40 50 60
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
::. .::.:...:::.: ::: .. .
CCDS35 MTRNARPNIVLLMADDLGVGDLCCYGNNSVS
10 20 30
70 80 90 100 110
pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV-------GG
: :.:..::::.:... :::: :.::::..:::: .:.:.. . .. . ::
CCDS35 TPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGG
40 50 60 70 80 90
120 130 140 150 160
pF1KSD LPLNETTLAEVLQQAGYVTGIIGKWHLG------HHGSYHPNFRGFDYYFGIPYSHDMGC
:: ::::.:..::. :: ::.::::::: . ::: .:: :..:.:.. :
CCDS35 LPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDC
100 110 120 130 140 150
170 180 190
pF1KSD --TDTPGYNH----------------PPCPACPQG----DGPSRNLQ----------RDC
. :: .. : :. . : . . .
CCDS35 QASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSW
160 170 180 190 200 210
200 210 220 230 240
pF1KSD YTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALAH
:.. .. :..: .:..::.. ..:. . ..: ::.: . .::::. .. :
CCDS35 YSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKR--EPFLLFFSFLH
220 230 240 250 260
250 260 270 280 290 300
pF1KSD MHVPLPVTQLPAAPRGR-SLYGAGLWEMDSLVGQIKDKVDHT-VKENTFLWFTGDNGPWA
.:.:: ... . :.. . :: .. ::: .::.: : .:. . ..:...::.:::
CCDS35 VHTPL-ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHL
270 280 290 300 310 320
310 320 330 340 350 360
pF1KSD QKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVLD
. . : ..: ..:... .: . :::: :::.. ::. . .. . . :..:
CCDS35 EPLDGAVQLGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMD
330 340 350 360 370 380
370 380 390 400 410 420
pF1KSD IFPTVVALAQASLPQGRRFDGVDVSEVLFGR-SQPGHRVLFHPNSGAAGEFGALQTVRLE
:.::. .. . : : : .:: .. .: :: :. :. ::: : . :.::: .
CCDS35 IYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFH----YCGVY--LHTVRWH
390 400 410 420 430
430 440 450 460 470
pF1KSD R------YKAFYITG-----GARACDGS-----TGPELQHKFPLIFNLEDDTAEAVPLER
. .:: :.: :. :: :: .: : ::.:.. : .::.::
CCDS35 QKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPPLLFDISRDPSEALPLNP
440 450 460 470 480 490
480 490 500 510 520
pF1KSD GGAEYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA
CCDS35 DNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI
500 510 520 530 540 550
>>CCDS35196.1 ARSD gene_id:414|Hs108|chrX (593 aa)
initn: 742 init1: 240 opt: 376 Z-score: 417.0 bits: 87.0 E(32554): 6.6e-17
Smith-Waterman score: 790; 31.9% identity (58.2% similar) in 545 aa overlap (18-494:23-556)
10 20 30 40 50
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANW
:: :. : . . :::...:.:::.: ::::
CCDS35 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD AETKDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV----
.: : :.:..: ::.:... ::: :.::::..:::: ..:.:. . . ..
CCDS35 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
70 80 90 100 110 120
120 130 140 150 160
pF1KSD --GGLPLNETTLAEVLQQAGYVTGIIGKWHLG----HHGSY--HPNFRGFDYYFGIPYSH
:::: ::::.:..::: ::.::.::::: : .:.. :: .::::..:.:..
CCDS35 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
130 140 150 160 170 180
170 180 190
pF1KSD DMGCTDTPGYNHPP----------------------CPACPQGDG----PSRNLQR----
: :: .:: : : : .: .
CCDS35 TNDCD--PG--RPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGV
190 200 210 220 230
200 210 220 230 240
pF1KSD DC------YTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPF
: :.. .. :..: ...:::. : . :. . ..:...:.: . . ::
CCDS35 GCLFFISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHG--PF
240 250 260 270 280 290
250 260 270 280 290 300
pF1KSD LLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKENTFLWFT
::...: :.:.:: .:. . ..::: .. ::: :.:.. . . :. .:..:: .::
CCDS35 LLFLSLLHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFT
300 310 320 330 340 350
310 320 330 340 350 360
pF1KSD GDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTST
.:.: . . ...: ..:... .: . :::: :::.. .::: .:.. .
CCDS35 SDHGGHLEARDGHSQLGGWNGIYKGGKG-----MGGWEGGIRVPGIFHWPGVLPAGRVIG
360 370 380 390 400
370 380 390 400 410
pF1KSD ALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFG-RSQPGHRVLFHPNSGAAGEFGA
:..:.::::: :. . .:: : .:: .. .: : ... .:. ::: .
CCDS35 EPTSLMDVFPTVVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARW
410 420 430 440 450 460
420 430 440 450 460
pF1KSD LQTVRLERYKAFYITG-----GARACDGS-----TGPEL-QHKFPLIFNLEDDTAEAVPL
: .:. : : :: :: : .: . .:. ::.:.: : .:: ::
CCDS35 HQKDSGSVWKVHYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPL
470 480 490 500 510 520
470 480 490 500 510 520
pF1KSD ERGGAE-YQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA
. :.::. .: .... : ..
CCDS35 TPDSEPLYHAVIARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDG
530 540 550 560 570 580
>>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa)
initn: 766 init1: 219 opt: 354 Z-score: 392.6 bits: 82.5 E(32554): 1.5e-15
Smith-Waterman score: 708; 31.1% identity (58.3% similar) in 501 aa overlap (28-464:30-522)
10 20 30 40 50
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAET
:. ...::.....:::.: ::.: .:
CCDS14 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNT
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD KDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV------G
: :.:..: .:..... .::: :.::::..:::: .:.:.. ... . :
CCDS14 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASG
70 80 90 100 110 120
120 130 140 150 160
pF1KSD GLPLNETTLAEVLQQAGYVTGIIGKWHLGHH------GSYHPNFRGFDYYFGIPYSHDMG
::: ::::.:..:.. ::.::.::::::: . .:: .:::...:.:.:
CCDS14 GLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGD
130 140 150 160 170 180
170 180 190
pF1KSD C----------------------------TDTPG-YNH-PPCPACP--QGDGPSRNLQRD
: : . : .: : : . . : .
CCDS14 CARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS
190 200 210 220 230 240
200 210 220 230 240
pF1KSD CYTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALA
: :: :..: .:.:::. .. . .....:..: . : ::::.:..
CCDS14 SYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKR-NKHG-PFLLFVSFL
250 260 270 280 290
250 260 270 280 290 300
pF1KSD HMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVD-HTVKENTFLWFTGDNGPWA
:.:.:: . . . ..::: .. ::: .::.: : .: . ....:...::.:.: .
CCDS14 HVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG-S
300 310 320 330 340 350
310 320 330 340 350 360
pF1KSD QKCELAGS-VGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVL
. .:... : ..:... .: . :::: :::.. ::: .:.. . :..
CCDS14 LENQLGNTQYGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLM
360 370 380 390 400 410
370 380 390 400 410 420
pF1KSD DIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPG-HRVLFHPNSGAAGEFGALQTVRL
:.::::: :: . .:: : .:: :. .:.: .: . :. :.: : :
CCDS14 DVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRG
420 430 440 450 460 470
430 440 450 460 470
pF1KSD ERYKAFYITG-----GARACDGST-----GPEL-QHKFPLIFNLEDDTAEAVPLERGGAE
.:. ..: :: :: : : .. .: ::.:.: : .:
CCDS14 TMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEP
480 490 500 510 520 530
480 490 500 510 520
pF1KSD YQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA
CCDS14 VFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
540 550 560 570 580
>>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa)
initn: 766 init1: 219 opt: 354 Z-score: 392.4 bits: 82.5 E(32554): 1.6e-15
Smith-Waterman score: 708; 31.1% identity (58.3% similar) in 501 aa overlap (28-464:55-547)
10 20 30 40 50
pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAE
:. ...::.....:::.: ::.: .
CCDS75 IVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNN
30 40 50 60 70 80
60 70 80 90 100 110
pF1KSD TKDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV------
: : :.:..: .:..... .::: :.::::..:::: .:.:.. ... .
CCDS75 TMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS
90 100 110 120 130 140
120 130 140 150 160
pF1KSD GGLPLNETTLAEVLQQAGYVTGIIGKWHLGHH------GSYHPNFRGFDYYFGIPYSHDM
:::: ::::.:..:.. ::.::.::::::: . .:: .:::...:.:.:
CCDS75 GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMG
150 160 170 180 190 200
170 180 190
pF1KSD GC----------------------------TDTPG-YNH-PPCPACP--QGDGPSRNLQR
: : . : .: : : . . :
CCDS75 DCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLA
210 220 230 240 250 260
200 210 220 230 240
pF1KSD DCYTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVAL
. : :: :..: .:.:::. .. . .....:..: . : ::::.:..
CCDS75 SSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKR-NKHG-PFLLFVSF
270 280 290 300 310 320
250 260 270 280 290 300
pF1KSD AHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVD-HTVKENTFLWFTGDNGPW
:.:.:: . . . ..::: .. ::: .::.: : .: . ....:...::.:.:
CCDS75 LHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG-
330 340 350 360 370 380
310 320 330 340 350 360
pF1KSD AQKCELAGS-VGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSV
. . .:... : ..:... .: . :::: :::.. ::: .:.. . :.
CCDS75 SLENQLGNTQYGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSL
390 400 410 420 430
370 380 390 400 410 420
pF1KSD LDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPG-HRVLFHPNSGAAGEFGALQTVR
.:.::::: :: . .:: : .:: :. .:.: .: . :. :.: : :
CCDS75 MDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDR
440 450 460 470 480 490
430 440 450 460 470
pF1KSD LERYKAFYITG-----GARACDGST-----GPEL-QHKFPLIFNLEDDTAEAVPLERGGA
.:. ..: :: :: : : .. .: ::.:.: : .:
CCDS75 GTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASE
500 510 520 530 540 550
480 490 500 510 520
pF1KSD EYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA
CCDS75 PVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
560 570 580 590 600 610
525 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 18:57:37 2016 done: Thu Nov 3 18:57:37 2016
Total Scan time: 3.560 Total Display time: 0.130
Function used was FASTA [36.3.4 Apr, 2011]