FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1001, 525 aa 1>>>pF1KSDA1001 525 - 525 aa - 525 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9331+/-0.000812; mu= 15.7079+/- 0.049 mean_var=80.9163+/-16.061, 0's: 0 Z-trim(109.3): 24 B-trim: 0 in 0/49 Lambda= 0.142579 statistics sampled from 10749 (10773) to 10749 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.696), E-opt: 0.2 (0.331), width: 16 Scan time: 3.560 The best scores are: opt bits E(32554) CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 3629 756.1 2.2e-218 CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 709 155.5 1.4e-37 CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 487 109.8 7.9e-24 CCDS46736.1 ARSA gene_id:410|Hs108|chr22 ( 423) 410 93.9 3.9e-19 CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 394 90.7 5e-18 CCDS75949.1 ARSE gene_id:415|Hs108|chrX ( 544) 393 90.5 5.4e-18 CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 376 87.0 6.3e-17 CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 376 87.0 6.6e-17 CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 354 82.5 1.5e-15 CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 354 82.5 1.6e-15 CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 334 78.3 1.9e-14 CCDS14127.1 STS gene_id:412|Hs108|chrX ( 583) 336 78.8 1.9e-14 CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 334 78.3 2.4e-14 CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 ( 599) 319 75.3 2.2e-13 CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 307 72.8 1.2e-12 >>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa) initn: 3629 init1: 3629 opt: 3629 Z-score: 4034.2 bits: 756.1 E(32554): 2.2e-218 Smith-Waterman score: 3629; 99.8% identity (99.8% similar) in 525 aa overlap (1-525:1-525) 10 20 30 40 50 60 pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGGLPLNETT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGGLPLNETT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNHPPCPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNHPPCPA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD CPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 CPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD FLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVDHTVKENTFLWFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 FLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVDHTVKENTFLWFT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD GDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTST 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD ALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPGHRVLFHPNSGAAGEFGAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPGHRVLFHPNSGAAGEFGAL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD QTVRLERYKAFYITGGARACDGSTGPELQHKFPLIFNLEDDTAEAVPLERGGAEYQAVLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QTVRLERYKAFYITGGARACDGSTGPELQHKFPLIFNLEDDTAEAVPLERGGAEYQAVLP 430 440 450 460 470 480 490 500 510 520 pF1KSD EVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA :::::::::::::::::::: :::::::::::::::::::::::: CCDS11 EVRKVLADVLQDIANDNISSADYTQDPSVTPCCNPYQIACRCQAA 490 500 510 520 >>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa) initn: 716 init1: 259 opt: 709 Z-score: 788.2 bits: 155.5 E(32554): 1.4e-37 Smith-Waterman score: 972; 36.6% identity (60.3% similar) in 519 aa overlap (28-522:15-504) 10 20 30 40 50 60 pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD .: . .. ::.:.:.:::.:.:::: .. CCDS14 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSST 10 20 30 40 70 80 90 100 110 pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAV-TSVGGLPLNET : :::..:. :.::.::.. .: :.::::.:::::: .: :. . : .: :::::.:. CCDS14 TPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEV 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD TLAEVLQQAGYVTGIIGKWHLG--HHGSYHPNFRGFDYYFGIPYSHDMG-CTDTPGYNHP :.:::: ::.::. :::::: .:.. : .:: ..:::::::.: : . . : CCDS14 TVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCF--P 110 120 130 140 150 160 180 190 200 210 220 230 pF1KSD PCPACPQGDGPSRNLQRDCYTD-VALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRAS : : : : : .:: ::.. :: : .: .: : ... :. CCDS14 PATPCDGG----------CDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQ 170 180 190 200 210 240 250 260 270 280 290 pF1KSD TSGRPFLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKEN . :::.:: : : : : : : ::. .: .: :.:. :: . . : . :. CCDS14 RQDRPFFLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEE 220 230 240 250 260 270 300 310 320 330 340 350 pF1KSD TFLWFTGDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVP :.. ::.:::: ... : : .:. . .: ::.::: : ::::.:::.. CCDS14 TLVIFTADNGPETMRM----SRGGCSGLLRCGKG------TTYEGGVREPALAFWPGHIA 280 290 300 310 320 360 370 380 390 400 410 pF1KSD VNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGA .:: : : ::..::..::: : ::. .:: :.: .:.: .. : . ..:.:. CCDS14 PGVTHE-LASSLDLLPTLAALAGAPLPN-VTLDGFDLSPLLLGTGKSPRQSLFFYPSY-- 330 340 350 360 370 380 420 430 440 450 460 pF1KSD AGEFGALQTVRLERYKAFYITGGARACDGSTGPELQ-------HKFPLIFNLEDDTAEAV : .. .:: .::: ..: :. : .. : . :. ::...: : .: CCDS14 PDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENY 390 400 410 420 430 440 470 480 490 500 510 pF1KSD PLERGGAEYQAVLPEVRKVLADV--LQDIANDNIS-SPDYT---QDPSVTPCCNP----Y : : : .. ::: ..: .. :. . .. .:. . .::.. ::.: CCDS14 NLLGGVA---GATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPR 450 460 470 480 490 520 pF1KSD QIACRCQAA :.: CCDS14 PACCHCPDPHA 500 >>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa) initn: 892 init1: 284 opt: 487 Z-score: 541.3 bits: 109.8 E(32554): 7.9e-24 Smith-Waterman score: 862; 37.8% identity (61.4% similar) in 479 aa overlap (34-486:29-472) 10 20 30 40 50 60 pF1KSD LFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKDTAN : ::....: :::::::::. ...: : CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPN 10 20 30 40 50 70 80 90 100 110 pF1KSD LDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGV------TRNFAVTS---VGGL ::.::.::. : .:..: ::::::.:::::: .::: .:: : : :::. CCDS10 LDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARN-AYTPQEIVGGI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD PLNETTLAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYN : .: : :.:..::::. :.:::::::. ..:: .::: .:: : : .: : :. CCDS10 PDSEQLLPELLKKAGYVSKIVGKWHLGHRPQFHPLKHGFDEWFGSPNCH-FG----P-YD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD HPPCPACPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSS----LAQKYAEKATQF . : : . :: ... :: : :.::.. :.: : ..: .: CCDS10 NKARPNIP--------VYRD--WEMVGRYYE-----EFPINLKTGEANLTQIYLQEALDF 180 190 200 210 240 250 260 270 280 pF1KSD IQRASTSGRPFLLYVALAHMHVPLPVTQ--LPAAPRGRSLYGAGLWEMDSLVGQIKDKV- :.: . .::.:: :. :.:. ... : .. ::: :: .. :.:. .:.: . . CCDS10 IKRQARH-HPFFLYWAVDATHAPVYASKPFLGTSQRGR--YGDAVREIDDSIGKILELLQ 220 230 240 250 260 270 290 300 310 320 330 340 pF1KSD DHTVKENTFLWFTGDNGP-WAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPAL : : .:::..::.::: . : .:: ::: .::::.::: : ::: CCDS10 DLHVADNTFVFFTSDNGAALISAPEQGGSNGPFLC----------GKQTTFEGGMREPAL 280 290 300 310 320 350 360 370 380 390 400 pF1KSD AYWPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLF-GRSQPGHRV :.:::.: .. .: : :..:.: : .::: . :. : .::... .:. :: . CCDS10 AWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDRPIF 330 340 350 360 370 380 410 420 430 440 450 pF1KSD LFHPNSGAAGEFGALQ------TVRLERYKAFYITGGARACDGSTGPELQ-H-KFPLIFN .. .. :. .: . : : .. .. .: : .:. : :.::::. CCDS10 YYRGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFH 390 400 410 420 430 440 460 470 480 490 500 510 pF1KSD LEDDTAEAVPLERGGAEYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQ : : .: :: ..:::: .: .. .:. CCDS10 LGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEK 450 460 470 480 490 500 >>CCDS46736.1 ARSA gene_id:410|Hs108|chr22 (423 aa) initn: 609 init1: 171 opt: 410 Z-score: 457.1 bits: 93.9 E(32554): 3.9e-19 Smith-Waterman score: 735; 35.2% identity (58.4% similar) in 449 aa overlap (96-522:1-418) 70 80 90 100 110 120 pF1KSD KMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGGLPLNETTLAEVL .:. :: .. .: :::::.:.:.:::: CCDS46 MGMYPGV---LVPSSRGGLPLEEVTVAEVL 10 20 130 140 150 160 170 180 pF1KSD QQAGYVTGIIGKWHLG--HHGSYHPNFRGFDYYFGIPYSHDMG-CTDTPGYNHPPCPACP ::.::. :::::: .:.. : .:: ..:::::::.: : . . : :: : CCDS46 AARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCF--P--PATP 30 40 50 60 70 80 190 200 210 220 230 240 pF1KSD QGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFL : ...: : .:: ::.. :: : .: .: : ... :. . :::. CCDS46 CDGGCDQGL-------VPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFF 90 100 110 120 130 250 260 270 280 290 300 pF1KSD LYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKENTFLWFTG :: : : : : : : ::. .: .: :.:. :: . . : . :.:.. ::. CCDS46 LYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTA 140 150 160 170 180 190 310 320 330 340 350 360 pF1KSD DNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTA :::: ... : : .:. : : : ::.::: : ::::.:::.. .:: CCDS46 DNGPETMRM----SRGGCSGL--LRCG----KGTTYEGGVREPALAFWPGHIAPGVTHE- 200 210 220 230 240 370 380 390 400 410 420 pF1KSD LLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGAAGEFGAL : : ::..::..::: : ::. .:: :.: .:.: .. : . ..:.:. : .. CCDS46 LASSLDLLPTLAALAGAPLPN-VTLDGFDLSPLLLGTGKSPRQSLFFYPSY--PDEVRGV 250 260 270 280 290 300 430 440 450 460 470 pF1KSD QTVRLERYKAFYITGGARACDGSTGPELQ-------HKFPLIFNLEDDTAEAVPLERGGA .:: .::: ..: :. : .. : . :. ::...: : .: : : : CCDS46 FAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENYNLLGGVA 310 320 330 340 350 360 480 490 500 510 520 pF1KSD EYQAVLPEVRKVLADV--LQDIANDNIS-SPDYT---QDPSVTPCCNP----YQIACRCQ .. ::: ..: .. :. . .. .:. . .::.. ::.: :.: CCDS46 ---GATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHCP 370 380 390 400 410 pF1KSD AA CCDS46 DPHA 420 >>CCDS14123.1 ARSF gene_id:416|Hs108|chrX (590 aa) initn: 763 init1: 250 opt: 394 Z-score: 437.1 bits: 90.7 E(32554): 5e-18 Smith-Waterman score: 782; 32.3% identity (58.4% similar) in 526 aa overlap (15-468:9-519) 10 20 30 40 50 60 pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD : ... :.. : . ... .:::.:.:..::.: :::: .: CCDS14 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMR 10 20 30 40 50 70 80 90 100 110 pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNG--------VTRNFAVTSVG : ..:..: ::.:... .::: :::::...:::: .:.: : .:.:: . CCDS14 TPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPA-- 60 70 80 90 100 110 120 130 140 150 160 pF1KSD GLPLNETTLAEVLQQAGYVTGIIGKWHLGHHGS------YHPNFRGFDYYFGIPYSHDMG :::::::::: .:.. :: ::.::::: : . . .:: :::::.:.:.. . CCDS14 GLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDS 120 130 140 150 160 170 170 180 190 pF1KSD CTDTPGYN-----HPPCPACPQ---------GDGPSRN------------------LQRD : :. : . : : : . : CCDS14 CWPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYA 180 190 200 210 220 230 200 210 220 230 240 pF1KSD CYTDVALPLYENL------NIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALA ... . ::: . .:.:::.. .. ....: .:..: : . :::. .. CCDS14 WFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSK--ETFLLFFSFL 240 250 260 270 280 290 250 260 270 280 290 300 pF1KSD HMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVDHT-VKENTFLWFTGDNGPWA :.:.:::.:. .. ..::: .. ::::.::.: : .: ...::...::.:.: CCDS14 HVHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHL 300 310 320 330 340 350 310 320 330 340 350 360 pF1KSD QKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVLD . . ...: ..:... .: . :::: :::... :::.::.. :..: CCDS14 EARRGHAQLGGWNGIYKGGKG-----MGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMD 360 370 380 390 400 370 380 390 400 410 420 pF1KSD IFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPG-HRVLFHPNSGAAGEFGALQTVR-L :.:::.... .:::: : .:: :. .: : . . :. ::: : . :..:: . CCDS14 ILPTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFH----YCGSY--LHAVRWI 410 420 430 440 450 430 440 450 460 pF1KSD ER------YKAFYIT--------GGARA---CDGSTGPELQHKFPLIFNLEDDTAEAVPL . .:: :.: :: . : :. ::.:.: : .:..:: CCDS14 PKDDSGSVWKAHYVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPL 460 470 480 490 500 510 470 480 490 500 510 520 pF1KSD ERGGAEYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA CCDS14 TPATEPLHDFVIKKVANALKEHQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEE 520 530 540 550 560 570 >>CCDS75949.1 ARSE gene_id:415|Hs108|chrX (544 aa) initn: 646 init1: 200 opt: 393 Z-score: 436.5 bits: 90.5 E(32554): 5.4e-18 Smith-Waterman score: 664; 30.3% identity (55.3% similar) in 535 aa overlap (61-522:18-537) 40 50 60 70 80 90 pF1KSD TRGQKPNFVIILADDMGWGDLGANWAETKDTANLDKMASEGMRFVDFHAAASTCSPSRAS : :.:..: .:..... .::: :.::::. CCDS75 MSGSRERDNMLHLHHSWTPNIDRLAEDGVKLTQHISAASLCTPSRAA 10 20 30 40 100 110 120 130 140 pF1KSD LLTGRLGLRNGVTRNFAVTSV------GGLPLNETTLAEVLQQAGYVTGIIGKWHLGHH- .:::: .:.:.. ... . :::: ::::.:..:.. ::.::.::::::: . CCDS75 FLTGRYPVRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNC 50 60 70 80 90 100 150 160 170 pF1KSD -----GSYHPNFRGFDYYFGIPYSHDMGC----------------------------TDT .:: .:::...:.:.: : : . CCDS75 ESASDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLV 110 120 130 140 150 160 180 190 200 210 220 pF1KSD PG-YNH-PPCPACP--QGDGPSRNLQRDCYTDVALP------LYENLNIVEQPVNLSSLA : .: : : . . : . : :: :..: .:.:::. .. . CCDS75 AGKLTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTT 170 180 190 200 210 220 230 240 250 260 270 280 pF1KSD QKYAEKATQFIQRASTSGRPFLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLV .....:..: . : ::::.:.. :.:.:: . . . ..::: .. ::: .: CCDS75 PLILQEVASFLKR-NKHG-PFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMV 230 240 250 260 270 280 290 300 310 320 330 pF1KSD GQIKDKVD-HTVKENTFLWFTGDNGPWAQKCELAGS-VGPFTGFWQTRQGGSPAKQTTWE :.: : .: . ....:...::.:.: . . .:... : ..:... .: . :: CCDS75 GRILDTLDVEGLSNSTLIYFTSDHGG-SLENQLGNTQYGGWNGIYKGGKG-----MGGWE 290 300 310 320 330 340 350 360 370 380 390 pF1KSD GGHRVPALAYWPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGR :: :::.. ::: .:.. . :..:.::::: :: . .:: : .:: :. .:.: CCDS75 GGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGT 340 350 360 370 380 390 400 410 420 430 440 pF1KSD SQPG-HRVLFHPNSGAAGEFGALQTVRLERYKAFYITG-----GARACDGST-----GPE .: . :. :.: : : .:. ..: :: :: : : . CCDS75 AQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEK 400 410 420 430 440 450 450 460 470 480 490 500 pF1KSD L-QHKFPLIFNLEDDTAEAVPLERGGAEYQAVLPEVRKVLADVLQDI-ANDNISSPDYTQ . .: ::.:.: : .:. : : : .:. : : . .. :: : CCDS75 VVHHDPPLLFDLSRDPSETHILT------PASEPVFYQVMERVQQAVWEHQRTLSPVPLQ 460 470 480 490 500 510 510 520 pF1KSD -D-------PSVTPCCNPYQIACRCQAA : : . :::.:. . : : CCDS75 LDRLGNIWRPWLQPCCGPFPL-CWCLREDDPQ 520 530 540 >>CCDS35198.1 ARSH gene_id:347527|Hs108|chrX (562 aa) initn: 798 init1: 244 opt: 376 Z-score: 417.4 bits: 87.0 E(32554): 6.3e-17 Smith-Waterman score: 741; 31.9% identity (59.1% similar) in 508 aa overlap (31-468:2-495) 10 20 30 40 50 60 pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD ::. .::.:...:::.: ::: .. . CCDS35 MTRNARPNIVLLMADDLGVGDLCCYGNNSVS 10 20 30 70 80 90 100 110 pF1KSD TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV-------GG : :.:..::::.:... :::: :.::::..:::: .:.:.. . .. . :: CCDS35 TPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGG 40 50 60 70 80 90 120 130 140 150 160 pF1KSD LPLNETTLAEVLQQAGYVTGIIGKWHLG------HHGSYHPNFRGFDYYFGIPYSHDMGC :: ::::.:..::. :: ::.::::::: . ::: .:: :..:.:.. : CCDS35 LPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDC 100 110 120 130 140 150 170 180 190 pF1KSD --TDTPGYNH----------------PPCPACPQG----DGPSRNLQ----------RDC . :: .. : :. . : . . . CCDS35 QASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSW 160 170 180 190 200 210 200 210 220 230 240 pF1KSD YTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALAH :.. .. :..: .:..::.. ..:. . ..: ::.: . .::::. .. : CCDS35 YSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKR--EPFLLFFSFLH 220 230 240 250 260 250 260 270 280 290 300 pF1KSD MHVPLPVTQLPAAPRGR-SLYGAGLWEMDSLVGQIKDKVDHT-VKENTFLWFTGDNGPWA .:.:: ... . :.. . :: .. ::: .::.: : .:. . ..:...::.::: CCDS35 VHTPL-ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHL 270 280 290 300 310 320 310 320 330 340 350 360 pF1KSD QKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVLD . . : ..: ..:... .: . :::: :::.. ::. . .. . . :..: CCDS35 EPLDGAVQLGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMD 330 340 350 360 370 380 370 380 390 400 410 420 pF1KSD IFPTVVALAQASLPQGRRFDGVDVSEVLFGR-SQPGHRVLFHPNSGAAGEFGALQTVRLE :.::. .. . : : : .:: .. .: :: :. :. ::: : . :.::: . CCDS35 IYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFH----YCGVY--LHTVRWH 390 400 410 420 430 430 440 450 460 470 pF1KSD R------YKAFYITG-----GARACDGS-----TGPELQHKFPLIFNLEDDTAEAVPLER . .:: :.: :. :: :: .: : ::.:.. : .::.:: CCDS35 QKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPPLLFDISRDPSEALPLNP 440 450 460 470 480 490 480 490 500 510 520 pF1KSD GGAEYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA CCDS35 DNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI 500 510 520 530 540 550 >>CCDS35196.1 ARSD gene_id:414|Hs108|chrX (593 aa) initn: 742 init1: 240 opt: 376 Z-score: 417.0 bits: 87.0 E(32554): 6.6e-17 Smith-Waterman score: 790; 31.9% identity (58.2% similar) in 545 aa overlap (18-494:23-556) 10 20 30 40 50 pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANW :: :. : . . :::...:.:::.: :::: CCDS35 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD AETKDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV---- .: : :.:..: ::.:... ::: :.::::..:::: ..:.:. . . .. CCDS35 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA 70 80 90 100 110 120 120 130 140 150 160 pF1KSD --GGLPLNETTLAEVLQQAGYVTGIIGKWHLG----HHGSY--HPNFRGFDYYFGIPYSH :::: ::::.:..::: ::.::.::::: : .:.. :: .::::..:.:.. CCDS35 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL 130 140 150 160 170 180 170 180 190 pF1KSD DMGCTDTPGYNHPP----------------------CPACPQGDG----PSRNLQR---- : :: .:: : : : .: . CCDS35 TNDCD--PG--RPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGV 190 200 210 220 230 200 210 220 230 240 pF1KSD DC------YTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPF : :.. .. :..: ...:::. : . :. . ..:...:.: . . :: CCDS35 GCLFFISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHG--PF 240 250 260 270 280 290 250 260 270 280 290 300 pF1KSD LLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKENTFLWFT ::...: :.:.:: .:. . ..::: .. ::: :.:.. . . :. .:..:: .:: CCDS35 LLFLSLLHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFT 300 310 320 330 340 350 310 320 330 340 350 360 pF1KSD GDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTST .:.: . . ...: ..:... .: . :::: :::.. .::: .:.. . CCDS35 SDHGGHLEARDGHSQLGGWNGIYKGGKG-----MGGWEGGIRVPGIFHWPGVLPAGRVIG 360 370 380 390 400 370 380 390 400 410 pF1KSD ALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFG-RSQPGHRVLFHPNSGAAGEFGA :..:.::::: :. . .:: : .:: .. .: : ... .:. ::: . CCDS35 EPTSLMDVFPTVVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARW 410 420 430 440 450 460 420 430 440 450 460 pF1KSD LQTVRLERYKAFYITG-----GARACDGS-----TGPEL-QHKFPLIFNLEDDTAEAVPL : .:. : : :: :: : .: . .:. ::.:.: : .:: :: CCDS35 HQKDSGSVWKVHYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPL 470 480 490 500 510 520 470 480 490 500 510 520 pF1KSD ERGGAE-YQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA . :.::. .: .... : .. CCDS35 TPDSEPLYHAVIARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDG 530 540 550 560 570 580 >>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa) initn: 766 init1: 219 opt: 354 Z-score: 392.6 bits: 82.5 E(32554): 1.5e-15 Smith-Waterman score: 708; 31.1% identity (58.3% similar) in 501 aa overlap (28-464:30-522) 10 20 30 40 50 pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAET :. ...::.....:::.: ::.: .: CCDS14 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD KDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV------G : :.:..: .:..... .::: :.::::..:::: .:.:.. ... . : CCDS14 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASG 70 80 90 100 110 120 120 130 140 150 160 pF1KSD GLPLNETTLAEVLQQAGYVTGIIGKWHLGHH------GSYHPNFRGFDYYFGIPYSHDMG ::: ::::.:..:.. ::.::.::::::: . .:: .:::...:.:.: CCDS14 GLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGD 130 140 150 160 170 180 170 180 190 pF1KSD C----------------------------TDTPG-YNH-PPCPACP--QGDGPSRNLQRD : : . : .: : : . . : . CCDS14 CARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS 190 200 210 220 230 240 200 210 220 230 240 pF1KSD CYTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALA : :: :..: .:.:::. .. . .....:..: . : ::::.:.. CCDS14 SYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKR-NKHG-PFLLFVSFL 250 260 270 280 290 250 260 270 280 290 300 pF1KSD HMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVD-HTVKENTFLWFTGDNGPWA :.:.:: . . . ..::: .. ::: .::.: : .: . ....:...::.:.: . CCDS14 HVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG-S 300 310 320 330 340 350 310 320 330 340 350 360 pF1KSD QKCELAGS-VGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVL . .:... : ..:... .: . :::: :::.. ::: .:.. . :.. CCDS14 LENQLGNTQYGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLM 360 370 380 390 400 410 370 380 390 400 410 420 pF1KSD DIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPG-HRVLFHPNSGAAGEFGALQTVRL :.::::: :: . .:: : .:: :. .:.: .: . :. :.: : : CCDS14 DVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRG 420 430 440 450 460 470 430 440 450 460 470 pF1KSD ERYKAFYITG-----GARACDGST-----GPEL-QHKFPLIFNLEDDTAEAVPLERGGAE .:. ..: :: :: : : .. .: ::.:.: : .: CCDS14 TMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEP 480 490 500 510 520 530 480 490 500 510 520 pF1KSD YQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA CCDS14 VFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 540 550 560 570 580 >>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa) initn: 766 init1: 219 opt: 354 Z-score: 392.4 bits: 82.5 E(32554): 1.6e-15 Smith-Waterman score: 708; 31.1% identity (58.3% similar) in 501 aa overlap (28-464:55-547) 10 20 30 40 50 pF1KSD MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAE :. ...::.....:::.: ::.: . CCDS75 IVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNN 30 40 50 60 70 80 60 70 80 90 100 110 pF1KSD TKDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSV------ : : :.:..: .:..... .::: :.::::..:::: .:.:.. ... . CCDS75 TMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS 90 100 110 120 130 140 120 130 140 150 160 pF1KSD GGLPLNETTLAEVLQQAGYVTGIIGKWHLGHH------GSYHPNFRGFDYYFGIPYSHDM :::: ::::.:..:.. ::.::.::::::: . .:: .:::...:.:.: CCDS75 GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMG 150 160 170 180 190 200 170 180 190 pF1KSD GC----------------------------TDTPG-YNH-PPCPACP--QGDGPSRNLQR : : . : .: : : . . : CCDS75 DCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLA 210 220 230 240 250 260 200 210 220 230 240 pF1KSD DCYTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVAL . : :: :..: .:.:::. .. . .....:..: . : ::::.:.. CCDS75 SSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKR-NKHG-PFLLFVSF 270 280 290 300 310 320 250 260 270 280 290 300 pF1KSD AHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVD-HTVKENTFLWFTGDNGPW :.:.:: . . . ..::: .. ::: .::.: : .: . ....:...::.:.: CCDS75 LHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG- 330 340 350 360 370 380 310 320 330 340 350 360 pF1KSD AQKCELAGS-VGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSV . . .:... : ..:... .: . :::: :::.. ::: .:.. . :. CCDS75 SLENQLGNTQYGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSL 390 400 410 420 430 370 380 390 400 410 420 pF1KSD LDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPG-HRVLFHPNSGAAGEFGALQTVR .:.::::: :: . .:: : .:: :. .:.: .: . :. :.: : : CCDS75 MDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDR 440 450 460 470 480 490 430 440 450 460 470 pF1KSD LERYKAFYITG-----GARACDGST-----GPEL-QHKFPLIFNLEDDTAEAVPLERGGA .:. ..: :: :: : : .. .: ::.:.: : .: CCDS75 GTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASE 500 510 520 530 540 550 480 490 500 510 520 pF1KSD EYQAVLPEVRKVLADVLQDIANDNISSPDYTQDPSVTPCCNPYQIACRCQAA CCDS75 PVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 560 570 580 590 600 610 525 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 18:57:37 2016 done: Thu Nov 3 18:57:37 2016 Total Scan time: 3.560 Total Display time: 0.130 Function used was FASTA [36.3.4 Apr, 2011]