FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0337, 509 aa 1>>>pF1KE0337 509 - 509 aa - 509 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6551+/-0.000766; mu= 17.8820+/- 0.046 mean_var=93.4402+/-18.621, 0's: 0 Z-trim(111.0): 28 B-trim: 0 in 0/51 Lambda= 0.132681 statistics sampled from 11999 (12024) to 11999 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.733), E-opt: 0.2 (0.369), width: 16 Scan time: 3.540 The best scores are: opt bits E(32554) CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 3545 688.7 4.2e-198 CCDS46736.1 ARSA gene_id:410|Hs108|chr22 ( 423) 2972 578.9 3.8e-165 CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 958 193.5 5e-49 CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 709 145.8 1.1e-34 CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 517 109.0 1.1e-23 CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 517 109.1 1.3e-23 CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 422 90.9 4.2e-18 CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 422 90.9 4.3e-18 CCDS14127.1 STS gene_id:412|Hs108|chrX ( 583) 421 90.7 4.7e-18 CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 401 86.9 6.6e-17 CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 390 84.8 2.9e-16 CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 384 83.6 6.5e-16 CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 368 80.6 5.3e-15 CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 ( 599) 361 79.2 1.4e-14 CCDS75949.1 ARSE gene_id:415|Hs108|chrX ( 544) 304 68.3 2.5e-11 >>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa) initn: 3545 init1: 3545 opt: 3545 Z-score: 3670.1 bits: 688.7 E(32554): 4.2e-198 Smith-Waterman score: 3545; 100.0% identity (100.0% similar) in 509 aa overlap (1-509:1-509) 10 20 30 40 50 60 pF1KE0 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEVTVAEVLAARGYLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEVTVAEVLAARGYLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 GMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQGLVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQGLVP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 IPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFSGQSF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 IPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFSGQSF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 AERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGCSGLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 AERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGCSGLL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 RCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLDGFDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLDGFDL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 SPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 SLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGPSQVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGPSQVA 430 440 450 460 470 480 490 500 pF1KE0 RGEDPALQICCHPGCTPRPACCHCPDPHA ::::::::::::::::::::::::::::: CCDS14 RGEDPALQICCHPGCTPRPACCHCPDPHA 490 500 >>CCDS46736.1 ARSA gene_id:410|Hs108|chr22 (423 aa) initn: 2972 init1: 2972 opt: 2972 Z-score: 3078.4 bits: 578.9 E(32554): 3.8e-165 Smith-Waterman score: 2972; 100.0% identity (100.0% similar) in 423 aa overlap (87-509:1-423) 60 70 80 90 100 110 pF1KE0 GGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEVTVAEVLAAR :::::::::::::::::::::::::::::: CCDS46 MGMYPGVLVPSSRGGLPLEEVTVAEVLAAR 10 20 30 120 130 140 150 160 170 pF1KE0 GYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 GYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQ 40 50 60 70 80 90 180 190 200 210 220 230 pF1KE0 GLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 GLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFS 100 110 120 130 140 150 240 250 260 270 280 290 pF1KE0 GQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 GQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMSRGGC 160 170 180 190 200 210 300 310 320 330 340 350 pF1KE0 SGLLRCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SGLLRCGKGTTYEGGVREPALAFWPGHIAPGVTHELASSLDLLPTLAALAGAPLPNVTLD 220 230 240 250 260 270 360 370 380 390 400 410 pF1KE0 GFDLSPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 GFDLSPLLLGTGKSPRQSLFFYPSYPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPAC 280 290 300 310 320 330 420 430 440 450 460 470 pF1KE0 HASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 HASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVTFGP 340 350 360 370 380 390 480 490 500 pF1KE0 SQVARGEDPALQICCHPGCTPRPACCHCPDPHA ::::::::::::::::::::::::::::::::: CCDS46 SQVARGEDPALQICCHPGCTPRPACCHCPDPHA 400 410 420 >>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa) initn: 709 init1: 323 opt: 958 Z-score: 993.7 bits: 193.5 E(32554): 5e-49 Smith-Waterman score: 968; 37.1% identity (59.9% similar) in 534 aa overlap (9-506:13-512) 10 20 30 40 50 pF1KE0 MSMGAPRSLLLAL-AAGLAVA---RPPNIVLIFADDLGYGDLGCYGHPSSTTPNLD :::.: :::.... .::::.:.. ::.:.:::: ::.:: ::::: CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD 10 20 30 40 50 60 60 70 80 90 100 pF1KE0 QLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYP------GVLVPSS-RGGLPLE ..:: :: : .:: ::.::::::::::::.: :.: .. .:. ::.: CCDS10 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE0 EVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFP : . :.: ::.. ..:::::: :. : : ..:: ...: : : :: .: . CCDS10 EQLLPELLKKAGYVSKIVGKWHLGHRPQ--FHPLKHGFDEWFGSPNCH-FGPYDNKA--R 130 140 150 160 170 170 180 190 200 210 220 pF1KE0 PATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEAR----YMAFAHDLMADAQRQDRPF : : : .: . : : : :: :. : :.. :. .:: CCDS10 PNIPVYR--DWEMV------GRYYEEFPINLKTGEANLTQIYLQEALDFIKRQARH-HPF 180 190 200 210 220 230 240 250 260 270 280 pF1KE0 FLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFT :::.: :: : .... : : :: .::.. :.: ..: .. . :: . ..:.:.:: CCDS10 FLYWAVDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFT 230 240 250 260 270 280 290 300 310 320 330 pF1KE0 ADNGPETMRMS-RGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAPG-VTHELASSLDLL .::: . .:: .: . ::: ::.:::.::::::.::::.. : :.:.:.: .::. CCDS10 SDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLF 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE0 PTLAALAG-APLPNVTLDGFDLSPLLLGTGKSPRQSLFFYPSYPDEVRG--VFAVRTGKY : :::: .: . ..::..: : :: :. . .:.: :: ..:. :.. CCDS10 TTSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRPIFYY-------RGDTLMAATLGQH 350 360 370 380 390 400 410 420 430 440 pF1KE0 KAHFFTQGSAHSDTTAD-PACHAS--SSLTAH------EPPLLYDLSKDPGENYNLLGGV ::::.: .. . : .. :..:.: . ::.. :..:::: . : CCDS10 KAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPL---- 400 410 420 430 440 450 450 460 470 480 490 500 pF1KE0 AGATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQIC-------CHPGCTPRPA . :. : .::... . : . :.. :.: : :..: ::: CCDS10 SFASAEYQEALSRITSVVQQHQEALV--PAQ------PQLNVCNWAVMNWAPPGCEKLGK 460 470 480 490 500 pF1KE0 CCHCPDPHA : :. CCDS10 CLTPPESIPKKCLWSH 510 520 >>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa) initn: 716 init1: 259 opt: 709 Z-score: 736.1 bits: 145.8 E(32554): 1.1e-34 Smith-Waterman score: 972; 36.6% identity (60.1% similar) in 519 aa overlap (15-504:28-522) 10 20 30 40 pF1KE0 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSST .: . .. ::.:.:.:::.:.:::: .. CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 TPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSSRGGLPLEEV : :::..:. :.::.::.. .: :.::::.:::::: .: :. . : .: :::::.:. CCDS11 TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAV-TSVGGLPLNET 70 80 90 100 110 110 120 130 140 150 160 pF1KE0 TVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCF--P :.:::: ::.::. ::::: : .:.. : .:: ..:::::::.: : . . : CCDS11 TLAEVLQQAGYVTGIIGKWHL--GHHGSYHPNFRGFDYYFGIPYSHDMG-CTDTPGYNHP 120 130 140 150 160 170 170 180 190 200 210 pF1KE0 PATPCDGG----------CDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMADAQ : : : : : .:: ::.. :: : .: .: : ... :. CCDS11 PCPACPQGDGPSRNLQRDCYTD-VALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRAS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE0 RQDRPFFLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEE . :::.:: : : : : : : ::. .: .: :.:. :: . . : . :. CCDS11 TSGRPFLLYVALAHMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKV-DHTVKEN 240 250 260 270 280 290 280 290 300 310 320 pF1KE0 TLVIFTADNGPETMRM----SRGGCSGLLRCGKG------TTYEGGVREPALAFWPGHIA :.. ::.:::: ... : : .:. . .: ::.::: : ::::.:::.. CCDS11 TFLWFTGDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVP 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE0 PGVTHE-LASSLDLLPTLAALAGAPLPN-VTLDGFDLSPLLLGTGKSPRQSLFFYPSY-- .:: : : ::..::..::: : ::. .:: :.: .:.: .. : . ..:.:. CCDS11 VNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGA 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE0 PDEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENY : .. .:: .::: ..: :. : .. : . :. ::...: : .: CCDS11 AGEFGALQTVRLERYKAFYITGGARACDGSTGPELQ-------HKFPLIFNLEDDTAEAV 420 430 440 450 460 450 460 470 480 490 pF1KE0 NLLGGVA---GATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPR : : : .. ::: ..: .. :. .. . :.. .::.. ::. : CCDS11 PLERGGAEYQAVLPEVRKVLADV------LQDIANDNISSADYTQDPSVTPCCN----PY 470 480 490 500 510 500 pF1KE0 PACCHCPDPHA :.: CCDS11 QIACRCQAA 520 >>CCDS43334.1 ARSB gene_id:411|Hs108|chr5 (413 aa) initn: 533 init1: 197 opt: 517 Z-score: 538.9 bits: 109.0 E(32554): 1.1e-23 Smith-Waterman score: 551; 32.5% identity (55.7% similar) in 397 aa overlap (6-383:25-401) 10 20 30 pF1KE0 MSMGAPRSLLLALA---AGLAVARPPNIVLIFADDLGYGDL : ::: :: .: ...:::..:...:::::..:. CCDS43 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 GCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS : .: ::.:: :::::. . ..:. ::::::. ::::: .: :. .. : . CCDS43 GFHGS-RIRTPHLDALAAGGVLLDNYYTQ-PLCTPSRSQLLTGRYQIRTGLQHQIIWPCQ 70 80 90 100 110 100 110 120 130 140 150 pF1KE0 RGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGI------PYS . .::.: . ..: :: : :.::::::. . :: ..:: ..: :: CCDS43 PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY-RKECLPTRRGFDTYFGYLLGSEDYYS 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 HDQGPCQNLTCFPPATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMA :.. : . . .: : .: :. . : .:. . CCDS43 HER--CTLIDALN-VTRCALDFRDGEEVATGYKNMYSTNI------FTKRAIALITN--- 180 190 200 210 220 220 230 240 250 260 pF1KE0 DAQRQDRPFFLYYASHHTHYP------QFSGQSFAERSGRGPFGDSLMELDAAVGTLMTA . ..:.::: : . .: : .. .: . ..: .. . .: :::.. .: CCDS43 --HPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAA 230 240 250 260 270 280 270 280 290 300 310 320 pF1KE0 IGDLGLLEETLVIFTADNGPETMRMSRGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAP . . :: ..:. ::..::: .:. :: . :: : . .::::: ... : CCDS43 LKSSGLWNNTVFIFSTDNGGQTLA---GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQK 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE0 GVTH-ELASSLDLLPTLAALA-GAPLPNVTLDGFDLSPLLLGTGKSPRQSLFFY--PSYP :: . :: : ::::. :: : . :::::. . . ::: :. :.. CCDS43 GVKNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFV 350 360 370 380 390 400 390 400 410 420 430 440 pF1KE0 DEVRGVFAVRTGKYKAHFFTQGSAHSDTTADPACHASSSLTAHEPPLLYDLSKDPGENYN : CCDS43 DSSPYWPECSLLL 410 >>CCDS4043.1 ARSB gene_id:411|Hs108|chr5 (533 aa) initn: 533 init1: 197 opt: 517 Z-score: 537.4 bits: 109.1 E(32554): 1.3e-23 Smith-Waterman score: 569; 30.0% identity (53.8% similar) in 526 aa overlap (6-485:25-523) 10 20 30 pF1KE0 MSMGAPRSLLLALA---AGLAVARPPNIVLIFADDLGYGDL : ::: :: .: ...:::..:...:::::..:. CCDS40 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 GCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS : .: ::.:: :::::. . ..:. ::::::. ::::: .: :. .. : . CCDS40 GFHGS-RIRTPHLDALAAGGVLLDNYYTQ-PLCTPSRSQLLTGRYQIRTGLQHQIIWPCQ 70 80 90 100 110 100 110 120 130 140 150 pF1KE0 RGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGI------PYS . .::.: . ..: :: : :.::::::. . :: ..:: ..: :: CCDS40 PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY-RKECLPTRRGFDTYFGYLLGSEDYYS 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 HDQGPCQNLTCFPPATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMA :.. : . . .: : .: :. . : .:. . CCDS40 HER--CTLIDALN-VTRCALDFRDGEEVATGYKNMYSTNI------FTKRAIALITN--- 180 190 200 210 220 220 230 240 250 260 pF1KE0 DAQRQDRPFFLYYASHHTHYP------QFSGQSFAERSGRGPFGDSLMELDAAVGTLMTA . ..:.::: : . .: : .. .: . ..: .. . .: :::.. .: CCDS40 --HPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAA 230 240 250 260 270 280 270 280 290 300 310 320 pF1KE0 IGDLGLLEETLVIFTADNGPETMRMSRGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAP . . :: ..:. ::..::: .:. :: . :: : . .::::: ... : CCDS40 LKSSGLWNNTVFIFSTDNGGQTLA---GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQK 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE0 GVTH-ELASSLDLLPTLAALA-GAPLPNVTLDGFDLSPLLLGTGKSPRQSLFFY--PSYP :: . :: : ::::. :: : . :::::. . . ::: :. :.. CCDS40 GVKNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFV 350 360 370 380 390 400 390 400 410 420 pF1KE0 DEV---RGVFA-----VRTGKYKAHFFTQGSA--HSD---TTADPAC---------HASS : :. .: .:.: . .: :.. :. :.: . : CCDS40 DSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVS 410 420 430 440 450 460 430 440 450 460 470 pF1KE0 SLTAHEPPL----LYDLSKDPGENYNLLGGVAGATPEVL-QALKQLQLLKAQLDAAVTFG . . .:: :.:...:: : ..: . :... . :..::. . . .. : : CCDS40 EIPSSDPPTKTLWLFDIDRDPEERHDL----SREYPHIVTKLLSRLQFYHKH-SVPVYF- 470 480 490 500 510 480 490 500 pF1KE0 PSQVARGEDPALQICCHPGCTPRPACCHCPDPHA :.: : :: CCDS40 PAQDPRC-DPKATGVWGPWM 520 530 >>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa) initn: 814 init1: 292 opt: 422 Z-score: 438.5 bits: 90.9 E(32554): 4.2e-18 Smith-Waterman score: 794; 33.0% identity (57.4% similar) in 528 aa overlap (8-462:20-542) 10 20 30 40 pF1KE0 MSMGAPRSLLLALA----AGLAVARPPNIVLIFADDLGYGDLGCYGHP ..::.:: . ....:: ::.:..::::: ::.::::. CCDS14 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRP-NILLLMADDLGIGDIGCYGNN 10 20 30 40 50 50 60 70 80 90 pF1KE0 SSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLV-----PSSR . :::.:.:: :...:. .:::::::::.:::: ::: :: .. .. CCDS14 TMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE0 GGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGA----FLPPHQGFHRFLGIPYSHDQ :::: .:.: :..: .:: ::. ::::::.. :.: : :.:: .: :.:.: . CCDS14 GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSL-M 120 130 140 150 160 170 160 170 180 190 pF1KE0 GPCQNLTCFPPATPCDGGCD-----QGLVPIPLLANLSVEAQP-PWLPG----------L : : . . . .:: . :.:. .. : :.: : CCDS14 GDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLL 180 190 200 210 220 230 200 210 220 pF1KE0 EARYMAFAHDLMADA---------------QR----------------QDRPFFLYYASH . :.. : . :: :: . ::.:. . CCDS14 ASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFL 240 250 260 270 280 290 230 240 250 260 270 280 pF1KE0 HTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGP-- :.: : .. ..: .: .: .::.. :.: :: .. .. :: . ::. ::.:.: CCDS14 HVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSL 300 310 320 330 340 350 290 300 310 320 330 340 pF1KE0 --ETMRMSRGGCSGLLRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTL . . :: .:. . ::: .:::.: :.. ::: . : : : .: .:..::. CCDS14 ENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTV 360 370 380 390 400 410 350 360 370 380 390 pF1KE0 AALAGAPLP-NVTLDGFDLSPLLLGTGK-SPRQSLFFY-PSYPDEVRGVFAVRTGKYKAH . :::. .: . ..:: :: ::::::.. : .. :. : . .: : .:.: CCDS14 VRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVH 420 430 440 450 460 470 400 410 420 430 440 450 pF1KE0 FFT---QGSAHSDTTADPACHA-SSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVL : : : . . . .: . ... :.::::.:::.::.:.. : . .. : CCDS14 FVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHIL---TPASEPVFY 480 490 500 510 520 530 460 470 480 490 500 pF1KE0 QALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA :.....: CCDS14 QVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 540 550 560 570 580 >>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa) initn: 814 init1: 292 opt: 422 Z-score: 438.3 bits: 90.9 E(32554): 4.3e-18 Smith-Waterman score: 794; 33.0% identity (57.4% similar) in 528 aa overlap (8-462:45-567) 10 20 30 pF1KE0 MSMGAPRSLLLALA----AGLAVARPPNIVLIFADDL ..::.:: . ....:: ::.:..:::: CCDS75 LMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRP-NILLLMADDL 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE0 GYGDLGCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGV : ::.::::. . :::.:.:: :...:. .:::::::::.:::: ::: :: .. CCDS75 GIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSI 80 90 100 110 120 130 100 110 120 130 140 pF1KE0 LV-----PSSRGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGA----FLPPHQGFH .. :::: .:.: :..: .:: ::. ::::::.. :.: : :.:: CCDS75 GYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFD 140 150 160 170 180 190 150 160 170 180 190 pF1KE0 RFLGIPYSHDQGPCQNLTCFPPATPCDGGCD-----QGLVPIPLLANLSVEAQP-PWLPG .: :.:.: .: : . . . .:: . :.:. .. : :.: CCDS75 HFYGMPFSL-MGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPV 200 210 220 230 240 250 200 210 pF1KE0 ----------LEARYMAFAHDLMADA---------------QR----------------Q : . :.. : . :: :: . CCDS75 IWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNK 260 270 280 290 300 310 220 230 240 250 260 270 pF1KE0 DRPFFLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETL ::.:. . :.: : .. ..: .: .: .::.. :.: :: .. .. :: . :: CCDS75 HGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTL 320 330 340 350 360 370 280 290 300 310 320 330 pF1KE0 VIFTADNGP----ETMRMSRGGCSGLLRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHE . ::.:.: . . :: .:. . ::: .:::.: :.. ::: . : : : CCDS75 IYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGE 380 390 400 410 420 430 340 350 360 370 380 pF1KE0 LASSLDLLPTLAALAGAPLP-NVTLDGFDLSPLLLGTGK-SPRQSLFFY-PSYPDEVRGV .: .:..::.. :::. .: . ..:: :: ::::::.. : .. :. : . .: CCDS75 PTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWH 440 450 460 470 480 490 390 400 410 420 430 440 pF1KE0 FAVRTGKYKAHFFT---QGSAHSDTTADPACHA-SSSLTAHEPPLLYDLSKDPGENYNLL : .:.:: : : . . . .: . ... :.::::.:::.::.:.. : CCDS75 QRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHIL- 500 510 520 530 540 550 450 460 470 480 490 500 pF1KE0 GGVAGATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHC . .. : :.....: CCDS75 --TPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLR 560 570 580 590 600 >>CCDS14127.1 STS gene_id:412|Hs108|chrX (583 aa) initn: 905 init1: 293 opt: 421 Z-score: 437.5 bits: 90.7 E(32554): 4.7e-18 Smith-Waterman score: 861; 35.3% identity (58.0% similar) in 533 aa overlap (3-462:6-531) 10 20 30 40 50 pF1KE0 MSMGAPRSLLLAL--AAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLA : : ::. : : . :..:: ::.:..::::: :: ::::. . :::.:.:: CCDS14 MPLRKMKIPFLLLFFLWEAESHAASRP-NIILVMADDLGIGDPGCYGNKTIRTPNIDRLA 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 AGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGM----YPGV-LVPSSRGGLPLEEVTVA .::...:. . ::::::::..::: ::: :: :: : .: :::: .:.: : CCDS14 SGGVKLTQHLAASPLCTPSRAAFMTGRYPVRSGMASWSRTGVFLFTASSGGLPTDEITFA 60 70 80 90 100 110 120 130 140 150 160 pF1KE0 EVLAARGYLTGMAGKWHLGVG--PEGAFL--PPHQGFHRFLGIPYSH--DQGPCQN---- ..: .:: :.. ::::::.. . : : :.::. : :: .. : : .. CCDS14 KLLKDQGYSTALIGKWHLGMSCHSKTDFCHHPLHHGFNYFYGISLTNLRDCKPGEGSVFT 120 130 140 150 160 170 170 180 pF1KE0 -----LTCFP-----------PATPCDG------------------------GCDQGLVP :. .: : : : : . . : CCDS14 TGFKRLVFLPLQIVGVTLLTLAALNCLGLLHVPLGVFFSLLFLAALILTLFLGFLHYFRP 180 190 200 210 220 230 190 200 210 220 230 pF1KE0 IP--LLANLSVEAQPPWLPGLEARYMAFAHDLMADAQRQ-DRPFFLYYASHHTHYPQFSG . .. : . :: .: : . : ... ::. . ::.: . :.: ::. CCDS14 LNCFMMRNYEIIQQPMSYDNLTQRLTVEAAQFI---QRNTETPFLLVLSYLHVHTALFSS 240 250 260 270 280 290 240 250 260 270 280 290 pF1KE0 QSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMS----- ..:: .: .: .::.. :.: .:: ... . .: : ..::. ::.:.: .. ..: CCDS14 KDFAGKSQHGVYGDAVEEMDWSVGQILNLLDELRLANDTLIYFTSDQGAHVEEVSSKGEI 300 310 320 330 340 350 300 310 320 330 340 350 pF1KE0 RGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAPGVT-HELASSLDLLPTLAALAGAPLP .:: .:. . ::....:::.: :.. :: : : : .:..:..::.: ::::::: CCDS14 HGGSNGIYKGGKANNWEGGIRVPGILRWPRVIQAGQKIDEPTSNMDIFPTVAKLAGAPLP 360 370 380 390 400 410 360 370 380 390 400 pF1KE0 -NVTLDGFDLSPLLLG-TGKSPRQSLFFY-PSYPDEVRGVFAVRTGKYKAHFFTQGSAHS . .:: :: ::: : . .: .. :: : .: . :: :. .:: ::: . CCDS14 EDRIIDGRDLMPLLEGKSQRSDHEFLFHYCNAYLNAVRWHPQNSTSIWKAFFFTPNFNPV 420 430 440 450 460 470 410 420 430 440 450 460 pF1KE0 DTTADPACHA----SSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLL ... : :. .: .: :.::::.:.:::: : : . .. :. . :: .: CCDS14 GSNGCFATHVCFCFGSYVTHHDPPLLFDISKDPRERNPL---TPASEPRFYEILKVMQEA 480 490 500 510 520 530 470 480 490 500 pF1KE0 KAQLDAAVTFGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA CCDS14 ADRHTQTLPEVPDQFSWNNFLWKPWLQLCCPSTGLSCQCDREKQDKRLSR 540 550 560 570 580 >>CCDS35198.1 ARSH gene_id:347527|Hs108|chrX (562 aa) initn: 791 init1: 295 opt: 401 Z-score: 417.1 bits: 86.9 E(32554): 6.6e-17 Smith-Waterman score: 777; 34.3% identity (57.3% similar) in 490 aa overlap (23-443:7-495) 10 20 30 40 50 60 pF1KE0 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR :::::..::::: ::: :::. : .:::.:.::. :.: CCDS35 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVR 10 20 30 40 70 80 90 100 110 pF1KE0 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS------RGGLPLEEVTVAEVLA .:. . .:.:::::::.:::: :.: :: . . . :::: .:.: :..: CCDS35 LTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQ 50 60 70 80 90 100 120 130 140 150 160 pF1KE0 ARGYLTGMAGKWHLGVG----PEGAFLPPHQGFHRFLGIPYSHDQGPCQ-----NLTCFP ::: ::. ::::::.. . . : ..::: : :.:.. . :: .: . CCDS35 HRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGL-LSDCQASKTPELHRWL 110 120 130 140 150 160 170 180 190 200 pF1KE0 PATPCDGGCDQGLVP----IPLLAN-LSVEAQ-------------PPWLP--GLEARY-- . .::: :: .: .:: . : :. :. CCDS35 RIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNC 170 180 190 200 210 220 210 220 230 240 pF1KE0 -MAFAHDLMADAQRQDR-------------------PFFLYYASHHTHYPQFSGQSFAER . :... . ..... ::.:... :.: : .: ..:. : CCDS35 ILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGR 230 240 250 260 270 280 250 260 270 280 290 pF1KE0 SGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNG----PETMRMSRGGCSGL : : .::.. :.: :: .. :. . : ..::: ::.::: : .. :: .:. CCDS35 SKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGI 290 300 310 320 330 340 300 310 320 330 340 350 pF1KE0 LRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTLAALAGAPLP-NVTLD . ::: .:::.: :.. ::. . : : .: .: .:. :::. ..:. : . ..: CCDS35 YKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVID 350 360 370 380 390 400 360 370 380 390 400 410 pF1KE0 GFDLSPLLLG-TGKSPRQSLFFYPS-YPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTA-- : .: ::: : ...: .. :: : . : :: . .:::. : : : CCDS35 GQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACY 410 420 430 440 450 460 420 430 440 450 460 470 pF1KE0 -DPACHASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAA . : :...: :.::::.:.:.::.: : CCDS35 GSGICSCSGDVTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTP 470 480 490 500 510 520 480 490 500 pF1KE0 VTFGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA CCDS35 VPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP 530 540 550 560 509 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 15:20:22 2016 done: Thu Nov 3 15:20:23 2016 Total Scan time: 3.540 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]