FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0376, 562 aa 1>>>pF1KE0376 562 - 562 aa - 562 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6161+/-0.000866; mu= 17.2403+/- 0.052 mean_var=70.8936+/-14.787, 0's: 0 Z-trim(106.6): 28 B-trim: 9 in 1/48 Lambda= 0.152325 statistics sampled from 9038 (9063) to 9038 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.278), width: 16 Scan time: 3.050 The best scores are: opt bits E(32554) CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 3976 883.1 0 CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 2651 591.9 7e-169 CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 2429 543.1 3.4e-154 CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 2429 543.2 3.5e-154 CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 2410 539.0 6.1e-153 CCDS75949.1 ARSE gene_id:415|Hs108|chrX ( 544) 2283 511.0 1.4e-144 CCDS14127.1 STS gene_id:412|Hs108|chrX ( 583) 2063 462.7 5.5e-130 CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 414 100.3 6.1e-21 CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 401 97.4 4.3e-20 CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 376 92.0 2e-18 CCDS46736.1 ARSA gene_id:410|Hs108|chr22 ( 423) 342 84.4 2.9e-16 CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 305 76.3 8.1e-14 CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 305 76.4 1e-13 CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 261 66.7 8.7e-11 >>CCDS35198.1 ARSH gene_id:347527|Hs108|chrX (562 aa) initn: 3976 init1: 3976 opt: 3976 Z-score: 4719.4 bits: 883.1 E(32554): 0 Smith-Waterman score: 3976; 100.0% identity (100.0% similar) in 562 aa overlap (1-562:1-562) 10 20 30 40 50 60 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 AFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 SCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 LLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 VASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 GKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 GIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 EFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ 490 500 510 520 530 540 550 560 pF1KE0 PCCGTFPFCGCDKEDDILPMAP :::::::::::::::::::::: CCDS35 PCCGTFPFCGCDKEDDILPMAP 550 560 >>CCDS35196.1 ARSD gene_id:414|Hs108|chrX (593 aa) initn: 2293 init1: 1859 opt: 2651 Z-score: 3145.4 bits: 591.9 E(32554): 7e-169 Smith-Waterman score: 2651; 64.8% identity (84.5% similar) in 560 aa overlap (2-559:35-593) 10 20 30 pF1KE0 MTRNA-RPNIVLLMADDLGVGDLCCYGNNSV : :: .:::.:.::::::.::: :::::.. CCDS35 ARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYGNNTL 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 STPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSG :::::.:: :::::::::::: .::::::::::::. .:::: .: : ::. : .::: CCDS35 RTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGM-DASNGYRALQWNAGSG 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 GLPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSD ::: ::::::..::..:: :::::::: :..::::.:::.::::::: ::::.:: : .: CCDS35 GLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTLTND 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE0 CQASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTS :. .. ::. :: .:: : ::: . : . .::: ... .: .. ::: : CCDS35 CDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGVGCLFFIS 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 WYSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHV ::::.::.:::::::::::.. .::: ::.::::::::...:::.:. :::::.:.::: CCDS35 WYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSLLHV 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE0 HTPLISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEP : ::.. . :.:.:..: ::::::::::..::.:.:.... : : :..:::::.::::: CCDS35 HIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGHLEA 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE0 LDGAVQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSY :: ::::::::::::::::::::::::::::.::.:: :::::.:::::::..::. CCDS35 RDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPTVVQ 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE0 IGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYV . :: . :::::::..:.:::.: ..: ::::::::: .::..:::::: ..:::.::. CCDS35 LVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKVHYT 430 440 450 460 470 480 460 470 480 490 500 pF1KE0 TPKFYPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKK ::.:.:::.::::: :.: :::. ::.: ::::::.::::::: ::.::.:::. .:: . CCDS35 TPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAVIAR 490 500 510 520 530 540 510 520 530 540 550 560 pF1KE0 MEAAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP . ::. :::.::.:::::::. : .:::::::::: ::::.: .. : : CCDS35 VGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP 550 560 570 580 590 >>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa) initn: 2066 init1: 1642 opt: 2429 Z-score: 2881.8 bits: 543.1 E(32554): 3.4e-154 Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:36-587) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN .::::.::::::::.::. :::::.. ::: CCDS14 HSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT ::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.:::::: CCDS14 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS :::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..:: CCDS14 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS . : . :. :: . .:::: . :. :... . : : .. :: : :...: : CCDS14 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL .. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: :: CCDS14 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA :. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: : CCDS14 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG .: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..:: CCDS14 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF . ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: : CCDS14 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA :::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... : CCDS14 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA 490 500 510 520 530 540 520 530 540 550 560 pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP . ::.:::.::: :.. ...::.:::::::: ::.: : .::: CCDS14 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 550 560 570 580 >>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa) initn: 2066 init1: 1642 opt: 2429 Z-score: 2881.5 bits: 543.2 E(32554): 3.5e-154 Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:61-612) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN .::::.::::::::.::. :::::.. ::: CCDS75 QISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN 40 50 60 70 80 90 40 50 60 70 80 90 pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT ::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.:::::: CCDS75 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT 100 110 120 130 140 100 110 120 130 140 150 pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS :::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..:: CCDS75 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS . : . :. :: . .:::: . :. :... . : : .. :: : :...: : CCDS75 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL .. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: :: CCDS75 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA :. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: : CCDS75 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN 330 340 350 360 370 380 340 350 360 370 380 390 pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG .: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..:: CCDS75 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG 390 400 410 420 430 440 400 410 420 430 440 450 pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF . ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: : CCDS75 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF 450 460 470 480 490 500 460 470 480 490 500 510 pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA :::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... : CCDS75 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA 510 520 530 540 550 560 520 530 540 550 560 pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP . ::.:::.::: :.. ...::.:::::::: ::.: : .::: CCDS75 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 570 580 590 600 610 >>CCDS14123.1 ARSF gene_id:416|Hs108|chrX (590 aa) initn: 2139 init1: 1519 opt: 2410 Z-score: 2859.2 bits: 539.0 E(32554): 6.1e-153 Smith-Waterman score: 2410; 60.2% identity (82.0% similar) in 560 aa overlap (6-562:29-586) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDR .:::::.:.::::.::: ::::... ::.::: CCDS14 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 LASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNET :: ::::::::..:::.:.:::.:::::::::::::::. : :.. :. .::: ::: CCDS14 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGN-RRVIQNLAVPAGLPLNET 70 80 90 100 110 100 110 120 130 140 150 pF1KE0 TFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTP :.: ::...:: :::::::: ::.: ::.:.:.:: :.:: :.::.:: :...: . . CCDS14 TLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSR 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 ELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGF . . .. .::. . .:.. . : . :.. : :::: .:: . :. ::. .:.::. CCDS14 NTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE0 TRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISK :.:.:::.::: .:::: :...:.:.:::..:.::...: :::::::::::::: . CCDS14 PLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTT 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE0 KKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQL :.: ::.: ::::::::: ::::::::.:. : :.::::::::.::::: : .:: CCDS14 DDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQL 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE0 GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILS ::::::::::::::::::::::::: :::. . :::.:.:::::::: ::.. ..:: : CCDS14 GGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLP 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE0 QDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKD-CATVWKAHYVTPKFYP :::::::..:::::.: . ::.::::::::: :::.::: :: ..::::::::: : : CCDS14 QDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQP 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE0 EGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIR ..:.:: ...: : :. ::::.::::::.::::::. ::.: .::: : ::::. :.. CCDS14 PASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALK 480 490 500 510 520 530 520 530 540 550 560 pF1KE0 EHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI-LPMAP ::..:..:: :.: .: . ::.::::.:::: ::::... : .: CCDS14 EHQETIVPVTYQLSELNQ-GRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR 540 550 560 570 580 590 >>CCDS75949.1 ARSE gene_id:415|Hs108|chrX (544 aa) initn: 1674 init1: 1642 opt: 2283 Z-score: 2708.9 bits: 511.0 E(32554): 1.4e-144 Smith-Waterman score: 2283; 60.3% identity (82.3% similar) in 526 aa overlap (32-556:18-542) 10 20 30 40 50 60 pF1KE0 TRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRAA :::::::: .::.::::..:::.::::::: CCDS75 MSGSRERDNMLHLHHSWTPNIDRLAEDGVKLTQHISAASLCTPSRAA 10 20 30 40 70 80 90 100 110 120 pF1KE0 FLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGLS :::::::.::::::. . :.. : :.:::::::::::::.:...:: :::::::::::. CCDS75 FLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLN 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE0 CASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFLL : : .:::.:::.::: .:::.::.:..:: . : . :. :: . .:::: . : CCDS75 CESASDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTL 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE0 LIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEKV . :... . : : .. :: : :...: : .. . .:.::::: : .::: ... CCDS75 VAGKLTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRT 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE0 ASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMVG . :.:.:. .:..: :. ::::: :::::: :::. ..:.:.: .: ::::::::::::: CCDS75 TPLILQEVASFLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVG 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE0 KILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVPG .:::.:: : :.: ::.:::::.:: :: : .: :::::::::::::::::::::::: CCDS75 RILDTLDVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPG 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE0 IFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDHE :::::.:: :::::.:::::::..::. ..:: . ::::::::.:.::: : :.::::: CCDS75 IFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHE 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE0 FLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGD-VTYHDPP ::.::: .::..::::.: .:.::.:.::: : :::.::::: .: : :. :..:::: CCDS75 FLMHYCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPP 410 420 430 440 450 460 490 500 510 520 530 540 pF1KE0 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ ::::.::::::. :.: .::.: .:..... :. ::.:::.::: :.. ...::.:::: CCDS75 LLFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQ 470 480 490 500 510 520 550 560 pF1KE0 PCCGTFPFCGCDKEDDILPMAP :::: ::.: : .::: CCDS75 PCCGPFPLCWCLREDDPQ 530 540 >>CCDS14127.1 STS gene_id:412|Hs108|chrX (583 aa) initn: 1745 init1: 1339 opt: 2063 Z-score: 2447.2 bits: 462.7 E(32554): 5.5e-130 Smith-Waterman score: 2063; 53.5% identity (78.3% similar) in 557 aa overlap (5-554:25-575) 10 20 30 40 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLAS .::::.:.::::::.:: ::::... ::::::::: CCDS14 MPLRKMKIPFLLLFFLWEAESHAASRPNIILVMADDLGIGDPGCYGNKTIRTPNIDRLAS 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 EGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFA ::.:::::::. .::::::::.:::::.::::.: .. . .: . ..::::::.: ::: CCDS14 GGVKLTQHLAASPLCTPSRAAFMTGRYPVRSGMAS-WSRTGVFLFTASSGGLPTDEITFA 70 80 90 100 110 110 120 130 140 150 pF1KE0 KLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASK----T :::. .:: :.::::::::.:: :..: :.:::.:::.::::. . : ::. .. : CCDS14 KLLKDQGYSTALIGKWHLGMSCHSKTDFCHHPLHHGFNYFYGISLTNLRDCKPGEGSVFT 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 PELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYG ..: . . : : :.: . : . . :: :.: . .:: :..: . . CCDS14 TGFKRLVFLPLQIVGVTLLTLAALNCLG----LLHVPLGVFFSLLFLAALILTLFLGFLH 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE0 FTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLIS . : ::..:::.:::::::. ..... . :: ::.: . :::: .:.::::: :.: CCDS14 YFRPLNCFMMRNYEIIQQPMSYDNLTQRLTVEAAQFIQRNTETPFLLVLSYLHVHTALFS 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE0 KKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQ .: :.:.:..: ::: :::::: ::.::. ::. :::: ::.:::::.:.:.: ... . CCDS14 SKDFAGKSQHGVYGDAVEEMDWSVGQILNLLDELRLANDTLIYFTSDQGAHVEEVSSKGE 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE0 L-GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGI . :: ::::::::. ..::::::::::.::: :..::. :.:::: :::.::.. ..:. CCDS14 IHGGSNGIYKGGKA-NNWEGGIRVPGILRWPRVIQAGQKIDEPTSNMDIFPTVAKLAGAP 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE0 LSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFY : .::.:::..:::::::....::::::::::..::..:::: .. ...::: . ::.: CCDS14 LPEDRIIDGRDLMPLLEGKSQRSDHEFLFHYCNAYLNAVRWHPQNSTSIWKAFFFTPNFN 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE0 PEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAI : :...:... .: : :. ::.::::::::::.:: : ::.: .:: : ..: :. : CCDS14 PVGSNGCFATHVCFCFGSYVTHHDPPLLFDISKDPRERNPLTPASEPRFYEILKVMQEAA 480 490 500 510 520 530 520 530 540 550 560 pF1KE0 REHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPF-CGCDKEDDILPMAP .: .:: ::.::: : .:::::: :: . . : ::.: CCDS14 DRHTQTLPEVPDQFSWNNFLWKPWLQLCCPSTGLSCQCDREKQDKRLSR 540 550 560 570 580 >>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa) initn: 828 init1: 260 opt: 414 Z-score: 489.5 bits: 100.3 E(32554): 6.1e-21 Smith-Waterman score: 862; 32.7% identity (57.8% similar) in 548 aa overlap (7-549:31-507) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNID :::.::. ::.: ::: ::. : :::.: CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 RLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNR-AFTWLGGSGGLPTN :.:.::. . . .: .:.:::::.:::: :::.:. .. : :.: ::.: . CCDS10 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 ETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASK : . .::.. :: . ..:::::: : . .:::.::: ..: : .:. . CCDS10 EQLLPELLKKAGYVSKIVGKWHLG----HRPQ--FHPLKHGFDEWFGSP-----NCHFGP 130 140 150 160 160 170 180 190 200 210 pF1KE0 TPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSY . : : :: . : : .: . CCDS10 YDNKAR----------------PN---IPVYRDWEMVG----------------RYYEEF 170 180 190 220 230 240 250 260 270 pF1KE0 GFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKRE-PFLLFFSFLHVHTPL :. : ......:.::: ::.: :. ::.:... .:.:. CCDS10 P---------------INLKTGEANLTQIYLQEALDFIKRQARHHPFFLYWAVDATHAPV 200 210 220 230 280 290 300 310 320 330 pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA ..: :.: :. ::::: :.:.: .::::. :.. ..:..:.:.::::::. : .: CCDS10 YASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGA---ALISA 240 250 260 270 280 290 340 350 360 370 380 390 pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG . :: :: . :: . .:::.: :.. ::. . ::.: .. :.::.. : ..: CCDS10 PEQGGSNGPFLCGK-QTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGL 300 310 320 330 340 350 400 410 420 430 440 450 pF1KE0 ILSQDRVIDGQNLMP-LLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPK .::.::: ::.: ::.:: :. .:.: : : .. :. : : . CCDS10 TPPSDRAIDGLNLLPTLLQGRL--MDRP-IFYYRGDTLMAATLGQHK-AHFWTWTNSWEN 360 370 380 390 400 410 460 470 480 490 500 510 pF1KE0 FYPEGTGACYGSGICSCSG-DVTYHDP-PLLFDISRDPSEALPLNPDNEPLFDSVIKKME : .: : :... . . .. : ::.: ..:::.: .::. . .. ..... CCDS10 FR-QGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAE-YQEALSRIT 420 430 440 450 460 520 530 540 550 560 pF1KE0 AAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP .....:...:.:. :..: : : : : . : CCDS10 SVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH 470 480 490 500 510 520 >>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa) initn: 791 init1: 295 opt: 401 Z-score: 474.2 bits: 97.4 E(32554): 4.3e-20 Smith-Waterman score: 797; 32.8% identity (55.7% similar) in 551 aa overlap (7-551:23-501) 10 20 30 40 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVR :::::..::::: ::: :::. : .:::.:.::. :.: CCDS14 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 LTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQ .:. . .:.:::::::.:::: :.: :: . . . :::: .:.: :..: CCDS14 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS------RGGLPLEEVTVAEVLA 70 80 90 100 110 110 120 130 140 150 160 pF1KE0 HRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGL-LSDCQASKTPELHRWL ::: ::. ::::::.. . . : ..::: : :.:.. . :: .: . CCDS14 ARGYLTGMAGKWHLGVG----PEGAFLPPHQGFHRFLGIPYSHDQGPCQ-----NLTCFP 120 130 140 150 160 170 180 190 200 210 220 pF1KE0 RIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNC . .::: :: .: .:: . : :. :. CCDS14 PATPCDGGCDQGLVP----IPLLAN-LSVEAQ-------------PPWLP--GLEARY-- 170 180 190 200 230 240 250 260 270 280 pF1KE0 ILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGR . :... . ..... ::.:... :.: : .: ..:. : CCDS14 -MAFAHDLMADAQRQDR-------------------PFFLYYASHHTHYPQFSGQSFAER 210 220 230 240 290 300 310 320 330 340 pF1KE0 SKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGI : : .::.. :.: :: .. :. . : ..::: ::.::: : .. :: .:. CCDS14 SGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNG----PETMRMSRGGCSGL 250 260 270 280 290 350 360 370 380 390 400 pF1KE0 YKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVID . ::: .:::.: :.. ::. . : : .: .: .:. :::. ..:. : . ..: CCDS14 LRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTLAALAGAPLP-NVTLD 300 310 320 330 340 350 410 420 430 440 450 460 pF1KE0 GQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACY : .: ::: : ...: .. :: : . : :: . .:::. : : : CCDS14 GFDLSPLLLG-TGKSPRQSLFFYPS-YPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTA-- 360 370 380 390 400 410 470 480 490 500 510 520 pF1KE0 GSGICSCSGDVTYHDPPLLFDISRDPSEALPL---NPDNEPLFDSVIKKMEAAIREHRRT . : :...: :.::::.:.:.::.: : : ...:... . . CCDS14 -DPACHASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAA 420 430 440 450 460 470 530 540 550 560 pF1KE0 LTPVPQQFSVFNTIWKPWLQPCC--GTFPFCGCDKEDDILPMAP .: :.: . . : :: :: : : .: CCDS14 VTFGPSQVARGED---PALQICCHPGCTPRPACCHCPDPHA 480 490 500 >>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa) initn: 798 init1: 244 opt: 376 Z-score: 444.3 bits: 92.0 E(32554): 2e-18 Smith-Waterman score: 773; 31.1% identity (58.1% similar) in 570 aa overlap (2-551:31-522) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVS ::. .::.:...:::.: ::: .. . CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 TPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGG : :.:..::::.:... :::: :.::::..:::: .:.:.. : :. . . :: CCDS11 TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVT------RNFA-VTSVGG 70 80 90 100 110 100 110 120 130 140 150 pF1KE0 LPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDC :: ::::.:..::. :: ::.::::::: . ::: .:: :..:.:.. : CCDS11 LPLNETTLAEVLQQAGYVTGIIGKWHLG------HHGSYHPNFRGFDYYFGIPYSHDMGC 120 130 140 150 160 160 170 180 190 200 210 pF1KE0 QASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSW . :: .. : :. . : . . . CCDS11 --TDTPGYNH----------------PPCPACPQG----DGPSRNL----------QRDC 170 180 190 220 230 240 250 260 pF1KE0 YSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKR--EPFLLFFSFLH :.. .. :..: .:..::.. ..:. . ..: ::.: . .::::. .. : CCDS11 YTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALAH 200 210 220 230 240 270 280 290 300 310 320 pF1KE0 VHTPL-ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHL .:.:: ... . :.. . :: .. ::: .::.: : .:. . ..:...::.::: CCDS11 MHVPLPVTQLPAAPRGR-SLYGAGLWEMDSLVGQIKDKVDHT-VKENTFLWFTGDNGPWA 250 260 270 280 290 300 330 340 350 360 370 380 pF1KE0 EPLDGAVQLGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMD . . : ..: ..:... .: . :::: :::.. ::. . .. . . :..: CCDS11 QKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVLD 310 320 330 340 350 360 390 400 410 420 430 pF1KE0 IYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFH----YCGVY--LHTVRWH :.::. .. . : : : .:: .. .: :: :. :. ::: : . :.::: . CCDS11 IFPTVVALAQASLPQGRRFDGVDVSEVLFGR-SQPGHRVLFHPNSGAAGEFGALQTVRLE 370 380 390 400 410 420 440 450 460 470 480 490 pF1KE0 QKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPPLLFDISRDPSEALPLNP . .:: :.: :. :: :: .: : ::.:.. : .::.::. CCDS11 R------YKAFYITG-----GARACDGS-----TGPELQHKFPLIFNLEDDTAEAVPLER 430 440 450 460 470 500 510 520 530 540 550 pF1KE0 DNEPLFDSVIKKMEAAIREHRRTLTPVPQQF-----SVFNTIWKPWLQPCCGTFPF-CGC . ...:.. : :..:. : :.. : . : . :::. . . : : CCDS11 GG--------AEYQAVLPEVRKVLADVLQDIANDNISSADYTQDPSVTPCCNPYQIACRC 480 490 500 510 520 560 pF1KE0 DKEDDILPMAP CCDS11 QAA 562 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 13:30:26 2016 done: Thu Nov 3 13:30:27 2016 Total Scan time: 3.050 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]