FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2430, 533 aa 1>>>pF1KE2430 533 - 533 aa - 533 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5349+/-0.000704; mu= 18.3882+/- 0.043 mean_var=86.0476+/-17.018, 0's: 0 Z-trim(111.9): 27 B-trim: 0 in 0/52 Lambda= 0.138263 statistics sampled from 12733 (12760) to 12733 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.744), E-opt: 0.2 (0.392), width: 16 Scan time: 3.130 The best scores are: opt bits E(32554) CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 3754 758.5 4.3e-219 CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 2797 567.5 1e-161 CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 ( 599) 1750 358.8 1e-98 CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 1729 354.6 1.8e-97 CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 539 117.2 4.7e-26 CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 516 112.6 1.1e-24 CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 354 80.3 6.7e-15 CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 349 79.3 1.3e-14 CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 349 79.4 1.4e-14 CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 334 76.3 9.7e-14 CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 331 75.8 1.6e-13 CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 305 70.6 5.6e-12 >>CCDS4043.1 ARSB gene_id:411|Hs108|chr5 (533 aa) initn: 3754 init1: 3754 opt: 3754 Z-score: 4046.9 bits: 758.5 E(32554): 4.3e-219 Smith-Waterman score: 3754; 99.8% identity (100.0% similar) in 533 aa overlap (1-533:1-533) 10 20 30 40 50 60 pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::.:: CCDS40 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLVKL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 EYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTLWLFDIDRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 EYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTLWLFDIDRD 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 PEERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATGVWGPWM ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 PEERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATGVWGPWM 490 500 510 520 530 >>CCDS43334.1 ARSB gene_id:411|Hs108|chr5 (413 aa) initn: 2796 init1: 2796 opt: 2797 Z-score: 3016.8 bits: 567.5 E(32554): 1e-161 Smith-Waterman score: 2797; 98.5% identity (99.3% similar) in 411 aa overlap (1-410:1-411) 10 20 30 40 50 60 pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::.:: CCDS43 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLVKL 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPC-PRNSMAPAKDDSSL :::::::::::::::::::::::::::::::::::::::::::: :. :. CCDS43 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPYWPECSLLL 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 PEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTLWLFDIDR >>CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 (599 aa) initn: 1869 init1: 774 opt: 1750 Z-score: 1885.9 bits: 358.8 E(32554): 1e-98 Smith-Waterman score: 1858; 53.7% identity (77.2% similar) in 501 aa overlap (41-532:72-554) 20 30 40 50 60 70 pF1KE2 RGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDVGFHGSRIRTP .. :::.:.:::: :. :::.:::.:.:: CCDS43 GYLSWGQALEEEEEGALLAQAGEKLEPSTTSTSQPHLIFILADDQGFRDVGYHGSEIKTP 50 60 70 80 90 100 80 90 100 110 120 130 pF1KE2 HLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPSCVPLDEKLLP :: ::: :: :.:::.::.:::::::..::.:::.:::::.:: : ::.:.:::. :: CCDS43 TLDKLAAEGVKLENYYVQPICTPSRSQFITGKYQIHTGLQHSIIRPTQPNCLPLDNATLP 110 120 130 140 150 160 140 150 160 170 180 190 pF1KE2 QLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHERCTLIDALNVT : :::.::.::::::::::.:::::.::::::::.:: :::: :::.: .: :. .. CCDS43 QKLKEVGYSTHMVGKWHLGFYRKECMPTRRGFDTFFGSLLGSGDYYTHYKC---DSPGM- 170 180 190 200 210 200 210 220 230 240 pF1KE2 RCALDFRDGEEVATGYKN-MYSTNIFTKRAIALITNHPPEKPLFLYLALQSVHEPLQVPE :. :. .....: : : .:::...:.:. ....: : ::.:::.: :.:: :::.: CCDS43 -CGYDLYENDNAAWDYDNGIYSTQMYTQRVQQILASHNPTKPIFLYIAYQAVHSPLQAPG 220 230 240 250 260 270 250 260 270 280 290 300 pF1KE2 EYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTDNGGQTLAGG .:.. : : . ::..::.:.: .:::..::: :::. :..::...:.:.::::: ::: CCDS43 RYFEHYRSIININRRRYAAMLSCLDEAINNVTLALKTYGFYNNSIIIYSSDNGGQPTAGG 280 290 300 310 320 330 310 320 330 340 350 360 pF1KE2 NNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKLARGHTNGTK .:::::: : . ::::.:.:::: :::::.::. .::.::.:: :::..::.:. . CCDS43 SNWPLRGSKGTYWEGGIRAVGFVHSPLLKNKGTVCKELVHITDWYPTLISLAEGQIDEDI 340 350 360 370 380 390 370 380 390 400 410 420 pF1KE2 PLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLPEYSAFNTSV :::.:.:.::::: :::...:::::: .. ::. : :. .::.. CCDS43 QLDGYDIWETISEGLRSPRVDILHNIDPIYTK-----------AKNGSWAAGYGIWNTAI 400 410 420 430 440 430 440 450 460 470 480 pF1KE2 HAAIRHGNWKLLTGYPGCGYWFPP-------PSQYNVSEIPSSDPPTKTLWLFDIDRDPE ..::: .:::::: :: . : :: :.... .: : :..:::.: :: CCDS43 QSAIRVQHWKLLTGNPGYSDWVPPQSFSNLGPNRWHNERITLSTG--KSVWLFNITADPY 450 460 470 480 490 500 490 500 510 520 530 pF1KE2 ERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATG-VWGPWM :: ::: .:: :: ::: ::. ..: .::: .: .::: .:. .: ::::: CCDS43 ERVDLSNRYPGIVKKLLRRLSQFNKTAVPVRYPPKDPRSNPRLNGGVWGPWYKEETKKKK 510 520 530 540 550 560 CCDS43 PSKNQAEKKQKKSKKKKKKQQKAVSGSTCHSGVTCG 570 580 590 >>CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 (569 aa) initn: 1890 init1: 832 opt: 1729 Z-score: 1863.5 bits: 354.6 E(32554): 1.8e-97 Smith-Waterman score: 1855; 54.6% identity (76.7% similar) in 502 aa overlap (39-532:41-523) 10 20 30 40 50 60 pF1KE2 LPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDVGFHGSRIR :. .:::..:.:.:: :..:::.::: :. CCDS34 SLLSFGYLSWDWAKPSFVADGPGEAGEQPSAAPPQPPHIIFILTDDQGYHDVGYHGSDIE 20 30 40 50 60 70 70 80 90 100 110 120 pF1KE2 TPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPSCVPLDEKL :: :: ::: :: :.::: ::.:::::::::::::::.:::::.:: : ::.:.:::. CCDS34 TPTLDRLAAKGVKLENYYIQPICTPSRSQLLTGRYQIHTGLQHSIIRPQQPNCLPLDQVT 80 90 100 110 120 130 130 140 150 160 170 180 pF1KE2 LPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHERCTLIDALN ::: :.::::.::::::::::.::::::::::::::..: : :. :::... : :. . CCDS34 LPQKLQEAGYSTHMVGKWHLGFYRKECLPTRRGFDTFLGSLTGNVDYYTYDNC---DGPG 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 VTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQSVHEPLQVP : :..:...::.:: : ...::: ....:: ....: :..:::::.:.:.:: ::: : CCDS34 V--CGFDLHEGENVAWGLSGQYSTMLYAQRASHILASHSPQRPLFLYVAFQAVHTPLQSP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 EEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTDNGGQTLAG .::: : . . :..::.::. ::::: :.: ::: :..::.:.:::.::::::..: CCDS34 REYLYRYRTMGNVARRKYAAMVTCMDEAVRNITWALKRYGFYNNSVIIFSSDNGGQTFSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 GNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKLARGHTNGT :.:::::::: . :::::::.::: :::::.: .: :.::.:: :::. :: : :... CCDS34 GSNWPLRGRKGTYWEGGVRGLGFVHSPLLKRKQRTSRALMHITDWYPTLVGLAGGTTSAA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 KPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLPEYSAFNTS :::.::: .:::: ::: :.:::::: . :. : .. .::. CCDS34 DGLDGYDVWPAISEGRASPRTEILHNIDPLY-----------NHAQHGSLEGGFGIWNTA 370 380 390 400 410 430 440 450 460 470 480 pF1KE2 VHAAIRHGNWKLLTGYPGCGYWFPP------P-SQYNVSEIPSSDPPTKTLWLFDIDRDP :.:::: :.:::::: :: : :.:: : : .:. .. : ...:::.:. :: CCDS34 VQAAIRVGEWKLLTGDPGYGDWIPPQTLATFPGSWWNLERMASV---RQAVWLFNISADP 420 430 440 450 460 470 490 500 510 520 530 pF1KE2 EERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATG-VWGPWM ::.::. . : .: ::.:: :.. ..:: .::..:: : .: .:::: CCDS34 YEREDLAGQRPDVVRTLLARLAEYNRTAIPVRYPAENPRAHPDFNGGAWGPWASDEEEEE 480 490 500 510 520 530 CCDS34 EEGRARSFSRGRRKKKCKICKLRSFFRKLNTRLMSQRI 540 550 560 >>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa) initn: 554 init1: 139 opt: 539 Z-score: 581.2 bits: 117.2 E(32554): 4.7e-26 Smith-Waterman score: 677; 31.2% identity (57.0% similar) in 528 aa overlap (28-531:13-498) 10 20 30 40 50 pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGA-GASRPPHLVFLLADDLGWND :::.:. : :: :: .::....:: ::.::.: CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGD 10 20 30 40 60 70 80 90 100 110 pF1KE2 VGFHGSRIR-TPHLDALAAGGVLLDNYYT-QPLCTPSRSQLLTGRYQIRTGLQ----H-- .: .: : ::.:: .:: :.:. :.:. .:::.:::. ::::: ::.:. : CCDS10 LGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHAR 50 60 70 80 90 100 120 130 140 150 160 pF1KE2 QIIWPCQP-SCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGY-- . : . . .: .:.:::.:::.:::....::::::: .: . : ..::: .:: CCDS10 NAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLG-HRPQFHPLKHGFDEWFGSPN 110 120 130 140 150 160 170 180 190 200 210 220 pF1KE2 -LLGSEDYYSHERCTLI-DALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNH .: : .. . : : : .: .. :: :. :.:. ..:. .: . CCDS10 CHFGPYDNKARPNIPVYRDWEMVGRYYEEF--PINLKTGEANL--TQIYLQEALDFIKRQ 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE2 PPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS ..:.::: :....: :. . :: :. ..: .:. : .:...:.. :.. CCDS10 ARHHPFFLYWAVDATHAPVYAS----KP--FLGTSQRGRYGDAVREIDDSIGKILELLQD 230 240 250 260 270 290 300 310 320 330 340 pF1KE2 SGLWNNTVFIFSTDNGGQTLA----GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGV . .:: .:..:::. .. ::.: :. : . .:::.: ... : : CCDS10 LHVADNTFVFFTSDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQ 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE2 KNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDS ...: : : . : . :: . . .::... :. .: : : : CCDS10 VSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDR--------PIFYYR 340 350 360 370 380 410 420 430 440 450 460 pF1KE2 SPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWK-LLTGYPGCGYWFPPPSQYNVSE . ... : .: ...: : ..:. . : : :.: ::: CCDS10 G----DTLMAA----TLGQHKA-----HFWTWTNSWENFRQGIDFC------PGQ-NVSG 390 400 410 420 470 480 490 500 510 pF1KE2 IPSSD--PPTKTLWLFDIDRDPEERHDLS---REYPHIVTKLLSRLQFYHKHSVPVYFPA . . . :: .: . ::: :: :: :: . .... : .: ... ::. : CCDS10 VTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQ-P- 430 440 450 460 470 480 520 530 pF1KE2 QDPRCDPKATGVWGPWM : :. :. :.: CCDS10 QLNVCN-WAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH 490 500 510 520 >>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa) initn: 532 init1: 197 opt: 516 Z-score: 556.6 bits: 112.6 E(32554): 1.1e-24 Smith-Waterman score: 568; 29.5% identity (52.8% similar) in 528 aa overlap (25-523:6-485) 10 20 30 40 50 60 pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV : ::: :: .: ...:::..:...:::::..:. CCDS14 MSMGAPRSLLLALA---AGLAVARPPNIVLIFADDLGYGDL 10 20 30 70 80 90 100 110 pF1KE2 GFHGS-RIRTPHLDALAAGGVLLDNYYTQ-PLCTPSRSQLLTGRYQIRTGLQHQIIWPCQ : .: ::.:: :::::. . ..:. ::::::. ::::: .: :. .. : . CCDS14 GCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE2 PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRK-ECLPTRRGFDTYFGYLLGSEDYYS . .::.: . ..: :: : :.::::::. . :: ..:: ..: :: CCDS14 RGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGI------PYS 100 110 120 130 140 150 180 190 200 210 220 pF1KE2 HER--CTLIDALN-VTRCALDFRDGEEVATGYKNMYSTNI------FTKRAIALITN--- :.. : . . .: : .: :. . : .:. . CCDS14 HDQGPCQNLTCFPPATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMA 160 170 180 190 200 210 230 240 250 260 270 280 pF1KE2 --HPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAA . ..:.::: : . .: : .. .: . ..: .. . .: :::.. .: CCDS14 DAQRQDRPFFLYYASHHTHYP------QFSGQSFAERSGRGPFGDSLMELDAAVGTLMTA 220 230 240 250 260 290 300 310 320 330 340 pF1KE2 LKSSGLWNNTVFIFSTDNGGQTLA---GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQK . . :: ..:. ::..::: .:. :: . :: : . .::::: ... : CCDS14 IGDLGLLEETLVIFTADNGPETMRMSRGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAP 270 280 290 300 310 320 350 360 370 380 390 400 pF1KE2 GVKNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFV :: . :: : :::: :: : . ::::: ..: .. CCDS14 GVTH-ELASSLDLLPTLAALA-GAPLPNVTLDGFD-------------------LSPLLL 330 340 350 360 410 420 430 440 450 pF1KE2 DSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGY--WFPPPSQYN .. ::.:. : : .: : .: :..: : .. :. . CCDS14 GTGKSPRQSLF------FYPSYPDEVRGVFA-VRTGKYKAHFFTQGSAHSDTTADPACHA 370 380 390 400 410 460 470 480 490 500 510 pF1KE2 VSEIPSSDPPTKTLWLFDIDRDPEERHDL----SREYPHIVTKLLSRLQFYHKH-SVPVY : . . .:: :.:...:: : ..: . :... . :..::. . . .. : CCDS14 SSSLTAHEPPL----LYDLSKDPGENYNLLGGVAGATPEVL-QALKQLQLLKAQLDAAVT 420 430 440 450 460 470 520 530 pF1KE2 F-PAQDPRC-DPKATGVWGPWM : :.: : :: CCDS14 FGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA 480 490 500 >>CCDS14123.1 ARSF gene_id:416|Hs108|chrX (590 aa) initn: 520 init1: 125 opt: 354 Z-score: 381.0 bits: 80.3 E(32554): 6.7e-15 Smith-Waterman score: 506; 27.2% identity (48.1% similar) in 580 aa overlap (15-514:3-550) 10 20 30 40 50 60 pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV ::: :.:. :. :: . . :..:....:::: .:. CCDS14 MRPRR---PLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDL 10 20 30 40 70 80 90 100 110 pF1KE2 GFHGS-RIRTPHLDALAAGGVLLDNYYTQP-LCTPSRSQLLTGRYQIRTGL----QHQII : .:. .::::.: :: :: : .. . ::.:::: .::::: ::.:. ....: CCDS14 GCYGNDTMRTPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVI 50 60 70 80 90 100 120 130 140 150 160 pF1KE2 WPCQ-PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGM----YRKECL-PTRRGFDTYFG- :. .::.: : :::. ::.: ..:::: :. .: : ::: :.: CCDS14 QNLAVPAGLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGM 110 120 130 140 150 160 170 180 190 pF1KE2 -YLLGSEDYYSHER------------CTLIDALNVTR----------------------- . : . . . : :. . :. . CCDS14 PFTLVDSCWPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILF 170 180 190 200 210 220 200 210 220 230 pF1KE2 -------------------CALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPL : : .: : . .: . .:..:.::... : : . CCDS14 IFLLGYAWFSSHTSPLYWDCLL-MRGHEITEQPMKAERAGSIMVKEAISFLERHSKET-F 230 240 250 260 270 280 240 250 260 270 280 290 pF1KE2 FLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNN .:.... :: :: . . :: ... :. : :: ::.. :. . :: :: CCDS14 LLFFSFLHVHTPLPTTD------DFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNN 290 300 310 320 330 300 310 320 330 340 pF1KE2 TVFIFSTDNGGQTLA-------GGNNWPLRGRK-WSLWEGGVRGVGFVASPLLKQKGVKN :. :..:.::. : :: : .: : . ::::.: :.: : : CCDS14 TLVYFTSDHGGHLEARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLI 340 350 360 370 380 390 350 360 370 380 390 400 pF1KE2 RELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSP .: . : :::. ... : . .:: :. .. . . :.: . ... . CCDS14 KEPTSLMDILPTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAV- 400 410 420 430 440 450 410 420 430 440 450 460 pF1KE2 CPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPS : ::::. . . : : :. .:. : : :. CCDS14 ----RWIP-KDDSGSVWKAHYVTPVFQPPASGG-CYVTSLCRC---FGEQVTYH------ 460 470 480 490 500 470 480 490 500 510 520 pF1KE2 SDPPTKTLWLFDIDRDPEERHDLS--REYPH--IVTKLLSRLQFYHKHSVPVYFPAQDPR .:: :::..::: : :. : : .. :. . :. ... ::: . CCDS14 -NPPL----LFDLSRDPSESTPLTPATEPLHDFVIKKVANALKEHQETIVPVTYQLSELN 510 520 530 540 550 530 pF1KE2 CDPKATGVWGPWM CCDS14 QGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR 560 570 580 590 >>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa) initn: 561 init1: 110 opt: 349 Z-score: 375.7 bits: 79.3 E(32554): 1.3e-14 Smith-Waterman score: 515; 28.3% identity (51.0% similar) in 573 aa overlap (17-517:12-558) 10 20 30 40 50 60 pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV : ::..: .:: ::: .:. .. :....:.::::: .:. CCDS14 MLHLHHSCLCFRSWLPAMLAVLLS--LAPSASSDISASRPNILLLMADDLGIGDI 10 20 30 40 50 70 80 90 100 110 pF1KE2 GFHGSR-IRTPHLDALAAGGVLLDNYYTQP-LCTPSRSQLLTGRYQIRTGLQHQI----- : .:. .:::..: :: :: : .. . ::::::. .::::: .:.:. .: CCDS14 GCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVL 60 70 80 90 100 110 120 130 140 150 160 pF1KE2 IWPCQPSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY----RKECL-PTRRGFDTYFGY : . .: .: . ..::: ::.: ..::::::. .: : ..::: ..:. CCDS14 QWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGM 120 130 140 150 160 170 170 180 190 200 pF1KE2 ---LLGSEDYY--SHERCTLIDALN-----VTRCALDFRDGEEV-------------ATG :.:. . :..: .: . :: .. :: . :. . : . CCDS14 PFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALS 180 190 200 210 220 230 210 220 230 240 pF1KE2 YKNMYSTNIFTKRAIA-----LITNHP-PEKPLFLY----LALQSV--------HEPLQV . ... :. :. :. :: :.:. . : :: : : :. . CCDS14 AVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLL 240 250 260 270 280 290 250 260 270 280 290 300 pF1KE2 PEEYLK---PYDFIQD---KNRHH-YAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD .:. : ... :. : :. : :: :: . .: :: :.:.. :..: CCDS14 FVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSD 300 310 320 330 340 350 310 320 330 340 350 pF1KE2 NGGQ-------TLAGGNNWPLRGRK-WSLWEGGVRGVGFVASPLLKQKGVKNRELIHISD .::. : :: : .: : . ::::.: :. : . : : . : CCDS14 HGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMD 360 370 380 390 400 410 360 370 380 390 400 410 pF1KE2 WLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAP .::...:: :.. . .:: :. . . :.: . :. .. : . CCDS14 VFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAA---RWHQ-- 420 430 440 450 460 420 430 440 450 460 470 pF1KE2 AKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTL .: ... . : : : : : : : .. .. ::: CCDS14 -RDRGTMWKVH-FVTPVFQPEGAGA---CYGRKVC----PCFGE----KVVHHDPPL--- 470 480 490 500 510 480 490 500 510 520 pF1KE2 WLFDIDRDPEERHDLSREYPHIVTKLLSRLQ---FYHKHSV-PVYFPAQDPRCDPKATGV :::..::: : : :. . ... :.: . :.... :: : : CCDS14 -LFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPV--PLQLDRLGNIWRPW 520 530 540 550 560 530 pF1KE2 WGPWM CCDS14 LQPCCGPFPLCWCLREDDPQ 570 580 >>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa) initn: 561 init1: 110 opt: 349 Z-score: 375.4 bits: 79.4 E(32554): 1.4e-14 Smith-Waterman score: 515; 28.3% identity (51.0% similar) in 573 aa overlap (17-517:37-583) 10 20 30 40 pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPH : ::..: .:: ::: .:. .. :. CCDS75 RCAPGSLDLMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLS--LAPSASSDISASRPN 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 LVFLLADDLGWNDVGFHGSR-IRTPHLDALAAGGVLLDNYYTQP-LCTPSRSQLLTGRYQ ...:.::::: .:.: .:. .:::..: :: :: : .. . ::::::. .::::: CCDS75 ILLLMADDLGIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYP 70 80 90 100 110 120 110 120 130 140 150 pF1KE2 IRTGLQHQI-----IWPCQPSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY----RKEC .:.:. .: : . .: .: . ..::: ::.: ..::::::. .: CCDS75 VRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHC 130 140 150 160 170 180 160 170 180 190 200 pF1KE2 L-PTRRGFDTYFGY---LLGSEDYY--SHERCTLIDALN-----VTRCALDFRDGEEV-- : ..::: ..:. :.:. . :..: .: . :: .. :: . :. . CCDS75 HHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHL 190 200 210 220 230 240 210 220 230 240 pF1KE2 -----------ATGYKNMYSTNIFTKRAIA-----LITNHP-PEKPLFLY----LALQSV : . . ... :. :. :. :: :.:. . : :: : CCDS75 IPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEV 250 260 270 280 290 300 250 260 270 280 pF1KE2 --------HEPLQVPEEYLK---PYDFIQD---KNRHH-YAGMVSLMDEAVGNVTAALKS : :. . .:. : ... :. : :. : :: :: . .: CCDS75 ASFLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDV 310 320 330 340 350 360 290 300 310 320 330 pF1KE2 SGLWNNTVFIFSTDNGGQ-------TLAGGNNWPLRGRK-WSLWEGGVRGVGFVASPLLK :: :.:.. :..:.::. : :: : .: : . ::::.: :. : . CCDS75 EGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVL 370 380 390 400 410 420 340 350 360 370 380 390 pF1KE2 QKGVKNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPN : : . : .::...:: :.. . .:: :. . . :.: . CCDS75 PAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCER 430 440 450 460 470 480 400 410 420 430 440 450 pF1KE2 FVDSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYN :. .. : . .: ... . : : : : : : : .. CCDS75 FLHAA---RWHQ---RDRGTMWKVH-FVTPVFQPEGAGA---CYGRKVC----PCFGE-- 490 500 510 520 460 470 480 490 500 510 pF1KE2 VSEIPSSDPPTKTLWLFDIDRDPEERHDLSREYPHIVTKLLSRLQ---FYHKHSV-PVYF .. ::: :::..::: : : :. . ... :.: . :.... :: CCDS75 --KVVHHDPPL----LFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPV-- 530 540 550 560 570 580 520 530 pF1KE2 PAQDPRCDPKATGVWGPWM : : CCDS75 PLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 590 600 610 >>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa) initn: 372 init1: 120 opt: 334 Z-score: 360.2 bits: 76.3 E(32554): 9.7e-14 Smith-Waterman score: 481; 29.8% identity (57.3% similar) in 396 aa overlap (37-398:28-410) 10 20 30 40 50 60 pF1KE2 ASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDVGFHGSR :: .. :..:..::::.::.:.: . .. CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAE 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 IR-TPHLDALAAGGV-LLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPSCVPL . : .:: .:. :. ..: . . :.:::..::::: .:.:. ... . .:: CCDS11 TKDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGG-LPL 60 70 80 90 100 110 130 140 150 160 170 pF1KE2 DEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFG----YLLGSEDY--YSH .: : ..:..:::.: ..:::::: .. :. :::: ::: . .: : :.: CCDS11 NETTLAEVLQQAGYVTGIIGKWHLG-HHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNH 120 130 140 150 160 170 180 190 200 210 220 pF1KE2 ERCTLID-----ALNVTR-C----ALDFRDGEEVATGYKNMYS-TNIFTKRAIALITNHP : . :. : : :: . .. ... :. : .. ....: .: CCDS11 PPCPACPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRAS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 PE-KPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS .:..::.:: .: :: : . : ..: :.. . :: ::.. . CCDS11 TSGRPFLLYVALAHMHVPLPVTQLPAAP------RGRSLYGAGLWEMDSLVGQIKDKVDH 240 250 260 270 280 290 300 310 320 330 pF1KE2 SGLWNNTVFIFSTDNGGQT----LAGGNN-----WPLR--GR--KWSLWEGGVRGVGFVA . . .:: . :. ::: . :::. . : : : : . :::: : ... CCDS11 T-VKENTFLWFTGDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAY 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE2 SPLLKQKGVKNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTI-SEGSPSPRIELL : .: . :. . : .::.. ::.. . .:: :: ... ....:. :. :. CCDS11 WPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPGHRV-LF 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE2 HNIDPNFVDSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFP : :: CCDS11 H---PNSGAAGEFGALQTVRLERYKAFYITGGARACDGSTGPELQHKFPLIFNLEDDTAE 410 420 430 440 450 460 533 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:58:17 2016 done: Mon Nov 7 19:58:18 2016 Total Scan time: 3.130 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]