FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1350, 878 aa 1>>>pF1KSDA1350 878 - 878 aa - 878 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4914+/-0.000938; mu= 10.6134+/- 0.057 mean_var=115.7560+/-22.747, 0's: 0 Z-trim(108.3): 19 B-trim: 0 in 0/52 Lambda= 0.119207 statistics sampled from 10130 (10139) to 10130 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.665), E-opt: 0.2 (0.311), width: 16 Scan time: 4.020 The best scores are: opt bits E(32554) CCDS43265.1 USP53 gene_id:54532|Hs108|chr4 (1073) 5970 1038.3 0 CCDS7329.2 USP54 gene_id:159195|Hs108|chr10 (1684) 784 146.4 4e-34 >>CCDS43265.1 USP53 gene_id:54532|Hs108|chr4 (1073 aa) initn: 5970 init1: 5970 opt: 5970 Z-score: 5549.5 bits: 1038.3 E(32554): 0 Smith-Waterman score: 5970; 99.9% identity (99.9% similar) in 878 aa overlap (1-878:196-1073) 10 20 30 pF1KSD MLERHERFKPEMFAELLQAANTTDDYRKCP :::::::::::::::::::::::::::::: CCDS43 RSCGASSDPLPFTEFVRYISTTALCNEVERMLERHERFKPEMFAELLQAANTTDDYRKCP 170 180 190 200 210 220 40 50 60 70 80 90 pF1KSD SNCGQKIKIRRVLMNCPEIVTIGLVWDSEHSDLTEAVVRNLATHLYLPGLFYRVTDENAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SNCGQKIKIRRVLMNCPEIVTIGLVWDSEHSDLTEAVVRNLATHLYLPGLFYRVTDENAK 230 240 250 260 270 280 100 110 120 130 140 150 pF1KSD NSELNLVGMICYTSQHYCAFAFHTKSSKWVFFDDANVKEIGTRWKDVVSKCIRCHFQPLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NSELNLVGMICYTSQHYCAFAFHTKSSKWVFFDDANVKEIGTRWKDVVSKCIRCHFQPLL 290 300 310 320 330 340 160 170 180 190 200 210 pF1KSD LFYANPDGTAVSTEDALRQVISWSHYKSVAENMGCEKPVIHKSDNLKENGFGDQAKQREN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LFYANPDGTAVSTEDALRQVISWSHYKSVAENMGCEKPVIHKSDNLKENGFGDQAKQREN 350 360 370 380 390 400 220 230 240 250 260 270 pF1KSD QKFPTDNISSSNRSHSHTGVGKGPAKLSHIDQREKIKDISRECALKAIEQKNLLSSQRKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QKFPTDNISSSNRSHSHTGVGKGPAKLSHIDQREKIKDISRECALKAIEQKNLLSSQRKD 410 420 430 440 450 460 280 290 300 310 320 330 pF1KSD LEKGQRKDLGRHRDLVDEDLSHFQSGSPPAPNGFKQHGNPHLYHSQGKGSYKHDRVVPQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LEKGQRKDLGRHRDLVDEDLSHFQSGSPPAPNGFKQHGNPHLYHSQGKGSYKHDRVVPQS 470 480 490 500 510 520 340 350 360 370 380 390 pF1KSD RASAQIISSSKSQILAPGEKITGKVKSDNGTGYDTDSSQDSRDRGNSCDSSSKSRNRGWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RASAQIISSSKSQILAPGEKITGKVKSDNGTGYDTDSSQDSRDRGNSCDSSSKSRNRGWK 530 540 550 560 570 580 400 410 420 430 440 450 pF1KSD PMRETLNVDSIFSESEKRQHSPRHKPNISNKPKSSKDPSFSNWPKENPKQKGLMTIYEDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PMRETLNVDSIFSESEKRQHSPRHKPNISNKPKSSKDPSFSNWPKENPKQKGLMTIYEDE 590 600 610 620 630 640 460 470 480 490 500 510 pF1KSD MKQEIGSRSSLESNGKGAEKNKGLVEGKVHGDNWQMQRTESGYESSDHISNGSTNLDSPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MKQEIGSRSSLESNGKGAEKNKGLVEGKVHGDNWQMQRTESGYESSDHISNGSTNLDSPV 650 660 670 680 690 700 520 530 540 550 560 570 pF1KSD IDGNGTVMDISGVKETVCFSDQITTSNLNKERGDCTSLQSQHHLEGFRKELRNLEAGYKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IDGNGTVMDISGVKETVCFSDQITTSNLNKERGDCTSLQSQHHLEGFRKELRNLEAGYKS 710 720 730 740 750 760 580 590 600 610 620 630 pF1KSD HEFHPESHLQIKNHLIKRSHVHEDNGKLFPSSSLQIPKDHNAREHIHQSDEQKLEKPNEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 HEFHPESHLQIKNHLIKRSHVHEDNGKLFPSSSLQIPKDHNAREHIHQSDEQKLEKPNEC 770 780 790 800 810 820 640 650 660 670 680 690 pF1KSD KFSEWLNIENSERTGLPFHVDNSASGKRVNSNEPSSLWSSHLRTVGLKPETAPLIQQQNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KFSEWLNIENSERTGLPFHVDNSASGKRVNSNEPSSLWSSHLRTVGLKPETAPLIQQQNI 830 840 850 860 870 880 700 710 720 730 740 750 pF1KSD MDQCYFENSLSTECIIRSASRSDGCQMPKLFCQNLPPPLPPKKYAITSVPQSEKSESTPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MDQCYFENSLSTECIIRSASRSDGCQMPKLFCQNLPPPLPPKKYAITSVPQSEKSESTPD 890 900 910 920 930 940 760 770 780 790 800 810 pF1KSD VKLTEVFKATSHLPKHRLSTASEPSLEVSTHMNDERHKETFQVRECFGNTPNCPSSSSTN :::::::::::::::: ::::::::::::::::::::::::::::::::::::::::::: CCDS43 VKLTEVFKATSHLPKHSLSTASEPSLEVSTHMNDERHKETFQVRECFGNTPNCPSSSSTN 950 960 970 980 990 1000 820 830 840 850 860 870 pF1KSD DFQANSGAIDAFCQPELDSISTCPNETVSLTTYFSVDSCMTDTYRLKYHQRPKLSFPESS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DFQANSGAIDAFCQPELDSISTCPNETVSLTTYFSVDSCMTDTYRLKYHQRPKLSFPESS 1010 1020 1030 1040 1050 1060 pF1KSD GFCNNSLS :::::::: CCDS43 GFCNNSLS 1070 >>CCDS7329.2 USP54 gene_id:159195|Hs108|chr10 (1684 aa) initn: 956 init1: 762 opt: 784 Z-score: 726.2 bits: 146.4 E(32554): 4e-34 Smith-Waterman score: 922; 29.2% identity (57.7% similar) in 885 aa overlap (1-834:197-1037) 10 20 30 pF1KSD MLERHERFKPEMFAELLQAANTTDDYRKCP ::::.:. .: ::.:::: :.: : :.:: CCDS73 TSCGATSDPLPFIQMVHYISTTSLCNQAICMLERREKPSPSMFGELLQNASTMGDLRNCP 170 180 190 200 210 220 40 50 60 70 80 90 pF1KSD SNCGQKIKIRRVLMNCPEIVTIGLVWDSEHSDLTEAVVRNLATHLYLPGLFYRVTDENAK ::::..:.::::::: :.:.::::::::.::::.: :...:.: : : ::.::::. :: CCDS73 SNCGERIRIRRVLMNAPQIITIGLVWDSDHSDLAEDVIHSLGTCLKLGDLFFRVTDDRAK 230 240 250 260 270 280 100 110 120 130 140 150 pF1KSD NSELNLVGMICYTSQHYCAFAFHTKSSKWVFFDDANVKEIGTRWKDVVSKCIRCHFQPLL .::: ::::::: ..:: .: :.:: ::..::::.::::: .:::::.:::. :.:::: CCDS73 QSELYLVGMICYYGKHYSTFFFQTKIRKWMYFDDAHVKEIGPKWKDVVTKCIKGHYQPLL 290 300 310 320 330 340 160 170 180 190 200 pF1KSD LFYANPDGTAVSTEDALRQVISWSHYKSV--AENMGCEKPVIHKSDNLKENGFGDQAKQR :.::.:.:: :::.: :. :. .. .:. : : : : .::. ... . .. CCDS73 LLYADPQGTPVSTQDLPPQAEFQSYSRTCYDSEDSGRE-PSI-SSDTRTDSSTESYPYKH 350 360 370 380 390 400 210 220 230 240 250 260 pF1KSD ENQKFPTDNISSSNRSHSHTGVGKGPAKLSHIDQREKIKDISRECALKAIEQKNLLSSQR ... ....::.... .: . . : .:. . . :: : .:. : CCDS73 SHHESVVSHFSSDSQGTVIYNVENDSMSQS---SRDTGHLTDSECNQKHTSKKGSL---- 410 420 430 440 450 270 280 290 300 310 320 pF1KSD KDLEKGQRKDLGRHRDLVDEDLSHFQSGSPPAPNGFKQHGNPHLYHSQGKGSYKHDRVVP .:. ... :: : :: . :: . .:.. :. . .: : . .:. CCDS73 --IER--KRSSGRVRRKGDEPQA---SGYHSEGETLKEKQAPR---NASKPSSSTNRLRD 460 470 480 490 500 330 340 350 360 370 pF1KSD QSRASAQIISSSKSQILAPGEKITGKVKSDNGTGYDTDSSQD----SRD-----RGNSCD ... ...: . : :: .. .. .. .: : . ::: .. CCDS73 FKETVSNMIHNRPS--LASQTNVGSHCRGRGGDQPDKKPPRTLPLHSRDWEIESTSSESK 510 520 530 540 550 560 380 390 400 410 420 pF1KSD SSSKSRNRG-WKPMRETLNVDSIFSESEKRQH------SPRHK-------PNISNKPKS- :::.:. : :.: ::.::.:::::. .::.: :: . :. .:: : CCDS73 SSSSSKYRPTWRPKRESLNIDSIFSK-DKRKHCGYTQLSPFSEDSAKEFIPDEPSKPPSY 570 580 590 600 610 620 430 440 450 460 470 pF1KSD -----SKDPSFSNWPKENPKQKGLMTIYEDEMKQEIGSRSSLESNGKGAEKNKGLVEGKV . .:... : : .. : . ...: : .:: ..... . . .: :.. CCDS73 DIKFGGPSPQYKRWGPARPGSHLLEQHPRLIQRMESGYESSERNSSSPVSLDAALPESSN 630 640 650 660 670 680 480 490 500 510 520 530 pF1KSD HGDNWQMQRTESGYESSDHISNGSTNLDSPVIDGNGTVMDISGVKETVCFS-DQITTSNL . . .:. . : :: .. . : ... ..:. ...: .. :: ..:.... CCDS73 VYRDPSAKRSAGLVPSWRHIPKSHS---SSILEVDSTA-SMGGWTKSQPFSGEEISSKSE 690 700 710 720 730 740 540 550 560 570 580 590 pF1KSD NKERGDCTSLQSQHHLEGFRKELRNLEA--GYKSH--EFHPESHLQIKNHL--IKRSHVH : . .. ..:.. : ::. ..::: :.. : .: ..:: ... ..:: .. CCDS73 LDELQEEVARRAQEQ-ELRRKREKELEAAKGFNPHPSRFMDLDELQNQGRSDGFERS-LQ 750 760 770 780 790 600 610 620 630 640 pF1KSD EDNGKLFPSSSLQIPKDHNAREHIHQSDEQKLE---KPNECK------FSEWLNIENSER : .. . : :. : : . . .::. . :. .. :.: . CCDS73 EAESVFEESLHLEQKGDCAAALALCNEAISKLRLALHGASCSTHSRALVDKKLQISIRKA 800 810 820 830 840 850 650 660 670 680 690 700 pF1KSD TGLPFHVDNSASGKRVNSNEPSSLWSSHLRTVGLKPETAPLIQQQNIMDQCYFENSLSTE .: ..... : .. ..::. .. :.. :. : . .. .:....:: CCDS73 RSLQDRMQQQQSPQQ--PSQPSACLPTQAGTLSQPTSEQPIPLQVLLSQEAQLESGMDTE 860 870 880 890 900 910 710 720 730 740 750 760 pF1KSD CIIRSASRSDGCQMPKLFCQNLPPPLPPKKYAITSVPQSEKSESTPDVKLTEVFKATSHL : .: . :.. : :. .:.:: ..: : .:: .. . CCDS73 FGASSFFHSPAS------CHESHSSLSPE----SSAPQ-HSSPSRSALKLLTSVEVDNIE 920 930 940 950 960 770 780 790 800 810 pF1KSD PK--HRLSTASEPSLEVSTHMNDERHKETFQVRECFGNTPNCPSSSSTN-DFQANSG-AI :. :: . . :. :. :... : ... : . : .:: .. : . : : CCDS73 PSAFHRQGLPKAPGW---TEKNSHHSWEPLDAPEGKLQGSRCDNSSCSKLPPQEGRGIAQ 970 980 990 1000 1010 1020 820 830 840 850 860 870 pF1KSD DAFCQPELDSISTCPNETVSLTTYFSVDSCMTDTYRLKYHQRPKLSFPESSGFCNNSLS . . : . : . : CCDS73 EQLFQEKKDPANPSPVMPGIATSERGDEHSLGCSPSNSSAQPSLPLYRTCHPIMPVASSF 1030 1040 1050 1060 1070 1080 878 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 05:57:27 2016 done: Thu Nov 3 05:57:28 2016 Total Scan time: 4.020 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]