FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1079, 1072 aa 1>>>pF1KE1079 1072 - 1072 aa - 1072 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.3732+/-0.000986; mu= 12.1123+/- 0.060 mean_var=111.1340+/-21.958, 0's: 0 Z-trim(107.5): 24 B-trim: 51 in 1/51 Lambda= 0.121661 statistics sampled from 9593 (9604) to 9593 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.651), E-opt: 0.2 (0.295), width: 16 Scan time: 4.200 The best scores are: opt bits E(32554) CCDS43265.1 USP53 gene_id:54532|Hs108|chr4 (1073) 7301 1293.0 0 CCDS7329.2 USP54 gene_id:159195|Hs108|chr10 (1684) 1769 322.1 6.3e-87 >>CCDS43265.1 USP53 gene_id:54532|Hs108|chr4 (1073 aa) initn: 6010 init1: 6010 opt: 7301 Z-score: 6924.8 bits: 1293.0 E(32554): 0 Smith-Waterman score: 7301; 99.9% identity (99.9% similar) in 1073 aa overlap (1-1072:1-1073) 10 20 30 40 50 60 pF1KE1 MAWVKFLRKPGGNLGKVYQPGSMLSLAPTKGLLNEPGQNSCFLNSAVQVLWQLDIFRRSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MAWVKFLRKPGGNLGKVYQPGSMLSLAPTKGLLNEPGQNSCFLNSAVQVLWQLDIFRRSL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 RVLTGHVCQGDACIFCALKTIFAQFQHSREKALPSDNIRHALAESFKDEQRFQLGLMDDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RVLTGHVCQGDACIFCALKTIFAQFQHSREKALPSDNIRHALAESFKDEQRFQLGLMDDA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 AECFENMLERIHFHIVPSRDADMCTSKSCITHQKFAMTLYEQCVCRSCGASSDPLPFTEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AECFENMLERIHFHIVPSRDADMCTSKSCITHQKFAMTLYEQCVCRSCGASSDPLPFTEF 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 VRYISTTAL-NEVERMLERHERFKPEMFAELLQAANTTDDYRKCPSNCGQKIKIRRVLMN ::::::::: :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VRYISTTALCNEVERMLERHERFKPEMFAELLQAANTTDDYRKCPSNCGQKIKIRRVLMN 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 CPEIVTIGLVWDSEHSDLTEAVVRNLATHLYLPGLFYRVTDENAKNSELNLVGMICYTSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 CPEIVTIGLVWDSEHSDLTEAVVRNLATHLYLPGLFYRVTDENAKNSELNLVGMICYTSQ 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE1 HYCAFAFHTKSSKWVFFDDANVKEIGTRWKDVVSKCIRCHFQPLLLFYANPDGTAVSTED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 HYCAFAFHTKSSKWVFFDDANVKEIGTRWKDVVSKCIRCHFQPLLLFYANPDGTAVSTED 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE1 ALRQVISWSHYKSVAENMGCEKPVIHKSDNLKENGFGDQAKQRENQKFPTDNISSSNRSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ALRQVISWSHYKSVAENMGCEKPVIHKSDNLKENGFGDQAKQRENQKFPTDNISSSNRSH 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE1 SHTGVGKGPAKLSHIDQREKIKDISRECALKAIEQKNLLSSQRKDLEKGQRKDLGRHRDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SHTGVGKGPAKLSHIDQREKIKDISRECALKAIEQKNLLSSQRKDLEKGQRKDLGRHRDL 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE1 VDEDLSHFQSGSPPAPNGFKQHGNPHLYHSQGKGSYKHDRVVPQSRASAQIISSSKSQIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VDEDLSHFQSGSPPAPNGFKQHGNPHLYHSQGKGSYKHDRVVPQSRASAQIISSSKSQIL 490 500 510 520 530 540 540 550 560 570 580 590 pF1KE1 APGEKITGKVKSDNGTGYDTDSSQDSRDRGNSCDSSSKSRNRGWKPMRETLNVDSIFSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 APGEKITGKVKSDNGTGYDTDSSQDSRDRGNSCDSSSKSRNRGWKPMRETLNVDSIFSES 550 560 570 580 590 600 600 610 620 630 640 650 pF1KE1 EKRQHSPRHKPNISNKPKSSKDPSFSNWPKENPKQKGLMTIYEDEMKQEIGSRSSLESNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EKRQHSPRHKPNISNKPKSSKDPSFSNWPKENPKQKGLMTIYEDEMKQEIGSRSSLESNG 610 620 630 640 650 660 660 670 680 690 700 710 pF1KE1 KGAEKNKGLVEGKVHGDNWQMQRTESGYESSDHISNGSTNLDSPVIDGNGTVMDISGVKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KGAEKNKGLVEGKVHGDNWQMQRTESGYESSDHISNGSTNLDSPVIDGNGTVMDISGVKE 670 680 690 700 710 720 720 730 740 750 760 770 pF1KE1 TVCFSDQITTSNLNKERGDCTSLQSQHHLEGFRKELRNLEAGYKSHEFHPESHLQIKNHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TVCFSDQITTSNLNKERGDCTSLQSQHHLEGFRKELRNLEAGYKSHEFHPESHLQIKNHL 730 740 750 760 770 780 780 790 800 810 820 830 pF1KE1 IKRSHVHEDNGKLFPSSSLQIPKDHNAREHIHQSDEQKLEKPNECKFSEWLNIENSERTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IKRSHVHEDNGKLFPSSSLQIPKDHNAREHIHQSDEQKLEKPNECKFSEWLNIENSERTG 790 800 810 820 830 840 840 850 860 870 880 890 pF1KE1 LPFHVDNSASGKRVNSNEPSSLWSSHLRTVGLKPETAPLIQQQNIMDQCYFENSLSTECI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LPFHVDNSASGKRVNSNEPSSLWSSHLRTVGLKPETAPLIQQQNIMDQCYFENSLSTECI 850 860 870 880 890 900 900 910 920 930 940 950 pF1KE1 IRSASRSDGCQMPKLFCQNLPPPLPPKKYAITSVPQSEKSESTPDVKLTEVFKATSHLPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IRSASRSDGCQMPKLFCQNLPPPLPPKKYAITSVPQSEKSESTPDVKLTEVFKATSHLPK 910 920 930 940 950 960 960 970 980 990 1000 1010 pF1KE1 HSLSTASEPSLEVSTHMNDERHKETFQVRECFGNTPNCPSSSSTNDFQANSGAIDAFCQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 HSLSTASEPSLEVSTHMNDERHKETFQVRECFGNTPNCPSSSSTNDFQANSGAIDAFCQP 970 980 990 1000 1010 1020 1020 1030 1040 1050 1060 1070 pF1KE1 ELDSISTCPNETVSLTTYFSVDSCMTDTYRLKYHQRPKLSFPESSGFCNNSLS ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ELDSISTCPNETVSLTTYFSVDSCMTDTYRLKYHQRPKLSFPESSGFCNNSLS 1030 1040 1050 1060 1070 >>CCDS7329.2 USP54 gene_id:159195|Hs108|chr10 (1684 aa) initn: 1802 init1: 891 opt: 1769 Z-score: 1674.1 bits: 322.1 E(32554): 6.3e-87 Smith-Waterman score: 1804; 37.3% identity (63.1% similar) in 994 aa overlap (1-966:1-940) 10 20 30 40 50 pF1KE1 MAWVKFLRKPG-GNLGKVYQPGSMLSLAPTKGLLNEPGQNSCFLNSAVQVLWQLDIFRRS :.: . . : :.. .. : : :.::.::: :::::::::::::.::::.::::::: CCDS73 MSWKRNYFSGGRGSVQGMFAPRSSTSIAPSKGLSNEPGQNSCFLNSALQVLWHLDIFRRS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 LRVLTGHVCQGDACIFCALKTIFAQFQHSREKALPSDNIRHALAESFKDEQRFQLGLMDD .: :: : :.::.::::::: :: ::: : ::.::::..: :::..:.::::::::.::: CCDS73 FRQLTTHKCMGDSCIFCALKGIFNQFQCSSEKVLPSDTLRSALAKTFQDEQRFQLGIMDD 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 AAECFENMLERIHFHIVPSRDADMCTSKSCITHQKFAMTLYEQCVCRSCGASSDPLPFTE :::::::.: ::::::. :.::.. ::.::::::::.::::: ::::.:::::: . CCDS73 AAECFENLLMRIHFHIADETKEDICTAQHCISHQKFAMTLFEQCVCTSCGATSDPLPFIQ 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 FVRYISTTAL-NEVERMLERHERFKPEMFAELLQAANTTDDYRKCPSNCGQKIKIRRVLM .:.:::::.: :.. ::::.:. .: ::.:::: :.: : :.::::::..:.:::::: CCDS73 MVHYISTTSLCNQAICMLERREKPSPSMFGELLQNASTMGDLRNCPSNCGERIRIRRVLM 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 NCPEIVTIGLVWDSEHSDLTEAVVRNLATHLYLPGLFYRVTDENAKNSELNLVGMICYTS : :.:.::::::::.::::.: :...:.: : : ::.::::. ::.::: ::::::: . CCDS73 NAPQIITIGLVWDSDHSDLAEDVIHSLGTCLKLGDLFFRVTDDRAKQSELYLVGMICYYG 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE1 QHYCAFAFHTKSSKWVFFDDANVKEIGTRWKDVVSKCIRCHFQPLLLFYANPDGTAVSTE .:: .: :.:: ::..::::.::::: .:::::.:::. :.:::::.::.:.:: :::. CCDS73 KHYSTFFFQTKIRKWMYFDDAHVKEIGPKWKDVVTKCIKGHYQPLLLLYADPQGTPVSTQ 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE1 DALRQVISWSHYKSV--AENMGCEKPVIHKSDNLKENGFGDQAKQRENQKFPTDNISSSN : :. :. .. .:. : : : : .::. ... . .. ... ....::.. CCDS73 DLPPQAEFQSYSRTCYDSEDSGRE-PSI-SSDTRTDSSTESYPYKHSHHESVVSHFSSDS 370 380 390 400 410 420 430 440 450 460 470 pF1KE1 RSHSHTGVGKGPAKLSHIDQREKIKDISRECALKAIEQKNLLSSQRKDLEKGQRKDLGRH .. .: . . : .:. . . :: : .:. : .:. ... :: CCDS73 QGTVIYNVENDSMSQS---SRDTGHLTDSECNQKHTSKKGSL------IER--KRSSGRV 420 430 440 450 460 480 490 500 510 520 530 pF1KE1 RDLVDEDLSHFQSGSPPAPNGFKQHGNPHLYHSQGKGSYKHDRVVPQSRASAQIISSSKS : :: . :: . .:.. :. . .: : . .:. ... ...: . : CCDS73 RRKGDEPQA---SGYHSEGETLKEKQAPR---NASKPSSSTNRLRDFKETVSNMIHNRPS 470 480 490 500 510 520 540 550 560 570 580 pF1KE1 QILAPGEKITGKVKSDNGTGYDTDSSQD----SRD-----RGNSCDSSSKSRNRG-WKPM :: .. .. .. .: : . ::: .. :::.:. : :.: CCDS73 --LASQTNVGSHCRGRGGDQPDKKPPRTLPLHSRDWEIESTSSESKSSSSSKYRPTWRPK 530 540 550 560 570 590 600 610 620 630 640 pF1KE1 RETLNVDSIFSESEKRQHSPRHKPNISNKPKSSKDPSFSNWPKENPKQKGLMTIYEDEMK ::.::.:::::. .::.: . .: ..: . . :.. :. ..: CCDS73 RESLNIDSIFSK-DKRKHCGYTQ--LSPFSEDSAKEFIPDEPSKPPSY---------DIK 580 590 600 610 620 650 660 670 680 690 700 pF1KE1 QEIGSRSSLESNGKGAEKNKGLVEGKVHGDNWQMQRTESGYESSDHISNGSTNLDSPVID .:. : . :. .. :.: . . .:: :::::::.. :.. ..::. . . CCDS73 --FGGPSPQYKRWGPARPGSHLLEQHPR----LIQRMESGYESSERNSSSPVSLDAALPE 630 640 650 660 670 680 710 720 730 740 750 760 pF1KE1 GNGTVMDISGVKETVCFSDQITTSNLNKERGDCTSL---QSQHHLEGFRKE--LRNLEAG .... : :. . : .. : . .. .:. .: . :. : . . : . CCDS73 SSNVYRDPSAKR-----SAGLVPSWRHIPKSHSSSILEVDSTASMGGWTKSQPFSGEEIS 690 700 710 720 730 770 780 790 800 810 pF1KE1 YKSH--EFHPESHLQIKNHLIKRSHVHE-DNGKLF-PSSSLQIPKDHNAREHIHQSDEQK ::. :.. : . ... ..:.. .: . .: : : : . :. . .. :.. CCDS73 SKSELDELQEEVARRAQEQELRRKREKELEAAKGFNPHPSRFMDLDELQNQGRSDGFERS 740 750 760 770 780 790 820 830 840 850 860 870 pF1KE1 LEKPNECKFSEWLNIENSERTGLPFHVDNSASGK-RVNSNEPSSLWSSHLRTVGLKPETA :.. : : : :..:.. . . . : : .: :. . : :.: :.. : CCDS73 LQEA-ESVFEESLHLEQKGDCAAALALCNEAISKLRLALHGASC--STHSRALVDKKLQI 800 810 820 830 840 850 880 890 900 910 920 930 pF1KE1 PLIQQQNIMDQCYFENSLSTECIIRSASRSDGCQMPKLFCQNLPPPLPPKKYAITSVPQS . . ....:. ..: .. :. ..: . . : : . . : CCDS73 SIRKARSLQDRMQQQQS------PQQPSQPSACLPTQAGTLSQPTSEQPIPLQVL-LSQE 860 870 880 890 900 940 950 960 970 980 990 pF1KE1 EKSESTPDVKL--TEVFK--ATSHLPKHSLSTASEPSLEVSTHMNDERHKETFQVRECFG . :: :... . :. :. : . ::: : CCDS73 AQLESGMDTEFGASSFFHSPASCHESHSSLSPESSAPQHSSPSRSALKLLTSVEVDNIEP 910 920 930 940 950 960 1000 1010 1020 1030 1040 1050 pF1KE1 NTPNCPSSSSTNDFQANSGAIDAFCQPELDSISTCPNETVSLTTYFSVDSCMTDTYRLKY CCDS73 SAFHRQGLPKAPGWTEKNSHHSWEPLDAPEGKLQGSRCDNSSCSKLPPQEGRGIAQEQLF 970 980 990 1000 1010 1020 1072 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 02:15:12 2016 done: Sat Nov 5 02:15:13 2016 Total Scan time: 4.200 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]