FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4391, 520 aa 1>>>pF1KB4391 520 - 520 aa - 520 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7983+/-0.00099; mu= 16.1706+/- 0.059 mean_var=83.2070+/-15.947, 0's: 0 Z-trim(105.9): 101 B-trim: 35 in 1/50 Lambda= 0.140603 statistics sampled from 8575 (8679) to 8575 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.634), E-opt: 0.2 (0.267), width: 16 Scan time: 2.970 The best scores are: opt bits E(32554) CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 ( 520) 3589 738.2 5.4e-213 CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 ( 476) 2913 601.0 9.6e-172 CCDS9053.1 USP44 gene_id:84101|Hs108|chr12 ( 712) 602 132.3 1.7e-30 CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 ( 362) 487 108.8 1.1e-23 CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 ( 396) 487 108.9 1.1e-23 CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 ( 605) 487 109.0 1.6e-23 CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012) 484 108.5 3.7e-23 CCDS10137.1 USP8 gene_id:9101|Hs108|chr15 (1118) 484 108.5 4e-23 CCDS8963.1 USP15 gene_id:9958|Hs108|chr12 ( 952) 479 107.5 7.2e-23 CCDS58251.1 USP15 gene_id:9958|Hs108|chr12 ( 981) 479 107.5 7.3e-23 CCDS2794.1 USP4 gene_id:7375|Hs108|chr3 ( 916) 466 104.8 4.3e-22 CCDS2793.1 USP4 gene_id:7375|Hs108|chr3 ( 963) 466 104.8 4.5e-22 CCDS30920.1 USP21 gene_id:27005|Hs108|chr1 ( 565) 452 101.9 2.1e-21 CCDS680.1 USP33 gene_id:23032|Hs108|chr1 ( 828) 429 97.3 7.2e-20 CCDS679.1 USP33 gene_id:23032|Hs108|chr1 ( 911) 429 97.3 7.8e-20 CCDS678.1 USP33 gene_id:23032|Hs108|chr1 ( 942) 429 97.3 8e-20 CCDS43892.1 USP20 gene_id:10868|Hs108|chr9 ( 914) 424 96.3 1.6e-19 CCDS14277.1 USP11 gene_id:8237|Hs108|chrX ( 963) 422 95.9 2.2e-19 CCDS14370.1 USP51 gene_id:158880|Hs108|chrX ( 711) 410 93.4 9.2e-19 CCDS42285.1 USP22 gene_id:23326|Hs108|chr17 ( 525) 361 83.4 7.1e-16 CCDS65260.1 USP27X gene_id:389856|Hs108|chrX ( 438) 350 81.1 2.9e-15 CCDS42912.1 USP16 gene_id:10600|Hs108|chr21 ( 822) 344 80.1 1.1e-14 CCDS13583.1 USP16 gene_id:10600|Hs108|chr21 ( 823) 344 80.1 1.1e-14 CCDS81392.1 USP21 gene_id:27005|Hs108|chr1 ( 551) 339 78.9 1.6e-14 CCDS31952.1 USP12 gene_id:219333|Hs108|chr13 ( 370) 311 73.1 6e-13 CCDS47054.1 USP46 gene_id:64854|Hs108|chr4 ( 359) 296 70.1 4.8e-12 CCDS47053.1 USP46 gene_id:64854|Hs108|chr4 ( 366) 296 70.1 4.9e-12 >>CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 (520 aa) initn: 3589 init1: 3589 opt: 3589 Z-score: 3937.4 bits: 738.2 E(32554): 5.4e-213 Smith-Waterman score: 3589; 100.0% identity (100.0% similar) in 520 aa overlap (1-520:1-520) 10 20 30 40 50 60 pF1KB4 MECPHLSSSVCIAPDSAKFPNGSPSSWCCSVCRSNKSPWVCLTCSSVHCGRYVNGHAKKH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MECPHLSSSVCIAPDSAKFPNGSPSSWCCSVCRSNKSPWVCLTCSSVHCGRYVNGHAKKH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 YEDAQVPLTNHKKSEKQDKVQHTVCMDCSSYSTYCYRCDDFVVNDTKLGLVQKVREHLQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 YEDAQVPLTNHKKSEKQDKVQHTVCMDCSSYSTYCYRCDDFVVNDTKLGLVQKVREHLQN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 LENSAFTADRHKKRKLLENSTLNSKLLKVNGSTTAICATGLRNLGNTCFMNAILQSLSNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LENSAFTADRHKKRKLLENSTLNSKLLKVNGSTTAICATGLRNLGNTCFMNAILQSLSNI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 EQFCCYFKELPAVELRNGKTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQGSQTAFSPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EQFCCYFKELPAVELRNGKTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQGSQTAFSPE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 SLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSASNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSASNK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 CCINGASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQFRSKRSKNQENGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CCINGASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQFRSKRSKNQENGP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 VCSLRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFWIQKLPKVLCLHLKRFHWTAYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VCSLRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFWIQKLPKVLCLHLKRFHWTAYL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 RNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGHYTAYATHEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGHYTAYATHEG 430 440 450 460 470 480 490 500 510 520 pF1KB4 RWFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL :::::::::::::::::::::::::::::::::::::::: CCDS32 RWFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL 490 500 510 520 >>CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 (476 aa) initn: 2913 init1: 2913 opt: 2913 Z-score: 3196.8 bits: 601.0 E(32554): 9.6e-172 Smith-Waterman score: 3170; 91.3% identity (91.3% similar) in 520 aa overlap (1-520:1-476) 10 20 30 40 50 60 pF1KB4 MECPHLSSSVCIAPDSAKFPNGSPSSWCCSVCRSNKSPWVCLTCSSVHCGRYVNGHAKKH :::::::::::::::::::::::::::::::::::::::::::::::::: : CCDS58 MECPHLSSSVCIAPDSAKFPNGSPSSWCCSVCRSNKSPWVCLTCSSVHCGSY-------- 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 YEDAQVPLTNHKKSEKQDKVQHTVCMDCSSYSTYCYRCDDFVVNDTKLGLVQKVREHLQN :::::::::::::::::::::::: CCDS58 ------------------------------------RCDDFVVNDTKLGLVQKVREHLQN 60 70 130 140 150 160 170 180 pF1KB4 LENSAFTADRHKKRKLLENSTLNSKLLKVNGSTTAICATGLRNLGNTCFMNAILQSLSNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LENSAFTADRHKKRKLLENSTLNSKLLKVNGSTTAICATGLRNLGNTCFMNAILQSLSNI 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB4 EQFCCYFKELPAVELRNGKTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQGSQTAFSPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EQFCCYFKELPAVELRNGKTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQGSQTAFSPE 140 150 160 170 180 190 250 260 270 280 290 300 pF1KB4 SLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSASNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSASNK 200 210 220 230 240 250 310 320 330 340 350 360 pF1KB4 CCINGASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQFRSKRSKNQENGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 CCINGASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQFRSKRSKNQENGP 260 270 280 290 300 310 370 380 390 400 410 420 pF1KB4 VCSLRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFWIQKLPKVLCLHLKRFHWTAYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VCSLRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFWIQKLPKVLCLHLKRFHWTAYL 320 330 340 350 360 370 430 440 450 460 470 480 pF1KB4 RNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGHYTAYATHEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGHYTAYATHEG 380 390 400 410 420 430 490 500 510 520 pF1KB4 RWFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL :::::::::::::::::::::::::::::::::::::::: CCDS58 RWFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL 440 450 460 470 >>CCDS9053.1 USP44 gene_id:84101|Hs108|chr12 (712 aa) initn: 721 init1: 191 opt: 602 Z-score: 660.8 bits: 132.3 E(32554): 1.7e-30 Smith-Waterman score: 710; 32.2% identity (58.5% similar) in 482 aa overlap (109-520:218-687) 80 90 100 110 120 130 pF1KB4 KVQHTVCMDCSSYSTYCYRCDDFVVNDTKLGLVQKVREHLQNLENSAFTADRHKKRKLLE ::.:.. .. ... : : : :.: CCDS90 REVKKRRQELEYQVKAELESMPPRKSLRLQGLAQSTIIEIVSVQVPAQTPASPAKDKVLS 190 200 210 220 230 240 140 150 160 170 180 pF1KB4 NSTLNSKLLKVNGSTT------AICATGLRNLGNTCFMNAILQSLSNIEQF-CCYFK--- .: : ::. :.. . .::::::::::.::..:: ::.. : :..: CCDS90 TSE-NEISQKVSDSSVKRRPIVTPGVTGLRNLGNTCYMNSVLQVLSHLLIFRQCFLKLDL 250 260 270 280 290 300 190 200 pF1KB4 ---------------ELPAVE----------------------------LRNGKTAGRRT . : : : .: . ::. CCDS90 NQWLAMTASEKTRSCKHPPVTDTVVYQMNECQEKDTGFVCSRQSSLSSGLSGGASKGRKM 310 320 330 340 350 360 210 220 230 240 250 260 pF1KB4 --YHTRSQGDNNVSLVEEFRKTLCALWQGSQTAFSPESLFYVVWKIMPNFRGYQQQDAHE . . .. .:: .:.. . ..:.:. . :: .... ::...: :::: ::::.: CCDS90 ELIQPKEPTSQYISLCHELHTLFQVMWSGKWALVSPFAMLHSVWRLIPAFRGYAQQDAQE 370 380 390 400 410 420 270 280 290 300 310 320 pF1KB4 FMRYLLDHLHLELQGGFNGVSRSAILQENSTLSASNKCCINGASTVVTAIFGGILQNEVN :. :::... ::. .:.: :. . .:.. :. . .::. :: : : ..:. CCDS90 FLCELLDKIQRELET--TGTSLPAL------IPTSQRKLIKQVLNVVNNIFHGQLLSQVT 430 440 450 460 470 330 340 350 360 370 380 pF1KB4 CLICGTESRKFDPFLDLSLDIPSQFRSKRSKNQENGPVCSLRDCLRSFTDLEELDETELY :: : ..: ..:: ::::..: ... . .:. . : : . . : .::. : : : ..: CCDS90 CLACDNKSNTIEPFWDLSLEFPERYQCS-GKDIASQP-CLVTEMLAKFTETEAL-EGKIY 480 490 500 510 520 530 390 400 410 420 430 pF1KB4 MCHKCKKKQK-----------STKKFWIQKLPKVLCLHLKRFHWTAYL-RNKVDTYVEFP .: .:..:.. . :.. : .::.:: ::::::.:.. :.:. ..: : CCDS90 VCDQCNSKRRRFSSKPVVLTEAQKQLMICHLPQVLRLHLKRFRWSGRNNREKIGVHVGFE 540 550 560 570 580 590 440 450 460 470 480 pF1KB4 -LRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGHYTAYA--THEGRWFHFNDS . ... : .. :: .:::.:::.:::.: :::::::: .. : : : ::: CCDS90 EILNMEPYCCRETLKSLRPECFIYDLSAVVMHHGKGFGSGHYTAYCYNSEGGFWVHCNDS 600 610 620 630 640 650 490 500 510 520 pF1KB4 TVTLTDEETVVKAKAYILFYVEHQAKAGSDKL ... . : ::.::::::... .. : .:: CCDS90 KLSMCTMDEVCKAQAYILFYTQRVTENGHSKLLPPELLLGSQHPNEDADTSSNEILS 660 670 680 690 700 710 >>CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 (362 aa) initn: 672 init1: 235 opt: 487 Z-score: 539.0 bits: 108.8 E(32554): 1.1e-23 Smith-Waterman score: 687; 38.6% identity (59.2% similar) in 373 aa overlap (148-508:13-353) 120 130 140 150 160 170 pF1KB4 LQNLENSAFTADRHKKRKLLENSTLNSKLLKVNGSTTAICATGLRNLGNTCFMNAILQSL : ..: .: .::::::::::::.::: : CCDS58 MLVPGSTRPYSKKRQNSKSAQGLAGLRNLGNTCFMNSILQCL 10 20 30 40 180 190 200 210 220 230 pF1KB4 SNIEQFCCY-FKELPAVELRNGKTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQGSQT- :: ... : ...: .:..:..: :: .::::: : . ..: .: . CCDS58 SNTRELRDYCLQRLYMRDLHHGSNA-----HT--------ALVEEFAKLIQTIWTSSPND 50 60 70 80 240 250 260 270 280 290 pF1KB4 AFSPESLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVS-RSAILQEN-S . :: . . . : : ::.::::.::.:.::: :: :. : :. : :: . CCDS58 VVSPSEFKTQIQRYAPRFVGYNQQDAQEFLRFLLDGLHNEV----NRVTLRPKSNPENLD 90 100 110 120 130 140 300 310 320 330 340 pF1KB4 TLSASNKC------CINGASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQ : ..: .. .. . .: : :.. ..: :: : :::: :::: : CCDS58 HLPDDEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGYCSTVFDPFWDLSLPI--- 150 160 170 180 190 200 350 360 370 380 390 400 pF1KB4 FRSKRSKNQENGPVCSLRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFWIQKLPKVL .::. : .: ::.: :: . :: : : .:. ... ::: ::..::.: CCDS58 --AKRGY-----PEVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKIL 210 220 230 240 250 410 420 430 440 450 460 pF1KB4 CLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGV :::::: . .:. :.:.:::: ::.. . : : . .:.: :: : :. . CCDS58 VLHLKRFSESRIRTSKLTTFVNFPLRDLDLREFASENTNHA----VYNLYAVSNHSGTTM 260 270 280 290 300 310 470 480 490 500 510 520 pF1KB4 GSGHYTAY--ATHEGRWFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL : :::::: . :.: ::::.:: . : . ::.::: CCDS58 G-GHYTAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM 320 330 340 350 360 >>CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 (396 aa) initn: 672 init1: 235 opt: 487 Z-score: 538.4 bits: 108.9 E(32554): 1.1e-23 Smith-Waterman score: 694; 38.2% identity (59.5% similar) in 385 aa overlap (136-508:35-387) 110 120 130 140 150 160 pF1KB4 TKLGLVQKVREHLQNLENSAFTADRHKKRKLLENSTLNSKLLKVNGSTTAICATGLRNLG :: .. .. : :...: .: .:::::: CCDS84 YTVTLPEDPPAAPFPALAKELRPRSPLSPSLLLSTFVGLLLNKAKNSKSAQGLAGLRNLG 10 20 30 40 50 60 170 180 190 200 210 220 pF1KB4 NTCFMNAILQSLSNIEQFCCY-FKELPAVELRNGKTAGRRTYHTRSQGDNNVSLVEEFRK ::::::.::: ::: ... : ...: .:..:..: :: .::::: : CCDS84 NTCFMNSILQCLSNTRELRDYCLQRLYMRDLHHGSNA-----HT--------ALVEEFAK 70 80 90 100 110 230 240 250 260 270 280 pF1KB4 TLCALWQGSQT-AFSPESLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGV . ..: .: . . :: . . . : : ::.::::.::.:.::: :: :. : : CCDS84 LIQTIWTSSPNDVVSPSEFKTQIQRYAPRFVGYNQQDAQEFLRFLLDGLHNEV----NRV 120 130 140 150 160 290 300 310 320 330 pF1KB4 S-RSAILQEN-STLSASNKC------CINGASTVVTAIFGGILQNEVNCLICGTESRKFD . : :: . : ..: .. .. . .: : :.. ..: :: : :: CCDS84 TLRPKSNPENLDHLPDDEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGYCSTVFD 170 180 190 200 210 220 340 350 360 370 380 390 pF1KB4 PFLDLSLDIPSQFRSKRSKNQENGPVCSLRDCLRSFTDLEELDETELYMCHKCKKKQKST :: :::: : .::. : .: ::.: :: . :: : : .:. ... CCDS84 PFWDLSLPI-----AKRGY-----PEVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCI 230 240 250 260 270 400 410 420 430 440 450 pF1KB4 KKFWIQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLYD ::: ::..::.: :::::: . .:. :.:.:::: ::.. . : : . .:. CCDS84 KKFSIQRFPKILVLHLKRFSESRIRTSKLTTFVNFPLRDLDLREFASENTNHA----VYN 280 290 300 310 320 330 460 470 480 490 500 510 pF1KB4 LAAVVVHHGSGVGSGHYTAY--ATHEGRWFHFNDSTVTLTDEETVVKAKAYILFYVEHQA : :: : :. .: :::::: . :.: ::::.:: . : . ::.::: CCDS84 LYAVSNHSGTTMG-GHYTAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASP 340 350 360 370 380 390 520 pF1KB4 KAGSDKL CCDS84 PSRM >>CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 (605 aa) initn: 630 init1: 235 opt: 487 Z-score: 535.8 bits: 109.0 E(32554): 1.6e-23 Smith-Waterman score: 684; 38.8% identity (59.1% similar) in 369 aa overlap (152-508:260-596) 130 140 150 160 170 180 pF1KB4 ENSAFTADRHKKRKLLENSTLNSKLLKVNGSTTAICATGLRNLGNTCFMNAILQSLSNIE : .: .::::::::::::.::: ::: . CCDS84 PIGRYTLWETGKGQAPGPSRSSSPGRDGMNSKSAQGLAGLRNLGNTCFMNSILQCLSNTR 230 240 250 260 270 280 190 200 210 220 230 pF1KB4 QFCCY-FKELPAVELRNGKTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQGSQT-AFSP .. : ...: .:..:..: :: .::::: : . ..: .: . . :: CCDS84 ELRDYCLQRLYMRDLHHGSNA-----HT--------ALVEEFAKLIQTIWTSSPNDVVSP 290 300 310 320 330 240 250 260 270 280 290 pF1KB4 ESLFYVVWKIMPNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVS-RSAILQEN-STLSA . . . : : ::.::::.::.:.::: :: :. : :. : :: . : CCDS84 SEFKTQIQRYAPRFVGYNQQDAQEFLRFLLDGLHNEV----NRVTLRPKSNPENLDHLPD 340 350 360 370 380 390 300 310 320 330 340 350 pF1KB4 SNKC------CINGASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQFRSK ..: .. .. . .: : :.. ..: :: : :::: :::: : .: CCDS84 DEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGYCSTVFDPFWDLSLPI-----AK 400 410 420 430 440 360 370 380 390 400 410 pF1KB4 RSKNQENGPVCSLRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFWIQKLPKVLCLHL :. : .: ::.: :: . :: : : .:. ... ::: ::..::.: ::: CCDS84 RGY-----PEVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKILVLHL 450 460 470 480 490 500 420 430 440 450 460 470 pF1KB4 KRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGH ::: . .:. :.:.:::: ::.. . : : . .:.: :: : :. .: :: CCDS84 KRFSESRIRTSKLTTFVNFPLRDLDLREFASENTNHA----VYNLYAVSNHSGTTMG-GH 510 520 530 540 550 480 490 500 510 520 pF1KB4 YTAY--ATHEGRWFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL :::: . :.: ::::.:: . : . ::.::: CCDS84 YTAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM 560 570 580 590 600 >>CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012 aa) initn: 663 init1: 242 opt: 484 Z-score: 529.2 bits: 108.5 E(32554): 3.7e-23 Smith-Waterman score: 674; 34.1% identity (60.9% similar) in 417 aa overlap (110-508:616-1000) 80 90 100 110 120 130 pF1KB4 VQHTVCMDCSSYSTYCYRCDDFVVNDTKLGLVQKVREHLQNLENSAFTADRHKKRKLL-- ..: ..:. . . . :..:..: CCDS61 TPPTHKAKPQIPAERDREPSKLKRSYSSPDITQAIQEEEKRKPTVTPTVNRENKPTCYPK 590 600 610 620 630 640 140 150 160 170 180 190 pF1KB4 -ENSTLN-SKLLKVN----GSTTAICATGLRNLGNTCFMNAILQSLSNIEQFCCYFKELP : : :. :.. ..: :: :. ::::::::::.::.::: : : .. ::. CCDS61 AEISRLSASQIRNLNPVFGGSGPAL--TGLRNLGNTCYMNSILQCLCNAPHLADYFN--- 650 660 670 680 690 700 200 210 220 230 240 250 pF1KB4 AVELRNG-KTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQGSQTAFSPESLFYVVWKIM :: . :. .:. ..::: . ::: :. .::... .. :: CCDS61 ----RNCYQDDINRSNLLGHKGE----VAEEFGIIMKALWTGQYRYISPKDFKITIGKIN 710 720 730 740 750 260 270 280 290 300 pF1KB4 PNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSASNKCCING----- .: ::.:::..:.. .:.: :: .:. . : :. .::. . : .. CCDS61 DQFAGYSQQDSQELLLFLMDGLHEDLNKADN---RKRYKEENNDHLDDFKAAEHAWQKHK 760 770 780 790 800 310 320 330 340 350 360 pF1KB4 --ASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQFRSKRSKNQENGPVCS ....:.: : ... :.:: : .:: :. :. ::: . : :: :. CCDS61 QLNESIIVALFQGQFKSTVQCLTCHKKSRTFEAFMYLSLPLAST--SK----------CT 810 820 830 840 850 370 380 390 400 410 420 pF1KB4 LRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFWIQKLPKVLCLHLKRFHWTAYLRNK :.:::: :. :.: ... ..: .:. .. : ::. : ::: :: .::::: . . ..: CCDS61 LQDCLRLFSKEEKLTDNNRFYCSHCRARRDSLKKIEIWKLPPVLLVHLKRFSYDGRWKQK 860 870 880 890 900 910 430 440 450 460 470 480 pF1KB4 VDTYVEFPLRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGHYTAYATHEGR-- ..: :.:::..::.. :.. :.:. . :.: .: :.: :. .:::::: . .: CCDS61 LQTSVDFPLENLDLSQYVIGPKNNLKK---YNLFSVSNHYG-GLDGGHYTAYCKNAARQR 920 930 940 950 960 970 490 500 510 520 pF1KB4 WFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL ::.:.: :. . .: .. :::::: CCDS61 WFKFDDHEVSDISVSSVKSSAAYILFYTSLGPRVTDVAT 980 990 1000 1010 >>CCDS10137.1 USP8 gene_id:9101|Hs108|chr15 (1118 aa) initn: 663 init1: 242 opt: 484 Z-score: 528.6 bits: 108.5 E(32554): 4e-23 Smith-Waterman score: 674; 34.1% identity (60.9% similar) in 417 aa overlap (110-508:722-1106) 80 90 100 110 120 130 pF1KB4 VQHTVCMDCSSYSTYCYRCDDFVVNDTKLGLVQKVREHLQNLENSAFTADRHKKRKLL-- ..: ..:. . . . :..:..: CCDS10 TPPTHKAKPQIPAERDREPSKLKRSYSSPDITQAIQEEEKRKPTVTPTVNRENKPTCYPK 700 710 720 730 740 750 140 150 160 170 180 190 pF1KB4 -ENSTLN-SKLLKVN----GSTTAICATGLRNLGNTCFMNAILQSLSNIEQFCCYFKELP : : :. :.. ..: :: :. ::::::::::.::.::: : : .. ::. CCDS10 AEISRLSASQIRNLNPVFGGSGPAL--TGLRNLGNTCYMNSILQCLCNAPHLADYFN--- 760 770 780 790 800 200 210 220 230 240 250 pF1KB4 AVELRNG-KTAGRRTYHTRSQGDNNVSLVEEFRKTLCALWQGSQTAFSPESLFYVVWKIM :: . :. .:. ..::: . ::: :. .::... .. :: CCDS10 ----RNCYQDDINRSNLLGHKGE----VAEEFGIIMKALWTGQYRYISPKDFKITIGKIN 810 820 830 840 850 260 270 280 290 300 pF1KB4 PNFRGYQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSASNKCCING----- .: ::.:::..:.. .:.: :: .:. . : :. .::. . : .. CCDS10 DQFAGYSQQDSQELLLFLMDGLHEDLNKADN---RKRYKEENNDHLDDFKAAEHAWQKHK 860 870 880 890 900 910 310 320 330 340 350 360 pF1KB4 --ASTVVTAIFGGILQNEVNCLICGTESRKFDPFLDLSLDIPSQFRSKRSKNQENGPVCS ....:.: : ... :.:: : .:: :. :. ::: . : :: :. CCDS10 QLNESIIVALFQGQFKSTVQCLTCHKKSRTFEAFMYLSLPLAST--SK----------CT 920 930 940 950 960 370 380 390 400 410 420 pF1KB4 LRDCLRSFTDLEELDETELYMCHKCKKKQKSTKKFWIQKLPKVLCLHLKRFHWTAYLRNK :.:::: :. :.: ... ..: .:. .. : ::. : ::: :: .::::: . . ..: CCDS10 LQDCLRLFSKEEKLTDNNRFYCSHCRARRDSLKKIEIWKLPPVLLVHLKRFSYDGRWKQK 970 980 990 1000 1010 1020 430 440 450 460 470 480 pF1KB4 VDTYVEFPLRGLDMKCYLLEPENSGPESCLYDLAAVVVHHGSGVGSGHYTAYATHEGR-- ..: :.:::..::.. :.. :.:. . :.: .: :.: :. .:::::: . .: CCDS10 LQTSVDFPLENLDLSQYVIGPKNNLKK---YNLFSVSNHYG-GLDGGHYTAYCKNAARQR 1030 1040 1050 1060 1070 490 500 510 520 pF1KB4 WFHFNDSTVTLTDEETVVKAKAYILFYVEHQAKAGSDKL ::.:.: :. . .: .. :::::: CCDS10 WFKFDDHEVSDISVSSVKSSAAYILFYTSLGPRVTDVAT 1080 1090 1100 1110 >>CCDS8963.1 USP15 gene_id:9958|Hs108|chr12 (952 aa) initn: 633 init1: 256 opt: 479 Z-score: 524.1 bits: 107.5 E(32554): 7.2e-23 Smith-Waterman score: 479; 43.1% identity (76.9% similar) in 160 aa overlap (360-517:755-910) 330 340 350 360 370 380 pF1KB4 ESRKFDPFLDLSLDIPSQFRSKRSKNQENGPVCSLRDCLRSFTDLEELDETELYMCHKCK : .:.::.. :: :.: . ..: .:: CCDS89 DPDLKKRYFDENAAEDFEKHESVEYKPPKKPFVKLKDCIELFTTKEKLGAEDPWYCPNCK 730 740 750 760 770 780 390 400 410 420 430 440 pF1KB4 KKQKSTKKFWIQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLEPENSGP ..:..:::. . .:: :: .::::: .. :.:.:.:: :.::. :::. .:..: :.:: CCDS89 EHQQATKKLDLWSLPPVLVVHLKRFSYSRYMRDKLDTLVDFPINDLDMSEFLINP-NAGP 790 800 810 820 830 840 450 460 470 480 490 500 pF1KB4 ESCLYDLAAVVVHHGSGVGSGHYTAYATH--EGRWFHFNDSTVTLTDEETVVKAKAYILF : :.: :: :.: :.:.:::::.: . .:.:..:.::.:. ..:. .:. ::.:: CCDS89 --CRYNLIAVSNHYG-GMGGGHYTAFAKNKDDGKWYYFDDSSVSTASEDQIVSKAAYVLF 850 860 870 880 890 900 510 520 pF1KB4 YVEHQAKAGSDKL : .... .:. CCDS89 YQRQDTFSGTGFFPLDRETKGASAATGIPLESDEDSNDNDNDIENENCMHTN 910 920 930 940 950 >>CCDS58251.1 USP15 gene_id:9958|Hs108|chr12 (981 aa) initn: 633 init1: 256 opt: 479 Z-score: 523.9 bits: 107.5 E(32554): 7.3e-23 Smith-Waterman score: 479; 43.1% identity (76.9% similar) in 160 aa overlap (360-517:784-939) 330 340 350 360 370 380 pF1KB4 ESRKFDPFLDLSLDIPSQFRSKRSKNQENGPVCSLRDCLRSFTDLEELDETELYMCHKCK : .:.::.. :: :.: . ..: .:: CCDS58 DPDLKKRYFDENAAEDFEKHESVEYKPPKKPFVKLKDCIELFTTKEKLGAEDPWYCPNCK 760 770 780 790 800 810 390 400 410 420 430 440 pF1KB4 KKQKSTKKFWIQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLEPENSGP ..:..:::. . .:: :: .::::: .. :.:.:.:: :.::. :::. .:..: :.:: CCDS58 EHQQATKKLDLWSLPPVLVVHLKRFSYSRYMRDKLDTLVDFPINDLDMSEFLINP-NAGP 820 830 840 850 860 870 450 460 470 480 490 500 pF1KB4 ESCLYDLAAVVVHHGSGVGSGHYTAYATH--EGRWFHFNDSTVTLTDEETVVKAKAYILF : :.: :: :.: :.:.:::::.: . .:.:..:.::.:. ..:. .:. ::.:: CCDS58 --CRYNLIAVSNHYG-GMGGGHYTAFAKNKDDGKWYYFDDSSVSTASEDQIVSKAAYVLF 880 890 900 910 920 510 520 pF1KB4 YVEHQAKAGSDKL : .... .:. CCDS58 YQRQDTFSGTGFFPLDRETKGASAATGIPLESDEDSNDNDNDIENENCMHTN 930 940 950 960 970 980 520 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 14:55:58 2016 done: Thu Nov 3 14:55:58 2016 Total Scan time: 2.970 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]