FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1003, 913 aa 1>>>pF1KA1003 913 - 913 aa - 913 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4162+/-0.000918; mu= 12.0490+/- 0.056 mean_var=141.1164+/-28.552, 0's: 0 Z-trim(111.4): 93 B-trim: 53 in 1/50 Lambda= 0.107966 statistics sampled from 12251 (12344) to 12251 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.722), E-opt: 0.2 (0.379), width: 16 Scan time: 3.770 The best scores are: opt bits E(32554) CCDS43892.1 USP20 gene_id:10868|Hs108|chr9 ( 914) 6255 986.4 0 CCDS679.1 USP33 gene_id:23032|Hs108|chr1 ( 911) 3097 494.5 3.6e-139 CCDS678.1 USP33 gene_id:23032|Hs108|chr1 ( 942) 3097 494.6 3.7e-139 CCDS680.1 USP33 gene_id:23032|Hs108|chr1 ( 828) 2314 372.6 1.7e-102 CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 ( 476) 424 78.0 4.7e-14 CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 ( 520) 424 78.0 5e-14 CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 ( 362) 394 73.3 9.6e-13 CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 ( 396) 394 73.3 1e-12 CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 ( 605) 394 73.4 1.4e-12 CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012) 384 72.0 6.4e-12 CCDS10137.1 USP8 gene_id:9101|Hs108|chr15 (1118) 384 72.0 6.9e-12 CCDS2794.1 USP4 gene_id:7375|Hs108|chr3 ( 916) 370 69.8 2.7e-11 CCDS2793.1 USP4 gene_id:7375|Hs108|chr3 ( 963) 370 69.8 2.8e-11 >>CCDS43892.1 USP20 gene_id:10868|Hs108|chr9 (914 aa) initn: 3838 init1: 3838 opt: 6255 Z-score: 5270.3 bits: 986.4 E(32554): 0 Smith-Waterman score: 6255; 99.8% identity (99.9% similar) in 914 aa overlap (1-913:1-914) 10 20 30 40 50 60 pF1KA1 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTCQSCGVTGPNLWACLQVACPYVGCGESFADH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTCQSCGVTGPNLWACLQVACPYVGCGESFADH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 STIHAQAKKHNLTVNLTTFRLWCYACEKEVFLEQRLAAPLLGSSSKFSEQDSPPPSHPLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 STIHAQAKKHNLTVNLTTFRLWCYACEKEVFLEQRLAAPLLGSSSKFSEQDSPPPSHPLK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 AVPIAVADEGESESEDDDLKPRGLTGMKNLGNSCYMNAALQALSNCPPLTQFFLECGGLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AVPIAVADEGESESEDDDLKPRGLTGMKNLGNSCYMNAALQALSNCPPLTQFFLECGGLV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 RTDKKPALCKSYQKLVSEVWHKKRPSYVVPTSLSHGIKLVNPMFRGYAQQDTQEFLRCLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RTDKKPALCKSYQKLVSEVWHKKRPSYVVPTSLSHGIKLVNPMFRGYAQQDTQEFLRCLM 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 DQLHEELKEPVVATVALTEARDSDSSDTDEKREGDRSPSEDEFLSCDSSSDRGEGDGQGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DQLHEELKEPVVATVALTEARDSDSSDTDEKREGDRSPSEDEFLSCDSSSDRGEGDGQGR 250 260 270 280 290 300 310 320 330 340 350 pF1KA1 GGGSSQAETELLIPDEAGRVISEKERMKDRKFSWGQQRTNSEQVDEDADVDTAMAALD-Q :::::::::::::::::::.:::::::::::::::::::::::::::::::::::::: : CCDS43 GGGSSQAETELLIPDEAGRAISEKERMKDRKFSWGQQRTNSEQVDEDADVDTAMAALDDQ 310 320 330 340 350 360 360 370 380 390 400 410 pF1KA1 PAEAQPPSPRSSSPCRTPEPDNDAHLRSSSRPCSPVHHHEGHAKLSSSPPRASPVRMAPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PAEAQPPSPRSSSPCRTPEPDNDAHLRSSSRPCSPVHHHEGHAKLSSSPPRASPVRMAPS 370 380 390 400 410 420 420 430 440 450 460 470 pF1KA1 YVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDRVSTTVETFQDLSLPIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 YVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDRVSTTVETFQDLSLPIP 430 440 450 460 470 480 480 490 500 510 520 530 pF1KA1 GKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFVVSCTPSWFWGPVVTLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFVVSCTPSWFWGPVVTLE 490 500 510 520 530 540 540 550 560 570 580 590 pF1KA1 DCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCIHLKRFRHEVMYSFKIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCIHLKRFRHEVMYSFKIN 550 560 570 580 590 600 600 610 620 630 640 650 pF1KA1 SHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHYIAYCQNVINGQWYEFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHYIAYCQNVINGQWYEFD 610 620 630 640 650 660 660 670 680 690 700 710 pF1KA1 DQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMREPSLLRFYVSREWLNKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMREPSLLRFYVSREWLNKF 670 680 690 700 710 720 720 730 740 750 760 770 pF1KA1 NTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHLYNRFGGGPAVNHLYVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHLYNRFGGGPAVNHLYVC 730 740 750 760 770 780 780 790 800 810 820 830 pF1KA1 SICQVEIEALAKRRRIEIDTFIKLNKAFQAEESPGVIYCISMQWFREWEAFVKGKDNEPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SICQVEIEALAKRRRIEIDTFIKLNKAFQAEESPGVIYCISMQWFREWEAFVKGKDNEPP 790 800 810 820 830 840 840 850 860 870 880 890 pF1KA1 GPIDNSRIAQVKGSGHVQLKQGADYGQISEETWTYLNSLYGGGPEIAIRQSVAQPLGPEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GPIDNSRIAQVKGSGHVQLKQGADYGQISEETWTYLNSLYGGGPEIAIRQSVAQPLGPEN 850 860 870 880 890 900 900 910 pF1KA1 LHGEQKIEAETRAV :::::::::::::: CCDS43 LHGEQKIEAETRAV 910 >>CCDS679.1 USP33 gene_id:23032|Hs108|chr1 (911 aa) initn: 2668 init1: 2470 opt: 3097 Z-score: 2611.9 bits: 494.5 E(32554): 3.6e-139 Smith-Waterman score: 3772; 60.1% identity (81.7% similar) in 928 aa overlap (1-913:1-911) 10 20 30 40 50 60 pF1KA1 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTCQSCGVTGPNLWACLQVACPYVGCGESFADH :. :. ::::::.::.:::::. :: ::::.: : ::::::::. : ::::::: .:: CCDS67 MSAFRNHCPHLDSVGEITKEDLIQKSLGTCQDCKVQGPNLWACLENRCSYVGCGESQVDH 10 20 30 40 50 60 70 80 90 100 110 pF1KA1 STIHAQAKKHNLTVNLTTFRLWCYACEKEVFLEQRLAA----PLLGSSSKFSE---QDSP ::::.: :: :::::::.:.::::: :::::...:.. : . . ...: :: CCDS67 STIHSQETKHYLTVNLTTLRVWCYACSKEVFLDRKLGTQPSLPHVRQPHQIQENSVQDFK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KA1 PPSHPLKAVP-IAVADEGESES-EDDDLKPRGLTGMKNLGNSCYMNAALQALSNCPPLTQ ::. .: .:: :. . :. :.:.:. :::::.::.::.:::::::::::::::::: CCDS67 IPSNTTLKTPLVAVFDDLDIEADEEDELRARGLTGLKNIGNTCYMNAALQALSNCPPLTQ 130 140 150 160 170 180 180 190 200 210 220 230 pF1KA1 FFLECGGLVRTDKKPALCKSYQKLVSEVWHKKRPSYVVPTSLSHGIKLVNPMFRGYAQQD :::.::::.:::::::.:::: ::..:.:::.::. ::::.: .::: ::: ::::.::: CCDS67 FFLDCGGLARTDKKPAICKSYLKLMTELWHKSRPGSVVPTTLFQGIKTVNPTFRGYSQQD 190 200 210 220 230 240 240 250 260 270 280 pF1KA1 TQEFLRCLMDQLHEELKEPVVATVALTEARDSDSSDTDEKREGDRSPSEDEFLSCDS--S .::::::::: ::::::: :. . .: .. :.: : :.: :. .: ::.: . CCDS67 AQEFLRCLMDLLHEELKEQVMEV-----EEDPQTITTEETMEEDKSQSDVDFQSCESCSN 250 260 270 280 290 290 300 310 320 330 340 pF1KA1 SDRGEGDGQGRGGGSSQAETELLIPDEAGRVISEKERMKDRKFSWGQQRTNSEQVDEDAD :::.:... .: . .. :: .:: :. . :. .:. :. ...::: . : : CCDS67 SDRAENENGSRCFSEDNNETTMLIQDDENNSEMSKDWQKE-KMCNKINKVNSEG-EFDKD 300 310 320 330 340 350 350 360 370 380 390 400 pF1KA1 VDTAMAALDQPAEAQPPSPRSSSPCRTPEPDNDAHLRSSSRPCSPVHHHEG-HAKLSSSP :. ..: . . . . :. : .:.: . : : . . .:: . .::.:: CCDS67 RDSISETVDLNNQE---TVKVQIHSRASEYITDVHSNDLSTP-QILPSNEGVNPRLSASP 360 370 380 390 400 410 420 430 440 450 460 pF1KA1 PRASPVR--MAPSYVLKKAQVLSAGSRRRKE-QRYRSVISDIFDGSILSLVQCLTCDRVS :... . .:: . :::: ::. .:.:. ..:::::::::::.:.: :::::::::: CCDS67 PKSGNLWPGLAPPH--KKAQ--SASPKRKKQHKKYRSVISDIFDGTIISSVQCLTCDRVS 410 420 430 440 450 460 470 480 490 500 510 520 pF1KA1 TTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFVVS .:.:::::::::::::::::::::. . . .: :.::..:: :::.::..::..::::: CCDS67 VTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAGSCGEAYAPQGWIAFFMEYVKRFVVS 470 480 490 500 510 520 530 540 550 560 570 580 pF1KA1 CTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCIHL :.:::::::::::.:::::::: ::::::::::::.:::::::::.::: .:::::::: CCDS67 CVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCEKCKKLRNGVKFCKVQNFPEILCIHL 530 540 550 560 570 580 590 600 610 620 630 640 pF1KA1 KRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHYIA ::::::.:.: ::..:::::::::::.:::::. .::.::::::::::::::.:::::: CCDS67 KRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSPAQIVTYDLLSVICHHGTASSGHYIA 590 600 610 620 630 640 650 660 670 680 690 700 pF1KA1 YCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMREPS ::.: .:. ::::::: :::: :..:::::.::::::::::::..::... .: . ::: CCDS67 YCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLFYRKSSEEAQKERRRISNLLNIMEPS 650 660 670 680 690 700 710 720 730 740 750 760 pF1KA1 LLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHLYN ::.::.::.:::::.::::::::.:. ::: :::.::.: ::.:::..::::.:..::. CCDS67 LLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGVPPRKAGYIEDLVLMLPQNIWDNLYS 710 720 730 740 750 760 770 780 790 800 810 820 pF1KA1 RFGGGPAVNHLYVCSICQVEIEALAKRRRIEIDTFIKLNKAFQAEESPGVIYCISMQWFR :.::::::::::.: ::.: : . :::. :.. ::.::.::: :.::...::::::::: CCDS67 RYGGGPAVNHLYICHTCQIEAEKIEKRRKTELEIFIRLNRAFQKEDSPATFYCISMQWFR 770 780 790 800 810 820 830 840 850 860 870 880 pF1KA1 EWEAFVKGKDNEPPGPIDNSRIAQVKGSGHVQLKQGADYGQISEETWTYLNSLYGGGPEI :::.::::::..:::::::..:: .: :.:.:.:::: ::::::::..:.:.::::::. CCDS67 EWESFVKGKDGDPPGPIDNTKIAVTK-CGNVMLRQGADSGQISEETWNFLQSIYGGGPEV 830 840 850 860 870 880 890 900 910 pF1KA1 AIRQSVAQPLGPENLHGEQKIEAETRAV .: :.. . :. :..:.:::.:::.. CCDS67 ILRPPVVH-VDPDILQAEEKIEVETRSL 890 900 910 >>CCDS678.1 USP33 gene_id:23032|Hs108|chr1 (942 aa) initn: 2668 init1: 2470 opt: 3097 Z-score: 2611.7 bits: 494.6 E(32554): 3.7e-139 Smith-Waterman score: 3772; 60.1% identity (81.7% similar) in 928 aa overlap (1-913:32-942) 10 20 30 pF1KA1 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTC :. :. ::::::.::.:::::. :: ::: CCDS67 TGSNSHITILTLKVLPHFESLGKQEKIPNKMSAFRNHCPHLDSVGEITKEDLIQKSLGTC 10 20 30 40 50 60 40 50 60 70 80 90 pF1KA1 QSCGVTGPNLWACLQVACPYVGCGESFADHSTIHAQAKKHNLTVNLTTFRLWCYACEKEV :.: : ::::::::. : ::::::: .::::::.: :: :::::::.:.::::: ::: CCDS67 QDCKVQGPNLWACLENRCSYVGCGESQVDHSTIHSQETKHYLTVNLTTLRVWCYACSKEV 70 80 90 100 110 120 100 110 120 130 140 pF1KA1 FLEQRLAA----PLLGSSSKFSE---QDSPPPSHPLKAVP-IAVADEGESES-EDDDLKP ::...:.. : . . ...: :: ::. .: .:: :. . :. :.:.:. CCDS67 FLDRKLGTQPSLPHVRQPHQIQENSVQDFKIPSNTTLKTPLVAVFDDLDIEADEEDELRA 130 140 150 160 170 180 150 160 170 180 190 200 pF1KA1 RGLTGMKNLGNSCYMNAALQALSNCPPLTQFFLECGGLVRTDKKPALCKSYQKLVSEVWH :::::.::.::.:::::::::::::::::::::.::::.:::::::.:::: ::..:.:: CCDS67 RGLTGLKNIGNTCYMNAALQALSNCPPLTQFFLDCGGLARTDKKPAICKSYLKLMTELWH 190 200 210 220 230 240 210 220 230 240 250 260 pF1KA1 KKRPSYVVPTSLSHGIKLVNPMFRGYAQQDTQEFLRCLMDQLHEELKEPVVATVALTEAR :.::. ::::.: .::: ::: ::::.:::.::::::::: ::::::: :. . . CCDS67 KSRPGSVVPTTLFQGIKTVNPTFRGYSQQDAQEFLRCLMDLLHEELKEQVMEV-----EE 250 260 270 280 290 270 280 290 300 310 pF1KA1 DSDSSDTDEKREGDRSPSEDEFLSCDS--SSDRGEGDGQGRGGGSSQAETELLIPDEAGR : .. :.: : :.: :. .: ::.: .:::.:... .: . .. :: .:: :. . CCDS67 DPQTITTEETMEEDKSQSDVDFQSCESCSNSDRAENENGSRCFSEDNNETTMLIQDDENN 300 310 320 330 340 350 320 330 340 350 360 370 pF1KA1 VISEKERMKDRKFSWGQQRTNSEQVDEDADVDTAMAALDQPAEAQPPSPRSSSPCRTPEP :. .:. :. ...::: . : : :. ..: . . . . :. : CCDS67 SEMSKDWQKE-KMCNKINKVNSEG-EFDKDRDSISETVDLNNQE---TVKVQIHSRASEY 360 370 380 390 400 410 380 390 400 410 420 430 pF1KA1 DNDAHLRSSSRPCSPVHHHEG-HAKLSSSPPRASPVR--MAPSYVLKKAQVLSAGSRRRK .:.: . : : . . .:: . .::.:::... . .:: . :::: ::. .:.: CCDS67 ITDVHSNDLSTP-QILPSNEGVNPRLSASPPKSGNLWPGLAPPH--KKAQ--SASPKRKK 420 430 440 450 460 440 450 460 470 480 490 pF1KA1 E-QRYRSVISDIFDGSILSLVQCLTCDRVSTTVETFQDLSLPIPGKEDLAKLHSAIYQNV . ..:::::::::::.:.: ::::::::::.:.:::::::::::::::::::::. . . CCDS67 QHKKYRSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTS 470 480 490 500 510 520 500 510 520 530 540 550 pF1KA1 PAKPGACGDSYAAQGWLAFIVEYIRRFVVSCTPSWFWGPVVTLEDCLAAFFAADELKGDN .: :.::..:: :::.::..::..::::::.:::::::::::.:::::::: ::::::: CCDS67 IVKAGSCGEAYAPQGWIAFFMEYVKRFVVSCVPSWFWGPVVTLQDCLAAFFARDELKGDN 530 540 550 560 570 580 560 570 580 590 600 610 pF1KA1 MYSCERCKKLRNGVKYCKVLRLPEILCIHLKRFRHEVMYSFKINSHVSFPLEGLDLRPFL :::::.:::::::::.::: .::::::::::::::.:.: ::..:::::::::::.::: CCDS67 MYSCEKCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFL 590 600 610 620 630 640 620 630 640 650 660 670 pF1KA1 AKECTSQITTYDLLSVICHHGTAGSGHYIAYCQNVINGQWYEFDDQYVTEVHETVVQNAE ::. .::.::::::::::::::.::::::::.: .:. ::::::: :::: :..::::: CCDS67 AKDSPAQIVTYDLLSVICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAE 650 660 670 680 690 700 680 690 700 710 720 730 pF1KA1 GYVLFYRKSSEEAMRERQQVVSLAAMREPSLLRFYVSREWLNKFNTFAEPGPITNQTFLC .::::::::::::..::... .: . :::::.::.::.:::::.::::::::.:. ::: CCDS67 AYVLFYRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLC 710 720 730 740 750 760 740 750 760 770 780 790 pF1KA1 SHGGIPPHKYHYIDDLVVILPQNVWEHLYNRFGGGPAVNHLYVCSICQVEIEALAKRRRI :::.::.: ::.:::..::::.:..::.:.::::::::::.: ::.: : . :::. CCDS67 IHGGVPPRKAGYIEDLVLMLPQNIWDNLYSRYGGGPAVNHLYICHTCQIEAEKIEKRRKT 770 780 790 800 810 820 800 810 820 830 840 850 pF1KA1 EIDTFIKLNKAFQAEESPGVIYCISMQWFREWEAFVKGKDNEPPGPIDNSRIAQVKGSGH :.. ::.::.::: :.::...::::::::::::.::::::..:::::::..:: .: :. CCDS67 ELEIFIRLNRAFQKEDSPATFYCISMQWFREWESFVKGKDGDPPGPIDNTKIAVTK-CGN 830 840 850 860 870 880 860 870 880 890 900 910 pF1KA1 VQLKQGADYGQISEETWTYLNSLYGGGPEIAIRQSVAQPLGPENLHGEQKIEAETRAV :.:.:::: ::::::::..:.:.::::::. .: :.. . :. :..:.:::.:::.. CCDS67 VMLRQGADSGQISEETWNFLQSIYGGGPEVILRPPVVH-VDPDILQAEEKIEVETRSL 890 900 910 920 930 940 >>CCDS680.1 USP33 gene_id:23032|Hs108|chr1 (828 aa) initn: 2184 init1: 1493 opt: 2314 Z-score: 1953.4 bits: 372.6 E(32554): 1.7e-102 Smith-Waterman score: 3201; 58.8% identity (79.6% similar) in 820 aa overlap (1-805:32-828) 10 20 30 pF1KA1 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTC :. :. ::::::.::.:::::. :: ::: CCDS68 TGSNSHITILTLKVLPHFESLGKQEKIPNKMSAFRNHCPHLDSVGEITKEDLIQKSLGTC 10 20 30 40 50 60 40 50 60 70 80 90 pF1KA1 QSCGVTGPNLWACLQVACPYVGCGESFADHSTIHAQAKKHNLTVNLTTFRLWCYACEKEV :.: : ::::::::. : ::::::: .::::::.: :: :::::::.:.::::: ::: CCDS68 QDCKVQGPNLWACLENRCSYVGCGESQVDHSTIHSQETKHYLTVNLTTLRVWCYACSKEV 70 80 90 100 110 120 100 110 120 130 140 pF1KA1 FLEQRLAA----PLLGSSSKFSE---QDSPPPSHPLKAVP-IAVADEGESES-EDDDLKP ::...:.. : . . ...: :: ::. .: .:: :. . :. :.:.:. CCDS68 FLDRKLGTQPSLPHVRQPHQIQENSVQDFKIPSNTTLKTPLVAVFDDLDIEADEEDELRA 130 140 150 160 170 180 150 160 170 180 190 200 pF1KA1 RGLTGMKNLGNSCYMNAALQALSNCPPLTQFFLECGGLVRTDKKPALCKSYQKLVSEVWH :::::.::.::.:::::::::::::::::::::.::::.:::::::.:::: ::..:.:: CCDS68 RGLTGLKNIGNTCYMNAALQALSNCPPLTQFFLDCGGLARTDKKPAICKSYLKLMTELWH 190 200 210 220 230 240 210 220 230 240 250 260 pF1KA1 KKRPSYVVPTSLSHGIKLVNPMFRGYAQQDTQEFLRCLMDQLHEELKEPVVATVALTEAR :.::. ::::.: .::: ::: ::::.:::.::::::::: ::::::: :. . . CCDS68 KSRPGSVVPTTLFQGIKTVNPTFRGYSQQDAQEFLRCLMDLLHEELKEQVMEV-----EE 250 260 270 280 290 270 280 290 300 310 pF1KA1 DSDSSDTDEKREGDRSPSEDEFLSCDS--SSDRGEGDGQGRGGGSSQAETELLIPDEAGR : .. :.: : :.: :. .: ::.: .:::.:... .: . .. :: .:: :. . CCDS68 DPQTITTEETMEEDKSQSDVDFQSCESCSNSDRAENENGSRCFSEDNNETTMLIQDDENN 300 310 320 330 340 350 320 330 340 350 360 370 pF1KA1 VISEKERMKDRKFSWGQQRTNSEQVDEDADVDTAMAALDQPAEAQPPSPRSSSPCRTPEP :. .:. :. ...::: . : : :. ..: . . . . :. : CCDS68 SEMSKDWQKE-KMCNKINKVNSEG-EFDKDRDSISETVDLNNQE---TVKVQIHSRASEY 360 370 380 390 400 410 380 390 400 410 420 430 pF1KA1 DNDAHLRSSSRPCSPVHHHEG-HAKLSSSPPRASPVR--MAPSYVLKKAQVLSAGSRRRK .:.: . : : . . .:: . .::.:::... . .:: . :::: ::. .:.: CCDS68 ITDVHSNDLSTP-QILPSNEGVNPRLSASPPKSGNLWPGLAPPH--KKAQ--SASPKRKK 420 430 440 450 460 440 450 460 470 480 490 pF1KA1 E-QRYRSVISDIFDGSILSLVQCLTCDRVSTTVETFQDLSLPIPGKEDLAKLHSAIYQNV . ..:::::::::::.:.: ::::::::::.:.:::::::::::::::::::::. . . CCDS68 QHKKYRSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTS 470 480 490 500 510 520 500 510 520 530 540 550 pF1KA1 PAKPGACGDSYAAQGWLAFIVEYIRRFVVSCTPSWFWGPVVTLEDCLAAFFAADELKGDN .: :.::..:: :::.::..::.. ::::::::::.:::::::: ::::::: CCDS68 IVKAGSCGEAYAPQGWIAFFMEYVK--------SWFWGPVVTLQDCLAAFFARDELKGDN 530 540 550 560 570 560 570 580 590 600 610 pF1KA1 MYSCERCKKLRNGVKYCKVLRLPEILCIHLKRFRHEVMYSFKINSHVSFPLEGLDLRPFL :::::.:::::::::.::: .::::::::::::::.:.: ::..:::::::::::.::: CCDS68 MYSCEKCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFL 580 590 600 610 620 630 620 630 640 650 660 670 pF1KA1 AKECTSQITTYDLLSVICHHGTAGSGHYIAYCQNVINGQWYEFDDQYVTEVHETVVQNAE ::. .::.::::::::::::::.::::::::.: .:. ::::::: :::: :..::::: CCDS68 AKDSPAQIVTYDLLSVICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAE 640 650 660 670 680 690 680 690 700 710 720 730 pF1KA1 GYVLFYRKSSEEAMRERQQVVSLAAMREPSLLRFYVSREWLNKFNTFAEPGPITNQTFLC .::::::::::::..::... .: . :::::.::.::.:::::.::::::::.:. ::: CCDS68 AYVLFYRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLC 700 710 720 730 740 750 740 750 760 770 780 790 pF1KA1 SHGGIPPHKYHYIDDLVVILPQNVWEHLYNRFGGGPAVNHLYVCSICQVEIEALAKRRRI :::.::.: ::.:::..::::.:..::.:.::::::::::.: ::.: : . :::. CCDS68 IHGGVPPRKAGYIEDLVLMLPQNIWDNLYSRYGGGPAVNHLYICHTCQIEAEKIEKRRKT 760 770 780 790 800 810 800 810 820 830 840 850 pF1KA1 EIDTFIKLNKAFQAEESPGVIYCISMQWFREWEAFVKGKDNEPPGPIDNSRIAQVKGSGH :.. ::...: CCDS68 ELEIFIRVKK 820 >>CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 (476 aa) initn: 642 init1: 257 opt: 424 Z-score: 365.9 bits: 78.0 E(32554): 4.7e-14 Smith-Waterman score: 437; 31.4% identity (57.8% similar) in 277 aa overlap (419-692:242-475) 390 400 410 420 430 440 pF1KA1 SRPCSPVHHHEGHAKLSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIF : .:.. ..::: : . . .:.. :: CCDS58 YQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSA-SNKCCINGASTVVTAIF 220 230 240 250 260 270 450 460 470 480 490 500 pF1KA1 DGSILSLVQCLTCDRVSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAA : . . :.:: : : . : :::: ::.. . . .: .: CCDS58 GGILQNEVNCLICGTESRKFDPFLDLSLDIPSQ--FRSKRSKNQEN-------------- 280 290 300 310 510 520 530 540 550 560 pF1KA1 QGWLAFIVEYIRRFVVSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNG ::: .:.::: .: .:: ..: :..::: ... CCDS58 ------------------------GPVCSLRDCLRSFTDLEELDETELYMCHKCKKKQKS 320 330 340 350 570 580 590 600 610 620 pF1KA1 VKYCKVLRLPEILCIHLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTS--QITTY .: . .::..::.:::::. .. :....: :::.:::.. .: . .: . : CCDS58 TKKFWIQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLY 360 370 380 390 400 410 630 640 650 660 670 680 pF1KA1 DLLSVICHHGTA-GSGHYIAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSS :: .:. :::.. ::::: :: . .:.:..:.:. :: . : .: .:..:.::: . . CCDS58 DLAAVVVHHGSGVGSGHYTAYATH--EGRWFHFNDSTVTLTDEETVVKAKAYILFYVEHQ 420 430 440 450 460 690 700 710 720 730 740 pF1KA1 EEAMRERQQVVSLAAMREPSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKY .: .. CCDS58 AKAGSDKL 470 >>CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 (520 aa) initn: 642 init1: 257 opt: 424 Z-score: 365.3 bits: 78.0 E(32554): 5e-14 Smith-Waterman score: 437; 31.4% identity (57.8% similar) in 277 aa overlap (419-692:286-519) 390 400 410 420 430 440 pF1KA1 SRPCSPVHHHEGHAKLSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIF : .:.. ..::: : . . .:.. :: CCDS32 YQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSA-SNKCCINGASTVVTAIF 260 270 280 290 300 310 450 460 470 480 490 500 pF1KA1 DGSILSLVQCLTCDRVSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAA : . . :.:: : : . : :::: ::.. . . .: .: CCDS32 GGILQNEVNCLICGTESRKFDPFLDLSLDIPSQ--FRSKRSKNQEN-------------- 320 330 340 350 510 520 530 540 550 560 pF1KA1 QGWLAFIVEYIRRFVVSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNG ::: .:.::: .: .:: ..: :..::: ... CCDS32 ------------------------GPVCSLRDCLRSFTDLEELDETELYMCHKCKKKQKS 360 370 380 390 570 580 590 600 610 620 pF1KA1 VKYCKVLRLPEILCIHLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTS--QITTY .: . .::..::.:::::. .. :....: :::.:::.. .: . .: . : CCDS32 TKKFWIQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLY 400 410 420 430 440 450 630 640 650 660 670 680 pF1KA1 DLLSVICHHGTA-GSGHYIAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSS :: .:. :::.. ::::: :: . .:.:..:.:. :: . : .: .:..:.::: . . CCDS32 DLAAVVVHHGSGVGSGHYTAYATH--EGRWFHFNDSTVTLTDEETVVKAKAYILFYVEHQ 460 470 480 490 500 510 690 700 710 720 730 740 pF1KA1 EEAMRERQQVVSLAAMREPSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKY .: .. CCDS32 AKAGSDKL 520 >>CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 (362 aa) initn: 740 init1: 225 opt: 394 Z-score: 342.3 bits: 73.3 E(32554): 9.6e-13 Smith-Waterman score: 405; 32.5% identity (54.8% similar) in 252 aa overlap (434-685:158-357) 410 420 430 440 450 460 pF1KA1 LSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDR :. .: : :.:.: :.. : . : : CCDS58 NEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGY 130 140 150 160 170 180 470 480 490 500 510 520 pF1KA1 VSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFV ::. . : :::::: : .:. CCDS58 CSTVFDPFWDLSLPI----------------------------AKRGY------------ 190 200 530 540 550 560 570 580 pF1KA1 VSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCI : ::: ::. : : : ::. .: ::. . .: .. :.:.:: . CCDS58 ----------PEVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKILVL 210 220 230 240 250 590 600 610 620 630 640 pF1KA1 HLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHY ::::: . . . :... :.:::. :::: : :.: :.. ..:.: .: : ::. .::: CCDS58 HLKRFSESRIRTSKLTTFVNFPLRDLDLREF-ASENTNH-AVYNLYAVSNHSGTTMGGHY 260 270 280 290 300 310 650 660 670 680 690 700 pF1KA1 IAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMRE :::.. .:.:. :.:. :: . . :.....:.:::. .: CCDS58 TAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM 320 330 340 350 360 710 720 730 740 750 760 pF1KA1 PSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHL >>CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 (396 aa) initn: 736 init1: 225 opt: 394 Z-score: 341.7 bits: 73.3 E(32554): 1e-12 Smith-Waterman score: 405; 32.5% identity (54.8% similar) in 252 aa overlap (434-685:192-391) 410 420 430 440 450 460 pF1KA1 LSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDR :. .: : :.:.: :.. : . : : CCDS84 NEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGY 170 180 190 200 210 220 470 480 490 500 510 520 pF1KA1 VSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFV ::. . : :::::: : .:. CCDS84 CSTVFDPFWDLSLPI----------------------------AKRGY------------ 230 240 530 540 550 560 570 580 pF1KA1 VSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCI : ::: ::. : : : ::. .: ::. . .: .. :.:.:: . CCDS84 ----------PEVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKILVL 250 260 270 280 290 590 600 610 620 630 640 pF1KA1 HLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHY ::::: . . . :... :.:::. :::: : :.: :.. ..:.: .: : ::. .::: CCDS84 HLKRFSESRIRTSKLTTFVNFPLRDLDLREF-ASENTNH-AVYNLYAVSNHSGTTMGGHY 300 310 320 330 340 650 660 670 680 690 700 pF1KA1 IAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMRE :::.. .:.:. :.:. :: . . :.....:.:::. .: CCDS84 TAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM 350 360 370 380 390 710 720 730 740 750 760 pF1KA1 PSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHL >>CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 (605 aa) initn: 736 init1: 225 opt: 394 Z-score: 339.1 bits: 73.4 E(32554): 1.4e-12 Smith-Waterman score: 405; 32.5% identity (54.8% similar) in 252 aa overlap (434-685:401-600) 410 420 430 440 450 460 pF1KA1 LSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDR :. .: : :.:.: :.. : . : : CCDS84 NEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGY 380 390 400 410 420 430 470 480 490 500 510 520 pF1KA1 VSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFV ::. . : :::::: : .:. CCDS84 CSTVFDPFWDLSLPI----------------------------AKRGY------------ 440 450 530 540 550 560 570 580 pF1KA1 VSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCI : ::: ::. : : : ::. .: ::. . .: .. :.:.:: . CCDS84 ----------PEVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKILVL 460 470 480 490 500 590 600 610 620 630 640 pF1KA1 HLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHY ::::: . . . :... :.:::. :::: : :.: :.. ..:.: .: : ::. .::: CCDS84 HLKRFSESRIRTSKLTTFVNFPLRDLDLREF-ASENTNH-AVYNLYAVSNHSGTTMGGHY 510 520 530 540 550 650 660 670 680 690 700 pF1KA1 IAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMRE :::.. .:.:. :.:. :: . . :.....:.:::. .: CCDS84 TAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM 560 570 580 590 600 710 720 730 740 750 760 pF1KA1 PSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHL >>CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012 aa) initn: 674 init1: 214 opt: 384 Z-score: 327.5 bits: 72.0 E(32554): 6.4e-12 Smith-Waterman score: 405; 29.8% identity (55.6% similar) in 248 aa overlap (434-681:806-1000) 410 420 430 440 450 460 pF1KA1 LSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDR ....: .:.: .:.:.. : :::::: . CCDS61 EDLNKADNRKRYKEENNDHLDDFKAAEHAWQKHKQLNESIIVALFQGQFKSTVQCLTCHK 780 790 800 810 820 830 470 480 490 500 510 520 pF1KA1 VSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFV : : :.:. ::::. :. . : CCDS61 KSRTFEAFMYLSLPL------------------ASTSKC--------------------- 840 850 530 540 550 560 570 580 pF1KA1 VSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCI ::.::: : ..: .: . : .:. :...: .. .:: .: . CCDS61 -------------TLQDCLRLFSKEEKLTDNNRFYCSHCRARRDSLKKIEIWKLPPVLLV 860 870 880 890 900 590 600 610 620 630 640 pF1KA1 HLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHY ::::: .. .. :... :.::::.::: .. ... :.:.:: :.: .::: CCDS61 HLKRFSYDGRWKQKLQTSVDFPLENLDLSQYVIGP-KNNLKKYNLFSVSNHYGGLDGGHY 910 920 930 940 950 960 650 660 670 680 690 700 pF1KA1 IAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMRE :::.:. .:..:::. :... . :... .:.::: CCDS61 TAYCKNAARQRWFKFDDHEVSDISVSSVKSSAAYILFYTSLGPRVTDVAT 970 980 990 1000 1010 710 720 730 740 750 760 pF1KA1 PSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHL 913 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 20:14:12 2016 done: Wed Nov 2 20:14:13 2016 Total Scan time: 3.770 Total Display time: 0.200 Function used was FASTA [36.3.4 Apr, 2011]