FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1003, 913 aa
1>>>pF1KA1003 913 - 913 aa - 913 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.4162+/-0.000918; mu= 12.0490+/- 0.056
mean_var=141.1164+/-28.552, 0's: 0 Z-trim(111.4): 93 B-trim: 53 in 1/50
Lambda= 0.107966
statistics sampled from 12251 (12344) to 12251 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.722), E-opt: 0.2 (0.379), width: 16
Scan time: 3.770
The best scores are: opt bits E(32554)
CCDS43892.1 USP20 gene_id:10868|Hs108|chr9 ( 914) 6255 986.4 0
CCDS679.1 USP33 gene_id:23032|Hs108|chr1 ( 911) 3097 494.5 3.6e-139
CCDS678.1 USP33 gene_id:23032|Hs108|chr1 ( 942) 3097 494.6 3.7e-139
CCDS680.1 USP33 gene_id:23032|Hs108|chr1 ( 828) 2314 372.6 1.7e-102
CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 ( 476) 424 78.0 4.7e-14
CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 ( 520) 424 78.0 5e-14
CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 ( 362) 394 73.3 9.6e-13
CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 ( 396) 394 73.3 1e-12
CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 ( 605) 394 73.4 1.4e-12
CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012) 384 72.0 6.4e-12
CCDS10137.1 USP8 gene_id:9101|Hs108|chr15 (1118) 384 72.0 6.9e-12
CCDS2794.1 USP4 gene_id:7375|Hs108|chr3 ( 916) 370 69.8 2.7e-11
CCDS2793.1 USP4 gene_id:7375|Hs108|chr3 ( 963) 370 69.8 2.8e-11
>>CCDS43892.1 USP20 gene_id:10868|Hs108|chr9 (914 aa)
initn: 3838 init1: 3838 opt: 6255 Z-score: 5270.3 bits: 986.4 E(32554): 0
Smith-Waterman score: 6255; 99.8% identity (99.9% similar) in 914 aa overlap (1-913:1-914)
10 20 30 40 50 60
pF1KA1 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTCQSCGVTGPNLWACLQVACPYVGCGESFADH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTCQSCGVTGPNLWACLQVACPYVGCGESFADH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 STIHAQAKKHNLTVNLTTFRLWCYACEKEVFLEQRLAAPLLGSSSKFSEQDSPPPSHPLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 STIHAQAKKHNLTVNLTTFRLWCYACEKEVFLEQRLAAPLLGSSSKFSEQDSPPPSHPLK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 AVPIAVADEGESESEDDDLKPRGLTGMKNLGNSCYMNAALQALSNCPPLTQFFLECGGLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AVPIAVADEGESESEDDDLKPRGLTGMKNLGNSCYMNAALQALSNCPPLTQFFLECGGLV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 RTDKKPALCKSYQKLVSEVWHKKRPSYVVPTSLSHGIKLVNPMFRGYAQQDTQEFLRCLM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RTDKKPALCKSYQKLVSEVWHKKRPSYVVPTSLSHGIKLVNPMFRGYAQQDTQEFLRCLM
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 DQLHEELKEPVVATVALTEARDSDSSDTDEKREGDRSPSEDEFLSCDSSSDRGEGDGQGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DQLHEELKEPVVATVALTEARDSDSSDTDEKREGDRSPSEDEFLSCDSSSDRGEGDGQGR
250 260 270 280 290 300
310 320 330 340 350
pF1KA1 GGGSSQAETELLIPDEAGRVISEKERMKDRKFSWGQQRTNSEQVDEDADVDTAMAALD-Q
:::::::::::::::::::.:::::::::::::::::::::::::::::::::::::: :
CCDS43 GGGSSQAETELLIPDEAGRAISEKERMKDRKFSWGQQRTNSEQVDEDADVDTAMAALDDQ
310 320 330 340 350 360
360 370 380 390 400 410
pF1KA1 PAEAQPPSPRSSSPCRTPEPDNDAHLRSSSRPCSPVHHHEGHAKLSSSPPRASPVRMAPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PAEAQPPSPRSSSPCRTPEPDNDAHLRSSSRPCSPVHHHEGHAKLSSSPPRASPVRMAPS
370 380 390 400 410 420
420 430 440 450 460 470
pF1KA1 YVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDRVSTTVETFQDLSLPIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 YVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDRVSTTVETFQDLSLPIP
430 440 450 460 470 480
480 490 500 510 520 530
pF1KA1 GKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFVVSCTPSWFWGPVVTLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFVVSCTPSWFWGPVVTLE
490 500 510 520 530 540
540 550 560 570 580 590
pF1KA1 DCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCIHLKRFRHEVMYSFKIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCIHLKRFRHEVMYSFKIN
550 560 570 580 590 600
600 610 620 630 640 650
pF1KA1 SHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHYIAYCQNVINGQWYEFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHYIAYCQNVINGQWYEFD
610 620 630 640 650 660
660 670 680 690 700 710
pF1KA1 DQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMREPSLLRFYVSREWLNKF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMREPSLLRFYVSREWLNKF
670 680 690 700 710 720
720 730 740 750 760 770
pF1KA1 NTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHLYNRFGGGPAVNHLYVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHLYNRFGGGPAVNHLYVC
730 740 750 760 770 780
780 790 800 810 820 830
pF1KA1 SICQVEIEALAKRRRIEIDTFIKLNKAFQAEESPGVIYCISMQWFREWEAFVKGKDNEPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SICQVEIEALAKRRRIEIDTFIKLNKAFQAEESPGVIYCISMQWFREWEAFVKGKDNEPP
790 800 810 820 830 840
840 850 860 870 880 890
pF1KA1 GPIDNSRIAQVKGSGHVQLKQGADYGQISEETWTYLNSLYGGGPEIAIRQSVAQPLGPEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GPIDNSRIAQVKGSGHVQLKQGADYGQISEETWTYLNSLYGGGPEIAIRQSVAQPLGPEN
850 860 870 880 890 900
900 910
pF1KA1 LHGEQKIEAETRAV
::::::::::::::
CCDS43 LHGEQKIEAETRAV
910
>>CCDS679.1 USP33 gene_id:23032|Hs108|chr1 (911 aa)
initn: 2668 init1: 2470 opt: 3097 Z-score: 2611.9 bits: 494.5 E(32554): 3.6e-139
Smith-Waterman score: 3772; 60.1% identity (81.7% similar) in 928 aa overlap (1-913:1-911)
10 20 30 40 50 60
pF1KA1 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTCQSCGVTGPNLWACLQVACPYVGCGESFADH
:. :. ::::::.::.:::::. :: ::::.: : ::::::::. : ::::::: .::
CCDS67 MSAFRNHCPHLDSVGEITKEDLIQKSLGTCQDCKVQGPNLWACLENRCSYVGCGESQVDH
10 20 30 40 50 60
70 80 90 100 110
pF1KA1 STIHAQAKKHNLTVNLTTFRLWCYACEKEVFLEQRLAA----PLLGSSSKFSE---QDSP
::::.: :: :::::::.:.::::: :::::...:.. : . . ...: ::
CCDS67 STIHSQETKHYLTVNLTTLRVWCYACSKEVFLDRKLGTQPSLPHVRQPHQIQENSVQDFK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KA1 PPSHPLKAVP-IAVADEGESES-EDDDLKPRGLTGMKNLGNSCYMNAALQALSNCPPLTQ
::. .: .:: :. . :. :.:.:. :::::.::.::.::::::::::::::::::
CCDS67 IPSNTTLKTPLVAVFDDLDIEADEEDELRARGLTGLKNIGNTCYMNAALQALSNCPPLTQ
130 140 150 160 170 180
180 190 200 210 220 230
pF1KA1 FFLECGGLVRTDKKPALCKSYQKLVSEVWHKKRPSYVVPTSLSHGIKLVNPMFRGYAQQD
:::.::::.:::::::.:::: ::..:.:::.::. ::::.: .::: ::: ::::.:::
CCDS67 FFLDCGGLARTDKKPAICKSYLKLMTELWHKSRPGSVVPTTLFQGIKTVNPTFRGYSQQD
190 200 210 220 230 240
240 250 260 270 280
pF1KA1 TQEFLRCLMDQLHEELKEPVVATVALTEARDSDSSDTDEKREGDRSPSEDEFLSCDS--S
.::::::::: ::::::: :. . .: .. :.: : :.: :. .: ::.: .
CCDS67 AQEFLRCLMDLLHEELKEQVMEV-----EEDPQTITTEETMEEDKSQSDVDFQSCESCSN
250 260 270 280 290
290 300 310 320 330 340
pF1KA1 SDRGEGDGQGRGGGSSQAETELLIPDEAGRVISEKERMKDRKFSWGQQRTNSEQVDEDAD
:::.:... .: . .. :: .:: :. . :. .:. :. ...::: . : :
CCDS67 SDRAENENGSRCFSEDNNETTMLIQDDENNSEMSKDWQKE-KMCNKINKVNSEG-EFDKD
300 310 320 330 340 350
350 360 370 380 390 400
pF1KA1 VDTAMAALDQPAEAQPPSPRSSSPCRTPEPDNDAHLRSSSRPCSPVHHHEG-HAKLSSSP
:. ..: . . . . :. : .:.: . : : . . .:: . .::.::
CCDS67 RDSISETVDLNNQE---TVKVQIHSRASEYITDVHSNDLSTP-QILPSNEGVNPRLSASP
360 370 380 390 400
410 420 430 440 450 460
pF1KA1 PRASPVR--MAPSYVLKKAQVLSAGSRRRKE-QRYRSVISDIFDGSILSLVQCLTCDRVS
:... . .:: . :::: ::. .:.:. ..:::::::::::.:.: ::::::::::
CCDS67 PKSGNLWPGLAPPH--KKAQ--SASPKRKKQHKKYRSVISDIFDGTIISSVQCLTCDRVS
410 420 430 440 450 460
470 480 490 500 510 520
pF1KA1 TTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFVVS
.:.:::::::::::::::::::::. . . .: :.::..:: :::.::..::..:::::
CCDS67 VTLETFQDLSLPIPGKEDLAKLHSSSHPTSIVKAGSCGEAYAPQGWIAFFMEYVKRFVVS
470 480 490 500 510 520
530 540 550 560 570 580
pF1KA1 CTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCIHL
:.:::::::::::.:::::::: ::::::::::::.:::::::::.::: .::::::::
CCDS67 CVPSWFWGPVVTLQDCLAAFFARDELKGDNMYSCEKCKKLRNGVKFCKVQNFPEILCIHL
530 540 550 560 570 580
590 600 610 620 630 640
pF1KA1 KRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHYIA
::::::.:.: ::..:::::::::::.:::::. .::.::::::::::::::.::::::
CCDS67 KRFRHELMFSTKISTHVSFPLEGLDLQPFLAKDSPAQIVTYDLLSVICHHGTASSGHYIA
590 600 610 620 630 640
650 660 670 680 690 700
pF1KA1 YCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMREPS
::.: .:. ::::::: :::: :..:::::.::::::::::::..::... .: . :::
CCDS67 YCRNNLNNLWYEFDDQSVTEVSESTVQNAEAYVLFYRKSSEEAQKERRRISNLLNIMEPS
650 660 670 680 690 700
710 720 730 740 750 760
pF1KA1 LLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHLYN
::.::.::.:::::.::::::::.:. ::: :::.::.: ::.:::..::::.:..::.
CCDS67 LLQFYISRQWLNKFKTFAEPGPISNNDFLCIHGGVPPRKAGYIEDLVLMLPQNIWDNLYS
710 720 730 740 750 760
770 780 790 800 810 820
pF1KA1 RFGGGPAVNHLYVCSICQVEIEALAKRRRIEIDTFIKLNKAFQAEESPGVIYCISMQWFR
:.::::::::::.: ::.: : . :::. :.. ::.::.::: :.::...:::::::::
CCDS67 RYGGGPAVNHLYICHTCQIEAEKIEKRRKTELEIFIRLNRAFQKEDSPATFYCISMQWFR
770 780 790 800 810 820
830 840 850 860 870 880
pF1KA1 EWEAFVKGKDNEPPGPIDNSRIAQVKGSGHVQLKQGADYGQISEETWTYLNSLYGGGPEI
:::.::::::..:::::::..:: .: :.:.:.:::: ::::::::..:.:.::::::.
CCDS67 EWESFVKGKDGDPPGPIDNTKIAVTK-CGNVMLRQGADSGQISEETWNFLQSIYGGGPEV
830 840 850 860 870 880
890 900 910
pF1KA1 AIRQSVAQPLGPENLHGEQKIEAETRAV
.: :.. . :. :..:.:::.:::..
CCDS67 ILRPPVVH-VDPDILQAEEKIEVETRSL
890 900 910
>>CCDS678.1 USP33 gene_id:23032|Hs108|chr1 (942 aa)
initn: 2668 init1: 2470 opt: 3097 Z-score: 2611.7 bits: 494.6 E(32554): 3.7e-139
Smith-Waterman score: 3772; 60.1% identity (81.7% similar) in 928 aa overlap (1-913:32-942)
10 20 30
pF1KA1 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTC
:. :. ::::::.::.:::::. :: :::
CCDS67 TGSNSHITILTLKVLPHFESLGKQEKIPNKMSAFRNHCPHLDSVGEITKEDLIQKSLGTC
10 20 30 40 50 60
40 50 60 70 80 90
pF1KA1 QSCGVTGPNLWACLQVACPYVGCGESFADHSTIHAQAKKHNLTVNLTTFRLWCYACEKEV
:.: : ::::::::. : ::::::: .::::::.: :: :::::::.:.::::: :::
CCDS67 QDCKVQGPNLWACLENRCSYVGCGESQVDHSTIHSQETKHYLTVNLTTLRVWCYACSKEV
70 80 90 100 110 120
100 110 120 130 140
pF1KA1 FLEQRLAA----PLLGSSSKFSE---QDSPPPSHPLKAVP-IAVADEGESES-EDDDLKP
::...:.. : . . ...: :: ::. .: .:: :. . :. :.:.:.
CCDS67 FLDRKLGTQPSLPHVRQPHQIQENSVQDFKIPSNTTLKTPLVAVFDDLDIEADEEDELRA
130 140 150 160 170 180
150 160 170 180 190 200
pF1KA1 RGLTGMKNLGNSCYMNAALQALSNCPPLTQFFLECGGLVRTDKKPALCKSYQKLVSEVWH
:::::.::.::.:::::::::::::::::::::.::::.:::::::.:::: ::..:.::
CCDS67 RGLTGLKNIGNTCYMNAALQALSNCPPLTQFFLDCGGLARTDKKPAICKSYLKLMTELWH
190 200 210 220 230 240
210 220 230 240 250 260
pF1KA1 KKRPSYVVPTSLSHGIKLVNPMFRGYAQQDTQEFLRCLMDQLHEELKEPVVATVALTEAR
:.::. ::::.: .::: ::: ::::.:::.::::::::: ::::::: :. . .
CCDS67 KSRPGSVVPTTLFQGIKTVNPTFRGYSQQDAQEFLRCLMDLLHEELKEQVMEV-----EE
250 260 270 280 290
270 280 290 300 310
pF1KA1 DSDSSDTDEKREGDRSPSEDEFLSCDS--SSDRGEGDGQGRGGGSSQAETELLIPDEAGR
: .. :.: : :.: :. .: ::.: .:::.:... .: . .. :: .:: :. .
CCDS67 DPQTITTEETMEEDKSQSDVDFQSCESCSNSDRAENENGSRCFSEDNNETTMLIQDDENN
300 310 320 330 340 350
320 330 340 350 360 370
pF1KA1 VISEKERMKDRKFSWGQQRTNSEQVDEDADVDTAMAALDQPAEAQPPSPRSSSPCRTPEP
:. .:. :. ...::: . : : :. ..: . . . . :. :
CCDS67 SEMSKDWQKE-KMCNKINKVNSEG-EFDKDRDSISETVDLNNQE---TVKVQIHSRASEY
360 370 380 390 400 410
380 390 400 410 420 430
pF1KA1 DNDAHLRSSSRPCSPVHHHEG-HAKLSSSPPRASPVR--MAPSYVLKKAQVLSAGSRRRK
.:.: . : : . . .:: . .::.:::... . .:: . :::: ::. .:.:
CCDS67 ITDVHSNDLSTP-QILPSNEGVNPRLSASPPKSGNLWPGLAPPH--KKAQ--SASPKRKK
420 430 440 450 460
440 450 460 470 480 490
pF1KA1 E-QRYRSVISDIFDGSILSLVQCLTCDRVSTTVETFQDLSLPIPGKEDLAKLHSAIYQNV
. ..:::::::::::.:.: ::::::::::.:.:::::::::::::::::::::. . .
CCDS67 QHKKYRSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTS
470 480 490 500 510 520
500 510 520 530 540 550
pF1KA1 PAKPGACGDSYAAQGWLAFIVEYIRRFVVSCTPSWFWGPVVTLEDCLAAFFAADELKGDN
.: :.::..:: :::.::..::..::::::.:::::::::::.:::::::: :::::::
CCDS67 IVKAGSCGEAYAPQGWIAFFMEYVKRFVVSCVPSWFWGPVVTLQDCLAAFFARDELKGDN
530 540 550 560 570 580
560 570 580 590 600 610
pF1KA1 MYSCERCKKLRNGVKYCKVLRLPEILCIHLKRFRHEVMYSFKINSHVSFPLEGLDLRPFL
:::::.:::::::::.::: .::::::::::::::.:.: ::..:::::::::::.:::
CCDS67 MYSCEKCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFL
590 600 610 620 630 640
620 630 640 650 660 670
pF1KA1 AKECTSQITTYDLLSVICHHGTAGSGHYIAYCQNVINGQWYEFDDQYVTEVHETVVQNAE
::. .::.::::::::::::::.::::::::.: .:. ::::::: :::: :..:::::
CCDS67 AKDSPAQIVTYDLLSVICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAE
650 660 670 680 690 700
680 690 700 710 720 730
pF1KA1 GYVLFYRKSSEEAMRERQQVVSLAAMREPSLLRFYVSREWLNKFNTFAEPGPITNQTFLC
.::::::::::::..::... .: . :::::.::.::.:::::.::::::::.:. :::
CCDS67 AYVLFYRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLC
710 720 730 740 750 760
740 750 760 770 780 790
pF1KA1 SHGGIPPHKYHYIDDLVVILPQNVWEHLYNRFGGGPAVNHLYVCSICQVEIEALAKRRRI
:::.::.: ::.:::..::::.:..::.:.::::::::::.: ::.: : . :::.
CCDS67 IHGGVPPRKAGYIEDLVLMLPQNIWDNLYSRYGGGPAVNHLYICHTCQIEAEKIEKRRKT
770 780 790 800 810 820
800 810 820 830 840 850
pF1KA1 EIDTFIKLNKAFQAEESPGVIYCISMQWFREWEAFVKGKDNEPPGPIDNSRIAQVKGSGH
:.. ::.::.::: :.::...::::::::::::.::::::..:::::::..:: .: :.
CCDS67 ELEIFIRLNRAFQKEDSPATFYCISMQWFREWESFVKGKDGDPPGPIDNTKIAVTK-CGN
830 840 850 860 870 880
860 870 880 890 900 910
pF1KA1 VQLKQGADYGQISEETWTYLNSLYGGGPEIAIRQSVAQPLGPENLHGEQKIEAETRAV
:.:.:::: ::::::::..:.:.::::::. .: :.. . :. :..:.:::.:::..
CCDS67 VMLRQGADSGQISEETWNFLQSIYGGGPEVILRPPVVH-VDPDILQAEEKIEVETRSL
890 900 910 920 930 940
>>CCDS680.1 USP33 gene_id:23032|Hs108|chr1 (828 aa)
initn: 2184 init1: 1493 opt: 2314 Z-score: 1953.4 bits: 372.6 E(32554): 1.7e-102
Smith-Waterman score: 3201; 58.8% identity (79.6% similar) in 820 aa overlap (1-805:32-828)
10 20 30
pF1KA1 MGDSRDLCPHLDSIGEVTKEDLLLKSKGTC
:. :. ::::::.::.:::::. :: :::
CCDS68 TGSNSHITILTLKVLPHFESLGKQEKIPNKMSAFRNHCPHLDSVGEITKEDLIQKSLGTC
10 20 30 40 50 60
40 50 60 70 80 90
pF1KA1 QSCGVTGPNLWACLQVACPYVGCGESFADHSTIHAQAKKHNLTVNLTTFRLWCYACEKEV
:.: : ::::::::. : ::::::: .::::::.: :: :::::::.:.::::: :::
CCDS68 QDCKVQGPNLWACLENRCSYVGCGESQVDHSTIHSQETKHYLTVNLTTLRVWCYACSKEV
70 80 90 100 110 120
100 110 120 130 140
pF1KA1 FLEQRLAA----PLLGSSSKFSE---QDSPPPSHPLKAVP-IAVADEGESES-EDDDLKP
::...:.. : . . ...: :: ::. .: .:: :. . :. :.:.:.
CCDS68 FLDRKLGTQPSLPHVRQPHQIQENSVQDFKIPSNTTLKTPLVAVFDDLDIEADEEDELRA
130 140 150 160 170 180
150 160 170 180 190 200
pF1KA1 RGLTGMKNLGNSCYMNAALQALSNCPPLTQFFLECGGLVRTDKKPALCKSYQKLVSEVWH
:::::.::.::.:::::::::::::::::::::.::::.:::::::.:::: ::..:.::
CCDS68 RGLTGLKNIGNTCYMNAALQALSNCPPLTQFFLDCGGLARTDKKPAICKSYLKLMTELWH
190 200 210 220 230 240
210 220 230 240 250 260
pF1KA1 KKRPSYVVPTSLSHGIKLVNPMFRGYAQQDTQEFLRCLMDQLHEELKEPVVATVALTEAR
:.::. ::::.: .::: ::: ::::.:::.::::::::: ::::::: :. . .
CCDS68 KSRPGSVVPTTLFQGIKTVNPTFRGYSQQDAQEFLRCLMDLLHEELKEQVMEV-----EE
250 260 270 280 290
270 280 290 300 310
pF1KA1 DSDSSDTDEKREGDRSPSEDEFLSCDS--SSDRGEGDGQGRGGGSSQAETELLIPDEAGR
: .. :.: : :.: :. .: ::.: .:::.:... .: . .. :: .:: :. .
CCDS68 DPQTITTEETMEEDKSQSDVDFQSCESCSNSDRAENENGSRCFSEDNNETTMLIQDDENN
300 310 320 330 340 350
320 330 340 350 360 370
pF1KA1 VISEKERMKDRKFSWGQQRTNSEQVDEDADVDTAMAALDQPAEAQPPSPRSSSPCRTPEP
:. .:. :. ...::: . : : :. ..: . . . . :. :
CCDS68 SEMSKDWQKE-KMCNKINKVNSEG-EFDKDRDSISETVDLNNQE---TVKVQIHSRASEY
360 370 380 390 400 410
380 390 400 410 420 430
pF1KA1 DNDAHLRSSSRPCSPVHHHEG-HAKLSSSPPRASPVR--MAPSYVLKKAQVLSAGSRRRK
.:.: . : : . . .:: . .::.:::... . .:: . :::: ::. .:.:
CCDS68 ITDVHSNDLSTP-QILPSNEGVNPRLSASPPKSGNLWPGLAPPH--KKAQ--SASPKRKK
420 430 440 450 460
440 450 460 470 480 490
pF1KA1 E-QRYRSVISDIFDGSILSLVQCLTCDRVSTTVETFQDLSLPIPGKEDLAKLHSAIYQNV
. ..:::::::::::.:.: ::::::::::.:.:::::::::::::::::::::. . .
CCDS68 QHKKYRSVISDIFDGTIISSVQCLTCDRVSVTLETFQDLSLPIPGKEDLAKLHSSSHPTS
470 480 490 500 510 520
500 510 520 530 540 550
pF1KA1 PAKPGACGDSYAAQGWLAFIVEYIRRFVVSCTPSWFWGPVVTLEDCLAAFFAADELKGDN
.: :.::..:: :::.::..::.. ::::::::::.:::::::: :::::::
CCDS68 IVKAGSCGEAYAPQGWIAFFMEYVK--------SWFWGPVVTLQDCLAAFFARDELKGDN
530 540 550 560 570
560 570 580 590 600 610
pF1KA1 MYSCERCKKLRNGVKYCKVLRLPEILCIHLKRFRHEVMYSFKINSHVSFPLEGLDLRPFL
:::::.:::::::::.::: .::::::::::::::.:.: ::..:::::::::::.:::
CCDS68 MYSCEKCKKLRNGVKFCKVQNFPEILCIHLKRFRHELMFSTKISTHVSFPLEGLDLQPFL
580 590 600 610 620 630
620 630 640 650 660 670
pF1KA1 AKECTSQITTYDLLSVICHHGTAGSGHYIAYCQNVINGQWYEFDDQYVTEVHETVVQNAE
::. .::.::::::::::::::.::::::::.: .:. ::::::: :::: :..:::::
CCDS68 AKDSPAQIVTYDLLSVICHHGTASSGHYIAYCRNNLNNLWYEFDDQSVTEVSESTVQNAE
640 650 660 670 680 690
680 690 700 710 720 730
pF1KA1 GYVLFYRKSSEEAMRERQQVVSLAAMREPSLLRFYVSREWLNKFNTFAEPGPITNQTFLC
.::::::::::::..::... .: . :::::.::.::.:::::.::::::::.:. :::
CCDS68 AYVLFYRKSSEEAQKERRRISNLLNIMEPSLLQFYISRQWLNKFKTFAEPGPISNNDFLC
700 710 720 730 740 750
740 750 760 770 780 790
pF1KA1 SHGGIPPHKYHYIDDLVVILPQNVWEHLYNRFGGGPAVNHLYVCSICQVEIEALAKRRRI
:::.::.: ::.:::..::::.:..::.:.::::::::::.: ::.: : . :::.
CCDS68 IHGGVPPRKAGYIEDLVLMLPQNIWDNLYSRYGGGPAVNHLYICHTCQIEAEKIEKRRKT
760 770 780 790 800 810
800 810 820 830 840 850
pF1KA1 EIDTFIKLNKAFQAEESPGVIYCISMQWFREWEAFVKGKDNEPPGPIDNSRIAQVKGSGH
:.. ::...:
CCDS68 ELEIFIRVKK
820
>>CCDS58370.1 USP3 gene_id:9960|Hs108|chr15 (476 aa)
initn: 642 init1: 257 opt: 424 Z-score: 365.9 bits: 78.0 E(32554): 4.7e-14
Smith-Waterman score: 437; 31.4% identity (57.8% similar) in 277 aa overlap (419-692:242-475)
390 400 410 420 430 440
pF1KA1 SRPCSPVHHHEGHAKLSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIF
: .:.. ..::: : . . .:.. ::
CCDS58 YQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSA-SNKCCINGASTVVTAIF
220 230 240 250 260 270
450 460 470 480 490 500
pF1KA1 DGSILSLVQCLTCDRVSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAA
: . . :.:: : : . : :::: ::.. . . .: .:
CCDS58 GGILQNEVNCLICGTESRKFDPFLDLSLDIPSQ--FRSKRSKNQEN--------------
280 290 300 310
510 520 530 540 550 560
pF1KA1 QGWLAFIVEYIRRFVVSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNG
::: .:.::: .: .:: ..: :..::: ...
CCDS58 ------------------------GPVCSLRDCLRSFTDLEELDETELYMCHKCKKKQKS
320 330 340 350
570 580 590 600 610 620
pF1KA1 VKYCKVLRLPEILCIHLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTS--QITTY
.: . .::..::.:::::. .. :....: :::.:::.. .: . .: . :
CCDS58 TKKFWIQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLY
360 370 380 390 400 410
630 640 650 660 670 680
pF1KA1 DLLSVICHHGTA-GSGHYIAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSS
:: .:. :::.. ::::: :: . .:.:..:.:. :: . : .: .:..:.::: . .
CCDS58 DLAAVVVHHGSGVGSGHYTAYATH--EGRWFHFNDSTVTLTDEETVVKAKAYILFYVEHQ
420 430 440 450 460
690 700 710 720 730 740
pF1KA1 EEAMRERQQVVSLAAMREPSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKY
.: ..
CCDS58 AKAGSDKL
470
>>CCDS32265.1 USP3 gene_id:9960|Hs108|chr15 (520 aa)
initn: 642 init1: 257 opt: 424 Z-score: 365.3 bits: 78.0 E(32554): 5e-14
Smith-Waterman score: 437; 31.4% identity (57.8% similar) in 277 aa overlap (419-692:286-519)
390 400 410 420 430 440
pF1KA1 SRPCSPVHHHEGHAKLSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIF
: .:.. ..::: : . . .:.. ::
CCDS32 YQQQDAHEFMRYLLDHLHLELQGGFNGVSRSAILQENSTLSA-SNKCCINGASTVVTAIF
260 270 280 290 300 310
450 460 470 480 490 500
pF1KA1 DGSILSLVQCLTCDRVSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAA
: . . :.:: : : . : :::: ::.. . . .: .:
CCDS32 GGILQNEVNCLICGTESRKFDPFLDLSLDIPSQ--FRSKRSKNQEN--------------
320 330 340 350
510 520 530 540 550 560
pF1KA1 QGWLAFIVEYIRRFVVSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNG
::: .:.::: .: .:: ..: :..::: ...
CCDS32 ------------------------GPVCSLRDCLRSFTDLEELDETELYMCHKCKKKQKS
360 370 380 390
570 580 590 600 610 620
pF1KA1 VKYCKVLRLPEILCIHLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTS--QITTY
.: . .::..::.:::::. .. :....: :::.:::.. .: . .: . :
CCDS32 TKKFWIQKLPKVLCLHLKRFHWTAYLRNKVDTYVEFPLRGLDMKCYLLEPENSGPESCLY
400 410 420 430 440 450
630 640 650 660 670 680
pF1KA1 DLLSVICHHGTA-GSGHYIAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSS
:: .:. :::.. ::::: :: . .:.:..:.:. :: . : .: .:..:.::: . .
CCDS32 DLAAVVVHHGSGVGSGHYTAYATH--EGRWFHFNDSTVTLTDEETVVKAKAYILFYVEHQ
460 470 480 490 500 510
690 700 710 720 730 740
pF1KA1 EEAMRERQQVVSLAAMREPSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKY
.: ..
CCDS32 AKAGSDKL
520
>>CCDS58189.1 USP2 gene_id:9099|Hs108|chr11 (362 aa)
initn: 740 init1: 225 opt: 394 Z-score: 342.3 bits: 73.3 E(32554): 9.6e-13
Smith-Waterman score: 405; 32.5% identity (54.8% similar) in 252 aa overlap (434-685:158-357)
410 420 430 440 450 460
pF1KA1 LSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDR
:. .: : :.:.: :.. : . : :
CCDS58 NEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGY
130 140 150 160 170 180
470 480 490 500 510 520
pF1KA1 VSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFV
::. . : :::::: : .:.
CCDS58 CSTVFDPFWDLSLPI----------------------------AKRGY------------
190 200
530 540 550 560 570 580
pF1KA1 VSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCI
: ::: ::. : : : ::. .: ::. . .: .. :.:.:: .
CCDS58 ----------PEVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKILVL
210 220 230 240 250
590 600 610 620 630 640
pF1KA1 HLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHY
::::: . . . :... :.:::. :::: : :.: :.. ..:.: .: : ::. .:::
CCDS58 HLKRFSESRIRTSKLTTFVNFPLRDLDLREF-ASENTNH-AVYNLYAVSNHSGTTMGGHY
260 270 280 290 300 310
650 660 670 680 690 700
pF1KA1 IAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMRE
:::.. .:.:. :.:. :: . . :.....:.:::. .:
CCDS58 TAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM
320 330 340 350 360
710 720 730 740 750 760
pF1KA1 PSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHL
>>CCDS8423.1 USP2 gene_id:9099|Hs108|chr11 (396 aa)
initn: 736 init1: 225 opt: 394 Z-score: 341.7 bits: 73.3 E(32554): 1e-12
Smith-Waterman score: 405; 32.5% identity (54.8% similar) in 252 aa overlap (434-685:192-391)
410 420 430 440 450 460
pF1KA1 LSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDR
:. .: : :.:.: :.. : . : :
CCDS84 NEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGY
170 180 190 200 210 220
470 480 490 500 510 520
pF1KA1 VSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFV
::. . : :::::: : .:.
CCDS84 CSTVFDPFWDLSLPI----------------------------AKRGY------------
230 240
530 540 550 560 570 580
pF1KA1 VSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCI
: ::: ::. : : : ::. .: ::. . .: .. :.:.:: .
CCDS84 ----------PEVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKILVL
250 260 270 280 290
590 600 610 620 630 640
pF1KA1 HLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHY
::::: . . . :... :.:::. :::: : :.: :.. ..:.: .: : ::. .:::
CCDS84 HLKRFSESRIRTSKLTTFVNFPLRDLDLREF-ASENTNH-AVYNLYAVSNHSGTTMGGHY
300 310 320 330 340
650 660 670 680 690 700
pF1KA1 IAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMRE
:::.. .:.:. :.:. :: . . :.....:.:::. .:
CCDS84 TAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM
350 360 370 380 390
710 720 730 740 750 760
pF1KA1 PSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHL
>>CCDS8422.1 USP2 gene_id:9099|Hs108|chr11 (605 aa)
initn: 736 init1: 225 opt: 394 Z-score: 339.1 bits: 73.4 E(32554): 1.4e-12
Smith-Waterman score: 405; 32.5% identity (54.8% similar) in 252 aa overlap (434-685:401-600)
410 420 430 440 450 460
pF1KA1 LSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDR
:. .: : :.:.: :.. : . : :
CCDS84 NEVNRVTLRPKSNPENLDHLPDDEKGRQMWRKYLEREDSRIGDLFVGQLKSSLTCTDCGY
380 390 400 410 420 430
470 480 490 500 510 520
pF1KA1 VSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFV
::. . : :::::: : .:.
CCDS84 CSTVFDPFWDLSLPI----------------------------AKRGY------------
440 450
530 540 550 560 570 580
pF1KA1 VSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCI
: ::: ::. : : : ::. .: ::. . .: .. :.:.:: .
CCDS84 ----------PEVTLMDCMRLFTKEDVLDGDEKPTCCRCRGRKRCIKKFSIQRFPKILVL
460 470 480 490 500
590 600 610 620 630 640
pF1KA1 HLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHY
::::: . . . :... :.:::. :::: : :.: :.. ..:.: .: : ::. .:::
CCDS84 HLKRFSESRIRTSKLTTFVNFPLRDLDLREF-ASENTNH-AVYNLYAVSNHSGTTMGGHY
510 520 530 540 550
650 660 670 680 690 700
pF1KA1 IAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMRE
:::.. .:.:. :.:. :: . . :.....:.:::. .:
CCDS84 TAYCRSPGTGEWHTFNDSSVTPMSSSQVRTSDAYLLFYELASPPSRM
560 570 580 590 600
710 720 730 740 750 760
pF1KA1 PSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHL
>>CCDS61632.1 USP8 gene_id:9101|Hs108|chr15 (1012 aa)
initn: 674 init1: 214 opt: 384 Z-score: 327.5 bits: 72.0 E(32554): 6.4e-12
Smith-Waterman score: 405; 29.8% identity (55.6% similar) in 248 aa overlap (434-681:806-1000)
410 420 430 440 450 460
pF1KA1 LSSSPPRASPVRMAPSYVLKKAQVLSAGSRRRKEQRYRSVISDIFDGSILSLVQCLTCDR
....: .:.: .:.:.. : :::::: .
CCDS61 EDLNKADNRKRYKEENNDHLDDFKAAEHAWQKHKQLNESIIVALFQGQFKSTVQCLTCHK
780 790 800 810 820 830
470 480 490 500 510 520
pF1KA1 VSTTVETFQDLSLPIPGKEDLAKLHSAIYQNVPAKPGACGDSYAAQGWLAFIVEYIRRFV
: : :.:. ::::. :. . :
CCDS61 KSRTFEAFMYLSLPL------------------ASTSKC---------------------
840 850
530 540 550 560 570 580
pF1KA1 VSCTPSWFWGPVVTLEDCLAAFFAADELKGDNMYSCERCKKLRNGVKYCKVLRLPEILCI
::.::: : ..: .: . : .:. :...: .. .:: .: .
CCDS61 -------------TLQDCLRLFSKEEKLTDNNRFYCSHCRARRDSLKKIEIWKLPPVLLV
860 870 880 890 900
590 600 610 620 630 640
pF1KA1 HLKRFRHEVMYSFKINSHVSFPLEGLDLRPFLAKECTSQITTYDLLSVICHHGTAGSGHY
::::: .. .. :... :.::::.::: .. ... :.:.:: :.: .:::
CCDS61 HLKRFSYDGRWKQKLQTSVDFPLENLDLSQYVIGP-KNNLKKYNLFSVSNHYGGLDGGHY
910 920 930 940 950 960
650 660 670 680 690 700
pF1KA1 IAYCQNVINGQWYEFDDQYVTEVHETVVQNAEGYVLFYRKSSEEAMRERQQVVSLAAMRE
:::.:. .:..:::. :... . :... .:.:::
CCDS61 TAYCKNAARQRWFKFDDHEVSDISVSSVKSSAAYILFYTSLGPRVTDVAT
970 980 990 1000 1010
710 720 730 740 750 760
pF1KA1 PSLLRFYVSREWLNKFNTFAEPGPITNQTFLCSHGGIPPHKYHYIDDLVVILPQNVWEHL
913 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 20:14:12 2016 done: Wed Nov 2 20:14:13 2016
Total Scan time: 3.770 Total Display time: 0.200
Function used was FASTA [36.3.4 Apr, 2011]