FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1372, 749 aa
1>>>pF1KA1372 749 - 749 aa - 749 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.8069+/-0.000901; mu= 5.4463+/- 0.054
mean_var=247.8696+/-49.952, 0's: 0 Z-trim(114.7): 67 B-trim: 378 in 1/52
Lambda= 0.081463
statistics sampled from 15202 (15268) to 15202 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.778), E-opt: 0.2 (0.469), width: 16
Scan time: 3.690
The best scores are: opt bits E(32554)
CCDS41693.1 USP35 gene_id:57558|Hs108|chr11 (1018) 5045 606.6 6.3e-173
CCDS77964.1 USP38 gene_id:84640|Hs108|chr4 (1004) 1141 147.7 8.2e-35
CCDS3758.1 USP38 gene_id:84640|Hs108|chr4 (1042) 1141 147.8 8.4e-35
>>CCDS41693.1 USP35 gene_id:57558|Hs108|chr11 (1018 aa)
initn: 5045 init1: 5045 opt: 5045 Z-score: 3218.1 bits: 606.6 E(32554): 6.3e-173
Smith-Waterman score: 5045; 100.0% identity (100.0% similar) in 749 aa overlap (1-749:270-1018)
10 20 30
pF1KA1 MIDWVSWPLGKNIDKWIIALLKGLAAVKKF
::::::::::::::::::::::::::::::
CCDS41 LPLELMDGVVRNLSNDDSVTDSQMLTAISRMIDWVSWPLGKNIDKWIIALLKGLAAVKKF
240 250 260 270 280 290
40 50 60 70 80 90
pF1KA1 SILIEVSLTKIEKVFSKLLYPIVRGAALSVLKYMLLTFQHSHEAFHLLLPHIPPMVASLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 SILIEVSLTKIEKVFSKLLYPIVRGAALSVLKYMLLTFQHSHEAFHLLLPHIPPMVASLV
300 310 320 330 340 350
100 110 120 130 140 150
pF1KA1 KEDSNSGTSCLEQLAELVHCMVFRFPGFPDLYEPVMEAIKDLHVPNEDRIKQLLGQDAWT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 KEDSNSGTSCLEQLAELVHCMVFRFPGFPDLYEPVMEAIKDLHVPNEDRIKQLLGQDAWT
360 370 380 390 400 410
160 170 180 190 200 210
pF1KA1 SQKSELAGFYPRLMAKSDTGKIGLINLGNTCYVNSILQALFMASDFRHCVLRLTENNSQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 SQKSELAGFYPRLMAKSDTGKIGLINLGNTCYVNSILQALFMASDFRHCVLRLTENNSQP
420 430 440 450 460 470
220 230 240 250 260 270
pF1KA1 LMTKLQWLFGFLEHSQRPAISPENFLSASWTPWFSPGTQQDCSEYLKYLLDRLHEEEKTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 LMTKLQWLFGFLEHSQRPAISPENFLSASWTPWFSPGTQQDCSEYLKYLLDRLHEEEKTG
480 490 500 510 520 530
280 290 300 310 320 330
pF1KA1 TRICQKLKQSSSPSPPEEPPAPSSTSVEKMFGGKIVTRICCLCCLNVSSREEAFTDLSLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 TRICQKLKQSSSPSPPEEPPAPSSTSVEKMFGGKIVTRICCLCCLNVSSREEAFTDLSLA
540 550 560 570 580 590
340 350 360 370 380 390
pF1KA1 FPPPERCRRRRLGSVMRPTEDITARELPPPTSAQGPGRVGPRRQRKHCITEDTPPTSLYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 FPPPERCRRRRLGSVMRPTEDITARELPPPTSAQGPGRVGPRRQRKHCITEDTPPTSLYI
600 610 620 630 640 650
400 410 420 430 440 450
pF1KA1 EGLDSKEAGGQSSQEERIEREEEGKEERTEKEEVGEEEESTRGEGEREKEEEVEEEEEKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 EGLDSKEAGGQSSQEERIEREEEGKEERTEKEEVGEEEESTRGEGEREKEEEVEEEEEKV
660 670 680 690 700 710
460 470 480 490 500 510
pF1KA1 EKETEKEAEQEKEEDSLGAGTHPDAAIPSGERTCGSEGSRSVLDLVNYFLSPEKLTAENR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 EKETEKEAEQEKEEDSLGAGTHPDAAIPSGERTCGSEGSRSVLDLVNYFLSPEKLTAENR
720 730 740 750 760 770
520 530 540 550 560 570
pF1KA1 YYCESCASLQDAEKVVELSQGPCYLILTLLRFSFDLRTMRRRKILDDVSIPLLLRLPLAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 YYCESCASLQDAEKVVELSQGPCYLILTLLRFSFDLRTMRRRKILDDVSIPLLLRLPLAG
780 790 800 810 820 830
580 590 600 610 620 630
pF1KA1 GRGQAYDLCSVVVHSGVSSESGHYYCYAREGAARPAASLGTADRPEPENQWYLFNDTRVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 GRGQAYDLCSVVVHSGVSSESGHYYCYAREGAARPAASLGTADRPEPENQWYLFNDTRVS
840 850 860 870 880 890
640 650 660 670 680 690
pF1KA1 FSSFESVSNVTSFFPKDTAYVLFYRQRPREGPEAELGSSRVRTEPTLHKDLMEAISKDNI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 FSSFESVSNVTSFFPKDTAYVLFYRQRPREGPEAELGSSRVRTEPTLHKDLMEAISKDNI
900 910 920 930 940 950
700 710 720 730 740
pF1KA1 LYLQEQEKEARSRAAYISALPTSPHWGRGFDEDKDEDEGSPGGCNPAGGNGGDFHRLVF
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 LYLQEQEKEARSRAAYISALPTSPHWGRGFDEDKDEDEGSPGGCNPAGGNGGDFHRLVF
960 970 980 990 1000 1010
>>CCDS77964.1 USP38 gene_id:84640|Hs108|chr4 (1004 aa)
initn: 1961 init1: 1137 opt: 1141 Z-score: 738.5 bits: 147.7 E(32554): 8.2e-35
Smith-Waterman score: 1732; 43.8% identity (64.2% similar) in 780 aa overlap (1-694:274-989)
10 20 30
pF1KA1 MIDWVSWPLGKNIDKWIIALLKGLAAVKKF
::::.::::....: :.::::::::::.::
CCDS77 IPLQMITVLIRSLTTDPNVKDASMTQALCRMIDWLSWPLAQHVDTWVIALLKGLAAVQKF
250 260 270 280 290 300
40 50 60 70 80 90
pF1KA1 SILIEVSLTKIEKVFSKLLYPIVRGAALSVLKYMLLTFQHSHEAFHLLLPHIPPMVASLV
.:::.:.: ::: ::..: .:.:: .::.::..:::.:::: :::::..::. .: :.
CCDS77 TILIDVTLLKIELVFNRLWFPLVRPGALAVLSHMLLSFQHSPEAFHLIVPHVVNLVHSFK
310 320 330 340 350 360
100 110 120 130 140 150
pF1KA1 KEDSNSGTSCLEQLAELVHCMVFRFPGFPDLYEPVMEAIKDLHVPNEDRIKQLLGQDAWT
.. :.:. : ::.::.:::.... ::::::::..:::::. :.:..:: .:.:.:::
CCDS77 NDGLPSSTAFLVQLTELIHCMMYHYSGFPDLYEPILEAIKDFPKPSEEKIKLILNQSAWT
370 380 390 400 410 420
160 170 180 190 200 210
pF1KA1 SQKSELAGFYPRLMAKSDTGKIGLINLGNTCYVNSILQALFMASDFRHCVLRLTENNSQP
::.. ::. :: .::.::: ::::::::::.::..::::::.:::. :: :. :. .
CCDS77 SQSNSLASCLSRLSGKSETGKTGLINLGNTCYMNSVIQALFMATDFRRQVLSLNLNGCNS
430 440 450 460 470 480
220 230 240 250 260
pF1KA1 LMTKLQWLFGFLEHSQRPAISPENFLSASWTPWFSPGTQQDCSEYLKYLLDRLHEEEKT-
:: ::: ::.:: :.:: : .:. :. :: :::.: .::::::::..::::::::::
CCDS77 LMKKLQHLFAFLAHTQREAYAPRIFFEASRPPWFTPRSQQDCSEYLRFLLDRLHEEEKIL
490 500 510 520 530 540
270 280 290 300 310
pF1KA1 -------GTRI--CQK--LKQSSSPSPP-EEPPAPSS---TSVEKMFGGKIVTRICCLCC
..: :.. :.. .: . : : :. : .:::::::. :.: :: :
CCDS77 KVQASHKPSEILECSETSLQEVASKAAVLTETPRTSDGEKTLIEKMFGGKLRTHIRCLNC
550 560 570 580 590 600
320 330 340 350 360 370
pF1KA1 LNVSSREEAFTDLSLAFPPPERCRRRRLGSVMRPTEDITARELPPPTSAQGPGRVGPRRQ
..:.. :::::::::: : . ::. :. . . .. .:. :: : ..
CCDS77 RSTSQKVEAFTDLSLAFCPSSSLENM---SVQDPASSPSIQD-GGLMQASVPG---PSEE
610 620 630 640 650
380 390 400 410 420 430
pF1KA1 RKHCITEDTPPTSLYIEGLDSKEAGGQSSQEERIEREEEGKEERTEKEEVGEEEESTRGE
. .: :. .: :: .:.: .: : .:
CCDS77 P----VVYNPTTAAFI--CDSLV------------------NEKT----IG----SPPNE
660 670 680
440 450 460 470 480 490
pF1KA1 GEREKEEEVEEEEEKVEKETEKEAEQEKEEDSLGAGTHPDAAIPSGERTCGSEGSRSVLD
.. : .: .:. ..:.. :. :.:: : :: :
CCDS77 FYCSENTSVPNESNKIL--VNKDVPQK----------------PGGETT------PSVTD
690 700 710 720
500 510 520 530 540 550
pF1KA1 LVNYFLSPEKLTAENRYYCESCASLQDAEKVVELSQGPCYLILTLLRFSFDLRTMRRRKI
:.::::.:: ::..:.::::.:::::.:::...... : ::::::::::.: . ::::
CCDS77 LLNYFLAPEILTGDNQYYCENCASLQNAEKTMQITEEPEYLILTLLRFSYDQKYHVRRKI
730 740 750 760 770 780
560 570
pF1KA1 LDDVSIPLLLRLPLA-------------------------------GGRGQA-------Y
::.::.::.:.::. .: .: :
CCDS77 LDNVSLPLVLELPVKRITSFSSLSESWSVDVDFTDLSENLAKKLKPSGTDEASCTKLVPY
790 800 810 820 830 840
580 590 600 610
pF1KA1 DLCSVVVHSGVSSESGHYYCYAR-------------EGAARPAAS-----LGTADRP---
: :::::::.:::::::: ::: .. : :: :: : :
CCDS77 LLSSVVVHSGISSESGHYYSYARNITSTDSSYQMYHQSEALALASSQSHLLGR-DSPSAV
850 860 870 880 890
620 630 640 650 660
pF1KA1 --------EPENQWYLFNDTRVSFSSFESVSNVTSFFPKDTAYVLFYR-QRPREGPEAEL
: ..:.::::.::.:.::.::...:: :::::::::.:. :. .: ..
CCDS77 FEQDLENKEMSKEWFLFNDSRVTFTSFQSVQKITSRFPKDTAYVLLYKKQHSTNGLSGNN
900 910 920 930 940 950
670 680 690 700 710 720
pF1KA1 GSSR--VRTEPTLHKDLMEAISKDNILYLQEQEKEARSRAAYISALPTSPHWGRGFDEDK
.: . .: :.:.::.::.::: ::::
CCDS77 PTSGLWINGDPPLQKELMDAITKDNKLYLQVSWKYKLYLLKILNN
960 970 980 990 1000
>>CCDS3758.1 USP38 gene_id:84640|Hs108|chr4 (1042 aa)
initn: 2034 init1: 1137 opt: 1141 Z-score: 738.3 bits: 147.8 E(32554): 8.4e-35
Smith-Waterman score: 1841; 43.5% identity (64.0% similar) in 841 aa overlap (1-749:274-1042)
10 20 30
pF1KA1 MIDWVSWPLGKNIDKWIIALLKGLAAVKKF
::::.::::....: :.::::::::::.::
CCDS37 IPLQMITVLIRSLTTDPNVKDASMTQALCRMIDWLSWPLAQHVDTWVIALLKGLAAVQKF
250 260 270 280 290 300
40 50 60 70 80 90
pF1KA1 SILIEVSLTKIEKVFSKLLYPIVRGAALSVLKYMLLTFQHSHEAFHLLLPHIPPMVASLV
.:::.:.: ::: ::..: .:.:: .::.::..:::.:::: :::::..::. .: :.
CCDS37 TILIDVTLLKIELVFNRLWFPLVRPGALAVLSHMLLSFQHSPEAFHLIVPHVVNLVHSFK
310 320 330 340 350 360
100 110 120 130 140 150
pF1KA1 KEDSNSGTSCLEQLAELVHCMVFRFPGFPDLYEPVMEAIKDLHVPNEDRIKQLLGQDAWT
.. :.:. : ::.::.:::.... ::::::::..:::::. :.:..:: .:.:.:::
CCDS37 NDGLPSSTAFLVQLTELIHCMMYHYSGFPDLYEPILEAIKDFPKPSEEKIKLILNQSAWT
370 380 390 400 410 420
160 170 180 190 200 210
pF1KA1 SQKSELAGFYPRLMAKSDTGKIGLINLGNTCYVNSILQALFMASDFRHCVLRLTENNSQP
::.. ::. :: .::.::: ::::::::::.::..::::::.:::. :: :. :. .
CCDS37 SQSNSLASCLSRLSGKSETGKTGLINLGNTCYMNSVIQALFMATDFRRQVLSLNLNGCNS
430 440 450 460 470 480
220 230 240 250 260
pF1KA1 LMTKLQWLFGFLEHSQRPAISPENFLSASWTPWFSPGTQQDCSEYLKYLLDRLHEEEKT-
:: ::: ::.:: :.:: : .:. :. :: :::.: .::::::::..::::::::::
CCDS37 LMKKLQHLFAFLAHTQREAYAPRIFFEASRPPWFTPRSQQDCSEYLRFLLDRLHEEEKIL
490 500 510 520 530 540
270 280 290 300 310
pF1KA1 -------GTRI--CQK--LKQSSSPSPP-EEPPAPSS---TSVEKMFGGKIVTRICCLCC
..: :.. :.. .: . : : :. : .:::::::. :.: :: :
CCDS37 KVQASHKPSEILECSETSLQEVASKAAVLTETPRTSDGEKTLIEKMFGGKLRTHIRCLNC
550 560 570 580 590 600
320 330 340 350 360 370
pF1KA1 LNVSSREEAFTDLSLAFPPPERCRRRRLGSVMRPTEDITARELPPPTSAQGPGRVGPRRQ
..:.. :::::::::: : . ::. :. . . .. .:. :: : ..
CCDS37 RSTSQKVEAFTDLSLAFCPSSSLENM---SVQDPASSPSIQD-GGLMQASVPG---PSEE
610 620 630 640 650
380 390 400 410 420 430
pF1KA1 RKHCITEDTPPTSLYIEGLDSKEAGGQSSQEERIEREEEGKEERTEKEEVGEEEESTRGE
. .: :. .: :: .... .: : .:
CCDS37 P----VVYNPTTAAFI--CDSL----------------------VNEKTIG----SPPNE
660 670 680
440 450 460 470 480 490
pF1KA1 GEREKEEEVEEEEEKVEKETEKEAEQEKEEDSLGAGTHPDAAIPSGERTCGSEGSRSVLD
.. : .: .:. ..:.. :. :.:: : :: :
CCDS37 FYCSENTSVPNESNKIL--VNKDVPQK----------------PGGETT------PSVTD
690 700 710 720
500 510 520 530 540 550
pF1KA1 LVNYFLSPEKLTAENRYYCESCASLQDAEKVVELSQGPCYLILTLLRFSFDLRTMRRRKI
:.::::.:: ::..:.::::.:::::.:::...... : ::::::::::.: . ::::
CCDS37 LLNYFLAPEILTGDNQYYCENCASLQNAEKTMQITEEPEYLILTLLRFSYDQKYHVRRKI
730 740 750 760 770 780
560 570
pF1KA1 LDDVSIPLLLRLPLA-------------------------------GGRGQA-------Y
::.::.::.:.::. .: .: :
CCDS37 LDNVSLPLVLELPVKRITSFSSLSESWSVDVDFTDLSENLAKKLKPSGTDEASCTKLVPY
790 800 810 820 830 840
580 590 600 610
pF1KA1 DLCSVVVHSGVSSESGHYYCYAR-------------EGAARPAAS-----LGTADRP---
: :::::::.:::::::: ::: .. : :: :: : :
CCDS37 LLSSVVVHSGISSESGHYYSYARNITSTDSSYQMYHQSEALALASSQSHLLGR-DSPSAV
850 860 870 880 890
620 630 640 650 660
pF1KA1 --------EPENQWYLFNDTRVSFSSFESVSNVTSFFPKDTAYVLFYR-QRPREGPEAEL
: ..:.::::.::.:.::.::...:: :::::::::.:. :. .: ..
CCDS37 FEQDLENKEMSKEWFLFNDSRVTFTSFQSVQKITSRFPKDTAYVLLYKKQHSTNGLSGNN
900 910 920 930 940 950
670 680 690 700 710 720
pF1KA1 GSSR--VRTEPTLHKDLMEAISKDNILYLQEQEKEARSRAAYISALPTS--PHWGRGFDE
.: . .: :.:.::.::.::: ::::::: .::.:: .. : :. :::
CCDS37 PTSGLWINGDPPLQKELMDAITKDNKLYLQEQELNARARALQAASASCSFRPN---GFD-
960 970 980 990 1000 1010
730 740
pF1KA1 DKDEDEGSPGGCNPAGGNGGD-FH---RLVF
:. ::.:.:.::.:: :. ::::
CCDS37 ----DNDPPGSCGPTGGGGGGGFNTVGRLVF
1020 1030 1040
749 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 21:03:46 2016 done: Wed Nov 2 21:03:47 2016
Total Scan time: 3.690 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]