FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1372, 749 aa 1>>>pF1KA1372 749 - 749 aa - 749 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.8069+/-0.000901; mu= 5.4463+/- 0.054 mean_var=247.8696+/-49.952, 0's: 0 Z-trim(114.7): 67 B-trim: 378 in 1/52 Lambda= 0.081463 statistics sampled from 15202 (15268) to 15202 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.778), E-opt: 0.2 (0.469), width: 16 Scan time: 3.690 The best scores are: opt bits E(32554) CCDS41693.1 USP35 gene_id:57558|Hs108|chr11 (1018) 5045 606.6 6.3e-173 CCDS77964.1 USP38 gene_id:84640|Hs108|chr4 (1004) 1141 147.7 8.2e-35 CCDS3758.1 USP38 gene_id:84640|Hs108|chr4 (1042) 1141 147.8 8.4e-35 >>CCDS41693.1 USP35 gene_id:57558|Hs108|chr11 (1018 aa) initn: 5045 init1: 5045 opt: 5045 Z-score: 3218.1 bits: 606.6 E(32554): 6.3e-173 Smith-Waterman score: 5045; 100.0% identity (100.0% similar) in 749 aa overlap (1-749:270-1018) 10 20 30 pF1KA1 MIDWVSWPLGKNIDKWIIALLKGLAAVKKF :::::::::::::::::::::::::::::: CCDS41 LPLELMDGVVRNLSNDDSVTDSQMLTAISRMIDWVSWPLGKNIDKWIIALLKGLAAVKKF 240 250 260 270 280 290 40 50 60 70 80 90 pF1KA1 SILIEVSLTKIEKVFSKLLYPIVRGAALSVLKYMLLTFQHSHEAFHLLLPHIPPMVASLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SILIEVSLTKIEKVFSKLLYPIVRGAALSVLKYMLLTFQHSHEAFHLLLPHIPPMVASLV 300 310 320 330 340 350 100 110 120 130 140 150 pF1KA1 KEDSNSGTSCLEQLAELVHCMVFRFPGFPDLYEPVMEAIKDLHVPNEDRIKQLLGQDAWT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 KEDSNSGTSCLEQLAELVHCMVFRFPGFPDLYEPVMEAIKDLHVPNEDRIKQLLGQDAWT 360 370 380 390 400 410 160 170 180 190 200 210 pF1KA1 SQKSELAGFYPRLMAKSDTGKIGLINLGNTCYVNSILQALFMASDFRHCVLRLTENNSQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SQKSELAGFYPRLMAKSDTGKIGLINLGNTCYVNSILQALFMASDFRHCVLRLTENNSQP 420 430 440 450 460 470 220 230 240 250 260 270 pF1KA1 LMTKLQWLFGFLEHSQRPAISPENFLSASWTPWFSPGTQQDCSEYLKYLLDRLHEEEKTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LMTKLQWLFGFLEHSQRPAISPENFLSASWTPWFSPGTQQDCSEYLKYLLDRLHEEEKTG 480 490 500 510 520 530 280 290 300 310 320 330 pF1KA1 TRICQKLKQSSSPSPPEEPPAPSSTSVEKMFGGKIVTRICCLCCLNVSSREEAFTDLSLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 TRICQKLKQSSSPSPPEEPPAPSSTSVEKMFGGKIVTRICCLCCLNVSSREEAFTDLSLA 540 550 560 570 580 590 340 350 360 370 380 390 pF1KA1 FPPPERCRRRRLGSVMRPTEDITARELPPPTSAQGPGRVGPRRQRKHCITEDTPPTSLYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 FPPPERCRRRRLGSVMRPTEDITARELPPPTSAQGPGRVGPRRQRKHCITEDTPPTSLYI 600 610 620 630 640 650 400 410 420 430 440 450 pF1KA1 EGLDSKEAGGQSSQEERIEREEEGKEERTEKEEVGEEEESTRGEGEREKEEEVEEEEEKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EGLDSKEAGGQSSQEERIEREEEGKEERTEKEEVGEEEESTRGEGEREKEEEVEEEEEKV 660 670 680 690 700 710 460 470 480 490 500 510 pF1KA1 EKETEKEAEQEKEEDSLGAGTHPDAAIPSGERTCGSEGSRSVLDLVNYFLSPEKLTAENR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EKETEKEAEQEKEEDSLGAGTHPDAAIPSGERTCGSEGSRSVLDLVNYFLSPEKLTAENR 720 730 740 750 760 770 520 530 540 550 560 570 pF1KA1 YYCESCASLQDAEKVVELSQGPCYLILTLLRFSFDLRTMRRRKILDDVSIPLLLRLPLAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 YYCESCASLQDAEKVVELSQGPCYLILTLLRFSFDLRTMRRRKILDDVSIPLLLRLPLAG 780 790 800 810 820 830 580 590 600 610 620 630 pF1KA1 GRGQAYDLCSVVVHSGVSSESGHYYCYAREGAARPAASLGTADRPEPENQWYLFNDTRVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GRGQAYDLCSVVVHSGVSSESGHYYCYAREGAARPAASLGTADRPEPENQWYLFNDTRVS 840 850 860 870 880 890 640 650 660 670 680 690 pF1KA1 FSSFESVSNVTSFFPKDTAYVLFYRQRPREGPEAELGSSRVRTEPTLHKDLMEAISKDNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 FSSFESVSNVTSFFPKDTAYVLFYRQRPREGPEAELGSSRVRTEPTLHKDLMEAISKDNI 900 910 920 930 940 950 700 710 720 730 740 pF1KA1 LYLQEQEKEARSRAAYISALPTSPHWGRGFDEDKDEDEGSPGGCNPAGGNGGDFHRLVF ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LYLQEQEKEARSRAAYISALPTSPHWGRGFDEDKDEDEGSPGGCNPAGGNGGDFHRLVF 960 970 980 990 1000 1010 >>CCDS77964.1 USP38 gene_id:84640|Hs108|chr4 (1004 aa) initn: 1961 init1: 1137 opt: 1141 Z-score: 738.5 bits: 147.7 E(32554): 8.2e-35 Smith-Waterman score: 1732; 43.8% identity (64.2% similar) in 780 aa overlap (1-694:274-989) 10 20 30 pF1KA1 MIDWVSWPLGKNIDKWIIALLKGLAAVKKF ::::.::::....: :.::::::::::.:: CCDS77 IPLQMITVLIRSLTTDPNVKDASMTQALCRMIDWLSWPLAQHVDTWVIALLKGLAAVQKF 250 260 270 280 290 300 40 50 60 70 80 90 pF1KA1 SILIEVSLTKIEKVFSKLLYPIVRGAALSVLKYMLLTFQHSHEAFHLLLPHIPPMVASLV .:::.:.: ::: ::..: .:.:: .::.::..:::.:::: :::::..::. .: :. CCDS77 TILIDVTLLKIELVFNRLWFPLVRPGALAVLSHMLLSFQHSPEAFHLIVPHVVNLVHSFK 310 320 330 340 350 360 100 110 120 130 140 150 pF1KA1 KEDSNSGTSCLEQLAELVHCMVFRFPGFPDLYEPVMEAIKDLHVPNEDRIKQLLGQDAWT .. :.:. : ::.::.:::.... ::::::::..:::::. :.:..:: .:.:.::: CCDS77 NDGLPSSTAFLVQLTELIHCMMYHYSGFPDLYEPILEAIKDFPKPSEEKIKLILNQSAWT 370 380 390 400 410 420 160 170 180 190 200 210 pF1KA1 SQKSELAGFYPRLMAKSDTGKIGLINLGNTCYVNSILQALFMASDFRHCVLRLTENNSQP ::.. ::. :: .::.::: ::::::::::.::..::::::.:::. :: :. :. . CCDS77 SQSNSLASCLSRLSGKSETGKTGLINLGNTCYMNSVIQALFMATDFRRQVLSLNLNGCNS 430 440 450 460 470 480 220 230 240 250 260 pF1KA1 LMTKLQWLFGFLEHSQRPAISPENFLSASWTPWFSPGTQQDCSEYLKYLLDRLHEEEKT- :: ::: ::.:: :.:: : .:. :. :: :::.: .::::::::..:::::::::: CCDS77 LMKKLQHLFAFLAHTQREAYAPRIFFEASRPPWFTPRSQQDCSEYLRFLLDRLHEEEKIL 490 500 510 520 530 540 270 280 290 300 310 pF1KA1 -------GTRI--CQK--LKQSSSPSPP-EEPPAPSS---TSVEKMFGGKIVTRICCLCC ..: :.. :.. .: . : : :. : .:::::::. :.: :: : CCDS77 KVQASHKPSEILECSETSLQEVASKAAVLTETPRTSDGEKTLIEKMFGGKLRTHIRCLNC 550 560 570 580 590 600 320 330 340 350 360 370 pF1KA1 LNVSSREEAFTDLSLAFPPPERCRRRRLGSVMRPTEDITARELPPPTSAQGPGRVGPRRQ ..:.. :::::::::: : . ::. :. . . .. .:. :: : .. CCDS77 RSTSQKVEAFTDLSLAFCPSSSLENM---SVQDPASSPSIQD-GGLMQASVPG---PSEE 610 620 630 640 650 380 390 400 410 420 430 pF1KA1 RKHCITEDTPPTSLYIEGLDSKEAGGQSSQEERIEREEEGKEERTEKEEVGEEEESTRGE . .: :. .: :: .:.: .: : .: CCDS77 P----VVYNPTTAAFI--CDSLV------------------NEKT----IG----SPPNE 660 670 680 440 450 460 470 480 490 pF1KA1 GEREKEEEVEEEEEKVEKETEKEAEQEKEEDSLGAGTHPDAAIPSGERTCGSEGSRSVLD .. : .: .:. ..:.. :. :.:: : :: : CCDS77 FYCSENTSVPNESNKIL--VNKDVPQK----------------PGGETT------PSVTD 690 700 710 720 500 510 520 530 540 550 pF1KA1 LVNYFLSPEKLTAENRYYCESCASLQDAEKVVELSQGPCYLILTLLRFSFDLRTMRRRKI :.::::.:: ::..:.::::.:::::.:::...... : ::::::::::.: . :::: CCDS77 LLNYFLAPEILTGDNQYYCENCASLQNAEKTMQITEEPEYLILTLLRFSYDQKYHVRRKI 730 740 750 760 770 780 560 570 pF1KA1 LDDVSIPLLLRLPLA-------------------------------GGRGQA-------Y ::.::.::.:.::. .: .: : CCDS77 LDNVSLPLVLELPVKRITSFSSLSESWSVDVDFTDLSENLAKKLKPSGTDEASCTKLVPY 790 800 810 820 830 840 580 590 600 610 pF1KA1 DLCSVVVHSGVSSESGHYYCYAR-------------EGAARPAAS-----LGTADRP--- : :::::::.:::::::: ::: .. : :: :: : : CCDS77 LLSSVVVHSGISSESGHYYSYARNITSTDSSYQMYHQSEALALASSQSHLLGR-DSPSAV 850 860 870 880 890 620 630 640 650 660 pF1KA1 --------EPENQWYLFNDTRVSFSSFESVSNVTSFFPKDTAYVLFYR-QRPREGPEAEL : ..:.::::.::.:.::.::...:: :::::::::.:. :. .: .. CCDS77 FEQDLENKEMSKEWFLFNDSRVTFTSFQSVQKITSRFPKDTAYVLLYKKQHSTNGLSGNN 900 910 920 930 940 950 670 680 690 700 710 720 pF1KA1 GSSR--VRTEPTLHKDLMEAISKDNILYLQEQEKEARSRAAYISALPTSPHWGRGFDEDK .: . .: :.:.::.::.::: :::: CCDS77 PTSGLWINGDPPLQKELMDAITKDNKLYLQVSWKYKLYLLKILNN 960 970 980 990 1000 >>CCDS3758.1 USP38 gene_id:84640|Hs108|chr4 (1042 aa) initn: 2034 init1: 1137 opt: 1141 Z-score: 738.3 bits: 147.8 E(32554): 8.4e-35 Smith-Waterman score: 1841; 43.5% identity (64.0% similar) in 841 aa overlap (1-749:274-1042) 10 20 30 pF1KA1 MIDWVSWPLGKNIDKWIIALLKGLAAVKKF ::::.::::....: :.::::::::::.:: CCDS37 IPLQMITVLIRSLTTDPNVKDASMTQALCRMIDWLSWPLAQHVDTWVIALLKGLAAVQKF 250 260 270 280 290 300 40 50 60 70 80 90 pF1KA1 SILIEVSLTKIEKVFSKLLYPIVRGAALSVLKYMLLTFQHSHEAFHLLLPHIPPMVASLV .:::.:.: ::: ::..: .:.:: .::.::..:::.:::: :::::..::. .: :. CCDS37 TILIDVTLLKIELVFNRLWFPLVRPGALAVLSHMLLSFQHSPEAFHLIVPHVVNLVHSFK 310 320 330 340 350 360 100 110 120 130 140 150 pF1KA1 KEDSNSGTSCLEQLAELVHCMVFRFPGFPDLYEPVMEAIKDLHVPNEDRIKQLLGQDAWT .. :.:. : ::.::.:::.... ::::::::..:::::. :.:..:: .:.:.::: CCDS37 NDGLPSSTAFLVQLTELIHCMMYHYSGFPDLYEPILEAIKDFPKPSEEKIKLILNQSAWT 370 380 390 400 410 420 160 170 180 190 200 210 pF1KA1 SQKSELAGFYPRLMAKSDTGKIGLINLGNTCYVNSILQALFMASDFRHCVLRLTENNSQP ::.. ::. :: .::.::: ::::::::::.::..::::::.:::. :: :. :. . CCDS37 SQSNSLASCLSRLSGKSETGKTGLINLGNTCYMNSVIQALFMATDFRRQVLSLNLNGCNS 430 440 450 460 470 480 220 230 240 250 260 pF1KA1 LMTKLQWLFGFLEHSQRPAISPENFLSASWTPWFSPGTQQDCSEYLKYLLDRLHEEEKT- :: ::: ::.:: :.:: : .:. :. :: :::.: .::::::::..:::::::::: CCDS37 LMKKLQHLFAFLAHTQREAYAPRIFFEASRPPWFTPRSQQDCSEYLRFLLDRLHEEEKIL 490 500 510 520 530 540 270 280 290 300 310 pF1KA1 -------GTRI--CQK--LKQSSSPSPP-EEPPAPSS---TSVEKMFGGKIVTRICCLCC ..: :.. :.. .: . : : :. : .:::::::. :.: :: : CCDS37 KVQASHKPSEILECSETSLQEVASKAAVLTETPRTSDGEKTLIEKMFGGKLRTHIRCLNC 550 560 570 580 590 600 320 330 340 350 360 370 pF1KA1 LNVSSREEAFTDLSLAFPPPERCRRRRLGSVMRPTEDITARELPPPTSAQGPGRVGPRRQ ..:.. :::::::::: : . ::. :. . . .. .:. :: : .. CCDS37 RSTSQKVEAFTDLSLAFCPSSSLENM---SVQDPASSPSIQD-GGLMQASVPG---PSEE 610 620 630 640 650 380 390 400 410 420 430 pF1KA1 RKHCITEDTPPTSLYIEGLDSKEAGGQSSQEERIEREEEGKEERTEKEEVGEEEESTRGE . .: :. .: :: .... .: : .: CCDS37 P----VVYNPTTAAFI--CDSL----------------------VNEKTIG----SPPNE 660 670 680 440 450 460 470 480 490 pF1KA1 GEREKEEEVEEEEEKVEKETEKEAEQEKEEDSLGAGTHPDAAIPSGERTCGSEGSRSVLD .. : .: .:. ..:.. :. :.:: : :: : CCDS37 FYCSENTSVPNESNKIL--VNKDVPQK----------------PGGETT------PSVTD 690 700 710 720 500 510 520 530 540 550 pF1KA1 LVNYFLSPEKLTAENRYYCESCASLQDAEKVVELSQGPCYLILTLLRFSFDLRTMRRRKI :.::::.:: ::..:.::::.:::::.:::...... : ::::::::::.: . :::: CCDS37 LLNYFLAPEILTGDNQYYCENCASLQNAEKTMQITEEPEYLILTLLRFSYDQKYHVRRKI 730 740 750 760 770 780 560 570 pF1KA1 LDDVSIPLLLRLPLA-------------------------------GGRGQA-------Y ::.::.::.:.::. .: .: : CCDS37 LDNVSLPLVLELPVKRITSFSSLSESWSVDVDFTDLSENLAKKLKPSGTDEASCTKLVPY 790 800 810 820 830 840 580 590 600 610 pF1KA1 DLCSVVVHSGVSSESGHYYCYAR-------------EGAARPAAS-----LGTADRP--- : :::::::.:::::::: ::: .. : :: :: : : CCDS37 LLSSVVVHSGISSESGHYYSYARNITSTDSSYQMYHQSEALALASSQSHLLGR-DSPSAV 850 860 870 880 890 620 630 640 650 660 pF1KA1 --------EPENQWYLFNDTRVSFSSFESVSNVTSFFPKDTAYVLFYR-QRPREGPEAEL : ..:.::::.::.:.::.::...:: :::::::::.:. :. .: .. CCDS37 FEQDLENKEMSKEWFLFNDSRVTFTSFQSVQKITSRFPKDTAYVLLYKKQHSTNGLSGNN 900 910 920 930 940 950 670 680 690 700 710 720 pF1KA1 GSSR--VRTEPTLHKDLMEAISKDNILYLQEQEKEARSRAAYISALPTS--PHWGRGFDE .: . .: :.:.::.::.::: ::::::: .::.:: .. : :. ::: CCDS37 PTSGLWINGDPPLQKELMDAITKDNKLYLQEQELNARARALQAASASCSFRPN---GFD- 960 970 980 990 1000 1010 730 740 pF1KA1 DKDEDEGSPGGCNPAGGNGGD-FH---RLVF :. ::.:.:.::.:: :. :::: CCDS37 ----DNDPPGSCGPTGGGGGGGFNTVGRLVF 1020 1030 1040 749 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 21:03:46 2016 done: Wed Nov 2 21:03:47 2016 Total Scan time: 3.690 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]