FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1594, 979 aa 1>>>pF1KA1594 979 - 979 aa - 979 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.0061+/-0.00108; mu= 9.0453+/- 0.066 mean_var=151.1292+/-30.585, 0's: 0 Z-trim(108.4): 64 B-trim: 263 in 1/50 Lambda= 0.104328 statistics sampled from 10139 (10181) to 10139 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.664), E-opt: 0.2 (0.313), width: 16 Scan time: 3.780 The best scores are: opt bits E(32554) CCDS2418.1 USP37 gene_id:57695|Hs108|chr2 ( 979) 6403 976.5 0 CCDS33124.1 USP29 gene_id:57663|Hs108|chr19 ( 922) 1497 238.0 6.5e-62 CCDS14635.1 USP26 gene_id:83844|Hs108|chrX ( 913) 1061 172.4 3.7e-42 >>CCDS2418.1 USP37 gene_id:57695|Hs108|chr2 (979 aa) initn: 6403 init1: 6403 opt: 6403 Z-score: 5215.3 bits: 976.5 E(32554): 0 Smith-Waterman score: 6403; 99.9% identity (100.0% similar) in 978 aa overlap (1-978:1-978) 10 20 30 40 50 60 pF1KA1 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 GAILGSRTSQKETSRQLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 GAILGSRTSQKETSRQLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGIA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 RTIPSLTSTSTPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 RTIPSLTSTSTPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKYL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 TSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 TSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAKR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 SLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 SLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSLF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 SLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 SLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAER 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 FSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPISGEENSPDISATRAYTCPVITNLE :::::::::::::::::::::::::::::::::::.:::::::::::::::::::::::: CCDS24 FSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPVSGEENSPDISATRAYTCPVITNLE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 FEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEELEYSCEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 FEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEELEYSCEK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 CGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHCTENTKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 CGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHCTENTKP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 PFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSEDELKRSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 PFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSEDELKRSV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 ALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDRMSEEELLAAVLEISKRDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 ALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDRMSEEELLAAVLEISKRDA 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 SPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTEITKDCDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 SPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTEITKDCDE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 NKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDLKRATELS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 NKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDLKRATELS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA1 LQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLISVVSHIGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 LQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLISVVSHIGS 850 860 870 880 890 900 910 920 930 940 950 960 pF1KA1 TSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEIFDELLET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 TSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEIFDELLET 910 920 930 940 950 960 970 pF1KA1 EKNSQSLSTEVGKTTRQAS :::::::::::::::::: CCDS24 EKNSQSLSTEVGKTTRQAL 970 >>CCDS33124.1 USP29 gene_id:57663|Hs108|chr19 (922 aa) initn: 2102 init1: 591 opt: 1497 Z-score: 1225.0 bits: 238.0 E(32554): 6.5e-62 Smith-Waterman score: 2345; 44.9% identity (69.4% similar) in 979 aa overlap (1-972:1-906) 10 20 30 40 50 60 pF1KA1 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV : ::. : :.: :..::.:: ::. .: :.......::: ...: . ::::::.::..: CCDS33 MISLKVCGFIQIWSQKTGMTKLKEALIETVQRQKEIKLVVTFKSGKFIRIFQLSNNIRSV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF ::: .::.: :::..: :: :::. .::... .::: .:::. :: CCDS33 VLRHCKKRQSHLRLTLKNNVFLFIDKLSYRDAKQLNMFLDIIHQNKSQQPMK-------- 70 80 90 100 110 130 140 150 160 170 180 pF1KA1 GAILGSRTSQKETSRQLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGIA : .: .. .:. :. : : .. ..:. CCDS33 -----------------SDDDWSVFESRNMLKEIDKTSFYSICNKPSY------------ 120 130 140 190 200 210 220 230 pF1KA1 RTIPSLTSTS-TPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKY . .: . : : : ...:.:::. : . .:. . ::: ::.. :.: :: : :: CCDS33 QKMPLFMSKSPTHVKKGILENQGGKGQNTLSSDVQTNEDILKEDNPVPNKKYKTD-SLKY 150 160 170 180 190 200 240 250 260 270 280 290 pF1KA1 LTSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAK . :.:.. ::.. :..: : : :: . . .:. :::.: ...:: .:: CCDS33 IQSNRKNPSSLEDLEKDRDLKLGP----SF-------NTNCNGNPNLDETVLATQTLNAK 210 220 230 240 250 300 310 320 330 340 350 pF1KA1 RSLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSL .: : : :: :: .:::.::.:: ::: ::::::::::.:::: CCDS33 NGLTS-PLEPEHSQGDPRC-------NKAQVPLDSHSQQLQQGFPNLGNTCYMNAVLQSL 260 270 280 290 300 360 370 380 390 400 410 pF1KA1 FSLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAE :.. :::.::: ::.::. ::..::: ...::. ::.:... :..:: .::..:::.:: CCDS33 FAIPSFADDLLTQGVPWEYIPFEALIMTLTQLLALKDFCSTKIKRELLGNVKKVISAVAE 310 320 330 340 350 360 420 430 440 450 460 470 pF1KA1 RFSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPISGEENS-PDI----SATRAYTCP ::: :::::::::.:::::::::::::: : .: :.::: :.. .::....:: CCDS33 IFSGNMQNDAHEFLGQCLDQLKEDMEKLNATLNTGKECGDENSSPQMHVGSAATKVFVCP 370 380 390 400 410 420 480 490 500 510 520 530 pF1KA1 VITNLEFEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEEL :..:.:::.: :.::::::. . : : : :::.: .. :::: :::.::::::. ::: CCDS33 VVANFEFELQLSLICKACGHAVLKVEPNNYLSINLHQETKPLP-LSIQNSLDLFFKEEEL 430 440 450 460 470 480 540 550 560 570 580 590 pF1KA1 EYSCEKCGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHC ::.:. : : ..:: :.:: ::::.:::::::: : : : ..:: ::. :.:::.: CCDS33 EYNCQMCKQKSCVARHTFSRLSRVLIIHLKRYSFNNAWLLV-KNNEQVYIPKSLSLSSYC 490 500 510 520 530 540 600 610 620 630 640 650 pF1KA1 TENTKPPFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSED .:.::::. :. :: .. . :..:: . : :.:: ::: :.: .:..::.: .. :.. CCDS33 NESTKPPLPLSSSAPVGKCEVLEVSQEMISEINSPLTPSMKLTSESSDSLVLPVEPDKNA 550 560 570 580 590 600 660 670 680 690 700 710 pF1KA1 ELKRSVALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDR-MSEEELLAAVL .:.: :: : ..::.:.:::. : : .::: . :: ..:.:: .: CCDS33 DLQRF----QRDCGDASQEQHQRDLENGSAL------ESELVHFR-DRAIGEKELPVADS 610 620 630 640 650 720 730 740 750 760 770 pF1KA1 EISKRDASPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTE ... : : . .:: : ::::: ..: .::.:..:. .. :: .:..:.. : :: CCDS33 LMDQGDISLPVMYEDGGKLISSPDTRLVEVHLQEVPQHPELQKYEKTNTFVEFNFDSVTE 660 670 680 690 700 710 780 790 800 810 820 830 pF1KA1 ITKDCDENKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDL :. . :::. :::::: .. ::: .:. .. :::: .... .: :. :. : CCDS33 STNGFYDCKENRIPEGSQGMAEQLQQC-IEESIIDEFLQQAPPPGVRKLDAQEHTEET-L 720 730 740 750 760 840 850 860 870 880 890 pF1KA1 KRATELSLQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLIS ...::: ::. . . . ::::: . ::....: : :..::.:: ::.. :. ..::::: CCDS33 NQSTELRLQKADLNHLGALGSD-NPGNKNILDAENTRGEAKELTRNVKMGDPLQAYRLIS 770 780 790 800 810 820 900 910 920 930 940 950 pF1KA1 VVSHIGSTSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEI :::::::. .::::::::::..:::::::::: ::.:.:. .: : .:::::::::. : CCDS33 VVSHIGSSPNSGHYISDVYDFQKQAWFTYNDLCVSEISETKMQEARLHSGYIFFYMHNGI 830 840 850 860 870 880 960 970 pF1KA1 FDELLETEKNSQSLSTEVGKTTRQAS :.:::. .::. ::..: CCDS33 FEELLRKAENSRLPSTQAGVIPQGEYEGDSLYRPA 890 900 910 920 >>CCDS14635.1 USP26 gene_id:83844|Hs108|chrX (913 aa) initn: 1662 init1: 506 opt: 1061 Z-score: 870.4 bits: 172.4 E(32554): 3.7e-42 Smith-Waterman score: 2113; 42.4% identity (66.9% similar) in 984 aa overlap (1-977:1-912) 10 20 30 40 50 60 pF1KA1 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV :. : ..: ..: . .:::.: ::. .: ::...: ::.....: :.:: ::.:: CCDS14 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKYST-FRLSDNIQNV 10 20 30 40 50 70 80 90 100 110 120 pF1KA1 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF ::. ..:..: ::::.:. : :. . : :::....::: ::::.. ..:..:.. : CCDS14 VLKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVF 60 70 80 90 100 110 130 140 150 160 170 pF1KA1 GAILGSRTSQKETSR-QLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGI : :.::: .. .. :...:.: :.: ..:: :.:. CCDS14 -----SSTTQKEINKTSFHKVDEKSSSK--SFEI-------------AKGS-----GTGV 120 130 140 150 180 190 200 210 220 230 pF1KA1 ARTIPSLTSTSTPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKY . .: ::: : . : ::. .:::::.:..::.::.. :::.: .:. .: :: CCDS14 LQRMPLLTSKLTLTCGELSENQHKKRKRMLSSSSEMNEEFLKENNSVEYKKSKADCSRC- 160 170 180 190 200 210 240 250 260 270 280 290 pF1KA1 LTSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAK .. .:::::.::. :::. : .:: .. ...:. :: .. :. . : CCDS14 VSYNREKQLKLKELEENKK---LECESSCIM--------NATGNPYLDDIGLL-QALTEK 220 230 240 250 260 300 310 320 330 340 350 pF1KA1 RSLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSL : :: : .. :: :.: .. . .. .:. ::::::::::.:::: CCDS14 MVLVFLLQQ--------GYSDGYTKWDKLKLFFELFPEKICHGLPNLGNTCYMNAVLQSL 270 280 290 300 310 360 370 380 390 400 410 pF1KA1 FSLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAE .:. :::.:::.:..:: ::::::: .:.:: :: : : :. :: ..:.::::.:: CCDS14 LSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEIKEMLLLNLKKAISAAAE 320 330 340 350 360 370 420 430 440 450 460 470 pF1KA1 RFSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPISGEENSP-----DISATRAYTCP : : ::::::::..::::::..::::: :: . ::.: : : : ...:: CCDS14 IFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNFPKQVFADDPDTSGFSCP 380 390 400 410 420 430 480 490 500 510 520 530 pF1KA1 VITNLEFEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEEL ::::.:.:. ::: :::::..: : : : :::.::.: : : :::...:::: :::: CCDS14 VITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKA-HPSSIQSTFDLFFGAEEL 440 450 460 470 480 490 540 550 560 570 580 590 pF1KA1 EYSCEKCGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHC ::.: :: : .. :.:.::::.::.::::::.: .:. : :.::: .:: .:::: CCDS14 EYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALK-KNDQEVIISKYLKVSSHC 500 510 520 530 540 550 600 610 620 630 640 650 pF1KA1 TENTKPPFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSED .:.:.::. :. ..... . ::. . ..: : : :. : .::. :: . ::.:. CCDS14 NEGTRPPLPLSEDGEITDFQLLKVIRKMTSGNISVSWPATK---ESKDILAPHIGSDKES 560 570 580 590 600 660 670 680 690 700 710 pF1KA1 ELKRSVALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDR-MSEEELLAAVL : :.. : . . . .:::. : :.:: :.. : :: :: . :.: :: .. CCDS14 EQKKG----QTVFKGASRRQQQKYLGKNSK-----PNELESVYSG-DRAFIEKEPLAHLM 610 620 630 640 650 720 730 740 750 760 770 pF1KA1 EISKRDASPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTE . :.: :. ::.::: : ... :.: .:::: . : . .. .: . . CCDS14 TYLE-DTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKYVKTSKFVAFD--RIIN 660 670 680 690 700 710 780 790 800 810 820 830 pF1KA1 ITKDCDENKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDL ::: :.:. . :: : . :: : : :: :::: ::. . . : . .: CCDS14 PTKDLYEDKNIRIPERFQKVSEQTQQCDGMRI-CEQAPQQALPQSFPKPGT--QGHTKNL 720 730 740 750 760 770 840 850 860 870 880 890 pF1KA1 KRATELSLQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLIS : :.:.::. : . . ::::... :.:..: ...:.: ::: . :. :.::::: CCDS14 LRPTKLNLQKSNRNSLLALGSNKNPRNKDILD--KIKSKAKETKRNDDKGD--HTYRLIS 780 790 800 810 820 900 910 920 930 940 950 pF1KA1 VVSHIGSTSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEI ::::.:.: .::::: :.::..:: ::::.:..: :::: .: :: .::::::::.:: CCDS14 VVSHLGKTLKSGHYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMHNEI 830 840 850 860 870 880 960 970 pF1KA1 FDELLETEKNSQSLSTEVGKTTRQAS :.:.:. :.:.: : :: .: .. CCDS14 FEEMLKREENAQLNSKEVEETLQKE 890 900 910 979 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 20:31:55 2016 done: Sat Nov 5 20:31:56 2016 Total Scan time: 3.780 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]