FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1594, 979 aa
1>>>pF1KA1594 979 - 979 aa - 979 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.0061+/-0.00108; mu= 9.0453+/- 0.066
mean_var=151.1292+/-30.585, 0's: 0 Z-trim(108.4): 64 B-trim: 263 in 1/50
Lambda= 0.104328
statistics sampled from 10139 (10181) to 10139 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.664), E-opt: 0.2 (0.313), width: 16
Scan time: 3.780
The best scores are: opt bits E(32554)
CCDS2418.1 USP37 gene_id:57695|Hs108|chr2 ( 979) 6403 976.5 0
CCDS33124.1 USP29 gene_id:57663|Hs108|chr19 ( 922) 1497 238.0 6.5e-62
CCDS14635.1 USP26 gene_id:83844|Hs108|chrX ( 913) 1061 172.4 3.7e-42
>>CCDS2418.1 USP37 gene_id:57695|Hs108|chr2 (979 aa)
initn: 6403 init1: 6403 opt: 6403 Z-score: 5215.3 bits: 976.5 E(32554): 0
Smith-Waterman score: 6403; 99.9% identity (100.0% similar) in 978 aa overlap (1-978:1-978)
10 20 30 40 50 60
pF1KA1 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 GAILGSRTSQKETSRQLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 GAILGSRTSQKETSRQLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGIA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 RTIPSLTSTSTPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 RTIPSLTSTSTPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKYL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 TSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 TSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAKR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 SLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 SLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSLF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 SLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 SLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAER
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 FSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPISGEENSPDISATRAYTCPVITNLE
:::::::::::::::::::::::::::::::::::.::::::::::::::::::::::::
CCDS24 FSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPVSGEENSPDISATRAYTCPVITNLE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 FEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEELEYSCEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 FEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEELEYSCEK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 CGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHCTENTKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 CGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHCTENTKP
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 PFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSEDELKRSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 PFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSEDELKRSV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 ALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDRMSEEELLAAVLEISKRDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 ALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDRMSEEELLAAVLEISKRDA
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 SPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTEITKDCDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 SPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTEITKDCDE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA1 NKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDLKRATELS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 NKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDLKRATELS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA1 LQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLISVVSHIGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 LQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLISVVSHIGS
850 860 870 880 890 900
910 920 930 940 950 960
pF1KA1 TSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEIFDELLET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 TSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEIFDELLET
910 920 930 940 950 960
970
pF1KA1 EKNSQSLSTEVGKTTRQAS
::::::::::::::::::
CCDS24 EKNSQSLSTEVGKTTRQAL
970
>>CCDS33124.1 USP29 gene_id:57663|Hs108|chr19 (922 aa)
initn: 2102 init1: 591 opt: 1497 Z-score: 1225.0 bits: 238.0 E(32554): 6.5e-62
Smith-Waterman score: 2345; 44.9% identity (69.4% similar) in 979 aa overlap (1-972:1-906)
10 20 30 40 50 60
pF1KA1 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV
: ::. : :.: :..::.:: ::. .: :.......::: ...: . ::::::.::..:
CCDS33 MISLKVCGFIQIWSQKTGMTKLKEALIETVQRQKEIKLVVTFKSGKFIRIFQLSNNIRSV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF
::: .::.: :::..: :: :::. .::... .::: .:::. ::
CCDS33 VLRHCKKRQSHLRLTLKNNVFLFIDKLSYRDAKQLNMFLDIIHQNKSQQPMK--------
70 80 90 100 110
130 140 150 160 170 180
pF1KA1 GAILGSRTSQKETSRQLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGIA
: .: .. .:. :. : : .. ..:.
CCDS33 -----------------SDDDWSVFESRNMLKEIDKTSFYSICNKPSY------------
120 130 140
190 200 210 220 230
pF1KA1 RTIPSLTSTS-TPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKY
. .: . : : : ...:.:::. : . .:. . ::: ::.. :.: :: : ::
CCDS33 QKMPLFMSKSPTHVKKGILENQGGKGQNTLSSDVQTNEDILKEDNPVPNKKYKTD-SLKY
150 160 170 180 190 200
240 250 260 270 280 290
pF1KA1 LTSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAK
. :.:.. ::.. :..: : : :: . . .:. :::.: ...:: .::
CCDS33 IQSNRKNPSSLEDLEKDRDLKLGP----SF-------NTNCNGNPNLDETVLATQTLNAK
210 220 230 240 250
300 310 320 330 340 350
pF1KA1 RSLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSL
.: : : :: :: .:::.::.:: ::: ::::::::::.::::
CCDS33 NGLTS-PLEPEHSQGDPRC-------NKAQVPLDSHSQQLQQGFPNLGNTCYMNAVLQSL
260 270 280 290 300
360 370 380 390 400 410
pF1KA1 FSLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAE
:.. :::.::: ::.::. ::..::: ...::. ::.:... :..:: .::..:::.::
CCDS33 FAIPSFADDLLTQGVPWEYIPFEALIMTLTQLLALKDFCSTKIKRELLGNVKKVISAVAE
310 320 330 340 350 360
420 430 440 450 460 470
pF1KA1 RFSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPISGEENS-PDI----SATRAYTCP
::: :::::::::.:::::::::::::: : .: :.::: :.. .::....::
CCDS33 IFSGNMQNDAHEFLGQCLDQLKEDMEKLNATLNTGKECGDENSSPQMHVGSAATKVFVCP
370 380 390 400 410 420
480 490 500 510 520 530
pF1KA1 VITNLEFEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEEL
:..:.:::.: :.::::::. . : : : :::.: .. :::: :::.::::::. :::
CCDS33 VVANFEFELQLSLICKACGHAVLKVEPNNYLSINLHQETKPLP-LSIQNSLDLFFKEEEL
430 440 450 460 470 480
540 550 560 570 580 590
pF1KA1 EYSCEKCGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHC
::.:. : : ..:: :.:: ::::.:::::::: : : : ..:: ::. :.:::.:
CCDS33 EYNCQMCKQKSCVARHTFSRLSRVLIIHLKRYSFNNAWLLV-KNNEQVYIPKSLSLSSYC
490 500 510 520 530 540
600 610 620 630 640 650
pF1KA1 TENTKPPFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSED
.:.::::. :. :: .. . :..:: . : :.:: ::: :.: .:..::.: .. :..
CCDS33 NESTKPPLPLSSSAPVGKCEVLEVSQEMISEINSPLTPSMKLTSESSDSLVLPVEPDKNA
550 560 570 580 590 600
660 670 680 690 700 710
pF1KA1 ELKRSVALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDR-MSEEELLAAVL
.:.: :: : ..::.:.:::. : : .::: . :: ..:.:: .:
CCDS33 DLQRF----QRDCGDASQEQHQRDLENGSAL------ESELVHFR-DRAIGEKELPVADS
610 620 630 640 650
720 730 740 750 760 770
pF1KA1 EISKRDASPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTE
... : : . .:: : ::::: ..: .::.:..:. .. :: .:..:.. : ::
CCDS33 LMDQGDISLPVMYEDGGKLISSPDTRLVEVHLQEVPQHPELQKYEKTNTFVEFNFDSVTE
660 670 680 690 700 710
780 790 800 810 820 830
pF1KA1 ITKDCDENKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDL
:. . :::. :::::: .. ::: .:. .. :::: .... .: :. :. :
CCDS33 STNGFYDCKENRIPEGSQGMAEQLQQC-IEESIIDEFLQQAPPPGVRKLDAQEHTEET-L
720 730 740 750 760
840 850 860 870 880 890
pF1KA1 KRATELSLQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLIS
...::: ::. . . . ::::: . ::....: : :..::.:: ::.. :. ..:::::
CCDS33 NQSTELRLQKADLNHLGALGSD-NPGNKNILDAENTRGEAKELTRNVKMGDPLQAYRLIS
770 780 790 800 810 820
900 910 920 930 940 950
pF1KA1 VVSHIGSTSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEI
:::::::. .::::::::::..:::::::::: ::.:.:. .: : .:::::::::. :
CCDS33 VVSHIGSSPNSGHYISDVYDFQKQAWFTYNDLCVSEISETKMQEARLHSGYIFFYMHNGI
830 840 850 860 870 880
960 970
pF1KA1 FDELLETEKNSQSLSTEVGKTTRQAS
:.:::. .::. ::..:
CCDS33 FEELLRKAENSRLPSTQAGVIPQGEYEGDSLYRPA
890 900 910 920
>>CCDS14635.1 USP26 gene_id:83844|Hs108|chrX (913 aa)
initn: 1662 init1: 506 opt: 1061 Z-score: 870.4 bits: 172.4 E(32554): 3.7e-42
Smith-Waterman score: 2113; 42.4% identity (66.9% similar) in 984 aa overlap (1-977:1-912)
10 20 30 40 50 60
pF1KA1 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV
:. : ..: ..: . .:::.: ::. .: ::...: ::.....: :.:: ::.::
CCDS14 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKYST-FRLSDNIQNV
10 20 30 40 50
70 80 90 100 110 120
pF1KA1 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF
::. ..:..: ::::.:. : :. . : :::....::: ::::.. ..:..:.. :
CCDS14 VLKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVF
60 70 80 90 100 110
130 140 150 160 170
pF1KA1 GAILGSRTSQKETSR-QLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGI
: :.::: .. .. :...:.: :.: ..:: :.:.
CCDS14 -----SSTTQKEINKTSFHKVDEKSSSK--SFEI-------------AKGS-----GTGV
120 130 140 150
180 190 200 210 220 230
pF1KA1 ARTIPSLTSTSTPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKY
. .: ::: : . : ::. .:::::.:..::.::.. :::.: .:. .: ::
CCDS14 LQRMPLLTSKLTLTCGELSENQHKKRKRMLSSSSEMNEEFLKENNSVEYKKSKADCSRC-
160 170 180 190 200 210
240 250 260 270 280 290
pF1KA1 LTSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAK
.. .:::::.::. :::. : .:: .. ...:. :: .. :. . :
CCDS14 VSYNREKQLKLKELEENKK---LECESSCIM--------NATGNPYLDDIGLL-QALTEK
220 230 240 250 260
300 310 320 330 340 350
pF1KA1 RSLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSL
: :: : .. :: :.: .. . .. .:. ::::::::::.::::
CCDS14 MVLVFLLQQ--------GYSDGYTKWDKLKLFFELFPEKICHGLPNLGNTCYMNAVLQSL
270 280 290 300 310
360 370 380 390 400 410
pF1KA1 FSLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAE
.:. :::.:::.:..:: ::::::: .:.:: :: : : :. :: ..:.::::.::
CCDS14 LSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEIKEMLLLNLKKAISAAAE
320 330 340 350 360 370
420 430 440 450 460 470
pF1KA1 RFSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPISGEENSP-----DISATRAYTCP
: : ::::::::..::::::..::::: :: . ::.: : : : ...::
CCDS14 IFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNFPKQVFADDPDTSGFSCP
380 390 400 410 420 430
480 490 500 510 520 530
pF1KA1 VITNLEFEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEEL
::::.:.:. ::: :::::..: : : : :::.::.: : : :::...:::: ::::
CCDS14 VITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKA-HPSSIQSTFDLFFGAEEL
440 450 460 470 480 490
540 550 560 570 580 590
pF1KA1 EYSCEKCGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHC
::.: :: : .. :.:.::::.::.::::::.: .:. : :.::: .:: .::::
CCDS14 EYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALK-KNDQEVIISKYLKVSSHC
500 510 520 530 540 550
600 610 620 630 640 650
pF1KA1 TENTKPPFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSED
.:.:.::. :. ..... . ::. . ..: : : :. : .::. :: . ::.:.
CCDS14 NEGTRPPLPLSEDGEITDFQLLKVIRKMTSGNISVSWPATK---ESKDILAPHIGSDKES
560 570 580 590 600
660 670 680 690 700 710
pF1KA1 ELKRSVALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDR-MSEEELLAAVL
: :.. : . . . .:::. : :.:: :.. : :: :: . :.: :: ..
CCDS14 EQKKG----QTVFKGASRRQQQKYLGKNSK-----PNELESVYSG-DRAFIEKEPLAHLM
610 620 630 640 650
720 730 740 750 760 770
pF1KA1 EISKRDASPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTE
. :.: :. ::.::: : ... :.: .:::: . : . .. .: . .
CCDS14 TYLE-DTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKYVKTSKFVAFD--RIIN
660 670 680 690 700 710
780 790 800 810 820 830
pF1KA1 ITKDCDENKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDL
::: :.:. . :: : . :: : : :: :::: ::. . . : . .:
CCDS14 PTKDLYEDKNIRIPERFQKVSEQTQQCDGMRI-CEQAPQQALPQSFPKPGT--QGHTKNL
720 730 740 750 760 770
840 850 860 870 880 890
pF1KA1 KRATELSLQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLIS
: :.:.::. : . . ::::... :.:..: ...:.: ::: . :. :.:::::
CCDS14 LRPTKLNLQKSNRNSLLALGSNKNPRNKDILD--KIKSKAKETKRNDDKGD--HTYRLIS
780 790 800 810 820
900 910 920 930 940 950
pF1KA1 VVSHIGSTSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEI
::::.:.: .::::: :.::..:: ::::.:..: :::: .: :: .::::::::.::
CCDS14 VVSHLGKTLKSGHYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMHNEI
830 840 850 860 870 880
960 970
pF1KA1 FDELLETEKNSQSLSTEVGKTTRQAS
:.:.:. :.:.: : :: .: ..
CCDS14 FEEMLKREENAQLNSKEVEETLQKE
890 900 910
979 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 20:31:55 2016 done: Sat Nov 5 20:31:56 2016
Total Scan time: 3.780 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]