FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8703, 574 aa
1>>>pF1KB8703 574 - 574 aa - 574 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.7825+/-0.000814; mu= 5.7871+/- 0.049
mean_var=238.0925+/-47.768, 0's: 0 Z-trim(116.6): 7 B-trim: 189 in 1/53
Lambda= 0.083119
statistics sampled from 17251 (17256) to 17251 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.819), E-opt: 0.2 (0.53), width: 16
Scan time: 3.950
The best scores are: opt bits E(32554)
CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 ( 574) 4035 496.6 3.6e-140
CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 ( 755) 1040 137.5 5.7e-32
CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 ( 644) 559 79.8 1.2e-14
CCDS77876.1 SENP5 gene_id:205564|Hs108|chr3 ( 709) 524 75.6 2.3e-13
CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 ( 589) 494 71.9 2.4e-12
>>CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 (574 aa)
initn: 4035 init1: 4035 opt: 4035 Z-score: 2630.0 bits: 496.6 E(32554): 3.6e-140
Smith-Waterman score: 4035; 99.8% identity (99.8% similar) in 574 aa overlap (1-574:1-574)
10 20 30 40 50 60
pF1KB8 MKETIQGTGSWGPEPPGPGIPPAYSSPRRERLRWPPPPKPRLKSGGGFGPDPGSGTTVPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 MKETIQGTGSWGPEPPGPGIPPAYSSPRRERLRWPPPPKPRLKSGGGFGPDPGSGTTVPA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 RRLPVPRPSFDASASEEEEEEEEEVDEDEEEEVAAWRLPPRWSQLGTSQRPRPSRPTHRK
:::::::::::::::::::::::: :::::::::::::::::::::::::::::::::::
CCDS73 RRLPVPRPSFDASASEEEEEEEEEEDEDEEEEVAAWRLPPRWSQLGTSQRPRPSRPTHRK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 TCSQRRRRAMRAFRMLLYSKSTSLTFHWKLWGRHRGRRRGLAHPKNHLSPQQGGATPQVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 TCSQRRRRAMRAFRMLLYSKSTSLTFHWKLWGRHRGRRRGLAHPKNHLSPQQGGATPQVP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 SPCCRFDSPRGPPPPRLGLLGALMAEDGVRGSPPVPSGPPMEEDGLRWTPKSPLDPDSGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 SPCCRFDSPRGPPPPRLGLLGALMAEDGVRGSPPVPSGPPMEEDGLRWTPKSPLDPDSGL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 LSCTLPNGFGGQSGPEGERSLAPPDASILISNVCSIGDHVAQELFQGSDLGMAEEAERPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 LSCTLPNGFGGQSGPEGERSLAPPDASILISNVCSIGDHVAQELFQGSDLGMAEEAERPG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 EKAGQHSPLREEHVTCVQSILDEFLQTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 EKAGQHSPLREEHVTCVQSILDEFLQTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 LQLIQSYQRMPGNAMVRGFRVAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 LQLIQSYQRMPGNAMVRGFRVAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB8 KVHFFNSFFYDKLRTKGYDGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 KVHFFNSFFYDKLRTKGYDGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITY
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB8 FDSQRTLNRRCPKHIAKYLQAEAVKKDRLDFHQGWKGYFKMNVARQNNDSDCGAFVLQYC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 FDSQRTLNRRCPKHIAKYLQAEAVKKDRLDFHQGWKGYFKMNVARQNNDSDCGAFVLQYC
490 500 510 520 530 540
550 560 570
pF1KB8 KHLALSQPFSFTQQDMPKLRRQIYKELCHCKLTV
::::::::::::::::::::::::::::::::::
CCDS73 KHLALSQPFSFTQQDMPKLRRQIYKELCHCKLTV
550 560 570
>>CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 (755 aa)
initn: 1041 init1: 887 opt: 1040 Z-score: 687.5 bits: 137.5 E(32554): 5.7e-32
Smith-Waterman score: 1040; 53.5% identity (79.2% similar) in 284 aa overlap (291-572:475-753)
270 280 290 300 310
pF1KB8 LAPPDASILISNVCSIGDHVAQELFQGSDLGMAEEAERPGEKAGQH-SPLREEHVT-CVQ
:. : . : : .:. ::. .:... :..
CCDS33 DGSLKQSILSSELLDHPYCKSPLEAPLVCSGLKLENQVGGGKNSQKASPVDDEQLSVCLS
450 460 470 480 490 500
320 330 340 350 360 370
pF1KB8 SILDEFLQTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRG
..::: .. ::::.::: ::. .:.:.:...:: .:: .. . : .:. . .
CCDS33 GFLDEVMKKYGSLVPLSEKEVLGRLKDVFNEDFS--NRKPFINREITNYRARHQKC---N
510 520 530 540 550
380 390 400 410 420 430
pF1KB8 FRVAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPEKVHFFNSFFYDKLRTKGY
::. :..:.: ::::.:: :::::::::.::::.:.::.::.:::::::::. .: ::::
CCDS33 FRIFYNKHMLDMDDLATLDGQNWLNDQVINMYGELIMDAVPDKVHFFNSFFHRQLVTKGY
560 570 580 590 600 610
440 450 460 470 480 490
pF1KB8 DGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIAKY
.:::::::.::.:.: :::::::::::::::.: . : :...::: . : ..: ::
CCDS33 NGVKRWTKKVDLFKKSLLLIPIHLEVHWSLITVTLSNRIISFYDSQGIHFKFCVENIRKY
620 630 640 650 660 670
500 510 520 530 540 550
pF1KB8 LQAEAVKKDRLDFHQGWKGYFKMNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQQDMPK
: .:: .:.: .: :::. . .:.::::::.::::::: ::: :::.:.:.:::.
CCDS33 LLTEAREKNRPEFLQGWQTAVTKCIPQQKNDSDCGVFVLQYCKCLALEQPFQFSQEDMPR
680 690 700 710 720 730
560 570
pF1KB8 LRRQIYKELCHCKLTV
.:..::::::.:.:
CCDS33 VRKRIYKELCECRLMD
740 750
>>CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 (644 aa)
initn: 492 init1: 331 opt: 559 Z-score: 376.7 bits: 79.8 E(32554): 1.2e-14
Smith-Waterman score: 562; 37.0% identity (63.7% similar) in 273 aa overlap (308-572:393-643)
280 290 300 310 320 330
pF1KB8 DHVAQELFQGSDLGMAEEAERPGEKAGQHSPLREE-HVTCVQSILDEFLQTYGSLIPLST
::..: :: :: : : . :
CCDS44 QKALALQLQNQRLQEREHSVHDSVELHLRVPLEKEIPVTVVQET-----QKKGHKLTDSE
370 380 390 400 410
340 350 360 370 380 390
pF1KB8 DEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRGFRVAYKRHVLTMDDLGTL
:: : :.. ..:... :.: ... ..::.. :. :. ::
CCDS44 DEFPEITEEM-EKEIKNVFRNG-----------NQDEVLSEAFRLTITRK-----DIQTL
420 430 440 450 460
400 410 420 430 440 450
pF1KB8 YGQNWLNDQVMNMYGDLVMDTVPEK----VHFFNSFFYDKLRTKGYDGVKRWTKNVDIFN
:::::...:.: ...:. :: :: ::.::. ::.: ::..::::::.::.:.
CCDS44 NHLNWLNDEIINFYMNMLMERSKEKGLPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFS
470 480 490 500 510 520
460 470 480 490 500 510
pF1KB8 KELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIAKYLQAEAVKKDRLDFH
..::.:::: ::: : :: :...:::.::. .: . . . .::. :.. : : .:
CCDS44 VDILLVPIHLGVHWCLAVVDFRKKNITYYDSMGGINNEACRILLQYLKQESIDKKRKEFD
530 540 550 560 570 580
520 530 540 550 560
pF1KB8 -QGWKGYFK--MNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQQDMPKLRRQIYKELCH
.::. . : ... .: : :::: :. .: .. ..:..:::: :: .:... :. :
CCDS44 TNGWQLFSKKSQEIPQQMNGSDCGMFACKYADCITKDRPINFTQQHMPYFRKRMVWEILH
590 600 610 620 630 640
570
pF1KB8 CKLTV
::
CCDS44 RKLL
>>CCDS77876.1 SENP5 gene_id:205564|Hs108|chr3 (709 aa)
initn: 848 init1: 371 opt: 524 Z-score: 353.4 bits: 75.6 E(32554): 2.3e-13
Smith-Waterman score: 769; 44.7% identity (66.9% similar) in 284 aa overlap (291-572:475-707)
270 280 290 300 310
pF1KB8 LAPPDASILISNVCSIGDHVAQELFQGSDLGMAEEAERPGEKAGQH-SPLREEHVT-CVQ
:. : . : : .:. ::. .:... :..
CCDS77 DGSLKQSILSSELLDHPYCKSPLEAPLVCSGLKLENQVGGGKNSQKASPVDDEQLSVCLS
450 460 470 480 490 500
320 330 340 350 360 370
pF1KB8 SILDEFLQTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRG
..::: .. ::::.::: ::. .:.:.:...:: .:: .. . : .:. . .
CCDS77 GFLDEVMKKYGSLVPLSEKEVLGRLKDVFNEDFS--NRKPFINREITNYRARHQKC---N
510 520 530 540 550
380 390 400 410 420 430
pF1KB8 FRVAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPEKVHFFNSFFYDKLRTKGY
::. :..:.: ::::.:: :::::::::.::::.:.::.::.:::::::::. .: ::::
CCDS77 FRIFYNKHMLDMDDLATLDGQNWLNDQVINMYGELIMDAVPDKVHFFNSFFHRQLVTKGY
560 570 580 590 600 610
440 450 460 470 480 490
pF1KB8 DGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIAKY
.::::::: :.: ::
CCDS77 NGVKRWTK----------------------------------------------KNIRKY
620 630
500 510 520 530 540 550
pF1KB8 LQAEAVKKDRLDFHQGWKGYFKMNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQQDMPK
: .:: .:.: .: :::. . .:.::::::.::::::: ::: :::.:.:.:::.
CCDS77 LLTEAREKNRPEFLQGWQTAVTKCIPQQKNDSDCGVFVLQYCKCLALEQPFQFSQEDMPR
640 650 660 670 680 690
560 570
pF1KB8 LRRQIYKELCHCKLTV
.:..::::::.:.:
CCDS77 VRKRIYKELCECRLMD
700
>>CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 (589 aa)
initn: 469 init1: 293 opt: 494 Z-score: 335.0 bits: 71.9 E(32554): 2.4e-12
Smith-Waterman score: 494; 34.1% identity (69.0% similar) in 229 aa overlap (356-572:361-588)
330 340 350 360 370 380
pF1KB8 QTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRG-----FR
: .:.: ..... .::. .: .
CCDS33 LGSGSNGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTEDMEKEISNALGHGPQDEILS
340 350 360 370 380 390
390 400 410 420 430
pF1KB8 VAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPEK----VHFFNSFFYDKLRTK
:.: .. : :. :: . .::::.:.:.: .:... .. .: :..::: ::..
CCDS33 SAFKLRI-TRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQGYPALHVFSTFFYPKLKSG
400 410 420 430 440
440 450 460 470 480 490
pF1KB8 GYDGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIA
::..::::::.:..:..:..:.::: .:::::. .:.:.. . :.::. ..: . .
CCDS33 GYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCLKYLDSMGQKGHRICEILL
450 460 470 480 490 500
500 510 520 530 540 550
pF1KB8 KYLQAEAVKKDRLDFHQGWKGYFKMN---VARQNNDSDCGAFVLQYCKHLALSQPFSFTQ
.::: :. : :.. . .:. . .: : :::: :. .: ... ..:..:::
CCDS33 QYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMFTCKYADYISRDKPITFTQ
510 520 530 540 550 560
560 570
pF1KB8 QDMPKLRRQIYKELCHCKLTV
..:: .:... :. : .:
CCDS33 HQMPLFRKKMVWEILHQQLL
570 580
574 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 14:45:01 2016 done: Fri Nov 4 14:45:02 2016
Total Scan time: 3.950 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]