FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1959, 649 aa
1>>>pF1KSDA1959 649 - 649 aa - 649 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7786+/-0.000932; mu= 16.9284+/- 0.056
mean_var=81.7530+/-17.014, 0's: 0 Z-trim(105.9): 71 B-trim: 476 in 1/49
Lambda= 0.141848
statistics sampled from 8599 (8669) to 8599 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.635), E-opt: 0.2 (0.266), width: 16
Scan time: 3.630
The best scores are: opt bits E(32554)
CCDS31694.1 UBASH3B gene_id:84959|Hs108|chr11 ( 649) 4457 922.4 0
CCDS58791.1 UBASH3A gene_id:53347|Hs108|chr21 ( 526) 1050 225.1 1.9e-58
CCDS33566.1 UBASH3A gene_id:53347|Hs108|chr21 ( 623) 1050 225.2 2.2e-58
CCDS13687.1 UBASH3A gene_id:53347|Hs108|chr21 ( 661) 923 199.2 1.5e-50
>>CCDS31694.1 UBASH3B gene_id:84959|Hs108|chr11 (649 aa)
initn: 4457 init1: 4457 opt: 4457 Z-score: 4929.6 bits: 922.4 E(32554): 0
Smith-Waterman score: 4457; 100.0% identity (100.0% similar) in 649 aa overlap (1-649:1-649)
10 20 30 40 50 60
pF1KSD MAQYGHPSPLGMAAREELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MAQYGHPSPLGMAAREELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALAS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD TGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 TGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNKA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD HNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 HNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKED
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD SAEVLKKFAADFAAEAASKTEVHVEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SAEVLKKFAADFAAEAASKTEVHVEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLGC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD DWVATIFSRDIRFANHETLQVIYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DWVATIFSRDIRFANHETLQVIYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGTS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD LTTGCSGLLPENYITKADECSTWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LTTGCSGLLPENYITKADECSTWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGET
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD TPLTIICQPMQPLRVNSQPGPQKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 TPLTIICQPMQPLRVNSQPGPQKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNLN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD MPHSLPQRSGGFRDYEKDAPITVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAHN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MPHSLPQRSGGFRDYEKDAPITVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAHN
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD ILKGLQQENHLKIRVEPGLFEWTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ILKGLQQENHLKIRVEPGLFEWTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISKL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD VVSESYDTYISRSFQVTKEIISECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 VVSESYDTYISRSFQVTKEIISECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFVQ
550 560 570 580 590 600
610 620 630 640
pF1KSD MVRKIPYLGFCSCEELGETGIWQLTDPPILPLTHGPTGGFNWRETLLQE
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MVRKIPYLGFCSCEELGETGIWQLTDPPILPLTHGPTGGFNWRETLLQE
610 620 630 640
>>CCDS58791.1 UBASH3A gene_id:53347|Hs108|chr21 (526 aa)
initn: 1565 init1: 1027 opt: 1050 Z-score: 1162.8 bits: 225.1 E(32554): 1.9e-58
Smith-Waterman score: 1575; 46.2% identity (72.8% similar) in 522 aa overlap (12-532:1-506)
10 20 30 40 50
pF1KSD MAQYGHPSPLGMAARE-ELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALA
::: : .::.::. . . .. : : :. ::.:::: : ::::
CCDS58 MAAGETQLYAKVSNKLKSRSSP------SLLEPLLAMGFPVHTALKALA
10 20 30 40
60 70 80 90 100 110
pF1KSD STGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNK
.:: .... : :: .: .:: ::::.:.::.:.: ::::: .::..::..::. :.::.
CCDS58 ATGRKTAEEALAWLHDHCNDPSLDDPIPQEYALFLCPTGPLLEKLQEFWRESKRQCAKNR
50 60 70 80 90 100
120 130 140 150 160 170
pF1KSD AHNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKE
::..:::.:::.:: :::.::. : :::. . .: .: . .:: :..: ...:.::.
CCDS58 AHEVFPHVTLCDFFTCEDQKVECLYEALKRAGDRLLGSFPTAVPLALHSSISYLGFFVSG
110 120 130 140 150 160
180 190 200 210 220 230
pF1KSD DSAEVLKKFAADFAAEAASKTEVHVEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLG
. :.:...:: ::.::. .. :.: ::::.:::..: : :::.::. : . .
CCDS58 SPADVIREFAMTFATEASLLADCSVKPCTKQLHLTLAHKFYPHHQRTLEQLARAIPLGHS
170 180 190 200 210 220
240 250 260 270 280 290
pF1KSD CDWVATIFSRDIRFANHETLQVIYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGT
:.:.:...:::.::....::.... : ::: ::: : :::.::..: .: .::::. :
CCDS58 CQWTAALYSRDMRFVHYQTLRALFQYKPQNVDELTLSPGDYIFVDPTQQDEASEGWVIGI
230 240 250 260 270 280
300 310 320 330 340 350
pF1KSD SLTTGCSGLLPENYITKADECSTWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGE
: ::: :.::::: .:.: .::. : :.. ... :: :: : ::
CCDS58 SQRTGCRGFLPENYTDRASESDTWVKHRMYTFSLATDLNSRK--DGEASSRCS-----GE
290 300 310 320 330
360 370 380 390 400 410
pF1KSD TTPLTIICQPMQPLRVNSQPGPQKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNL
: : . .. :.. : .. ..: :::::.: .::: ::.:: :.: : .:
CCDS58 FLPQT--ARSLSSLQA-LQATVARKSVLVVRHGERVDQIFGKAWLQQCSTPDGKYYRPDL
340 350 360 370 380 390
420 430 440 450 460 470
pF1KSD NMPHSLPQRSGGFRDYEKDAPITVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAH
:.: :::.:: :..:.:.: :.. : .:.:..:.:::.:. :. :. ::.:::::::.
CCDS58 NFPCSLPRRSRGIKDFENDPPLSSCGIFQSRIAGDALLDSGIRISSVFASPALRCVQTAK
400 410 420 430 440 450
480 490 500 510 520 530
pF1KSD NILKGLQQENHLKIRVEPGLFEWTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISK
::. :. :...:::::::.:::::: ::.: :. . :: ::...:: ::
CCDS58 LILEELKLEKKIKIRVEPGIFEWTKWEAGKTTPTLMSLEELKEANFNIDTDYRSLPWACA
460 470 480 490 500 510
540 550 560 570 580 590
pF1KSD LVVSESYDTYISRSFQVTKEIISECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFV
CCDS58 SVKKIKRKENGSW
520
>>CCDS33566.1 UBASH3A gene_id:53347|Hs108|chr21 (623 aa)
initn: 1934 init1: 1027 opt: 1050 Z-score: 1161.8 bits: 225.2 E(32554): 2.2e-58
Smith-Waterman score: 1944; 46.3% identity (72.8% similar) in 633 aa overlap (12-643:1-617)
10 20 30 40 50
pF1KSD MAQYGHPSPLGMAARE-ELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALA
::: : .::.::. . . .. : : :. ::.:::: : ::::
CCDS33 MAAGETQLYAKVSNKLKSRSSP------SLLEPLLAMGFPVHTALKALA
10 20 30 40
60 70 80 90 100 110
pF1KSD STGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNK
.:: .... : :: .: .:: ::::.:.::.:.: ::::: .::..::..::. :.::.
CCDS33 ATGRKTAEEALAWLHDHCNDPSLDDPIPQEYALFLCPTGPLLEKLQEFWRESKRQCAKNR
50 60 70 80 90 100
120 130 140 150 160 170
pF1KSD AHNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKE
::..:::.:::.:: :::.::. : :::. . .: .: . .:: :..: ...:.::.
CCDS33 AHEVFPHVTLCDFFTCEDQKVECLYEALKRAGDRLLGSFPTAVPLALHSSISYLGFFVSG
110 120 130 140 150 160
180 190 200 210 220 230
pF1KSD DSAEVLKKFAADFAAEAASKTEVHVEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLG
. :.:...:: ::.::. .. :.: ::::.:::..: : :::.::. : . .
CCDS33 SPADVIREFAMTFATEASLLADCSVKPCTKQLHLTLAHKFYPHHQRTLEQLARAIPLGHS
170 180 190 200 210 220
240 250 260 270 280 290
pF1KSD CDWVATIFSRDIRFANHETLQVIYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGT
:.:.:...:::.::....::.... : ::: ::: : :::.::..: .: .::::. :
CCDS33 CQWTAALYSRDMRFVHYQTLRALFQYKPQNVDELTLSPGDYIFVDPTQQDEASEGWVIGI
230 240 250 260 270 280
300 310 320 330 340 350
pF1KSD SLTTGCSGLLPENYITKADECSTWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGE
: ::: :.::::: .:.: .::. : :.. ... :: :: : ::
CCDS33 SQRTGCRGFLPENYTDRASESDTWVKHRMYTFSLATDLNSRK--DGEASSR-----CSGE
290 300 310 320 330
360 370 380 390 400 410
pF1KSD TTPLTIICQPMQPLRVNSQPGPQKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNL
: : . .. :.. : .. ..: :::::.: .::: ::.:: :.: : .:
CCDS33 FLPQT--ARSLSSLQA-LQATVARKSVLVVRHGERVDQIFGKAWLQQCSTPDGKYYRPDL
340 350 360 370 380 390
420 430 440 450 460 470
pF1KSD NMPHSLPQRSGGFRDYEKDAPITVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAH
:.: :::.:: :..:.:.: :.. : .:.:..:.:::.:. :. :. ::.:::::::.
CCDS33 NFPCSLPRRSRGIKDFENDPPLSSCGIFQSRIAGDALLDSGIRISSVFASPALRCVQTAK
400 410 420 430 440 450
480 490 500 510 520 530
pF1KSD NILKGLQQENHLKIRVEPGLFEWTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISK
::. :. :...:::::::.:::::: ::.: :. . :: ::...:: ::: .:.:
CCDS33 LILEELKLEKKIKIRVEPGIFEWTKWEAGKTTPTLMSLEELKEANFNIDTDYRPAFPLSA
460 470 480 490 500 510
540 550 560 570 580 590
pF1KSD LVVSESYDTYISRSFQVTKEIISECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFV
:. .:::. :..: .:.. : . . ::::.:.:.:..:: : :: :.. ::.
CCDS33 LMPAESYQEYMDRCTASMVQIVNTCPQDTGVILIVSHGSTLDSCTRPLLGLPPRECGDFA
520 530 540 550 560 570
600 610 620 630 640
pF1KSD QMVRKIPYLGFCSCEELGETGIWQLTDPPILPLTHGPTGGFNWRETLLQE
:.::::: ::.: ::: : : :.:..::. :::: ...::::
CCDS33 QLVRKIPSLGMCFCEENKEEGKWELVNPPVKTLTHGANAAFNWRNWISGN
580 590 600 610 620
>>CCDS13687.1 UBASH3A gene_id:53347|Hs108|chr21 (661 aa)
initn: 1926 init1: 921 opt: 923 Z-score: 1020.9 bits: 199.2 E(32554): 1.5e-50
Smith-Waterman score: 1866; 44.0% identity (69.0% similar) in 671 aa overlap (12-643:1-655)
10 20 30 40 50
pF1KSD MAQYGHPSPLGMAARE-ELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALA
::: : .::.::. . . .. : : :. ::.:::: : ::::
CCDS13 MAAGETQLYAKVSNKLKSRSSP------SLLEPLLAMGFPVHTALKALA
10 20 30 40
60 70 80 90 100 110
pF1KSD STGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNK
.:: .... : :: .: .:: ::::.:.::.:.: ::::: .::..::..::. :.::.
CCDS13 ATGRKTAEEALAWLHDHCNDPSLDDPIPQEYALFLCPTGPLLEKLQEFWRESKRQCAKNR
50 60 70 80 90 100
120 130 140 150 160 170
pF1KSD AHNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKE
::..:::.:::.:: :::.::. : :::. . .: .: . .:: :..: ...:.::.
CCDS13 AHEVFPHVTLCDFFTCEDQKVECLYEALKRAGDRLLGSFPTAVPLALHSSISYLGFFVSG
110 120 130 140 150 160
180 190 200
pF1KSD DSAEVLKKFAADFAAEAA-------------SKTEVH-----------------------
. :.:...:: ::.::. :.. :
CCDS13 SPADVIREFAMTFATEASLLAGTSVSRFWIFSQVPGHGPNLRLSNLTRASFVSHYILQKY
170 180 190 200 210 220
210 220 230 240 250 260
pF1KSD --VEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLGCDWVATIFSRDIRFANHETLQV
:.: ::::.:::..: : :::.::. : . .:.:.:...:::.::....::..
CCDS13 CSVKPCTKQLHLTLAHKFYPHHQRTLEQLARAIPLGHSCQWTAALYSRDMRFVHYQTLRA
230 240 250 260 270 280
270 280 290 300 310 320
pF1KSD IYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGTSLTTGCSGLLPENYITKADECS
.. : ::: ::: : :::.::..: .: .::::. : : ::: :.::::: .:.: .
CCDS13 LFQYKPQNVDELTLSPGDYIFVDPTQQDEASEGWVIGISQRTGCRGFLPENYTDRASESD
290 300 310 320 330 340
330 340 350 360 370 380
pF1KSD TWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGETTPLTIICQPMQPLRVNSQPGP
::. : :.. ... :: :: : :: : : . .. :.. :
CCDS13 TWVKHRMYTFSLATDLNSRK--DGEASSR-----CSGEFLPQT--ARSLSSLQA-LQATV
350 360 370 380 390
390 400 410 420 430 440
pF1KSD QKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNLNMPHSLPQRSGGFRDYEKDAPI
.. ..: :::::.: .::: ::.:: :.: : .::.: :::.:: :..:.:.: :.
CCDS13 ARKSVLVVRHGERVDQIFGKAWLQQCSTPDGKYYRPDLNFPCSLPRRSRGIKDFENDPPL
400 410 420 430 440 450
450 460 470 480 490 500
pF1KSD TVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAHNILKGLQQENHLKIRVEPGLFE
. : .:.:..:.:::.:. :. :. ::.:::::::. ::. :. :...:::::::.::
CCDS13 SSCGIFQSRIAGDALLDSGIRISSVFASPALRCVQTAKLILEELKLEKKIKIRVEPGIFE
460 470 480 490 500 510
510 520 530 540 550 560
pF1KSD WTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISKLVVSESYDTYISRSFQVTKEII
:::: ::.: :. . :: ::...:: ::: .:.: :. .:::. :..: .:.
CCDS13 WTKWEAGKTTPTLMSLEELKEANFNIDTDYRPAFPLSALMPAESYQEYMDRCTASMVQIV
520 530 540 550 560 570
570 580 590 600 610 620
pF1KSD SECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFVQMVRKIPYLGFCSCEELGETGI
. : . . ::::.:.:.:..:: : :: :.. ::.:.::::: ::.: ::: : :
CCDS13 NTCPQDTGVILIVSHGSTLDSCTRPLLGLPPRECGDFAQLVRKIPSLGMCFCEENKEEGK
580 590 600 610 620 630
630 640
pF1KSD WQLTDPPILPLTHGPTGGFNWRETLLQE
:.:..::. :::: ...::::
CCDS13 WELVNPPVKTLTHGANAAFNWRNWISGN
640 650 660
649 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 07:49:09 2016 done: Thu Nov 3 07:49:10 2016
Total Scan time: 3.630 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]