FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1959, 649 aa 1>>>pF1KSDA1959 649 - 649 aa - 649 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7786+/-0.000932; mu= 16.9284+/- 0.056 mean_var=81.7530+/-17.014, 0's: 0 Z-trim(105.9): 71 B-trim: 476 in 1/49 Lambda= 0.141848 statistics sampled from 8599 (8669) to 8599 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.635), E-opt: 0.2 (0.266), width: 16 Scan time: 3.630 The best scores are: opt bits E(32554) CCDS31694.1 UBASH3B gene_id:84959|Hs108|chr11 ( 649) 4457 922.4 0 CCDS58791.1 UBASH3A gene_id:53347|Hs108|chr21 ( 526) 1050 225.1 1.9e-58 CCDS33566.1 UBASH3A gene_id:53347|Hs108|chr21 ( 623) 1050 225.2 2.2e-58 CCDS13687.1 UBASH3A gene_id:53347|Hs108|chr21 ( 661) 923 199.2 1.5e-50 >>CCDS31694.1 UBASH3B gene_id:84959|Hs108|chr11 (649 aa) initn: 4457 init1: 4457 opt: 4457 Z-score: 4929.6 bits: 922.4 E(32554): 0 Smith-Waterman score: 4457; 100.0% identity (100.0% similar) in 649 aa overlap (1-649:1-649) 10 20 30 40 50 60 pF1KSD MAQYGHPSPLGMAAREELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MAQYGHPSPLGMAAREELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALAS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNKA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD HNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 HNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKED 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD SAEVLKKFAADFAAEAASKTEVHVEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SAEVLKKFAADFAAEAASKTEVHVEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLGC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD DWVATIFSRDIRFANHETLQVIYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DWVATIFSRDIRFANHETLQVIYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGTS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD LTTGCSGLLPENYITKADECSTWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LTTGCSGLLPENYITKADECSTWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGET 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TPLTIICQPMQPLRVNSQPGPQKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TPLTIICQPMQPLRVNSQPGPQKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNLN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD MPHSLPQRSGGFRDYEKDAPITVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAHN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MPHSLPQRSGGFRDYEKDAPITVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAHN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD ILKGLQQENHLKIRVEPGLFEWTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ILKGLQQENHLKIRVEPGLFEWTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISKL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD VVSESYDTYISRSFQVTKEIISECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VVSESYDTYISRSFQVTKEIISECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFVQ 550 560 570 580 590 600 610 620 630 640 pF1KSD MVRKIPYLGFCSCEELGETGIWQLTDPPILPLTHGPTGGFNWRETLLQE ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MVRKIPYLGFCSCEELGETGIWQLTDPPILPLTHGPTGGFNWRETLLQE 610 620 630 640 >>CCDS58791.1 UBASH3A gene_id:53347|Hs108|chr21 (526 aa) initn: 1565 init1: 1027 opt: 1050 Z-score: 1162.8 bits: 225.1 E(32554): 1.9e-58 Smith-Waterman score: 1575; 46.2% identity (72.8% similar) in 522 aa overlap (12-532:1-506) 10 20 30 40 50 pF1KSD MAQYGHPSPLGMAARE-ELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALA ::: : .::.::. . . .. : : :. ::.:::: : :::: CCDS58 MAAGETQLYAKVSNKLKSRSSP------SLLEPLLAMGFPVHTALKALA 10 20 30 40 60 70 80 90 100 110 pF1KSD STGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNK .:: .... : :: .: .:: ::::.:.::.:.: ::::: .::..::..::. :.::. CCDS58 ATGRKTAEEALAWLHDHCNDPSLDDPIPQEYALFLCPTGPLLEKLQEFWRESKRQCAKNR 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD AHNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKE ::..:::.:::.:: :::.::. : :::. . .: .: . .:: :..: ...:.::. CCDS58 AHEVFPHVTLCDFFTCEDQKVECLYEALKRAGDRLLGSFPTAVPLALHSSISYLGFFVSG 110 120 130 140 150 160 180 190 200 210 220 230 pF1KSD DSAEVLKKFAADFAAEAASKTEVHVEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLG . :.:...:: ::.::. .. :.: ::::.:::..: : :::.::. : . . CCDS58 SPADVIREFAMTFATEASLLADCSVKPCTKQLHLTLAHKFYPHHQRTLEQLARAIPLGHS 170 180 190 200 210 220 240 250 260 270 280 290 pF1KSD CDWVATIFSRDIRFANHETLQVIYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGT :.:.:...:::.::....::.... : ::: ::: : :::.::..: .: .::::. : CCDS58 CQWTAALYSRDMRFVHYQTLRALFQYKPQNVDELTLSPGDYIFVDPTQQDEASEGWVIGI 230 240 250 260 270 280 300 310 320 330 340 350 pF1KSD SLTTGCSGLLPENYITKADECSTWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGE : ::: :.::::: .:.: .::. : :.. ... :: :: : :: CCDS58 SQRTGCRGFLPENYTDRASESDTWVKHRMYTFSLATDLNSRK--DGEASSRCS-----GE 290 300 310 320 330 360 370 380 390 400 410 pF1KSD TTPLTIICQPMQPLRVNSQPGPQKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNL : : . .. :.. : .. ..: :::::.: .::: ::.:: :.: : .: CCDS58 FLPQT--ARSLSSLQA-LQATVARKSVLVVRHGERVDQIFGKAWLQQCSTPDGKYYRPDL 340 350 360 370 380 390 420 430 440 450 460 470 pF1KSD NMPHSLPQRSGGFRDYEKDAPITVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAH :.: :::.:: :..:.:.: :.. : .:.:..:.:::.:. :. :. ::.:::::::. CCDS58 NFPCSLPRRSRGIKDFENDPPLSSCGIFQSRIAGDALLDSGIRISSVFASPALRCVQTAK 400 410 420 430 440 450 480 490 500 510 520 530 pF1KSD NILKGLQQENHLKIRVEPGLFEWTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISK ::. :. :...:::::::.:::::: ::.: :. . :: ::...:: :: CCDS58 LILEELKLEKKIKIRVEPGIFEWTKWEAGKTTPTLMSLEELKEANFNIDTDYRSLPWACA 460 470 480 490 500 510 540 550 560 570 580 590 pF1KSD LVVSESYDTYISRSFQVTKEIISECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFV CCDS58 SVKKIKRKENGSW 520 >>CCDS33566.1 UBASH3A gene_id:53347|Hs108|chr21 (623 aa) initn: 1934 init1: 1027 opt: 1050 Z-score: 1161.8 bits: 225.2 E(32554): 2.2e-58 Smith-Waterman score: 1944; 46.3% identity (72.8% similar) in 633 aa overlap (12-643:1-617) 10 20 30 40 50 pF1KSD MAQYGHPSPLGMAARE-ELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALA ::: : .::.::. . . .. : : :. ::.:::: : :::: CCDS33 MAAGETQLYAKVSNKLKSRSSP------SLLEPLLAMGFPVHTALKALA 10 20 30 40 60 70 80 90 100 110 pF1KSD STGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNK .:: .... : :: .: .:: ::::.:.::.:.: ::::: .::..::..::. :.::. CCDS33 ATGRKTAEEALAWLHDHCNDPSLDDPIPQEYALFLCPTGPLLEKLQEFWRESKRQCAKNR 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD AHNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKE ::..:::.:::.:: :::.::. : :::. . .: .: . .:: :..: ...:.::. CCDS33 AHEVFPHVTLCDFFTCEDQKVECLYEALKRAGDRLLGSFPTAVPLALHSSISYLGFFVSG 110 120 130 140 150 160 180 190 200 210 220 230 pF1KSD DSAEVLKKFAADFAAEAASKTEVHVEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLG . :.:...:: ::.::. .. :.: ::::.:::..: : :::.::. : . . CCDS33 SPADVIREFAMTFATEASLLADCSVKPCTKQLHLTLAHKFYPHHQRTLEQLARAIPLGHS 170 180 190 200 210 220 240 250 260 270 280 290 pF1KSD CDWVATIFSRDIRFANHETLQVIYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGT :.:.:...:::.::....::.... : ::: ::: : :::.::..: .: .::::. : CCDS33 CQWTAALYSRDMRFVHYQTLRALFQYKPQNVDELTLSPGDYIFVDPTQQDEASEGWVIGI 230 240 250 260 270 280 300 310 320 330 340 350 pF1KSD SLTTGCSGLLPENYITKADECSTWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGE : ::: :.::::: .:.: .::. : :.. ... :: :: : :: CCDS33 SQRTGCRGFLPENYTDRASESDTWVKHRMYTFSLATDLNSRK--DGEASSR-----CSGE 290 300 310 320 330 360 370 380 390 400 410 pF1KSD TTPLTIICQPMQPLRVNSQPGPQKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNL : : . .. :.. : .. ..: :::::.: .::: ::.:: :.: : .: CCDS33 FLPQT--ARSLSSLQA-LQATVARKSVLVVRHGERVDQIFGKAWLQQCSTPDGKYYRPDL 340 350 360 370 380 390 420 430 440 450 460 470 pF1KSD NMPHSLPQRSGGFRDYEKDAPITVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAH :.: :::.:: :..:.:.: :.. : .:.:..:.:::.:. :. :. ::.:::::::. CCDS33 NFPCSLPRRSRGIKDFENDPPLSSCGIFQSRIAGDALLDSGIRISSVFASPALRCVQTAK 400 410 420 430 440 450 480 490 500 510 520 530 pF1KSD NILKGLQQENHLKIRVEPGLFEWTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISK ::. :. :...:::::::.:::::: ::.: :. . :: ::...:: ::: .:.: CCDS33 LILEELKLEKKIKIRVEPGIFEWTKWEAGKTTPTLMSLEELKEANFNIDTDYRPAFPLSA 460 470 480 490 500 510 540 550 560 570 580 590 pF1KSD LVVSESYDTYISRSFQVTKEIISECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFV :. .:::. :..: .:.. : . . ::::.:.:.:..:: : :: :.. ::. CCDS33 LMPAESYQEYMDRCTASMVQIVNTCPQDTGVILIVSHGSTLDSCTRPLLGLPPRECGDFA 520 530 540 550 560 570 600 610 620 630 640 pF1KSD QMVRKIPYLGFCSCEELGETGIWQLTDPPILPLTHGPTGGFNWRETLLQE :.::::: ::.: ::: : : :.:..::. :::: ...:::: CCDS33 QLVRKIPSLGMCFCEENKEEGKWELVNPPVKTLTHGANAAFNWRNWISGN 580 590 600 610 620 >>CCDS13687.1 UBASH3A gene_id:53347|Hs108|chr21 (661 aa) initn: 1926 init1: 921 opt: 923 Z-score: 1020.9 bits: 199.2 E(32554): 1.5e-50 Smith-Waterman score: 1866; 44.0% identity (69.0% similar) in 671 aa overlap (12-643:1-655) 10 20 30 40 50 pF1KSD MAQYGHPSPLGMAARE-ELYSKVTPRRNRQQRPGTIKHGSALDVLLSMGFPRARAQKALA ::: : .::.::. . . .. : : :. ::.:::: : :::: CCDS13 MAAGETQLYAKVSNKLKSRSSP------SLLEPLLAMGFPVHTALKALA 10 20 30 40 60 70 80 90 100 110 pF1KSD STGGRSVQAACDWLFSHVGDPFLDDPLPREYVLYLRPTGPLAQKLSDFWQQSKQICGKNK .:: .... : :: .: .:: ::::.:.::.:.: ::::: .::..::..::. :.::. CCDS13 ATGRKTAEEALAWLHDHCNDPSLDDPIPQEYALFLCPTGPLLEKLQEFWRESKRQCAKNR 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD AHNIFPHITLCQFFMCEDSKVDALGEALQTTVSRWKCKFSAPLPLELYTSSNFIGLFVKE ::..:::.:::.:: :::.::. : :::. . .: .: . .:: :..: ...:.::. CCDS13 AHEVFPHVTLCDFFTCEDQKVECLYEALKRAGDRLLGSFPTAVPLALHSSISYLGFFVSG 110 120 130 140 150 160 180 190 200 pF1KSD DSAEVLKKFAADFAAEAA-------------SKTEVH----------------------- . :.:...:: ::.::. :.. : CCDS13 SPADVIREFAMTFATEASLLAGTSVSRFWIFSQVPGHGPNLRLSNLTRASFVSHYILQKY 170 180 190 200 210 220 210 220 230 240 250 260 pF1KSD --VEPHKKQLHVTLAYHFQASHLPTLEKLAQNIDVKLGCDWVATIFSRDIRFANHETLQV :.: ::::.:::..: : :::.::. : . .:.:.:...:::.::....::.. CCDS13 CSVKPCTKQLHLTLAHKFYPHHQRTLEQLARAIPLGHSCQWTAALYSRDMRFVHYQTLRA 230 240 250 260 270 280 270 280 290 300 310 320 pF1KSD IYPYTPQNDDELELVPGDFIFMSPMEQTSTSEGWIYGTSLTTGCSGLLPENYITKADECS .. : ::: ::: : :::.::..: .: .::::. : : ::: :.::::: .:.: . CCDS13 LFQYKPQNVDELTLSPGDYIFVDPTQQDEASEGWVIGISQRTGCRGFLPENYTDRASESD 290 300 310 320 330 340 330 340 350 360 370 380 pF1KSD TWIFHGSYSILNTSSSNSLTFGDGVLERRPYEDQGLGETTPLTIICQPMQPLRVNSQPGP ::. : :.. ... :: :: : :: : : . .. :.. : CCDS13 TWVKHRMYTFSLATDLNSRK--DGEASSR-----CSGEFLPQT--ARSLSSLQA-LQATV 350 360 370 380 390 390 400 410 420 430 440 pF1KSD QKRCLFVCRHGERMDVVFGKYWLSQCFDAKGRYIRTNLNMPHSLPQRSGGFRDYEKDAPI .. ..: :::::.: .::: ::.:: :.: : .::.: :::.:: :..:.:.: :. CCDS13 ARKSVLVVRHGERVDQIFGKAWLQQCSTPDGKYYRPDLNFPCSLPRRSRGIKDFENDPPL 400 410 420 430 440 450 450 460 470 480 490 500 pF1KSD TVFGCMQARLVGEALLESNTIIDHVYCSPSLRCVQTAHNILKGLQQENHLKIRVEPGLFE . : .:.:..:.:::.:. :. :. ::.:::::::. ::. :. :...:::::::.:: CCDS13 SSCGIFQSRIAGDALLDSGIRISSVFASPALRCVQTAKLILEELKLEKKIKIRVEPGIFE 460 470 480 490 500 510 510 520 530 540 550 560 pF1KSD WTKWVAGSTLPAWIPPSELAAANLSVDTTYRPHIPISKLVVSESYDTYISRSFQVTKEII :::: ::.: :. . :: ::...:: ::: .:.: :. .:::. :..: .:. CCDS13 WTKWEAGKTTPTLMSLEELKEANFNIDTDYRPAFPLSALMPAESYQEYMDRCTASMVQIV 520 530 540 550 560 570 570 580 590 600 610 620 pF1KSD SECKSKGNNILIVAHASSLEACTCQLQGLSPQNSKDFVQMVRKIPYLGFCSCEELGETGI . : . . ::::.:.:.:..:: : :: :.. ::.:.::::: ::.: ::: : : CCDS13 NTCPQDTGVILIVSHGSTLDSCTRPLLGLPPRECGDFAQLVRKIPSLGMCFCEENKEEGK 580 590 600 610 620 630 630 640 pF1KSD WQLTDPPILPLTHGPTGGFNWRETLLQE :.:..::. :::: ...:::: CCDS13 WELVNPPVKTLTHGANAAFNWRNWISGN 640 650 660 649 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 07:49:09 2016 done: Thu Nov 3 07:49:10 2016 Total Scan time: 3.630 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]