FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8358, 344 aa
1>>>pF1KB8358 344 - 344 aa - 344 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.8031+/-0.00093; mu= -6.3212+/- 0.057
mean_var=301.2572+/-62.964, 0's: 0 Z-trim(115.7): 14 B-trim: 953 in 1/54
Lambda= 0.073893
statistics sampled from 16301 (16313) to 16301 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.8), E-opt: 0.2 (0.501), width: 16
Scan time: 3.290
The best scores are: opt bits E(32554)
CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 ( 344) 2330 261.0 1e-69
CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 ( 326) 1372 158.9 5.4e-39
CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 ( 469) 1372 159.0 7.3e-39
CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 ( 259) 542 70.3 2e-12
>>CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 (344 aa)
initn: 2330 init1: 2330 opt: 2330 Z-score: 1365.1 bits: 261.0 E(32554): 1e-69
Smith-Waterman score: 2330; 99.7% identity (100.0% similar) in 344 aa overlap (1-344:1-344)
10 20 30 40 50 60
pF1KB8 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCIVRYLETNKYCPMCDVQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCIVRYLETNKYCPMCDVQV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 HKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPLTEVPNGSNEDRGEVLEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 HKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPLTEVPNGSNEDRGEVLEQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 EKGALSDDEIVSLAIEFYEGARDRDEKKGPLENGDGDKEKTGVRFLRCPAAMTVMHLAKF
:::::::::::::.::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 EKGALSDDEIVSLSIEFYEGARDRDEKKGPLENGDGDKEKTGVRFLRCPAAMTVMHLAKF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 LRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYIYPWRRNGPLPLKYRVQPACKRLTLAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYIYPWRRNGPLPLKYRVQPACKRLTLAT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 VPTPSEGTNTSGASECESVSDKAPSPATLPATSSSLPSPATPSHGSPSSHGPPATHPTSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VPTPSEGTNTSGASECESVSDKAPSPATLPATSSSLPSPATPSHGSPSSHGPPATHPTSP
250 260 270 280 290 300
310 320 330 340
pF1KB8 TPPSTASGATTAANGGSLNCLQTPSSTSRGRKMTVNGAPVPPLT
::::::::::::::::::::::::::::::::::::::::::::
CCDS32 TPPSTASGATTAANGGSLNCLQTPSSTSRGRKMTVNGAPVPPLT
310 320 330 340
>>CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 (326 aa)
initn: 1399 init1: 825 opt: 1372 Z-score: 813.5 bits: 158.9 E(32554): 5.4e-39
Smith-Waterman score: 1396; 62.9% identity (80.7% similar) in 342 aa overlap (1-338:1-320)
10 20 30 40 50 60
pF1KB8 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCIVRYLETNKYCPMCDVQV
::::::::::::::::::.::::::::::::.:::::::::::::::::.::::.:::::
CCDS71 MHRTTRIKITELNPHLMCVLCGGYFIDATTIIECLHSFCKTCIVRYLETSKYCPICDVQV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 HKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPLTEVPNGSNEDRGEVLEQ
:::::::.::::::::::::::::::::.:::::::::::.: ... :::::::::: ..
CCDS71 HKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKRRRDFYAAHPSADAANGSNEDRGEVADE
70 80 90 100 110 120
130 140 150 160 170
pF1KB8 EKGALSDDEIVSLAIEFYEGARDRDEKKGPLENGDGDKEKTGV---RFLRCPAAMTVMHL
.: ..::::.::.:::.. ..: ..: : : .: : : :.::::::::::::
CCDS71 DKRIITDDEIISLSIEFFD--QNRLDRK---VNKDKEKSKEEVNDKRYLRCPAAMTVMHL
130 140 150 160 170
180 190 200 210 220 230
pF1KB8 AKFLRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYIYPWRRNGPLPLKYRVQPACKRLT
::::.:::.:. ....:.::.::::.::::::::::: :::::::::::::.:.:::.
CCDS71 RKFLRSKMDIPNTFQIDVMYEEEPLKDYYTLMDIAYIYTWRRNGPLPLKYRVRPTCKRMK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 LATVPTPSEGTNTSGASECESVSDKAPSPAT-LPATSSSLPSPATPSHGSPSSHGPPATH
.. .: ...: : .: :::: ::: .:.::: ::::.:: . :: :
CCDS71 IS---HQRDGLTNAGELESDSGSDKANSPAGGIPSTSSCLPSPSTPVQ-SP--------H
240 250 260 270 280
300 310 320 330 340
pF1KB8 PTSPTPPSTASGATTAANGGSLNCLQTPSSTSRGRKMTVNGAPVPPLT
: : :: .:.... .:. . : ..: :: .:::.
CCDS71 PQFPHISSTMNGTSNSPSGN-----HQSSFANRPRKSSVNGSSATSSG
290 300 310 320
>>CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 (469 aa)
initn: 1399 init1: 825 opt: 1372 Z-score: 811.2 bits: 159.0 E(32554): 7.3e-39
Smith-Waterman score: 1396; 62.9% identity (80.7% similar) in 342 aa overlap (1-338:144-463)
10 20 30
pF1KB8 MHRTTRIKITELNPHLMCALCGGYFIDATT
::::::::::::::::::.:::::::::::
CCDS59 LLGRTLIPHPIQRLVLVAAWNNYRIFYQAEMHRTTRIKITELNPHLMCVLCGGYFIDATT
120 130 140 150 160 170
40 50 60 70 80 90
pF1KB8 IVECLHSFCKTCIVRYLETNKYCPMCDVQVHKTRPLLSIRSDKTLQDIVYKLVPGLFKDE
:.:::::::::::::::::.::::.::::::::::::.::::::::::::::::::::.:
CCDS59 IIECLHSFCKTCIVRYLETSKYCPICDVQVHKTRPLLNIRSDKTLQDIVYKLVPGLFKNE
180 190 200 210 220 230
100 110 120 130 140 150
pF1KB8 MKRRRDFYAAYPLTEVPNGSNEDRGEVLEQEKGALSDDEIVSLAIEFYEGARDRDEKKGP
::::::::::.: ... :::::::::: ...: ..::::.::.:::.. ..: ..:
CCDS59 MKRRRDFYAAHPSADAANGSNEDRGEVADEDKRIITDDEIISLSIEFFD--QNRLDRK--
240 250 260 270 280
160 170 180 190 200
pF1KB8 LENGDGDKEKTGV---RFLRCPAAMTVMHLAKFLRNKMDVPSKYKVEVLYEDEPLKEYYT
: : .: : : :.:::::::::::: ::::.:::.:. ....:.::.::::.:::
CCDS59 -VNKDKEKSKEEVNDKRYLRCPAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEPLKDYYT
290 300 310 320 330 340
210 220 230 240 250 260
pF1KB8 LMDIAYIYPWRRNGPLPLKYRVQPACKRLTLATVPTPSEGTNTSGASECESVSDKAPSPA
:::::::: :::::::::::::.:.:::. .. .: ...: : .: :::: :::
CCDS59 LMDIAYIYTWRRNGPLPLKYRVRPTCKRMKIS---HQRDGLTNAGELESDSGSDKANSPA
350 360 370 380 390 400
270 280 290 300 310 320
pF1KB8 T-LPATSSSLPSPATPSHGSPSSHGPPATHPTSPTPPSTASGATTAANGGSLNCLQTPSS
.:.::: ::::.:: . :: :: : :: .:.... .:. . :
CCDS59 GGIPSTSSCLPSPSTPVQ-SP--------HPQFPHISSTMNGTSNSPSGN-----HQSSF
410 420 430 440 450
330 340
pF1KB8 TSRGRKMTVNGAPVPPLT
..: :: .:::.
CCDS59 ANRPRKSSVNGSSATSSG
460
>>CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 (259 aa)
initn: 513 init1: 486 opt: 542 Z-score: 336.7 bits: 70.3 E(32554): 2e-12
Smith-Waterman score: 552; 38.3% identity (69.8% similar) in 235 aa overlap (6-230:35-255)
10 20 30
pF1KB8 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECL
:.:: .:: :..: ::.:::.:::::.:::
CCDS19 QGGQIAIAMRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECL
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB8 HSFCKTCIVRYLETNKYCPMCDVQVHKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRR
:.:::.:::.::.:.::::::....:.:.:::... :...::::::::::: .: :: :
CCDS19 HTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIR
70 80 90 100 110 120
100 110 120 130 140
pF1KB8 DFYAAYPLTEV--PNGSNEDRGEV------LEQEKGALSD-DEIVSLAIEFYEGARDRDE
.:: . : .: :.: . ... ... :. :: ..: .: ...:..
CCDS19 EFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERLSSGKDKN-
130 140 150 160 170 180
150 160 170 180 190 200
pF1KB8 KKGPLENGDGDKEKTGVRFLRCPAAMTVMHLAKFLRNKMDVPSKYKVEVLYEDEPLKEYY
:. :.: ...:: . : :: . : ... . .. :..:...: : ...
CCDS19 -KSVLQN----------KYVRCSVRAEVRHLRRVLCHRLMLNPQH-VQLLFDNEVLPDHM
190 200 210 220 230
210 220 230 240 250 260
pF1KB8 TLMDIAYIYPWR-RNGPLPLKYRVQPACKRLTLATVPTPSEGTNTSGASECESVSDKAPS
:. .: .. : . .:: :.: :.
CCDS19 TMKQI-WLSRWFGKPSPLLLQYSVKEKRR
240 250
344 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 12:05:38 2016 done: Fri Nov 4 12:05:39 2016
Total Scan time: 3.290 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]