FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8358, 344 aa 1>>>pF1KB8358 344 - 344 aa - 344 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.8031+/-0.00093; mu= -6.3212+/- 0.057 mean_var=301.2572+/-62.964, 0's: 0 Z-trim(115.7): 14 B-trim: 953 in 1/54 Lambda= 0.073893 statistics sampled from 16301 (16313) to 16301 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.8), E-opt: 0.2 (0.501), width: 16 Scan time: 3.290 The best scores are: opt bits E(32554) CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 ( 344) 2330 261.0 1e-69 CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 ( 326) 1372 158.9 5.4e-39 CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 ( 469) 1372 159.0 7.3e-39 CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 ( 259) 542 70.3 2e-12 >>CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 (344 aa) initn: 2330 init1: 2330 opt: 2330 Z-score: 1365.1 bits: 261.0 E(32554): 1e-69 Smith-Waterman score: 2330; 99.7% identity (100.0% similar) in 344 aa overlap (1-344:1-344) 10 20 30 40 50 60 pF1KB8 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCIVRYLETNKYCPMCDVQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCIVRYLETNKYCPMCDVQV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 HKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPLTEVPNGSNEDRGEVLEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 HKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPLTEVPNGSNEDRGEVLEQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 EKGALSDDEIVSLAIEFYEGARDRDEKKGPLENGDGDKEKTGVRFLRCPAAMTVMHLAKF :::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EKGALSDDEIVSLSIEFYEGARDRDEKKGPLENGDGDKEKTGVRFLRCPAAMTVMHLAKF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 LRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYIYPWRRNGPLPLKYRVQPACKRLTLAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYIYPWRRNGPLPLKYRVQPACKRLTLAT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 VPTPSEGTNTSGASECESVSDKAPSPATLPATSSSLPSPATPSHGSPSSHGPPATHPTSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VPTPSEGTNTSGASECESVSDKAPSPATLPATSSSLPSPATPSHGSPSSHGPPATHPTSP 250 260 270 280 290 300 310 320 330 340 pF1KB8 TPPSTASGATTAANGGSLNCLQTPSSTSRGRKMTVNGAPVPPLT :::::::::::::::::::::::::::::::::::::::::::: CCDS32 TPPSTASGATTAANGGSLNCLQTPSSTSRGRKMTVNGAPVPPLT 310 320 330 340 >>CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 (326 aa) initn: 1399 init1: 825 opt: 1372 Z-score: 813.5 bits: 158.9 E(32554): 5.4e-39 Smith-Waterman score: 1396; 62.9% identity (80.7% similar) in 342 aa overlap (1-338:1-320) 10 20 30 40 50 60 pF1KB8 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCIVRYLETNKYCPMCDVQV ::::::::::::::::::.::::::::::::.:::::::::::::::::.::::.::::: CCDS71 MHRTTRIKITELNPHLMCVLCGGYFIDATTIIECLHSFCKTCIVRYLETSKYCPICDVQV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 HKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPLTEVPNGSNEDRGEVLEQ :::::::.::::::::::::::::::::.:::::::::::.: ... :::::::::: .. CCDS71 HKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKRRRDFYAAHPSADAANGSNEDRGEVADE 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 EKGALSDDEIVSLAIEFYEGARDRDEKKGPLENGDGDKEKTGV---RFLRCPAAMTVMHL .: ..::::.::.:::.. ..: ..: : : .: : : :.:::::::::::: CCDS71 DKRIITDDEIISLSIEFFD--QNRLDRK---VNKDKEKSKEEVNDKRYLRCPAAMTVMHL 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 AKFLRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYIYPWRRNGPLPLKYRVQPACKRLT ::::.:::.:. ....:.::.::::.::::::::::: :::::::::::::.:.:::. CCDS71 RKFLRSKMDIPNTFQIDVMYEEEPLKDYYTLMDIAYIYTWRRNGPLPLKYRVRPTCKRMK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 LATVPTPSEGTNTSGASECESVSDKAPSPAT-LPATSSSLPSPATPSHGSPSSHGPPATH .. .: ...: : .: :::: ::: .:.::: ::::.:: . :: : CCDS71 IS---HQRDGLTNAGELESDSGSDKANSPAGGIPSTSSCLPSPSTPVQ-SP--------H 240 250 260 270 280 300 310 320 330 340 pF1KB8 PTSPTPPSTASGATTAANGGSLNCLQTPSSTSRGRKMTVNGAPVPPLT : : :: .:.... .:. . : ..: :: .:::. CCDS71 PQFPHISSTMNGTSNSPSGN-----HQSSFANRPRKSSVNGSSATSSG 290 300 310 320 >>CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 (469 aa) initn: 1399 init1: 825 opt: 1372 Z-score: 811.2 bits: 159.0 E(32554): 7.3e-39 Smith-Waterman score: 1396; 62.9% identity (80.7% similar) in 342 aa overlap (1-338:144-463) 10 20 30 pF1KB8 MHRTTRIKITELNPHLMCALCGGYFIDATT ::::::::::::::::::.::::::::::: CCDS59 LLGRTLIPHPIQRLVLVAAWNNYRIFYQAEMHRTTRIKITELNPHLMCVLCGGYFIDATT 120 130 140 150 160 170 40 50 60 70 80 90 pF1KB8 IVECLHSFCKTCIVRYLETNKYCPMCDVQVHKTRPLLSIRSDKTLQDIVYKLVPGLFKDE :.:::::::::::::::::.::::.::::::::::::.::::::::::::::::::::.: CCDS59 IIECLHSFCKTCIVRYLETSKYCPICDVQVHKTRPLLNIRSDKTLQDIVYKLVPGLFKNE 180 190 200 210 220 230 100 110 120 130 140 150 pF1KB8 MKRRRDFYAAYPLTEVPNGSNEDRGEVLEQEKGALSDDEIVSLAIEFYEGARDRDEKKGP ::::::::::.: ... :::::::::: ...: ..::::.::.:::.. ..: ..: CCDS59 MKRRRDFYAAHPSADAANGSNEDRGEVADEDKRIITDDEIISLSIEFFD--QNRLDRK-- 240 250 260 270 280 160 170 180 190 200 pF1KB8 LENGDGDKEKTGV---RFLRCPAAMTVMHLAKFLRNKMDVPSKYKVEVLYEDEPLKEYYT : : .: : : :.:::::::::::: ::::.:::.:. ....:.::.::::.::: CCDS59 -VNKDKEKSKEEVNDKRYLRCPAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEPLKDYYT 290 300 310 320 330 340 210 220 230 240 250 260 pF1KB8 LMDIAYIYPWRRNGPLPLKYRVQPACKRLTLATVPTPSEGTNTSGASECESVSDKAPSPA :::::::: :::::::::::::.:.:::. .. .: ...: : .: :::: ::: CCDS59 LMDIAYIYTWRRNGPLPLKYRVRPTCKRMKIS---HQRDGLTNAGELESDSGSDKANSPA 350 360 370 380 390 400 270 280 290 300 310 320 pF1KB8 T-LPATSSSLPSPATPSHGSPSSHGPPATHPTSPTPPSTASGATTAANGGSLNCLQTPSS .:.::: ::::.:: . :: :: : :: .:.... .:. . : CCDS59 GGIPSTSSCLPSPSTPVQ-SP--------HPQFPHISSTMNGTSNSPSGN-----HQSSF 410 420 430 440 450 330 340 pF1KB8 TSRGRKMTVNGAPVPPLT ..: :: .:::. CCDS59 ANRPRKSSVNGSSATSSG 460 >>CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 (259 aa) initn: 513 init1: 486 opt: 542 Z-score: 336.7 bits: 70.3 E(32554): 2e-12 Smith-Waterman score: 552; 38.3% identity (69.8% similar) in 235 aa overlap (6-230:35-255) 10 20 30 pF1KB8 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECL :.:: .:: :..: ::.:::.:::::.::: CCDS19 QGGQIAIAMRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECL 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB8 HSFCKTCIVRYLETNKYCPMCDVQVHKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRR :.:::.:::.::.:.::::::....:.:.:::... :...::::::::::: .: :: : CCDS19 HTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIR 70 80 90 100 110 120 100 110 120 130 140 pF1KB8 DFYAAYPLTEV--PNGSNEDRGEV------LEQEKGALSD-DEIVSLAIEFYEGARDRDE .:: . : .: :.: . ... ... :. :: ..: .: ...:.. CCDS19 EFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERLSSGKDKN- 130 140 150 160 170 180 150 160 170 180 190 200 pF1KB8 KKGPLENGDGDKEKTGVRFLRCPAAMTVMHLAKFLRNKMDVPSKYKVEVLYEDEPLKEYY :. :.: ...:: . : :: . : ... . .. :..:...: : ... CCDS19 -KSVLQN----------KYVRCSVRAEVRHLRRVLCHRLMLNPQH-VQLLFDNEVLPDHM 190 200 210 220 230 210 220 230 240 250 260 pF1KB8 TLMDIAYIYPWR-RNGPLPLKYRVQPACKRLTLATVPTPSEGTNTSGASECESVSDKAPS :. .: .. : . .:: :.: :. CCDS19 TMKQI-WLSRWFGKPSPLLLQYSVKEKRR 240 250 344 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 12:05:38 2016 done: Fri Nov 4 12:05:39 2016 Total Scan time: 3.290 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]