FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9807, 227 aa 1>>>pF1KB9807 227 - 227 aa - 227 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8983+/-0.00101; mu= 5.0859+/- 0.061 mean_var=209.3181+/-42.974, 0's: 0 Z-trim(113.1): 23 B-trim: 1015 in 2/50 Lambda= 0.088648 statistics sampled from 13796 (13812) to 13796 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.765), E-opt: 0.2 (0.424), width: 16 Scan time: 2.210 The best scores are: opt bits E(32554) CCDS14496.1 TCEAL2 gene_id:140597|Hs108|chrX ( 227) 1552 210.1 9.6e-55 CCDS14510.2 TCEAL4 gene_id:79921|Hs108|chrX ( 215) 876 123.6 9.8e-29 CCDS76004.1 TCEAL4 gene_id:79921|Hs108|chrX ( 358) 876 123.8 1.4e-28 CCDS35356.1 TCEAL5 gene_id:340543|Hs108|chrX ( 206) 595 87.6 6.3e-18 CCDS14511.1 TCEAL3 gene_id:85012|Hs108|chrX ( 200) 560 83.2 1.4e-16 CCDS43978.1 TCEAL6 gene_id:158931|Hs108|chrX ( 183) 473 72.0 2.9e-13 >>CCDS14496.1 TCEAL2 gene_id:140597|Hs108|chrX (227 aa) initn: 1552 init1: 1552 opt: 1552 Z-score: 1096.3 bits: 210.1 E(32554): 9.6e-55 Smith-Waterman score: 1552; 100.0% identity (100.0% similar) in 227 aa overlap (1-227:1-227) 10 20 30 40 50 60 pF1KB9 MEKLFNENEGMPSNQGKIDNEEQPPHEGKPEVACILEDKKLENEGNTENTGKRVEEPLKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MEKLFNENEGMPSNQGKIDNEEQPPHEGKPEVACILEDKKLENEGNTENTGKRVEEPLKD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 KEKPESAGKAKGEGKSERKGKSEMQGGSKTEGKPERGGRAEGEGEPDSEREPESEGEPES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KEKPESAGKAKGEGKSERKGKSEMQGGSKTEGKPERGGRAEGEGEPDSEREPESEGEPES 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 ETRAAGKRPAEDDIPRKAKRKTNKGLAQYLKQYKEAIHDMNFSNEDMIREFDNMARVEDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ETRAAGKRPAEDDIPRKAKRKTNKGLAQYLKQYKEAIHDMNFSNEDMIREFDNMARVEDK 130 140 150 160 170 180 190 200 210 220 pF1KB9 RRKSKQKLGAFLWMQRNLQDPFYPRGPREFRGGCRAPRRDTEDIPYV ::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RRKSKQKLGAFLWMQRNLQDPFYPRGPREFRGGCRAPRRDTEDIPYV 190 200 210 220 >>CCDS14510.2 TCEAL4 gene_id:79921|Hs108|chrX (215 aa) initn: 825 init1: 825 opt: 876 Z-score: 629.3 bits: 123.6 E(32554): 9.8e-29 Smith-Waterman score: 1172; 78.5% identity (86.8% similar) in 228 aa overlap (1-227:1-215) 10 20 30 40 50 pF1KB9 MEKLFNENEGMPSNQGKIDNEEQPPHEGKPEVACILEDKKLENEGNTENTGKRV-EEPLK ::::..::::: :::::..::::: : ::::.: ::::::::::.::: :: :: :: CCDS14 MEKLYSENEGMASNQGKMENEEQPQDERKPEVTCTLEDKKLENEGKTENKGKTGDEEMLK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB9 DKEKPESAGKAKGEGKSERKGKSEMQGGSKTEGKPERGGRAEGEGEPDSEREPESEGEPE :: :::: :.:: ::::::.:.:::.:::. ::::: :. ::::::: CCDS14 DKGKPESEGEAK-EGKSEREGESEMEGGSEREGKPEIEGK------------PESEGEPG 70 80 90 100 120 130 140 150 160 170 pF1KB9 SETRAAGKRPAEDDIPRKAKRKTNKGLAQYLKQYKEAIHDMNFSNEDMIREFDNMARVED ::::::::::::::.:::::::::::::.:::.:::::::::::::::::::::::.:.: CCDS14 SETRAAGKRPAEDDVPRKAKRKTNKGLAHYLKEYKEAIHDMNFSNEDMIREFDNMAKVQD 110 120 130 140 150 160 180 190 200 210 220 pF1KB9 KRRKSKQKLGAFLWMQRNLQDPFYPRGPREFRGGCRAPRRDTEDIPYV ..::::::::::::::::::::::::::::::::::::::: :::::: CCDS14 EKRKSKQKLGAFLWMQRNLQDPFYPRGPREFRGGCRAPRRDIEDIPYV 170 180 190 200 210 >>CCDS76004.1 TCEAL4 gene_id:79921|Hs108|chrX (358 aa) initn: 825 init1: 825 opt: 876 Z-score: 626.5 bits: 123.8 E(32554): 1.4e-28 Smith-Waterman score: 1172; 78.5% identity (86.8% similar) in 228 aa overlap (1-227:144-358) 10 20 30 pF1KB9 MEKLFNENEGMPSNQGKIDNEEQPPHEGKP ::::..::::: :::::..::::: : :: CCDS76 QRSAKPEKEEQPVQNPRRSVKDRKRRGNLDMEKLYSENEGMASNQGKMENEEQPQDERKP 120 130 140 150 160 170 40 50 60 70 80 pF1KB9 EVACILEDKKLENEGNTENTGKRV-EEPLKDKEKPESAGKAKGEGKSERKGKSEMQGGSK ::.: ::::::::::.::: :: :: :::: :::: :.:: ::::::.:.:::.:::. CCDS76 EVTCTLEDKKLENEGKTENKGKTGDEEMLKDKGKPESEGEAK-EGKSEREGESEMEGGSE 180 190 200 210 220 230 90 100 110 120 130 140 pF1KB9 TEGKPERGGRAEGEGEPDSEREPESEGEPESETRAAGKRPAEDDIPRKAKRKTNKGLAQY ::::: :. ::::::: ::::::::::::::.:::::::::::::.: CCDS76 REGKPEIEGK------------PESEGEPGSETRAAGKRPAEDDVPRKAKRKTNKGLAHY 240 250 260 270 280 150 160 170 180 190 200 pF1KB9 LKQYKEAIHDMNFSNEDMIREFDNMARVEDKRRKSKQKLGAFLWMQRNLQDPFYPRGPRE ::.:::::::::::::::::::::::.:.:..:::::::::::::::::::::::::::: CCDS76 LKEYKEAIHDMNFSNEDMIREFDNMAKVQDEKRKSKQKLGAFLWMQRNLQDPFYPRGPRE 290 300 310 320 330 340 210 220 pF1KB9 FRGGCRAPRRDTEDIPYV ::::::::::: :::::: CCDS76 FRGGCRAPRRDIEDIPYV 350 >>CCDS35356.1 TCEAL5 gene_id:340543|Hs108|chrX (206 aa) initn: 1026 init1: 364 opt: 595 Z-score: 435.3 bits: 87.6 E(32554): 6.3e-18 Smith-Waterman score: 616; 45.0% identity (69.4% similar) in 229 aa overlap (1-227:1-206) 10 20 30 40 50 60 pF1KB9 MEKLFNENEGMPSNQGKIDNEEQPPHEGKPEVACILEDKKLENEGNTENTGKRVEEPLKD ::::..:::: : :. ....: :::: .::.::. :: :: CCDS35 MEKLYKENEGKPENERNLESE------GKPE-----------DEGSTEDEGKSDEE---- 10 20 30 70 80 90 100 110 120 pF1KB9 KEKPESAGKAKGEGKSERKGKSEMQGGSKTEGKPERGGRAEGEGEPDSEREPESEGEPES :::. ::.. ::: : .:. .: . ::. :. :..::: .:.:: .: :...::: CCDS35 -EKPDMEGKTECEGKREDEGEPGDEGQLEDEGNQEKQGKSEGEDKPQSEGKPASQAKPES 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB9 ETRAAGKRPAEDDIPRKAKRKTNKGLAQYLKQYKEAIHDMNFSNEDMIREFDNMARVEDK . ::: :::::: .::::::::..: . :. .: ... ..:.:.:.:: ...:.... CCDS35 QPRAAEKRPAEDYVPRKAKRKTDRGTDDSPKDSQEDLQERHLSSEEMMRECGDVSRAQEE 100 110 120 130 140 150 190 200 210 220 pF1KB9 RRKSKQKLGAFLWMQRNLQDPFYPRGPREFRG--GCRAPRRDTEDIPYV :: :::.:.: ::::..:::: ::: : :: : ..: ::.::: CCDS35 LRK-KQKMGGFHWMQRDVQDPFAPRGQRGVRGVRGGGRGQKDLEDVPYV 160 170 180 190 200 >>CCDS14511.1 TCEAL3 gene_id:85012|Hs108|chrX (200 aa) initn: 817 init1: 372 opt: 560 Z-score: 411.3 bits: 83.2 E(32554): 1.4e-16 Smith-Waterman score: 561; 41.5% identity (65.5% similar) in 229 aa overlap (1-227:1-200) 10 20 30 40 50 60 pF1KB9 MEKLFNENEGMPSNQGKIDNEEQPPHEGKPEVACILEDKKLENEGNTENTGKRVEEPLKD ::: .:.::: :.:: ..: .: ::: . . CCDS14 MEKPYNKNEGNLENEGKPEDEVEPDDEGKSD----------------------------E 10 20 30 70 80 90 100 110 120 pF1KB9 KEKPESAGKAKGEGKSERKGKSEMQGGSKTEGKPERGGRAEGEGEPDSEREPESEGEPES .:::. ::.. ::: : .:. .: . ::. :. ::.::::.:..: .: :...::: CCDS14 EEKPDVEGKTECEGKREDEGEPGDEGQLEDEGSQEKQGRSEGEGKPQGEGKPASQAKPES 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB9 ETRAAGKRPAEDDIPRKAKRKTNKGLAQYLKQYKEAIHDMNFSNEDMIREFDNMARVEDK . ::: :::::: .::::::::..: . :. .: ... ..:.:.:.:: ...:.... CCDS14 QPRAAEKRPAEDYVPRKAKRKTDRGTDDSPKDSQEDLQERHLSSEEMMRECGDVSRAQEE 100 110 120 130 140 150 190 200 210 220 pF1KB9 RRKSKQKLGAFLWMQRNLQDPFYPRGPREFRG--GCRAPRRDTEDIPYV :: :::.:.: ::::..:::: ::: : :: : .: .::::. CCDS14 LRK-KQKMGGFHWMQRDVQDPFAPRGQRGVRGVRGGGRGQRGLHDIPYL 160 170 180 190 200 >>CCDS43978.1 TCEAL6 gene_id:158931|Hs108|chrX (183 aa) initn: 637 init1: 347 opt: 473 Z-score: 351.7 bits: 72.0 E(32554): 2.9e-13 Smith-Waterman score: 485; 43.6% identity (66.3% similar) in 202 aa overlap (1-202:1-173) 10 20 30 40 50 60 pF1KB9 MEKLFNENEGMPSNQGKIDNEEQPPHEGKPEVACILEDKKLENEGNTENTGKRVEEPLKD ::: .:.::: :.:: ..: .: ::: . :..: . ::.:: ::: : CCDS43 MEKPYNKNEGNLENEGKPEDEVEPDDEGKSD-----EEEKPDAEGKTECEGKRKAE---- 10 20 30 40 50 70 80 90 100 110 120 pF1KB9 KEKPESAGKAKGEGKSERKGKSEMQGGSKTEGKPERGGRAEGEGEPDSEREPESEGEPES :. ::. : ::..: :: :. ::::. :::.: :. .:: :.: CCDS43 -------GEPGDEGQLEDKGSQEKQGKSEGEGKPQ------GEGKPASQAKPE--GQP-- 60 70 80 90 130 140 150 160 170 180 pF1KB9 ETRAAGKRPAEDDIPRKAKRKTNKGLAQYLKQYKEAIHDMNFSNEDMIREFDNMARVEDK ::: :::: : .::::::::..: . :. .: ... ..:.:.:.:: ...:.... CCDS43 --RAAEKRPAGDYVPRKAKRKTDRGTDDSPKDSQEDLQERHLSSEEMMRECGDVSRAQEE 100 110 120 130 140 150 190 200 210 220 pF1KB9 RRKSKQKLGAFLWMQRNLQDPFYPRGPREFRGGCRAPRRDTEDIPYV :: :::.:.: ::::..:::: CCDS43 LRK-KQKMGGFHWMQRDVQDPFAQGDNGVSGE 160 170 180 227 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 19:08:04 2016 done: Fri Nov 4 19:08:04 2016 Total Scan time: 2.210 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]