FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0408, 947 aa 1>>>pF1KA0408 947 - 947 aa - 947 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 13.2264+/-0.0012; mu= -11.7648+/- 0.072 mean_var=524.7221+/-108.756, 0's: 0 Z-trim(116.5): 21 B-trim: 881 in 2/51 Lambda= 0.055990 statistics sampled from 17066 (17079) to 17066 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.784), E-opt: 0.2 (0.525), width: 16 Scan time: 6.080 The best scores are: opt bits E(32554) CCDS43505.1 SOGA3 gene_id:387104|Hs108|chr6 ( 947) 6211 516.9 7.5e-146 CCDS54459.1 SOGA1 gene_id:140710|Hs108|chr20 (1661) 1456 133.0 4.7e-30 CCDS11841.1 MTCL1 gene_id:23255|Hs108|chr18 (1586) 1353 124.6 1.5e-27 CCDS46598.1 SOGA1 gene_id:140710|Hs108|chr20 (1016) 1342 123.6 2e-27 >>CCDS43505.1 SOGA3 gene_id:387104|Hs108|chr6 (947 aa) initn: 6211 init1: 6211 opt: 6211 Z-score: 2732.0 bits: 516.9 E(32554): 7.5e-146 Smith-Waterman score: 6211; 100.0% identity (100.0% similar) in 947 aa overlap (1-947:1-947) 10 20 30 40 50 60 pF1KA0 MSQPPIGGAAPATAAASPAAAATEARLHPEGSSRKQQRAQSPARPRDSSLRQTIAATRSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MSQPPIGGAAPATAAASPAAAATEARLHPEGSSRKQQRAQSPARPRDSSLRQTIAATRSP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 VGAGTKLNSVRQQQLQQQQQQGNKTGSRTGPPASIRGGGGGAEKATPLAPKGAAPGAVQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VGAGTKLNSVRQQQLQQQQQQGNKTGSRTGPPASIRGGGGGAEKATPLAPKGAAPGAVQP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 VAGAEAAPAATLAALGGRRPGPPEEPPRELESVPSKLGEPPPLGEGGGGGGEGGGAGGGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VAGAEAAPAATLAALGGRRPGPPEEPPRELESVPSKLGEPPPLGEGGGGGGEGGGAGGGS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 GEREGGAPQPPPPRGWRGKGVRAQQRGGSGGEGASPSPSSSSAGKTPGTGSRNSGSGVAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GEREGGAPQPPPPRGWRGKGVRAQQRGGSGGEGASPSPSSSSAGKTPGTGSRNSGSGVAG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 GGSGGGGSYWKEGCLQSELIQFHLKKERAAAAAAAAQMHAKNGGGSSSRSSPVSGPPAVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GGSGGGGSYWKEGCLQSELIQFHLKKERAAAAAAAAQMHAKNGGGSSSRSSPVSGPPAVC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 ETLAVASASPMAAAAEGPQQSAEGSASGGGMQAAAPPSSQPHPQQLQEQEEMQEEMEKLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ETLAVASASPMAAAAEGPQQSAEGSASGGGMQAAAPPSSQPHPQQLQEQEEMQEEMEKLR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 EENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNCRILQYRLRKAERKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNCRILQYRLRKAERKR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA0 LRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTEDENEKLRQQLIEVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTEDENEKLRQQLIEVE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA0 IAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLKCQLQFVKEEAALMR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLKCQLQFVKEEAALMR 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA0 KKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAELKLRLRLVEEEANI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAELKLRLRLVEEEANI 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA0 LGRKIVELEVENRGLKAELDDLRGDDFNGSANPLMREQSESLSELRQHLQLVEDETELLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LGRKIVELEVENRGLKAELDDLRGDDFNGSANPLMREQSESLSELRQHLQLVEDETELLR 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA0 RNVADLEEQNKRITAELNKYKYKSGGHDSARHHDNAKTEALQEELKAARLQINELSGKVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RNVADLEEQNKRITAELNKYKYKSGGHDSARHHDNAKTEALQEELKAARLQINELSGKVM 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA0 QLQYENRVLMSNMQRYDLASHLGIRGSPRDSDAESDAGKKESDDDSRPPHRKREGPIGGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QLQYENRVLMSNMQRYDLASHLGIRGSPRDSDAESDAGKKESDDDSRPPHRKREGPIGGE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA0 SDSEEVRNIRCLTPTRSFYPAPGPWPKSFSDRQQMKDIRSEAERLGKTIDRLIADTSTII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SDSEEVRNIRCLTPTRSFYPAPGPWPKSFSDRQQMKDIRSEAERLGKTIDRLIADTSTII 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA0 TEARIYVANGDLFGLMDEEDDGSRIREHELLYRINAQMKAFRKELQTFIDRLEVPKSADD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TEARIYVANGDLFGLMDEEDDGSRIREHELLYRINAQMKAFRKELQTFIDRLEVPKSADD 850 860 870 880 890 900 910 920 930 940 pF1KA0 RGAEEPISVSQMFQPIILLILILVLFSSLSYTTIFKLVFLFTLFFVL ::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RGAEEPISVSQMFQPIILLILILVLFSSLSYTTIFKLVFLFTLFFVL 910 920 930 940 >>CCDS54459.1 SOGA1 gene_id:140710|Hs108|chr20 (1661 aa) initn: 1104 init1: 677 opt: 1456 Z-score: 653.0 bits: 133.0 E(32554): 4.7e-30 Smith-Waterman score: 1553; 42.1% identity (67.6% similar) in 760 aa overlap (161-888:8-727) 140 150 160 170 180 pF1KA0 TLAALGGRRPGPPEEPPRELESVPSKLGEPPPLGEGGGGGGEGGGAGGGSGEREGG--AP ::. : : . . : . . ::. . :: CCDS54 MEAPAAEPPVR---GCGPQPAPAPAPAPERKKSHRAP 10 20 30 190 200 210 220 230 240 pF1KA0 QPPPPR---GWR-GKGVRAQQRGGSGGEGASPSPSSSSAGKTPGTGSRNSGSGVAGGGSG .: :. :: .:: :. :.. . .:. : .. :.. . :.:..: ::: .: CCDS54 SPARPKDVAGWSLAKGRRGPGPGSAVACSAAFSSRPDKKGRAVAPGARGAGVRVAGVRTG 40 50 60 70 80 90 250 260 270 280 290 300 pF1KA0 -GGGSYWKEGCLQSELIQFHLKKERAAAAAAAAQMHAKNGG---GSSSRSSPVSGPPAVC . . . : . .. .. :. .:. : . :: . ..: :: CCDS54 VRAKGRPRSGAGPRPPPPPPSLTDSSSEVSDCASEEARLLGLELALSSDAESAAGGPAGV 100 110 120 130 140 150 310 320 330 340 350 pF1KA0 ETLAVASASPMAAAAEGPQQSA-EGSASGGGMQAAAPP--SSQPHPQQLQEQEE-----M .: :. .: : : : : :...... .. : .: . .:. . . CCDS54 RTGQPAQPAPSAQQPPRPPASPDEPSVAASSVGSSRLPLSASLAFSDLTEEMLDCGPSGL 160 170 180 190 200 210 360 370 380 390 400 410 pF1KA0 QEEMEKLREENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNCRILQYR .:.:.:: ::. ::.::.:::.:: ::::...:::. ::::.:..:..:.:.::::::: CCDS54 VRELEELRSENDYLKDEIEELRAEMLEMRDVYMEEDVYQLQELRQQLDQASKTCRILQYR 220 230 240 250 260 270 420 430 440 450 460 470 pF1KA0 LRKAERKRLRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTEDENEKL ::::::. :: ::::..::::.:.::::.::.::.:.:::.::: ::.::. :.:::.: CCDS54 LRKAERRSLRAAQTGQVDGELIRGLEQDVKVSKDISMRLHKELEVVEKKRARLEEENEEL 280 290 300 310 320 330 480 490 500 510 520 530 pF1KA0 RQQLIEVEIAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLKCQLQFV ::.:::.:.:::.::.:::. .: :::.::...: :..:: : ..::. ::::::.:. CCDS54 RQRLIETELAKQVLQTELERPREHSLKKRGTRSLGKADKK---TLVQEDSADLKCQLHFA 340 350 360 370 380 390 540 550 560 570 580 590 pF1KA0 KEEAALMRKKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAELKLRLR :::.::: ::..:. ::.: ...:: ::::.:::::: : : . : .::.:::..:. CCDS54 KEESALMCKKLTKLAKENDSMKEELLKYRSLYGDLDSALSAEELADAPHSRETELKVHLK 400 410 420 430 440 450 600 610 620 630 640 pF1KA0 LVEEEANILGRKIVELEVENRGLKAELDDLRGDDFNGSANPLMR---------EQSESLS :::::::.:.:.:::::::::::.::.::.. : .: ..: : : .:::. CCDS54 LVEEEANLLSRRIVELEVENRGLRAEMDDMK-DHGGGCGGPEARLAFSALGGGECGESLA 460 470 480 490 500 510 650 660 670 680 690 700 pF1KA0 ELRQHLQLVEDETELLRRNVADLEEQNKRITAELNKYKYKSGGHDSARHHDNAK--TEAL :::.:::.::.:.:::::. :.::.::: . :: :.. . : : .:. . .: CCDS54 ELRRHLQFVEEEAELLRRSSAELEDQNKLLLNELAKFRSEHE-LDVALSEDSCSVLSEPS 520 530 540 550 560 710 720 730 740 750 760 pF1KA0 QEELKAARLQINELSGKVMQLQYENRVLMSNMQRYDLASHLGIRGSPR-DSDAESDAGKK :::: ::.:::.:::::: .::::::::.::.:: :::: . : : ..::: :: CCDS54 QEELAAAKLQIGELSGKVKKLQYENRVLLSNLQRCDLASCQSTR--PMLETDAE--AG-- 570 580 590 600 610 620 770 780 790 800 810 820 pF1KA0 ESDDDSRPPHRKREGPIGGESDSEEVRNIRCLTPTRSFYPAPGPWPKSFSDRQQMKDIRS :. . : .:.: .:. :: : .: :: .: CCDS54 --DSAQCVP-----APLGETHESHAVR----LCRAREAEVLPG--------------LRE 630 640 650 830 840 850 860 870 pF1KA0 EAERLGKTIDRLIADTSTIITEARIYVAN--GDLFGLMDEEDDGSRIREHELLYRINAQM .: ..:.:: :.::.. . . :. . : .: : : . :.. :. .:.. : ... CCDS54 QAALVSKAIDVLVADANGFTAGLRLCLDNECAD-FRLHEAPDNSEGPRDTKLIHAILVRL 660 670 680 690 700 710 880 890 900 910 920 930 pF1KA0 KAFRKELQTFIDRLEVPKSADDRGAEEPISVSQMFQPIILLILILVLFSSLSYTTIFKLV .....::..: CCDS54 SVLQQELNAFTRKADAVLGCSVKEQQESFSSLPPLGSQGLSKEILLAKDLGSDFQPPDFR 720 730 740 750 760 770 >>CCDS11841.1 MTCL1 gene_id:23255|Hs108|chr18 (1586 aa) initn: 1391 init1: 662 opt: 1353 Z-score: 608.3 bits: 124.6 E(32554): 1.5e-27 Smith-Waterman score: 1906; 58.8% identity (82.2% similar) in 539 aa overlap (377-892:1-533) 350 360 370 380 390 400 pF1KA0 QEQEEMQEEMEKLREENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNC :.::::...:::. ::::.:.::.:::::: CCDS11 MEEMRDSYLEEDVYQLQELRRELDRANKNC 10 20 30 410 420 430 440 450 460 pF1KA0 RILQYRLRKAERKRLRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTE :::::::::::.: :. :.::..::::.:::::::::::::::::::::..:::::. .: CCDS11 RILQYRLRKAEQKSLKVAETGQVDGELIRSLEQDLKVAKDVSVRLHHELKTVEEKRAKAE 40 50 60 70 80 90 470 480 490 500 510 520 pF1KA0 DENEKLRQQLIEVEIAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLK :::: ::::.:::::.:::::::::..:: :::::..... : ::: : ...:. ::. CCDS11 DENETLRQQMIEVEISKQALQNELERLKESSLKRRSTREMYK-EKK---TFNQDDSADLR 100 110 120 130 140 530 540 550 560 570 580 pF1KA0 CQLQFVKEEAALMRKKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAE :::::.:::: ::::::::. .:::..:.:::::.:.:::.::::: ::::::::::::: CCDS11 CQLQFAKEEAFLMRKKMAKLGREKDELEQELQKYKSLYGDVDSPLPTGEAGGPPSTREAE 150 160 170 180 190 200 590 600 610 620 630 pF1KA0 LKLRLRLVEEEANILGRKIVELEVENRGLKAELDDLRGD--------DFNGS--ANPLMR :::::.::::::::::::::::::::::::::..:.::. : : ..:. CCDS11 LKLRLKLVEEEANILGRKIVELEVENRGLKAEMEDMRGQQEREGPGRDHAPSIPTSPFG- 210 220 230 240 250 260 640 650 660 670 680 690 pF1KA0 EQSESLSELRQHLQLVEDETELLRRNVADLEEQNKRITAELNKYKYKS----GGHDSARH .. :: .:::.:::.::.:.:::::.....:..:...: ::.:.:.. : . CCDS11 DSLESSTELRRHLQFVEEEAELLRRSISEIEDHNRQLTHELSKFKFEPPREPGWLGEGAS 270 280 290 300 310 320 700 710 720 730 740 750 pF1KA0 HDNAKTEALQEELKAARLQINELSGKVMQLQYENRVLMSNMQRYDLASHLGIRG-SPRDS . ::::::.:::::.::::::..::.::..:.::.:: :::.:::.:. ::::: CCDS11 PGAGGGAPLQEELKSARLQISELSGKVLKLQHENHALLSNIQRCDLAAHLGLRAPSPRDS 330 340 350 360 370 380 760 770 780 790 800 pF1KA0 DAESDAGKKESD-DDSRPPHRKREGPIGGESDSEEV----RNIRCLTPTRSFYPAPGPWP :::::::::::: ..:: :. :::::.::::::::. .. :... : : CCDS11 DAESDAGKKESDGEESRLPQPKREGPVGGESDSEEMFEKTSGFGSGKPSEASEPCPTELL 390 400 410 420 430 440 810 820 830 840 850 860 pF1KA0 KSFSDRQQMKDIRSEAERLGKTIDRLIADTSTIITEARIYVANGDLFG--LMDEEDDG-S :. : . . .. ::.:: .:..:::.::.... .: . ... : : :. ::..: . CCDS11 KAREDSEYLVTLKHEAQRLERTVERLITDTDSFLHDAGLR-GGAPLPGPGLQGEEEQGEG 450 460 470 480 490 500 870 880 890 900 910 920 pF1KA0 RIREHELLYRINAQMKAFRKELQTFIDRLEVPKSADDRGAEEPISVSQMFQPIILLILIL .: .:: :::.::::.::::.:.... CCDS11 DQQEPQLLGTINAKMKAFKKELQAFLEQVNRIGDGLSPLPHLTESSSFLSTVTSVSRDSP 510 520 530 540 550 560 >>CCDS46598.1 SOGA1 gene_id:140710|Hs108|chr20 (1016 aa) initn: 923 init1: 587 opt: 1342 Z-score: 606.0 bits: 123.6 E(32554): 2e-27 Smith-Waterman score: 1392; 49.2% identity (74.0% similar) in 526 aa overlap (377-888:1-489) 350 360 370 380 390 400 pF1KA0 QEQEEMQEEMEKLREENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNC : ::::...:::. ::::.:..:..:.:.: CCDS46 MLEMRDVYMEEDVYQLQELRQQLDQASKTC 10 20 30 410 420 430 440 450 460 pF1KA0 RILQYRLRKAERKRLRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTE ::::::::::::. :: ::::..::::.:.::::.::.::.:.:::.::: ::.::. : CCDS46 RILQYRLRKAERRSLRAAQTGQVDGELIRGLEQDVKVSKDISMRLHKELEVVEKKRARLE 40 50 60 70 80 90 470 480 490 500 510 520 pF1KA0 DENEKLRQQLIEVEIAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLK .:::.:::.:::.:.:::.::.:::. .: :::.::...: :..:: : ..::. ::: CCDS46 EENEELRQRLIETELAKQVLQTELERPREHSLKKRGTRSLGKADKK---TLVQEDSADLK 100 110 120 130 140 530 540 550 560 570 580 pF1KA0 CQLQFVKEEAALMRKKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAE :::.:.:::.::: ::..:. ::.: ...:: ::::.:::::: : : . : .::.: CCDS46 CQLHFAKEESALMCKKLTKLAKENDSMKEELLKYRSLYGDLDSALSAEELADAPHSRETE 150 160 170 180 190 200 590 600 610 620 630 pF1KA0 LKLRLRLVEEEANILGRKIVELEVENRGLKAELDDLRGDDFNGSANPLMR---------E ::..:.:::::::.:.:.:::::::::::.::.::.. : .: ..: : : CCDS46 LKVHLKLVEEEANLLSRRIVELEVENRGLRAEMDDMK-DHGGGCGGPEARLAFSALGGGE 210 220 230 240 250 260 640 650 660 670 680 690 pF1KA0 QSESLSELRQHLQLVEDETELLRRNVADLEEQNKRITAELNKYKYKSGGHDSARHHDNAK .:::.:::.:::.::.:.:::::. :.::.::: . :: :.. . : : .:. . CCDS46 CGESLAELRRHLQFVEEEAELLRRSSAELEDQNKLLLNELAKFRSEHE-LDVALSEDSCS 270 280 290 300 310 320 700 710 720 730 740 750 pF1KA0 --TEALQEELKAARLQINELSGKVMQLQYENRVLMSNMQRYDLASHLGIRGSPR-DSDAE .: :::: ::.:::.:::::: .::::::::.::.:: :::: . : : ..::: CCDS46 VLSEPSQEELAAAKLQIGELSGKVKKLQYENRVLLSNLQRCDLASCQSTR--PMLETDAE 330 340 350 360 370 380 760 770 780 790 800 810 pF1KA0 SDAGKKESDDDSRPPHRKREGPIGGESDSEEVRNIRCLTPTRSFYPAPGPWPKSFSDRQQ :: :. . : .:.: .:. :: : .: :: CCDS46 --AG----DSAQCVP-----APLGETHESHAVR----LCRAREAEVLPG----------- 390 400 410 820 830 840 850 860 870 pF1KA0 MKDIRSEAERLGKTIDRLIADTSTIITEARIYVAN--GDLFGLMDEEDDGSRIREHELLY .: .: ..:.:: :.::.. . . :. . : .: : : . :.. :. .:.. CCDS46 ---LREQAALVSKAIDVLVADANGFTAGLRLCLDNECAD-FRLHEAPDNSEGPRDTKLIH 420 430 440 450 460 470 880 890 900 910 920 930 pF1KA0 RINAQMKAFRKELQTFIDRLEVPKSADDRGAEEPISVSQMFQPIILLILILVLFSSLSYT : ........::..: CCDS46 AILVRLSVLQQELNAFTRKADAVLGCSVKEQQESFSSLPPLGSQGLSKEILLAKDLGSDF 480 490 500 510 520 530 947 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 23:23:39 2016 done: Sat Nov 5 23:23:40 2016 Total Scan time: 6.080 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]