FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0802, 1545 aa 1>>>pF1KA0802 1545 - 1545 aa - 1545 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.2976+/-0.000965; mu= 11.3837+/- 0.058 mean_var=219.6042+/-44.229, 0's: 0 Z-trim(112.0): 49 B-trim: 86 in 2/50 Lambda= 0.086547 statistics sampled from 12829 (12863) to 12829 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.716), E-opt: 0.2 (0.395), width: 16 Scan time: 3.790 The best scores are: opt bits E(32554) CCDS11841.1 MTCL1 gene_id:23255|Hs108|chr18 (1586) 6287 799.3 0 CCDS54459.1 SOGA1 gene_id:140710|Hs108|chr20 (1661) 1628 217.6 2.6e-55 CCDS46598.1 SOGA1 gene_id:140710|Hs108|chr20 (1016) 1622 216.7 3e-55 CCDS43505.1 SOGA3 gene_id:387104|Hs108|chr6 ( 947) 1353 183.1 3.7e-45 >>CCDS11841.1 MTCL1 gene_id:23255|Hs108|chr18 (1586 aa) initn: 6287 init1: 6287 opt: 6287 Z-score: 4250.8 bits: 799.3 E(32554): 0 Smith-Waterman score: 10228; 97.3% identity (97.4% similar) in 1577 aa overlap (10-1545:10-1586) 10 20 30 40 50 60 pF1KA0 MEEMRDSYLEEDVYQLQELRRELDRANKNCRILQYRLRKAEQKSLKVAETGQVDGELIRS ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MEEMRDSYLEEDVYQLQELRRELDRANKNCRILQYRLRKAEQKSLKVAETGQVDGELIRS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 LEQDLKVAKDVSVRLHHELKTVEEKRAKAEDENETLRQQMIEVEISKQALQNELERLKES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LEQDLKVAKDVSVRLHHELKTVEEKRAKAEDENETLRQQMIEVEISKQALQNELERLKES 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 SLKRRSTREMYKEKKTFNQDDSADLRCQLQFAKEEAFLMRKKMAKLGREKDELEQELQKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SLKRRSTREMYKEKKTFNQDDSADLRCQLQFAKEEAFLMRKKMAKLGREKDELEQELQKY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 KSLYGDVDSPLPTGEAGGPPSTREAELKLRLKLVEEEANILGRKIVELEVENRGLKAEME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KSLYGDVDSPLPTGEAGGPPSTREAELKLRLKLVEEEANILGRKIVELEVENRGLKAEME 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 DMRGQQEREGPGRDHAPSIPTSPFGDSLESSTELRRHLQFVEEEAELLRRSISEIEDHNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DMRGQQEREGPGRDHAPSIPTSPFGDSLESSTELRRHLQFVEEEAELLRRSISEIEDHNR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 QLTHELSKFKFEPPREPGWLGEGASPGAGGGAPLQEELKSARLQISELSGKVLKLQHENH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QLTHELSKFKFEPPREPGWLGEGASPGAGGGAPLQEELKSARLQISELSGKVLKLQHENH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 ALLSNIQRCDLAAHLGLRAPSPRDSDAESDAGKKESDGEESRLPQPKREGPVGGESDSEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ALLSNIQRCDLAAHLGLRAPSPRDSDAESDAGKKESDGEESRLPQPKREGPVGGESDSEE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA0 MFEKTSGFGSGKPSEASEPCPTELLKAREDSEYLVTLKHEAQRLERTVERLITDTDSFLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MFEKTSGFGSGKPSEASEPCPTELLKAREDSEYLVTLKHEAQRLERTVERLITDTDSFLH 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA0 DAGLRGGAPLPGPGLQGEEERGEGDQQEPQLLGTINAKMKAFKKELQAFLEQVNRIGDGL ::::::::::::::::::::.::::::::::::::::::::::::::::::::::::::: CCDS11 DAGLRGGAPLPGPGLQGEEEQGEGDQQEPQLLGTINAKMKAFKKELQAFLEQVNRIGDGL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA0 SPLPHLTESSSFLSTVTSVSRDSPIGNLGKELGPDLQSRLKEQLEWQLGPARGDERESLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SPLPHLTESSSFLSTVTSVSRDSPIGNLGKELGPDLQSRLKEQLEWQLGPARGDERESLR 550 560 570 580 590 600 610 620 pF1KA0 LRAARELHRRADGDTGSHGLGGQTCFSLE------------------------------- ::::::::::::::::::::::::::::: CCDS11 LRAARELHRRADGDTGSHGLGGQTCFSLELRGPPVLPEQSVSIEELQGQLVQAARLHQEE 610 620 630 640 650 660 630 640 650 660 670 pF1KA0 ----------MEEEHLYALRWKELEMHSLALQNTLHERTWSDEKNLMQQELRSLKQNIFL :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TETFTNKIHKMEEEHLYALRWKELEMHSLALQNTLHERTWSDEKNLMQQELRSLKQNIFL 670 680 690 700 710 720 680 690 700 710 720 730 pF1KA0 FYVKLRWLLKHWRQGKQMEEEGEEFTEGEHPETLSRLGELGVQGGHQADGPDHDSDRSCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::.:: CCDS11 FYVKLRWLLKHWRQGKQMEEEGEEFTEGEHPETLSRLGELGVQGGHQADGPDHDSDRGCG 730 740 750 760 770 780 740 750 760 770 780 790 pF1KA0 FPVGEHSPHSRVQIGDHSLRLQTADRGQPHKQVVENQQLFSAFKALLEDFRAELREDERA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 FPVGEHSPHSRVQIGDHSLRLQTADRGQPHKQVVENQQLFSAFKALLEDFRAELREDERA 790 800 810 820 830 840 800 810 820 830 840 850 pF1KA0 RLRLQQQYASDKAAWDVEWAVLKCRLEQLEEKTENKLGELGSSAESKGALKKEREVHQKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RLRLQQQYASDKAAWDVEWAVLKCRLEQLEEKTENKLGELGSSAESKGALKKEREVHQKL 850 860 870 880 890 900 860 870 880 890 900 910 pF1KA0 LADSHSLVMDLRWQIHHSEKNWNREKVELLDRLDRDRQEWERQKKEFLWRIEQLQKENSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LADSHSLVMDLRWQIHHSEKNWNREKVELLDRLDRDRQEWERQKKEFLWRIEQLQKENSP 910 920 930 940 950 960 920 930 940 950 960 970 pF1KA0 RRGGSFLCDQKDGNVRPFPHQGSLRMPRPVAMWPCADADSIPFEDRPLSKLKESDRCSAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RRGGSFLCDQKDGNVRPFPHQGSLRMPRPVAMWPCADADSIPFEDRPLSKLKESDRCSAS 970 980 990 1000 1010 1020 980 990 1000 1010 1020 1030 pF1KA0 ENLYLDALSLDDEPEEPPAHRPEREFRNRLPEEEENHKGNLQRAVSVSSMSEFQRLMDIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ENLYLDALSLDDEPEEPPAHRPEREFRNRLPEEEENHKGNLQRAVSVSSMSEFQRLMDIS 1030 1040 1050 1060 1070 1080 1040 1050 1060 1070 1080 1090 pF1KA0 PFLPEKGLPSTSSKEDVTPPLSPDDLKYIEEFNKSWDYTPNRGHNGGGPDLWADRTEVGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PFLPEKGLPSTSSKEDVTPPLSPDDLKYIEEFNKSWDYTPNRGHNGGGPDLWADRTEVGR 1090 1100 1110 1120 1130 1140 1100 1110 1120 1130 1140 1150 pF1KA0 AGHEDSTEPFPDSSWYLTTSVTMTTDTMTSPEHCQKQPLRSHVLTEQSGLRVLHSPPAVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AGHEDSTEPFPDSSWYLTTSVTMTTDTMTSPEHCQKQPLRSHVLTEQSGLRVLHSPPAVR 1150 1160 1170 1180 1190 1200 1160 1170 1180 1190 1200 1210 pF1KA0 RVDSITAAGGEGPFPTSRARGSPGDTKGGPPEPMLSRWPCTSPRHSRDYVEGARRPLDSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RVDSITAAGGEGPFPTSRARGSPGDTKGGPPEPMLSRWPCTSPRHSRDYVEGARRPLDSP 1210 1220 1230 1240 1250 1260 1220 1230 1240 1250 1260 1270 pF1KA0 LCTSLGFASPLHSLEMSKNLSDDMKEVAFSVRNAICSGPGELQVKDMACQTNGSRTMGTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LCTSLGFASPLHSLEMSKNLSDDMKEVAFSVRNAICSGPGELQVKDMACQTNGSRTMGTQ 1270 1280 1290 1300 1310 1320 1280 1290 1300 1310 1320 1330 pF1KA0 TVQTISVGLQTEALRGSGVTSSPHKCLTPKAGGGATPVSSPSRSLRSRQVAPAIEKVQAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TVQTISVGLQTEALRGSGVTSSPHKCLTPKAGGGATPVSSPSRSLRSRQVAPAIEKVQAK 1330 1340 1350 1360 1370 1380 1340 1350 1360 1370 1380 1390 pF1KA0 FERTCCSPKYGSPKLQRKPLPKADQPNNRTSPGMAQKGYSESAWARSTTTRESPVHTTIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 FERTCCSPKYGSPKLQRKPLPKADQPNNRTSPGMAQKGYSESAWARSTTTRESPVHTTIN 1390 1400 1410 1420 1430 1440 1400 1410 1420 1430 1440 1450 pF1KA0 DGLSSLFNIIDHSPVVQDPFQKGLRAGSRSRSAEPRPELGPGQETGTNSRGRSPSPIGVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DGLSSLFNIIDHSPVVQDPFQKGLRAGSRSRSAEPRPELGPGQETGTNSRGRSPSPIGVG 1450 1460 1470 1480 1490 1500 1460 1470 1480 1490 1500 1510 pF1KA0 SEMCREEGGEGTPVKQDLSAPPGYTLTENVARILNKKLLEHALKEERRQAAHGPPGLHSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SEMCREEGGEGTPVKQDLSAPPGYTLTENVARILNKKLLEHALKEERRQAAHGPPGLHSD 1510 1520 1530 1540 1550 1560 1520 1530 1540 pF1KA0 SHSLGDTAEPGPMENQTVLLTAPWGL :::::::::::::::::::::::::: CCDS11 SHSLGDTAEPGPMENQTVLLTAPWGL 1570 1580 >>CCDS54459.1 SOGA1 gene_id:140710|Hs108|chr20 (1661 aa) initn: 1998 init1: 662 opt: 1628 Z-score: 1106.6 bits: 217.6 E(32554): 2.6e-55 Smith-Waterman score: 2633; 37.5% identity (61.8% similar) in 1583 aa overlap (1-1534:239-1612) 10 20 30 pF1KA0 MEEMRDSYLEEDVYQLQELRRELDRANKNC : :::: :.:::::::::::..::.:.:.: CCDS54 CGPSGLVRELEELRSENDYLKDEIEELRAEMLEMRDVYMEEDVYQLQELRQQLDQASKTC 210 220 230 240 250 260 40 50 60 70 80 90 pF1KA0 RILQYRLRKAEQKSLKVAETGQVDGELIRSLEQDLKVAKDVSVRLHHELKTVEEKRAKAE :::::::::::..::..:.::::::::::.::::.::.::.:.:::.::..::.:::. : CCDS54 RILQYRLRKAERRSLRAAQTGQVDGELIRGLEQDVKVSKDISMRLHKELEVVEKKRARLE 270 280 290 300 310 320 100 110 120 130 140 pF1KA0 DENETLRQQMIEVEISKQALQNELERLKESSLKRRSTREMYK-EKKTFNQDDSADLRCQL .::: :::..::.:..::.::.:::: .: :::.:.:: . : .:::. :.:::::.::: CCDS54 EENEELRQRLIETELAKQVLQTELERPREHSLKKRGTRSLGKADKKTLVQEDSADLKCQL 330 340 350 360 370 380 150 160 170 180 190 200 pF1KA0 QFAKEEAFLMRKKMAKLGREKDELEQELQKYKSLYGDVDSPLPTGEAGGPPSTREAELKL .:::::. :: ::..::..:.: ...:: ::.:::::.:: : . : . : .::.:::. CCDS54 HFAKEESALMCKKLTKLAKENDSMKEELLKYRSLYGDLDSALSAEELADAPHSRETELKV 390 400 410 420 430 440 210 220 230 240 250 260 pF1KA0 RLKLVEEEANILGRKIVELEVENRGLKAEMEDMRGQQEREGPGRDHAPSIPTSPFGDSLE .:::::::::.:.:.:::::::::::.:::.::. . : : . .. . :. : CCDS54 HLKLVEEEANLLSRRIVELEVENRGLRAEMDDMKDHGGGCG-GPEARLAFSALGGGECGE 450 460 470 480 490 500 270 280 290 300 310 320 pF1KA0 SSTELRRHLQFVEEEAELLRRSISEIEDHNRQLTHELSKFKFEPPREPGWLGEGASPGAG : .::::::::::::::::::: .:.::.:. : .::.::. : . . :.: . . CCDS54 SLAELRRHLQFVEEEAELLRRSSAELEDQNKLLLNELAKFRSEHELDVA-LSEDSCSVLS 510 520 530 540 550 560 330 340 350 360 370 380 pF1KA0 GGAPLQEELKSARLQISELSGKVLKLQHENHALLSNIQRCDLAAHLGLRAPSPRDSDAES : :::: .:.:::.:::::: :::.::..::::.::::::. . : : ..::: CCDS54 --EPSQEELAAAKLQIGELSGKVKKLQYENRVLLSNLQRCDLASCQSTR-PM-LETDAE- 570 580 590 600 610 620 390 400 410 420 430 440 pF1KA0 DAGKKESDGEESRLPQPKREGPVGGESDSEEMFEKTSGFGSGKPSEASEPCPTELLKARE :: :. . .: : .: . :.: . : .::: CCDS54 -AG----DSAQC-VPAP---------------------LGETHESHAVRLC-----RARE 630 640 450 460 470 480 490 500 pF1KA0 DSEYLVTLKHEAQRLERTVERLITDTDSFLHDAGLRGGAPLPGPGLQGEE--ERGEGDQQ .: : :...: . .... :..:...: :::: .. .: . .:: . CCDS54 -AEVLPGLREQAALVSKAIDVLVADANGFT--AGLRLCLDNECADFRLHEAPDNSEGPR- 650 660 670 680 690 700 510 520 530 540 550 560 pF1KA0 EPQLLGTINAKMKAFKKELQAFLEQVNRIGDGLSPLPHLTESSSFLSTVTSVSRDSPIGN . .:. .: ........::.:: .... . : : . . :: : : . : . .. : CCDS54 DTKLIHAILVRLSVLQQELNAFTRKADAVL-GCS-VKEQQESFSSLPPLGSQGLSKEIL- 710 720 730 740 750 760 570 580 590 600 pF1KA0 LGKELGPDLQS-RLKEQLEWQ--------LGP--ARGDERESLR-LRA------ARELHR :.:.:: :.: ... ::. : .. : .:.: :: : :... CCDS54 LAKDLGSDFQPPDFRDLPEWEPRIREAFRTGDLDSKPDPSRSFRPYRAEDNDSYASEIKE 770 780 790 800 810 820 610 620 630 640 650 pF1KA0 R----ADGDTGSHGLGGQTC------------FSLEM---EEEHLYALRWKELEMHSLAL :.. . .:: : :. .: .:.. :: .:.:..::.: CCDS54 LQLVLAEAHDSLRGLQEQLSQERQLRKEEADNFNQKMVQLKEDQQRALLRREFELQSLSL 830 840 850 860 870 880 660 670 680 690 700 710 pF1KA0 QNTLHERTWSDEKNLMQQELRSLKQNIFLFYVKLRWLLKHWRQGKQMEEEGEEFTEGEHP : :... ::.:::.. :: ...:.:..:...::::.::.::::: . ::..: : CCDS54 QRRLEQKFWSQEKNMLVQESQQFKHNFLLLFMKLRWFLKRWRQGKVLPSEGDDFLE---- 890 900 910 920 930 720 730 740 750 760 770 pF1KA0 ETLSRLGELGVQGGHQADGPDHDSDRSCGFPVGEHSPHSRVQIGDHSLRLQTADRGQPHK .. . :: . .. . .:.....: :: . .. :.. CCDS54 --VNSMKELYLLMEEEEINAQHSDNKAC--------------TGD------SWTQNTPNE 940 950 960 970 780 790 800 810 820 830 pF1KA0 QVVENQQLFSAFKALLEDFRAELREDERARLRLQQQYASDKAAWDVEWAVLKCRLEQLEE . . .. .:. :... ::...:. .::::.:. ::.:..: : :: . :.: CCDS54 YI----KTLADMKVTLKELCWLLRDERRGLTELQQQFAKAKATWETERAELKGHTSQMEL 980 990 1000 1010 1020 1030 840 850 860 870 880 890 pF1KA0 KTENKLGELGSSAESKGALKKEREVHQKLLADSHSLVMDLRWQIHHSEKNWNREKVELLD :: . :: .. . :.::..::: .:.:::.:.: ::.: :.. ::.::..::..:.. CCDS54 KTGKGAGER-AGPDWKAALQREREEQQHLLAESYSAVMELTRQLQISERNWSQEKLQLVE 1040 1050 1060 1070 1080 1090 900 910 920 930 940 950 pF1KA0 RLDRDRQEWERQKKEFLWRIEQLQKENSPRRGGSFLCDQKDGNVRPFPHQGSLRMPRPVA ::. ..:. :.: ::. :. :::: .: CCDS54 RLQGEKQQVEQQVKELQNRLSQLQKAADP------------------------------- 1100 1110 1120 960 970 980 990 1000 1010 pF1KA0 MWPCADADSIPFEDRPLSKLKESDRCSASENLYLDALSLDDEPEEPPAHRPEREFRNRLP : .. : : .: . . ::... : : . CCDS54 -WVLKHSE--------LEKQDNSWKETRSEKIH------DKEA---------------VS 1130 1140 1150 1020 1030 1040 1050 1060 1070 pF1KA0 EEEENHKGNLQRAVSVSSMSEFQRLMDISPFLPEKGLPSTSSKEDVTPPLSPDDLKYIEE : : . .: :.:. ::::::::. :.: ::.: : . ..: .: .. CCDS54 EVELGGNG-LKRTKSVSSMSEFESLLDCSPYLA--GGDARGKKLPNNPAFG--------- 1160 1170 1180 1190 1080 1090 1100 1110 1120 1130 pF1KA0 FNKSWDYTPNRGHNGGGPDLWADRTEVGRAGHEDSTEPFPDSSWYLTTSVTMTTDTMTSP : .: : : :. .:. : : :.. ... CCDS54 FVSS---EP------GDPE-------------KDTKEK-PG----LSSRDCNHLGALACQ 1200 1210 1220 1230 1140 1150 1160 1170 1180 pF1KA0 EHCQKQPLRSHVLTEQSGLRVLHSPPAVRRVDSITAAGGEG-----P-FPTSRARGSPGD . .: ::.. ...:.:: .:::..::. .. :: : : . :. . . CCDS54 DPPGRQMQRSYTAPDKTGIRVYYSPPVARRLGVPVVHDKEGKIIIEPGFLFTTAKPKESA 1240 1250 1260 1270 1280 1290 1190 1200 1210 1220 1230 1240 pF1KA0 TKGGPPEPMLSRWPCTSPRHSRDYVEGARRPLDSPLCTSLGFASPLHSLEMSKNLSDDMK : : .:: :. ::. ..:. :: .. :: . ::..::: :.::::: CCDS54 EADGLAESSYGRWLCN---FSRQRLDGGSA--GSPSAAGPGFPAALHDFEMSGNMSDDMK 1300 1310 1320 1330 1340 1250 1260 1270 1280 1290 1300 pF1KA0 EVAFSVRNAICSGPGELQVKDMACQTNGSRTMGTQTVQTISVGLQTEALRGSGVTSSPHK :.. ::.:. :: : .::. . :: : ..::::..:.::::::. : :: : CCDS54 EITNCVRQAMRSGSLERKVKSTSSQTVGLASVGTQTIRTVSVGLQTDPPR-----SSLH- 1350 1360 1370 1380 1390 1400 1310 1320 1330 1340 1350 1360 pF1KA0 CLTPKAGGGATPVSSPSRSLRSRQVAPAIEKVQAKFERTCCSPKYGSPKLQRKPLPKADQ : . .: :: :.::.:.. ...::....:: :::::::::::::. . : :. CCDS54 ------GKAWSPRSSSLVSVRSKQISSSLDKVHSRIERPCCSPKYGSPKLQRRSVSKLDS 1410 1420 1430 1440 1450 1370 1380 1390 1400 1410 1420 pF1KA0 PNNRTSPGMAQKGYSESAWARSTTTRESPVHTTINDGLSSLFNIIDHSPVVQDPFQKGLR ..:. .. : . ::::::::::.::: .:::::::::....:: ... .. :. CCDS54 SKDRSLWNLHQGKQNGSAWARSTTTRDSPVLRNINDGLSSLFSVVEHSGSTESVWKLGM- 1460 1470 1480 1490 1500 1510 1430 1440 1450 1460 1470 1480 pF1KA0 AGSRSRSAEPRPELGPGQETGTNSRGRSPSPIGVGSEMCREEGGEGTPVKQDLSAPPGYT :..:. :. : :: : ::.::: . ..: ::: . :: : .: CCDS54 --SETRAKPEPPKYGIVQEFFRNVCGRAPSPTSSAGE-------EGTKKPEPLS-PASYH 1520 1530 1540 1550 1560 1490 1500 1510 1520 1530 1540 pF1KA0 LTENVARILNKKLLEHALKEERRQAAH---GPPGLHSDSHSLGDTAEPGPMENQTVLLTA :.:::::::: . . .:: : . : :. : :: : : :. CCDS54 QPEGVARILNKKAAKLGSSEEVRLTMLPQVGKDGVLRD----GDGAVVLPNEDAVCDCST 1570 1580 1590 1600 1610 pF1KA0 PWGL CCDS54 QSLTSCFARSSRSAIRHSPSKCRLHPSESSWGGEERALPPSE 1620 1630 1640 1650 1660 >>CCDS46598.1 SOGA1 gene_id:140710|Hs108|chr20 (1016 aa) initn: 1496 init1: 662 opt: 1622 Z-score: 1105.3 bits: 216.7 E(32554): 3e-55 Smith-Waterman score: 1947; 41.3% identity (68.3% similar) in 959 aa overlap (1-919:1-882) 10 20 30 40 50 60 pF1KA0 MEEMRDSYLEEDVYQLQELRRELDRANKNCRILQYRLRKAEQKSLKVAETGQVDGELIRS : :::: :.:::::::::::..::.:.:.::::::::::::..::..:.::::::::::. CCDS46 MLEMRDVYMEEDVYQLQELRQQLDQASKTCRILQYRLRKAERRSLRAAQTGQVDGELIRG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 LEQDLKVAKDVSVRLHHELKTVEEKRAKAEDENETLRQQMIEVEISKQALQNELERLKES ::::.::.::.:.:::.::..::.:::. :.::: :::..::.:..::.::.:::: .: CCDS46 LEQDVKVSKDISMRLHKELEVVEKKRARLEEENEELRQRLIETELAKQVLQTELERPREH 70 80 90 100 110 120 130 140 150 160 170 pF1KA0 SLKRRSTREMYK-EKKTFNQDDSADLRCQLQFAKEEAFLMRKKMAKLGREKDELEQELQK :::.:.:: . : .:::. :.:::::.:::.:::::. :: ::..::..:.: ...:: : CCDS46 SLKKRGTRSLGKADKKTLVQEDSADLKCQLHFAKEESALMCKKLTKLAKENDSMKEELLK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KA0 YKSLYGDVDSPLPTGEAGGPPSTREAELKLRLKLVEEEANILGRKIVELEVENRGLKAEM :.:::::.:: : . : . : .::.:::..:::::::::.:.:.:::::::::::.::: CCDS46 YRSLYGDLDSALSAEELADAPHSRETELKVHLKLVEEEANLLSRRIVELEVENRGLRAEM 190 200 210 220 230 240 240 250 260 270 280 290 pF1KA0 EDMRGQQEREGPGRDHAPSIPTSPFGDSLESSTELRRHLQFVEEEAELLRRSISEIEDHN .::. . : : . .. . :. :: .::::::::::::::::::: .:.::.: CCDS46 DDMKDHGGGCG-GPEARLAFSALGGGECGESLAELRRHLQFVEEEAELLRRSSAELEDQN 250 260 270 280 290 300 310 320 330 340 350 pF1KA0 RQLTHELSKFKFEPPREPGWLGEGASPGAGGGAPLQEELKSARLQISELSGKVLKLQHEN . : .::.::. : . . :.: . . : :::: .:.:::.:::::: :::.:: CCDS46 KLLLNELAKFRSEHELDVA-LSEDSCSVLS--EPSQEELAAAKLQIGELSGKVKKLQYEN 300 310 320 330 340 350 360 370 380 390 400 410 pF1KA0 HALLSNIQRCDLAAHLGLRAPSPRDSDAESDAGKKESDGEESRLPQPKREGPVGGESDSE ..::::.::::::. . : : ..::: :: :. . .: : CCDS46 RVLLSNLQRCDLASCQSTR-PM-LETDAE--AG----DSAQC-VPAP------------- 360 370 380 390 420 430 440 450 460 470 pF1KA0 EMFEKTSGFGSGKPSEASEPCPTELLKAREDSEYLVTLKHEAQRLERTVERLITDTDSFL .: . :.: . : .::: .: : :...: . .... :..:...: CCDS46 --------LGETHESHAVRLC-----RARE-AEVLPGLREQAALVSKAIDVLVADANGF- 400 410 420 430 480 490 500 510 520 530 pF1KA0 HDAGLRGGAPLPGPGLQGEE--ERGEGDQQEPQLLGTINAKMKAFKKELQAFLEQVNRIG :::: .. .: . .:: . . .:. .: ........::.:: .... . CCDS46 -TAGLRLCLDNECADFRLHEAPDNSEGPR-DTKLIHAILVRLSVLQQELNAFTRKADAVL 440 450 460 470 480 490 540 550 560 570 580 pF1KA0 DGLSPLPHLTESSSFLSTVTSVSRDSPIGNLGKELGPDLQS-RLKEQLEWQ--------L : : . . :: : : . : . .. : :.:.:: :.: ... ::. CCDS46 -GCS-VKEQQESFSSLPPLGSQGLSKEIL-LAKDLGSDFQPPDFRDLPEWEPRIREAFRT 500 510 520 530 540 550 590 600 610 620 pF1KA0 GP--ARGDERESLR-LRA------ARELHRR----ADGDTGSHGLGGQTC---------- : .. : .:.: :: : :... :.. . .:: : CCDS46 GDLDSKPDPSRSFRPYRAEDNDSYASEIKELQLVLAEAHDSLRGLQEQLSQERQLRKEEA 560 570 580 590 600 610 630 640 650 660 670 680 pF1KA0 --FSLEM---EEEHLYALRWKELEMHSLALQNTLHERTWSDEKNLMQQELRSLKQNIFLF :. .: .:.. :: .:.:..::.:: :... ::.:::.. :: ...:.:..:. CCDS46 DNFNQKMVQLKEDQQRALLRREFELQSLSLQRRLEQKFWSQEKNMLVQESQQFKHNFLLL 620 630 640 650 660 670 690 700 710 720 730 740 pF1KA0 YVKLRWLLKHWRQGKQMEEEGEEFTEGEHPETLSRLGELGVQGGHQADGPDHDSDRSCGF ..::::.::.::::: . ::..: : .. . :: . .. . .:.....: CCDS46 FMKLRWFLKRWRQGKVLPSEGDDFLE------VNSMKELYLLMEEEEINAQHSDNKAC-- 680 690 700 710 720 750 760 770 780 790 800 pF1KA0 PVGEHSPHSRVQIGDHSLRLQTADRGQPHKQVVENQQLFSAFKALLEDFRAELREDERAR :: . .. :.. . . .. .:. :... ::...:. CCDS46 ------------TGD------SWTQNTPNEYI----KTLADMKVTLKELCWLLRDERRGL 730 740 750 760 810 820 830 840 850 860 pF1KA0 LRLQQQYASDKAAWDVEWAVLKCRLEQLEEKTENKLGELGSSAESKGALKKEREVHQKLL .::::.:. ::.:..: : :: . :.: :: . :: .. . :.::..::: .:.:: CCDS46 TELQQQFAKAKATWETERAELKGHTSQMELKTGKGAGER-AGPDWKAALQREREEQQHLL 770 780 790 800 810 820 870 880 890 900 910 920 pF1KA0 ADSHSLVMDLRWQIHHSEKNWNREKVELLDRLDRDRQEWERQKKEFLWRIEQLQKENSPR :.:.: ::.: :.. ::.::..::..:..::. ..:. :.: ::. :. :::: .: CCDS46 AESYSAVMELTRQLQISERNWSQEKLQLVERLQGEKQQVEQQVKELQNRLSQLQKAADPW 830 840 850 860 870 880 930 940 950 960 970 980 pF1KA0 RGGSFLCDQKDGNVRPFPHQGSLRMPRPVAMWPCADADSIPFEDRPLSKLKESDRCSASE CCDS46 VLKHSELEKQDNSWKETRSEKIHDKEAVSEVELGGNGLKRTKSVSSMSEFESLLDCSPYL 890 900 910 920 930 940 >>CCDS43505.1 SOGA3 gene_id:387104|Hs108|chr6 (947 aa) initn: 1389 init1: 662 opt: 1353 Z-score: 924.2 bits: 183.1 E(32554): 3.7e-45 Smith-Waterman score: 1904; 58.8% identity (82.0% similar) in 539 aa overlap (1-533:377-892) 10 20 30 pF1KA0 MEEMRDSYLEEDVYQLQELRRELDRANKNC :.::::...:::. ::::.:.::.:::::: CCDS43 QEQEEMQEEMEKLREENETLKNEIDELRTEMDEMRDTFFEEDACQLQEMRHELERANKNC 350 360 370 380 390 400 40 50 60 70 80 90 pF1KA0 RILQYRLRKAEQKSLKVAETGQVDGELIRSLEQDLKVAKDVSVRLHHELKTVEEKRAKAE :::::::::::.: :. :.::..::::.:::::::::::::::::::::..:::::. .: CCDS43 RILQYRLRKAERKRLRYAQTGEIDGELLRSLEQDLKVAKDVSVRLHHELENVEEKRTTTE 410 420 430 440 450 460 100 110 120 130 140 pF1KA0 DENETLRQQMIEVEISKQALQNELERLKESSLKRRSTREMYK-EKK---TFNQDDSADLR :::: ::::.:::::.:::::::::..:: :::::..... : ::: : ...:. ::. CCDS43 DENEKLRQQLIEVEIAKQALQNELEKMKELSLKRRGSKDLPKSEKKAQQTPTEEDNEDLK 470 480 490 500 510 520 150 160 170 180 190 200 pF1KA0 CQLQFAKEEAFLMRKKMAKLGREKDELEQELQKYKSLYGDVDSPLPTGEAGGPPSTREAE :::::.:::: ::::::::. .:::..:.:::::.:.:::.::::: ::::::::::::: CCDS43 CQLQFVKEEAALMRKKMAKIDKEKDRFEHELQKYRSFYGDLDSPLPKGEAGGPPSTREAE 530 540 550 560 570 580 210 220 230 240 250 260 pF1KA0 LKLRLKLVEEEANILGRKIVELEVENRGLKAEMEDMRGQQEREGPGRDHAPSIPTSPFG- :::::.::::::::::::::::::::::::::..:.::. : : ..:. CCDS43 LKLRLRLVEEEANILGRKIVELEVENRGLKAELDDLRGD--------DFNGS--ANPLMR 590 600 610 620 630 270 280 290 300 310 320 pF1KA0 DSLESSTELRRHLQFVEEEAELLRRSISEIEDHNRQLTHELSKFKFEPPREPGWLGEGAS .. :: .:::.:::.::.:.:::::.....:..:...: ::.:.:. . : . CCDS43 EQSESLSELRQHLQLVEDETELLRRNVADLEEQNKRITAELNKYKY----KSGGHDSARH 640 650 660 670 680 690 330 340 350 360 370 380 pF1KA0 PGAGGGAPLQEELKSARLQISELSGKVLKLQHENHALLSNIQRCDLAAHLGLRAPSPRDS . ::::::.:::::.::::::..::.::..:.::.:: :::.:::.:. ::::: CCDS43 HDNAKTEALQEELKAARLQINELSGKVMQLQYENRVLMSNMQRYDLASHLGIRG-SPRDS 700 710 720 730 740 750 390 400 410 420 430 440 pF1KA0 DAESDAGKKESDGEESRLPQPKREGPVGGESDSEEMFEKTSGFGSGKPSEASEPCPTELL :::::::::::: ..:: :. :::::.::::::::. .. :... : : CCDS43 DAESDAGKKESD-DDSRPPHRKREGPIGGESDSEEV----RNIRCLTPTRSFYPAPGPWP 760 770 780 790 800 450 460 470 480 490 500 pF1KA0 KAREDSEYLVTLKHEAQRLERTVERLITDTDSFLHDAGLR-GGAPLPGPGLQGEEERGEG :. : . . .. ::.:: .:..:::.::.... .: . ... : : :. ::. : . CCDS43 KSFSDRQQMKDIRSEAERLGKTIDRLIADTSTIITEARIYVANGDLFG--LMDEEDDG-S 810 820 830 840 850 860 510 520 530 540 550 560 pF1KA0 DQQEPQLLGTINAKMKAFKKELQAFLEQVNRIGDGLSPLPHLTESSSFLSTVTSVSRDSP .: .:: :::.::::.::::.:.... CCDS43 RIREHELLYRINAQMKAFRKELQTFIDRLEVPKSADDRGAEEPISVSQMFQPIILLILIL 870 880 890 900 910 920 1545 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 19:44:09 2016 done: Wed Nov 2 19:44:10 2016 Total Scan time: 3.790 Total Display time: 0.210 Function used was FASTA [36.3.4 Apr, 2011]