FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9557, 2004 aa 1>>>pF1KB9557 2004 - 2004 aa - 2004 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 17.9596+/-0.00144; mu= -31.4114+/- 0.088 mean_var=784.1378+/-159.538, 0's: 0 Z-trim(116.0): 45 B-trim: 64 in 1/53 Lambda= 0.045801 statistics sampled from 16517 (16553) to 16517 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.76), E-opt: 0.2 (0.508), width: 16 Scan time: 7.620 The best scores are: opt bits E(32554) CCDS6124.1 KAT6A gene_id:7994|Hs108|chr8 (2004) 13592 914.9 0 CCDS83290.1 KAT6A gene_id:7994|Hs108|chr8 ( 815) 5590 385.9 3.5e-106 CCDS58085.1 KAT6B gene_id:23522|Hs108|chr10 (1890) 2035 151.3 3.6e-35 CCDS58084.1 KAT6B gene_id:23522|Hs108|chr10 (1781) 1774 134.0 5.4e-30 CCDS7345.1 KAT6B gene_id:23522|Hs108|chr10 (2073) 1776 134.2 5.6e-30 CCDS56036.1 KAT7 gene_id:11143|Hs108|chr17 ( 501) 1222 97.2 1.8e-19 CCDS56038.1 KAT7 gene_id:11143|Hs108|chr17 ( 442) 1215 96.7 2.2e-19 CCDS56037.1 KAT7 gene_id:11143|Hs108|chr17 ( 472) 1209 96.3 3.1e-19 CCDS56035.1 KAT7 gene_id:11143|Hs108|chr17 ( 581) 1210 96.4 3.5e-19 CCDS11554.1 KAT7 gene_id:11143|Hs108|chr17 ( 611) 1209 96.4 3.9e-19 CCDS10706.1 KAT8 gene_id:84148|Hs108|chr16 ( 458) 1049 85.7 4.6e-16 CCDS8109.1 KAT5 gene_id:10524|Hs108|chr11 ( 461) 1005 82.8 3.5e-15 CCDS55771.1 KAT5 gene_id:10524|Hs108|chr11 ( 494) 1005 82.8 3.7e-15 CCDS31610.1 KAT5 gene_id:10524|Hs108|chr11 ( 513) 1005 82.9 3.8e-15 CCDS8110.1 KAT5 gene_id:10524|Hs108|chr11 ( 546) 1005 82.9 4e-15 CCDS45468.1 KAT8 gene_id:84148|Hs108|chr16 ( 467) 995 82.2 5.6e-15 >>CCDS6124.1 KAT6A gene_id:7994|Hs108|chr8 (2004 aa) initn: 13592 init1: 13592 opt: 13592 Z-score: 4871.6 bits: 914.9 E(32554): 0 Smith-Waterman score: 13592; 100.0% identity (100.0% similar) in 2004 aa overlap (1-2004:1-2004) 10 20 30 40 50 60 pF1KB9 MVKLANPLYTEWILEAIKKVKKQKQRPSEERICNAVSSSHGLDRKTVLEQLELSVKDGTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MVKLANPLYTEWILEAIKKVKKQKQRPSEERICNAVSSSHGLDRKTVLEQLELSVKDGTI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 LKVSNKGLNSYKDPDNPGRIALPKPRNHGKLDNKQNVDWNKLIKRAVEGLAESGGSTLKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LKVSNKGLNSYKDPDNPGRIALPKPRNHGKLDNKQNVDWNKLIKRAVEGLAESGGSTLKS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 IERFLKGQKDVSALFGGSAASGFHQQLRLAIKRAIGHGRLLKDGPLYRLNTKATNVDGKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 IERFLKGQKDVSALFGGSAASGFHQQLRLAIKRAIGHGRLLKDGPLYRLNTKATNVDGKE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 SCESLSCLPPVSLLPHEKDKPVAEPIPICSFCLGTKEQNREKKPEELISCADCGNSGHPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 SCESLSCLPPVSLLPHEKDKPVAEPIPICSFCLGTKEQNREKKPEELISCADCGNSGHPS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 CLKFSPELTVRVKALRWQCIECKTCSSCRDQGKNADNMLFCDSCDRGFHMECCDPPLTRM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 CLKFSPELTVRVKALRWQCIECKTCSSCRDQGKNADNMLFCDSCDRGFHMECCDPPLTRM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 PKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPIGRPKNRLKKQNTVSKGPFSKVRTGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPIGRPKNRLKKQNTVSKGPFSKVRTGP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 GRGRKRKITLSSQSASSSSEEGYLERIDGLDFCRDSNVSLKFNKKTKGLIDGLTKFFTPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 GRGRKRKITLSSQSASSSSEEGYLERIDGLDFCRDSNVSLKFNKKTKGLIDGLTKFFTPS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 PDGRKARGEVVDYSEQYRIRKRGNRKSSTSDWPTDNQDGWDGKQENEERLFGSQEIMTEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PDGRKARGEVVDYSEQYRIRKRGNRKSSTSDWPTDNQDGWDGKQENEERLFGSQEIMTEK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 DMELFRDIQEQALQKVGVTGPPDPQVRCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 DMELFRDIQEQALQKVGVTGPPDPQVRCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 EFCLKYMKSRTILQQHMKKCGWFHPPANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 EFCLKYMKSRTILQQHMKKCGWFHPPANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLF 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 LDHKTLYYDVEPFLFYVLTQNDVKGCHLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LDHKTLYYDVEPFLFYVLTQNDVKGCHLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGR 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 FLIDFSYLLSKREGQAGSPEKPLSDLGRLSYMAYWKSVILECLYHQNDKQISIKKLSKLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 FLIDFSYLLSKREGQAGSPEKPLSDLGRLSYMAYWKSVILECLYHQNDKQISIKKLSKLT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 GICPQDITSTLHHLRMLDFRSDQFVIIRREKLIQDHMAKLQLNLRPVDVDPECLRWTPVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 GICPQDITSTLHHLRMLDFRSDQFVIIRREKLIQDHMAKLQLNLRPVDVDPECLRWTPVI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 VSNSVVSEEEEEEAEEGENEEPQCQERELEISVGKSVSHENKEQDSYSVESEKKPEVMAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 VSNSVVSEEEEEEAEEGENEEPQCQERELEISVGKSVSHENKEQDSYSVESEKKPEVMAP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 VSSTRLSKQVLPHDSLPANSQPSRRGRWGRKNRKTQERFGDKDSKLLLEETSSAPQEQYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 VSSTRLSKQVLPHDSLPANSQPSRRGRWGRKNRKTQERFGDKDSKLLLEETSSAPQEQYG 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 ECGEKSEATQEQYTESEEQLVASEEQPSQDGKPDLPKRRLSEGVEPWRGQLKKSPEALKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 ECGEKSEATQEQYTESEEQLVASEEQPSQDGKPDLPKRRLSEGVEPWRGQLKKSPEALKC 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 RLTEGSERLPRRYSEGDRAVLRGFSESSEEEEEPESPRSSSPPILTKPTLKRKKPFLHRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 RLTEGSERLPRRYSEGDRAVLRGFSESSEEEEEPESPRSSSPPILTKPTLKRKKPFLHRR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB9 RRVRKRKHHNSSVVTETISETTEVLDEPFEDSDSERPMPRLEPTFEIDEEEEEEDENELF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 RRVRKRKHHNSSVVTETISETTEVLDEPFEDSDSERPMPRLEPTFEIDEEEEEEDENELF 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB9 PREYFRRLSSQDVLRCQSSSKRKSKDEEEDEESDDADDTPILKPVSLLRKRDVKNSPLEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PREYFRRLSSQDVLRCQSSSKRKSKDEEEDEESDDADDTPILKPVSLLRKRDVKNSPLEP 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB9 DTSTPLKKKKGWPKGKSRKPIHWKKRPGRKPGFKLSREIMPVSTQACVIEPIVSIPKAGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 DTSTPLKKKKGWPKGKSRKPIHWKKRPGRKPGFKLSREIMPVSTQACVIEPIVSIPKAGR 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB9 KPKIQESEETVEPKEDMPLPEERKEEEEMQAEAEEAEEGEEEDAASSEVPAASPADSSNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KPKIQESEETVEPKEDMPLPEERKEEEEMQAEAEEAEEGEEEDAASSEVPAASPADSSNS 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB9 PETETKEPEVEEEEEKPRVSEEQRQSEEEQQELEEPEPEEEEDAAAETAQNDDHDADDED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PETETKEPEVEEEEEKPRVSEEQRQSEEEQQELEEPEPEEEEDAAAETAQNDDHDADDED 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KB9 DGHLESTKKKELEEQPTREDVKEEPGVQESFLDANMQKSREKIKDKEETELDSEEEQPSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 DGHLESTKKKELEEQPTREDVKEEPGVQESFLDANMQKSREKIKDKEETELDSEEEQPSH 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KB9 DTSVVSEQMAGSEDDHEEDSHTKEELIELKEEEEIPHSELDLETVQAVQSLTQEESSEHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 DTSVVSEQMAGSEDDHEEDSHTKEELIELKEEEEIPHSELDLETVQAVQSLTQEESSEHE 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KB9 GAYQDCEETLAACQTLQSYTQADEDPQMSMVEDCHASEHNSPISSVQSHPSQSVRSVSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 GAYQDCEETLAACQTLQSYTQADEDPQMSMVEDCHASEHNSPISSVQSHPSQSVRSVSSP 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KB9 NVPALESGYTQISPEQGSLSAPSMQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 NVPALESGYTQISPEQGSLSAPSMQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTT 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KB9 ENYENPSSYDSTMGGSICGNSSSQSSCSYGGLSSSSSLTQSSCVVTQQMASMGSSCSMMQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 ENYENPSSYDSTMGGSICGNSSSQSSCSYGGLSSSSSLTQSSCVVTQQMASMGSSCSMMQ 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KB9 QSSVQPAANCSIKSPQSCVVERPPSNQQQQPPPPPPQQPQPPPPQPQPAPQPPPPQQQPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 QSSVQPAANCSIKSPQSCVVERPPSNQQQQPPPPPPQQPQPPPPQPQPAPQPPPPQQQPQ 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KB9 QQPQPQPQQPPPPPPPQQQPPLSQCSMNNSFTPAPMIMEIPESGSTGNISIYERIPGDFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 QQPQPQPQQPPPPPPPQQQPPLSQCSMNNSFTPAPMIMEIPESGSTGNISIYERIPGDFG 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KB9 AGSYSQPSATFSLAKLQQLTNTIMDPHAMPYSHSPAVTSYATSVSLSNTGLAQLAPSHPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 AGSYSQPSATFSLAKLQQLTNTIMDPHAMPYSHSPAVTSYATSVSLSNTGLAQLAPSHPL 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KB9 AGTPQAQATMTPPPNLASTTMNLTSPLLQCNMSATNIGIPHTQRLQGQMPVKGHISIRSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 AGTPQAQATMTPPPNLASTTMNLTSPLLQCNMSATNIGIPHTQRLQGQMPVKGHISIRSK 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KB9 SAPLPSAAAHQQQLYGRSPSAVAMQAGPRALAVQRGMNMGVNLMPTPAYNVNSMNMNTLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 SAPLPSAAAHQQQLYGRSPSAVAMQAGPRALAVQRGMNMGVNLMPTPAYNVNSMNMNTLN 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KB9 AMNSYRMTQPMMNSSYHSNPAYMNQTAQYPMQMQMGMMGSQAYTQQPMQPNPHGNMMYTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 AMNSYRMTQPMMNSSYHSNPAYMNQTAQYPMQMQMGMMGSQAYTQQPMQPNPHGNMMYTG 1930 1940 1950 1960 1970 1980 1990 2000 pF1KB9 PSHHSYMNAAGVPKQSLNGPYMRR :::::::::::::::::::::::: CCDS61 PSHHSYMNAAGVPKQSLNGPYMRR 1990 2000 >>CCDS83290.1 KAT6A gene_id:7994|Hs108|chr8 (815 aa) initn: 5628 init1: 5590 opt: 5590 Z-score: 2019.8 bits: 385.9 E(32554): 3.5e-106 Smith-Waterman score: 5590; 100.0% identity (100.0% similar) in 813 aa overlap (1-813:1-813) 10 20 30 40 50 60 pF1KB9 MVKLANPLYTEWILEAIKKVKKQKQRPSEERICNAVSSSHGLDRKTVLEQLELSVKDGTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 MVKLANPLYTEWILEAIKKVKKQKQRPSEERICNAVSSSHGLDRKTVLEQLELSVKDGTI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 LKVSNKGLNSYKDPDNPGRIALPKPRNHGKLDNKQNVDWNKLIKRAVEGLAESGGSTLKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 LKVSNKGLNSYKDPDNPGRIALPKPRNHGKLDNKQNVDWNKLIKRAVEGLAESGGSTLKS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 IERFLKGQKDVSALFGGSAASGFHQQLRLAIKRAIGHGRLLKDGPLYRLNTKATNVDGKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 IERFLKGQKDVSALFGGSAASGFHQQLRLAIKRAIGHGRLLKDGPLYRLNTKATNVDGKE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 SCESLSCLPPVSLLPHEKDKPVAEPIPICSFCLGTKEQNREKKPEELISCADCGNSGHPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 SCESLSCLPPVSLLPHEKDKPVAEPIPICSFCLGTKEQNREKKPEELISCADCGNSGHPS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 CLKFSPELTVRVKALRWQCIECKTCSSCRDQGKNADNMLFCDSCDRGFHMECCDPPLTRM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 CLKFSPELTVRVKALRWQCIECKTCSSCRDQGKNADNMLFCDSCDRGFHMECCDPPLTRM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 PKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPIGRPKNRLKKQNTVSKGPFSKVRTGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPIGRPKNRLKKQNTVSKGPFSKVRTGP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 GRGRKRKITLSSQSASSSSEEGYLERIDGLDFCRDSNVSLKFNKKTKGLIDGLTKFFTPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 GRGRKRKITLSSQSASSSSEEGYLERIDGLDFCRDSNVSLKFNKKTKGLIDGLTKFFTPS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 PDGRKARGEVVDYSEQYRIRKRGNRKSSTSDWPTDNQDGWDGKQENEERLFGSQEIMTEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PDGRKARGEVVDYSEQYRIRKRGNRKSSTSDWPTDNQDGWDGKQENEERLFGSQEIMTEK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 DMELFRDIQEQALQKVGVTGPPDPQVRCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 DMELFRDIQEQALQKVGVTGPPDPQVRCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 EFCLKYMKSRTILQQHMKKCGWFHPPANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 EFCLKYMKSRTILQQHMKKCGWFHPPANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLF 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 LDHKTLYYDVEPFLFYVLTQNDVKGCHLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 LDHKTLYYDVEPFLFYVLTQNDVKGCHLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGR 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 FLIDFSYLLSKREGQAGSPEKPLSDLGRLSYMAYWKSVILECLYHQNDKQISIKKLSKLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 FLIDFSYLLSKREGQAGSPEKPLSDLGRLSYMAYWKSVILECLYHQNDKQISIKKLSKLT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 GICPQDITSTLHHLRMLDFRSDQFVIIRREKLIQDHMAKLQLNLRPVDVDPECLRWTPVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 GICPQDITSTLHHLRMLDFRSDQFVIIRREKLIQDHMAKLQLNLRPVDVDPECLRWTPVI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 VSNSVVSEEEEEEAEEGENEEPQCQERELEISVGKSVSHENKEQDSYSVESEKKPEVMAP ::::::::::::::::::::::::::::::::: CCDS83 VSNSVVSEEEEEEAEEGENEEPQCQERELEISVRA 790 800 810 850 860 870 880 890 900 pF1KB9 VSSTRLSKQVLPHDSLPANSQPSRRGRWGRKNRKTQERFGDKDSKLLLEETSSAPQEQYG >>CCDS58085.1 KAT6B gene_id:23522|Hs108|chr10 (1890 aa) initn: 5014 init1: 1670 opt: 2035 Z-score: 744.8 bits: 151.3 E(32554): 3.6e-35 Smith-Waterman score: 6659; 53.8% identity (72.2% similar) in 2088 aa overlap (1-2004:1-1890) 10 20 30 40 50 60 pF1KB9 MVKLANPLYTEWILEAIKKVKKQKQRPSEERICNAVSSSHGLDRKTVLEQLELSVKDGTI :::::::::::::::::.:.:::::::::::::.:::.:::::.::: :::::::.::.. CCDS58 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 LKVSNKGLNSYKDPDNPGRIALPKPR--------NHGKLDNKQNVDWNKLIKRAVEGLAE :::.:::: ::::::::::.. :: ..:. .. .:::::::..::.::: : CCDS58 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB9 SGGSTLKSIERFLKGQKDVSALFGGSAASGFHQQLRLAIKRAIGHGRLLKDGPLYRLNTK .::.::.::..:..:.:... .. : :.:.:::. :::...:::::::: ::.: CCDS58 PNGSSLKNIEKYLRSQSDLTSTTNNPA---FQQRLRLGAKRAVNNGRLLKDGPQYRVNYG 130 140 150 160 170 180 190 200 210 220 230 pF1KB9 ATNVDGKESCESL--SCLPPVSLLPHEKDKPVAEPIPICSFCLGTKEQNREKKPEELISC . . : . : : ::::::::::::.: :.:::::::::::::.:::::::::.:: CCDS58 SLDGKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSC 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB9 ADCGNSGHPSCLKFSPELTVRVKALRWQCIECKTCSSCRDQGKNADNMLFCDSCDRGFHM ::::.::::::::: ::::. :::::::::::::::.:: ::.::::::::::::::::: CCDS58 ADCGSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHM 240 250 260 270 280 290 300 310 320 330 340 pF1KB9 ECCDPPLTRMPKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPIGRPKNRLKKQ---NT :::::::.::::::::::.:::.:::::::..:::::::::..:::::::.::.. : CCDS58 ECCDPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLLSVT 300 310 320 330 340 350 350 360 370 380 390 pF1KB9 VSKGPFSKV--RTGPGRGRKRKITLSSQSASSSSEEGYLERIDGLDFCRD---------- ..: .. : .::::.: :. . .:. ..: . :. : : CCDS58 SDEGSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKITTTS 360 370 380 390 400 410 400 410 420 430 440 450 pF1KB9 ---SNVSLKFNKKTKGLIDGLTKFFTPSPDGRKARGEVVDYSEQYRIRKRGNRKSSTSD- : .:: ::::::::::::::::::::::..:::..:.:..:: ::. ..:.: .. CCDS58 TYISASTLKVNKKTKGLIDGLTKFFTPSPDGRRSRGEIIDFSKHYRPRKKVSQKQSCTSH 420 430 440 450 460 470 460 470 480 490 500 pF1KB9 -WPTDNQDGWDGKQENEE-RLFGSQEIMTEKDMELFRDIQEQALQKVGVTGPPDPQVRCP ::.. . :::. . ..:.....::.:...:.. :: . .:. . . : : CCDS58 VLATDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCGRYP 480 490 500 510 520 530 510 520 530 540 550 560 pF1KB9 SVIEFGKYEIHTWYSSPYPQEYSRLPKLYLCEFCLKYMKSRTILQQHMKKCGWFHPPANE ::::::::::.:::::::::::.:::::::::::::::::..:: .: :::::::::::: CCDS58 SVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPPANE 540 550 560 570 580 590 570 580 590 600 610 620 pF1KB9 IYRKNNISVFEVDGNVSTIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTQNDVKGCHLV :::....::::::::.: ::::::::::::::::::::::::::::::::.:: :::::: CCDS58 IYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGCHLV 600 610 620 630 640 650 630 640 650 660 670 680 pF1KB9 GYFSKEKHCQQKYNVSCIMILPQYQRKGYGRFLIDFSYLLSKREGQAGSPEKPLSDLGRL ::::::: ::::::::::::.::.::.:.::::::::::::.:::::::::::::::::: CCDS58 GYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDLGRL 660 670 680 690 700 710 690 700 710 720 730 740 pF1KB9 SYMAYWKSVILECLYHQNDKQISIKKLSKLTGICPQDITSTLHHLRMLDFRSDQFVIIRR ::.::::::::: :::.....:::: .:. ::.::.::..::.::.:.: :. .:::::: CCDS58 SYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVIIRR 720 730 740 750 760 770 750 760 770 780 790 800 pF1KB9 EKLIQDHMAKLQLNLRPVDVDPECLRWTPVIVSNSVVSEEEEEEAEEGEN--EEPQCQER :::: .:: ::. : ..::. :::::...::..:::::.: .:.: :. .: :. CCDS58 EKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASCWEK 780 790 800 810 820 830 810 820 830 840 850 860 pF1KB9 ELEISVGKSVSHENKEQDSYSVESEKKPEVMAPVSSTRLSKQVLPHDSLPANSQPSRRGR : :: :... ...: : ::. : . . CCDS58 E--------------EQ-----------EILSTRANSRQS---------PAKVQSKNKYL 840 850 860 870 880 890 900 910 920 pF1KB9 WGRKNRKTQERFGDKDSKLLLEETSSAPQEQYGECGEKSEATQEQYTESEEQLVASEEQP . ..: . :.. . : : . :: .:. : :. : .:. :.::. ::. CCDS58 HSPESRPVT---GERGQLLELSKESSEEEEE--EEDEEEEEEEEEEEEDEEE----EEE- 870 880 890 900 910 930 940 950 960 970 980 pF1KB9 SQDGKPDLPKRRLSEGVEPWRGQLKKSPEALKCRLTEGSERLPRRYSEGDRAVLRGFSES CCDS58 ------------------------------------------------------------ 990 1000 1010 1020 1030 1040 pF1KB9 SEEEEEPESPRSSSPPILTKP---TLKRKKPFLHRRRRVRKRKHHNSSVVTETISETTEV ::::: : .:::: :::: ..:::.::. ...: :::.. ::::.:::::::::: CCDS58 -EEEEEEEENIQSSPPRLTKPQSVAIKRKRPFVLKKKRGRKRRRINSSVTTETISETTEV 920 930 940 950 960 970 1050 1060 1070 1080 1090 1100 pF1KB9 LDEPFEDSDSERPMPRLEPTFEIDEEEEEEDENELFPREYFRRLSSQDVLRCQSSSKRKS :.:::..:: :::::.:::: :: : ::: . :. :.. : ..::.. CCDS58 LNEPFDNSDEERPMPQLEPTCEI---EVEEDGRKPVLRKAFQH---------QPGKKRQT 980 990 1000 1010 1020 1110 1120 1130 1140 1150 1160 pF1KB9 KDEEEDEESDDADDTPILKPVSLLRKRDVKN-SPLEPDTSTPLKKKKGWPKGKSRKPIHW :.::. : : . : .: . :. ::: :. :::: .: .: CCDS58 ----EEEEGKDNHCFKNADPCRNNMNDDSSNLKEGSKDNPEPLKCKQVWPKGTKRGLSKW 1030 1040 1050 1060 1070 1170 1180 1190 1200 1210 1220 pF1KB9 KKRPGRKPGFKLSREIMPVSTQACVIEPIVSIPKAGRKPKIQESEETVEPKEDMPLP--- .. :: ::::. : . .:: .. ..:..:: : : . : : CCDS58 RQNKERKTGFKLNLYTPPETP----MEP-------DEQVTVEEQKETSEGKTS-PSPIRI 1080 1090 1100 1110 1120 1230 1240 1250 1260 1270 pF1KB9 -EERKEEEEMQAEAEEAEEGEEEDAASSEV-PAASPADSSNSPETETKEPEVEEEEEKPR :: :: : :: .. : .: .. :. .: :. .:: : .: : :::::. . CCDS58 EEEVKETGEALLPQEENRREETCAPVSPNTSPGEKPEDDLIKPEEEEEEEEEEEEEEEEE 1130 1140 1150 1160 1170 1180 1280 1290 1300 1310 pF1KB9 VSEEQRQS---EEE-----QQELEEPE-------------PEEEEDAAAETAQNDDHDAD .::.. . :.. .:: :::: ::::. : ..:.::::: CCDS58 EGEEEEGGGNVEKDPDGAKSQEKEEPEISTEKEDSARLDDHEEEEEEDEEPSHNEDHDAD 1190 1200 1210 1220 1230 1240 1320 1330 1340 1350 1360 1370 pF1KB9 DEDDGHLESTKKKELEEQPTREDVKEEPGVQESFLDANMQKSREKIKDKEETELD----- ::::.:.::.. : :: : ::. :: ::.::: :.: .. . . . .: CCDS58 DEDDSHMESAEV-EKEELP-RESFKEVLENQETFLDLNVQPGHSNPEVLMDCGVDLTASC 1250 1260 1270 1280 1290 1300 1380 1390 1400 1410 1420 pF1KB9 -SEEEQPSHDTSVVSEQ----MAGSEDDHEEDSHTKEELIELKEEEEIPHS-ELDLETVQ :: .. . : .: :. : . ........:: :.:: . : . :.: :::: CCDS58 NSEPKELAGDPEAVPESDEEPPPGEQAQKQDQKNSKEVDTEFKEGN--PATMEIDSETVQ 1310 1320 1330 1340 1350 1360 1430 1440 1450 1460 1470 1480 pF1KB9 AVQSLTQEESSEHEGAYQDCEETLAACQTLQSYTQADEDPQM-SMVEDCHASEHNSPISS :::::::: :::.. ..::: :: ::..::.::.::..::. . ..::. :.:.::.:: CCDS58 AVQSLTQE-SSEQDDTFQDCAETQEACRSLQNYTRADQSPQIATTLDDCQQSDHSSPVSS 1370 1380 1390 1400 1410 1490 1500 1510 1520 1530 1540 pF1KB9 VQSHPSQSVRSVSSPNVPALESGYTQISPEQGSLSAPSMQNMETSPMMDVPSVSDHSQQV :.:::.::::::.::.:::::..:.::::.:...:.::.::::::::::::::::::::: CCDS58 VHSHPGQSVRSVNSPSVPALENSYAQISPDQSAISVPSLQNMETSPMMDVPSVSDHSQQV 1420 1430 1440 1450 1460 1470 1550 1560 1570 1580 1590 1600 pF1KB9 VDSGFSDLGSIESTTENYENPSSYDSTMGGSICGNSSSQSSCSYGGLSSSSSLTQSSCVV :::::::::::::::::::::::::::::::::::.:::.::::..:.::: ::::::.: CCDS58 VDSGFSDLGSIESTTENYENPSSYDSTMGGSICGNGSSQNSCSYSNLTSSS-LTQSSCAV 1480 1490 1500 1510 1520 1530 1610 1620 1630 1640 1650 1660 pF1KB9 TQQMASMGSSCSMMQQSSVQPAANCSIKSPQSCVVERPPSNQQQQPPPPPPQQPQPPPPQ ::::.....::::.::.:.. .::.::::.::::::::..:: CCDS58 TQQMSNISGSCSMLQQTSISSPPTCSVKSPQGCVVERPPSSSQQ---------------- 1540 1550 1560 1570 1580 1670 1680 1690 1700 1710 1720 pF1KB9 PQPAPQPPPPQQQPQQQPQPQPQQPPPPPPPQQQPPLSQCSMNNSFTPAPMIMEIPESGS :.:::: .::: .. ::::. : CCDS58 ------------------------------------LAQCSMAANFTPPMQLAEIPET-S 1590 1600 1730 1740 1750 1760 1770 1780 pF1KB9 TGNISIYERI-PGDFGAGSYSQPSATFSLAKLQQLTNTIMDPHAMPYSHSPAVTSYATSV ..::..:::. .::::: : :::::::::::::::::..: :..::::: ::::::.:. CCDS58 NANIGLYERMGQSDFGAGHYPQPSATFSLAKLQQLTNTLID-HSLPYSHSAAVTSYANSA 1610 1620 1630 1640 1650 1660 1790 1800 1810 1820 1830 pF1KB9 SLS----NTGLAQLAPS-HPLAGTPQAQATMTPPPNLASTTMNLTSPLLQCNMSATNIGI ::: ::::.::. : : . : :::::::::::::. ::: :::: ::.:.:::: CCDS58 SLSTPLSNTGLVQLSQSPHSVPGGPQAQATMTPPPNLTPPPMNLPPPLLQRNMAASNIGI 1670 1680 1690 1700 1710 1720 1840 1850 1860 1870 1880 1890 pF1KB9 PHTQRLQGQMPVKGHISIRSKSAPL-PSAAAHQQQLYGRSPSAVAMQAGPRALAVQRGMN :.:::: :. :::::.:.::: : :.::.::.:.:::: . ::::. :.:..::::: CCDS58 SHSQRLQTQIASKGHISMRTKSASLSPAAATHQSQIYGRSQT-VAMQGPARTLTMQRGMN 1730 1740 1750 1760 1770 1780 1900 1910 1920 1930 1940 1950 pF1KB9 MGVNLMPTPAYNVNS--MNMNTLNAMNSYRMTQPMMNSSYHSNPAYMNQTAQYPMQMQMG :.:::::.::::::: ::::::::::.: :.::::::.:::: .::::: ::::::::: CCDS58 MSVNLMPAPAYNVNSVNMNMNTLNAMNGYSMSQPMMNSGYHSNHGYMNQTPQYPMQMQMG 1790 1800 1810 1820 1830 1840 1960 1970 1980 1990 2000 pF1KB9 MMGSQAYTQQPMQPNPHGNMMYTGPSHHSYMNAAGVPKQSLNGPYMRR :::.: :.::::: ::::::::.:.::.:::. :. :::::: :::: CCDS58 MMGTQPYAQQPMQTPPHGNMMYTAPGHHGYMNT-GMSKQSLNGSYMRR 1850 1860 1870 1880 1890 >>CCDS58084.1 KAT6B gene_id:23522|Hs108|chr10 (1781 aa) initn: 4947 init1: 1670 opt: 1774 Z-score: 652.0 bits: 134.0 E(32554): 5.4e-30 Smith-Waterman score: 6252; 52.3% identity (69.9% similar) in 2067 aa overlap (1-2004:1-1781) 10 20 30 40 50 60 pF1KB9 MVKLANPLYTEWILEAIKKVKKQKQRPSEERICNAVSSSHGLDRKTVLEQLELSVKDGTI :::::::::::::::::.:.:::::::::::::.:::.:::::.::: :::::::.::.. CCDS58 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 LKVSNKGLNSYKDPDNPGRIALPKPR--------NHGKLDNKQNVDWNKLIKRAVEGLAE :::.:::: ::::::::::.. :: ..:. .. .:::::::..::.::: : CCDS58 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB9 SGGSTLKSIERFLKGQKDVSALFGGSAASGFHQQLRLAIKRAIGHGRLLKDGPLYRLNTK .::.::.::..:..:.:... .. : :.:.:::. :::...:::::::: ::.: CCDS58 PNGSSLKNIEKYLRSQSDLTSTTNNPA---FQQRLRLGAKRAVNNGRLLKDGPQYRVNYG 130 140 150 160 170 180 190 200 210 220 230 pF1KB9 ATNVDGKESCESL--SCLPPVSLLPHEKDKPVAEPIPICSFCLGTKEQNREKKPEELISC . . : . : : ::::::::::::.: :.:::::::::::::.:::::::::.:: CCDS58 SLDGKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSC 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB9 ADCGNSGHPSCLKFSPELTVRVKALRWQCIECKTCSSCRDQGKNADNMLFCDSCDRGFHM ::::.::::::::: ::::. :::::::::::::::.:: ::.::::::::::::::::: CCDS58 ADCGSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHM 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 ECCDPPLTRMPKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPIGRPKNRLKKQNTVSK :::::::.::::::::::.:::.:::::::..:::::::::..:::::::.::.. CCDS58 ECCDPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLL--- 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB9 GPFSKVRTGPGRGRKRKITLSSQSASSSSEEGYLERIDGLDFCRDSNVSLKFNKKTKGLI : .:.:: .. . : .: CCDS58 -------------------------SVTSDEGSMNAFTG-----------------RG-- 360 370 420 430 440 450 460 470 pF1KB9 DGLTKFFTPSPDGRKARGEVVDYSEQYRIRKRGNRKSSTSDWPTDNQDGWDGKQENEERL ::: . .: : :. ..: . CCDS58 ---------SPD------------TEIKI----NIKQESADV----------------NV 380 480 490 500 510 520 530 pF1KB9 FGSQEIMTEKDMELFRDIQEQALQKVGVTGPPDPQVRCPSVIEFGKYEIHTWYSSPYPQE .:.....::.:...:.. :: . .:. . . : :::::::::::.:::::::::: CCDS58 IGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCGRYPSVIEFGKYEIQTWYSSPYPQE 390 400 410 420 430 440 540 550 560 570 580 590 pF1KB9 YSRLPKLYLCEFCLKYMKSRTILQQHMKKCGWFHPPANEIYRKNNISVFEVDGNVSTIYC :.:::::::::::::::::..:: .: :::::::::::::::....::::::::.: ::: CCDS58 YARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPPANEIYRRKDLSVFEVDGNMSKIYC 450 460 470 480 490 500 600 610 620 630 640 650 pF1KB9 QNLCLLAKLFLDHKTLYYDVEPFLFYVLTQNDVKGCHLVGYFSKEKHCQQKYNVSCIMIL :::::::::::::::::::::::::::::.:: ::::::::::::: ::::::::::::. CCDS58 QNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGCHLVGYFSKEKLCQQKYNVSCIMIM 510 520 530 540 550 560 660 670 680 690 700 710 pF1KB9 PQYQRKGYGRFLIDFSYLLSKREGQAGSPEKPLSDLGRLSYMAYWKSVILECLYHQNDKQ ::.::.:.::::::::::::.::::::::::::::::::::.::::::::: :::..... CCDS58 PQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDLGRLSYLAYWKSVILEYLYHHHERH 570 580 590 600 610 620 720 730 740 750 760 770 pF1KB9 ISIKKLSKLTGICPQDITSTLHHLRMLDFRSDQFVIIRREKLIQDHMAKLQLNLRPVDVD :::: .:. ::.::.::..::.::.:.: :. .:::::::::: .:: ::. : ..: CCDS58 ISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVIIRREKLILSHMEKLKTCSRANELD 630 640 650 660 670 680 780 790 800 810 820 pF1KB9 PECLRWTPVIVSNSVVSEEEEEEAEEGEN--EEPQCQERELEISVGKSVSHENKEQDSYS :. :::::...::..:::::.: .:.: :. .: :.: :: CCDS58 PDSLRWTPILISNAAVSEEEREAEKEAERLMEQASCWEKE--------------EQ---- 690 700 710 720 730 830 840 850 860 870 880 pF1KB9 VESEKKPEVMAPVSSTRLSKQVLPHDSLPANSQPSRRGRWGRKNRKTQERFGDKDSKLLL :... ...: : ::. : . . . ..: . :.. . : : CCDS58 -------EILSTRANSRQS---------PAKVQSKNKYLHSPESRPVT---GERGQLLEL 740 750 760 770 890 900 910 920 930 940 pF1KB9 EETSSAPQEQYGECGEKSEATQEQYTESEEQLVASEEQPSQDGKPDLPKRRLSEGVEPWR . :: .:. : :. : .:. :.::. ::. CCDS58 SKESSEEEEE--EEDEEEEEEEEEEEEDEEE----EEE---------------------- 780 790 800 950 960 970 980 990 1000 pF1KB9 GQLKKSPEALKCRLTEGSERLPRRYSEGDRAVLRGFSESSEEEEEPESPRSSSPPILTKP ::::: : .:::: :::: CCDS58 ----------------------------------------EEEEEEEENIQSSPPRLTKP 810 820 1010 1020 1030 1040 1050 1060 pF1KB9 ---TLKRKKPFLHRRRRVRKRKHHNSSVVTETISETTEVLDEPFEDSDSERPMPRLEPTF ..:::.::. ...: :::.. ::::.:::::::::::.:::..:: :::::.:::: CCDS58 QSVAIKRKRPFVLKKKRGRKRRRINSSVTTETISETTEVLNEPFDNSDEERPMPQLEPTC 830 840 850 860 870 880 1070 1080 1090 1100 1110 1120 pF1KB9 EIDEEEEEEDENELFPREYFRRLSSQDVLRCQSSSKRKSKDEEEDEESDDADDTPILKPV :: : ::: . :. :.. : ..::.. :.::. : : CCDS58 EI---EVEEDGRKPVLRKAFQH---------QPGKKRQT----EEEEGKDNHCFKNADPC 890 900 910 920 1130 1140 1150 1160 1170 1180 pF1KB9 SLLRKRDVKN-SPLEPDTSTPLKKKKGWPKGKSRKPIHWKKRPGRKPGFKLSREIMPVST . : .: . :. ::: :. :::: .: .:.. :: ::::. : . CCDS58 RNNMNDDSSNLKEGSKDNPEPLKCKQVWPKGTKRGLSKWRQNKERKTGFKLNLYTPPETP 930 940 950 960 970 980 1190 1200 1210 1220 1230 1240 pF1KB9 QACVIEPIVSIPKAGRKPKIQESEETVEPKEDMPLP----EERKEEEEMQAEAEEAEEGE .:: .. ..:..:: : : . : : :: :: : :: .. : CCDS58 ----MEP-------DEQVTVEEQKETSEGKTS-PSPIRIEEEVKETGEALLPQEENRREE 990 1000 1010 1020 1030 1250 1260 1270 1280 1290 pF1KB9 EEDAASSEV-PAASPADSSNSPETETKEPEVEEEEEKPRVSEEQRQS---EEE-----QQ .: .. :. .: :. .:: : .: : :::::. . .::.. . :.. .: CCDS58 TCAPVSPNTSPGEKPEDDLIKPEEEEEEEEEEEEEEEEEEGEEEEGGGNVEKDPDGAKSQ 1040 1050 1060 1070 1080 1090 1300 1310 1320 1330 pF1KB9 ELEEPE-------------PEEEEDAAAETAQNDDHDADDEDDGHLESTKKKELEEQPTR : :::: ::::. : ..:.:::::::::.:.::.. : :: : : CCDS58 EKEEPEISTEKEDSARLDDHEEEEEEDEEPSHNEDHDADDEDDSHMESAEV-EKEELP-R 1100 1110 1120 1130 1140 1150 1340 1350 1360 1370 1380 pF1KB9 EDVKEEPGVQESFLDANMQKSREKIKDKEETELD------SEEEQPSHDTSVVSEQ---- :. :: ::.::: :.: .. . . . .: :: .. . : .: :. CCDS58 ESFKEVLENQETFLDLNVQPGHSNPEVLMDCGVDLTASCNSEPKELAGDPEAVPESDEEP 1160 1170 1180 1190 1200 1210 1390 1400 1410 1420 1430 1440 pF1KB9 MAGSEDDHEEDSHTKEELIELKEEEEIPHS-ELDLETVQAVQSLTQEESSEHEGAYQDCE : . ........:: :.:: . : . :.: :::::::::::: :::.. ..::: CCDS58 PPGEQAQKQDQKNSKEVDTEFKEGN--PATMEIDSETVQAVQSLTQE-SSEQDDTFQDCA 1220 1230 1240 1250 1260 1270 1450 1460 1470 1480 1490 1500 pF1KB9 ETLAACQTLQSYTQADEDPQM-SMVEDCHASEHNSPISSVQSHPSQSVRSVSSPNVPALE :: ::..::.::.::..::. . ..::. :.:.::.:::.:::.::::::.::.::::: CCDS58 ETQEACRSLQNYTRADQSPQIATTLDDCQQSDHSSPVSSVHSHPGQSVRSVNSPSVPALE 1280 1290 1300 1310 1320 1330 1510 1520 1530 1540 1550 1560 pF1KB9 SGYTQISPEQGSLSAPSMQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENYENP ..:.::::.:...:.::.:::::::::::::::::::::::::::::::::::::::::: CCDS58 NSYAQISPDQSAISVPSLQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENYENP 1340 1350 1360 1370 1380 1390 1570 1580 1590 1600 1610 1620 pF1KB9 SSYDSTMGGSICGNSSSQSSCSYGGLSSSSSLTQSSCVVTQQMASMGSSCSMMQQSSVQP ::::::::::::::.:::.::::..:.::: ::::::.:::::.....::::.::.:.. CCDS58 SSYDSTMGGSICGNGSSQNSCSYSNLTSSS-LTQSSCAVTQQMSNISGSCSMLQQTSISS 1400 1410 1420 1430 1440 1450 1630 1640 1650 1660 1670 1680 pF1KB9 AANCSIKSPQSCVVERPPSNQQQQPPPPPPQQPQPPPPQPQPAPQPPPPQQQPQQQPQPQ .::.::::.::::::::..:: CCDS58 PPTCSVKSPQGCVVERPPSSSQQ------------------------------------- 1460 1470 1690 1700 1710 1720 1730 1740 pF1KB9 PQQPPPPPPPQQQPPLSQCSMNNSFTPAPMIMEIPESGSTGNISIYERI-PGDFGAGSYS :.:::: .::: .. ::::. :..::..:::. .::::: : CCDS58 ---------------LAQCSMAANFTPPMQLAEIPET-SNANIGLYERMGQSDFGAGHYP 1480 1490 1500 1510 1750 1760 1770 1780 1790 1800 pF1KB9 QPSATFSLAKLQQLTNTIMDPHAMPYSHSPAVTSYATSVSLS----NTGLAQLAPS-HPL :::::::::::::::::..: :..::::: ::::::.:.::: ::::.::. : : . CCDS58 QPSATFSLAKLQQLTNTLID-HSLPYSHSAAVTSYANSASLSTPLSNTGLVQLSQSPHSV 1520 1530 1540 1550 1560 1570 1810 1820 1830 1840 1850 1860 pF1KB9 AGTPQAQATMTPPPNLASTTMNLTSPLLQCNMSATNIGIPHTQRLQGQMPVKGHISIRSK : :::::::::::::. ::: :::: ::.:.:::: :.:::: :. :::::.:.: CCDS58 PGGPQAQATMTPPPNLTPPPMNLPPPLLQRNMAASNIGISHSQRLQTQIASKGHISMRTK 1580 1590 1600 1610 1620 1630 1870 1880 1890 1900 1910 pF1KB9 SAPL-PSAAAHQQQLYGRSPSAVAMQAGPRALAVQRGMNMGVNLMPTPAYNVNS--MNMN :: : :.::.::.:.:::: . ::::. :.:..::::::.:::::.::::::: :::: CCDS58 SASLSPAAATHQSQIYGRSQT-VAMQGPARTLTMQRGMNMSVNLMPAPAYNVNSVNMNMN 1640 1650 1660 1670 1680 1690 1920 1930 1940 1950 1960 1970 pF1KB9 TLNAMNSYRMTQPMMNSSYHSNPAYMNQTAQYPMQMQMGMMGSQAYTQQPMQPNPHGNMM ::::::.: :.::::::.:::: .::::: ::::::::::::.: :.::::: :::::: CCDS58 TLNAMNGYSMSQPMMNSGYHSNHGYMNQTPQYPMQMQMGMMGTQPYAQQPMQTPPHGNMM 1700 1710 1720 1730 1740 1750 1980 1990 2000 pF1KB9 YTGPSHHSYMNAAGVPKQSLNGPYMRR ::.:.::.:::. :. :::::: :::: CCDS58 YTAPGHHGYMNT-GMSKQSLNGSYMRR 1760 1770 1780 >>CCDS7345.1 KAT6B gene_id:23522|Hs108|chr10 (2073 aa) initn: 5014 init1: 1670 opt: 1776 Z-score: 651.7 bits: 134.2 E(32554): 5.6e-30 Smith-Waterman score: 5590; 49.0% identity (65.3% similar) in 2076 aa overlap (186-2004:193-2073) 160 170 180 190 200 210 pF1KB9 GHGRLLKDGPLYRLNTKATNVDGKESCESLSCLPPVSLLPHEKDKPVAEPIPICSFCLGT : ::::::::::::.: :.::::::::::: CCDS73 GRLLKDGPQYRVNYGSLDGKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGT 170 180 190 200 210 220 220 230 240 250 260 270 pF1KB9 KEQNREKKPEELISCADCGNSGHPSCLKFSPELTVRVKALRWQCIECKTCSSCRDQGKNA ::.:::::::::.::::::.::::::::: ::::. :::::::::::::::.:: ::.:: CCDS73 KESNREKKPEELLSCADCGSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNA 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB9 DNMLFCDSCDRGFHMECCDPPLTRMPKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPI ::::::::::::::::::::::.::::::::::.:::.:::::::..:::::::::..:: CCDS73 DNMLFCDSCDRGFHMECCDPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPI 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB9 GRPKNRLKKQ---NTVSKGPFSKV--RTGPGRGRKRKITLSSQSASSSSEEGYLERIDGL :::::.::.. : ..: .. : .::::.: :. . .:. ..: . :. CCDS73 GRPKNKLKQRLLSVTSDEGSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVT 350 360 370 380 390 400 400 410 420 430 pF1KB9 DFCRD-------------SNVSLKFNKKTKGLIDGLTKFFTPSPDGRKARGEVVDYSEQY : : : .:: ::::::::::::::::::::::..:::..:.:..: CCDS73 DPTRPGATTKITTTSTYISASTLKVNKKTKGLIDGLTKFFTPSPDGRRSRGEIIDFSKHY 410 420 430 440 450 460 440 pF1KB9 RIRKR--------------------------------------GNRKSST---------- : ::. ...:::: CCDS73 RPRKKVSQKQSCTSHVLATGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSS 470 480 490 500 510 520 450 pF1KB9 ---------SDWPTDNQ-----DG------------------------------------ :. :..: :: CCDS73 SSQCSVPSLSSLTTNSQLKALFDGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAK 530 540 550 560 570 580 460 pF1KB9 -----------------------W------------------------------------ : CCDS73 SKAHFFGKRDIRSRFISHSSSSSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQ 590 600 610 620 630 640 470 480 490 pF1KB9 ------------DG----------------KQENEE-RLFGSQEIMTEKDMELFRDIQEQ :: :::. . ..:.....::.:...:.. :: CCDS73 MGTPSPGKGSLTDGRIKPDQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQEL 650 660 670 680 690 700 500 510 520 530 540 550 pF1KB9 ALQKVGVTGPPDPQVRCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLCEFCLKYMKSRT . .:. . . : :::::::::::.:::::::::::.:::::::::::::::::.. CCDS73 SWEKIECESGVEDCGRYPSVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKN 710 720 730 740 750 760 560 570 580 590 600 610 pF1KB9 ILQQHMKKCGWFHPPANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLFLDHKTLYYDVE :: .: :::::::::::::::....::::::::.: :::::::::::::::::::::::: CCDS73 ILLRHSKKCGWFHPPANEIYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVE 770 780 790 800 810 820 620 630 640 650 660 670 pF1KB9 PFLFYVLTQNDVKGCHLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGRFLIDFSYLLSK ::::::::.:: ::::::::::::: ::::::::::::.::.::.:.::::::::::::. CCDS73 PFLFYVLTKNDEKGCHLVGYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSR 830 840 850 860 870 880 680 690 700 710 720 730 pF1KB9 REGQAGSPEKPLSDLGRLSYMAYWKSVILECLYHQNDKQISIKKLSKLTGICPQDITSTL ::::::::::::::::::::.::::::::: :::.....:::: .:. ::.::.::..:: CCDS73 REGQAGSPEKPLSDLGRLSYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTL 890 900 910 920 930 940 740 750 760 770 780 790 pF1KB9 HHLRMLDFRSDQFVIIRREKLIQDHMAKLQLNLRPVDVDPECLRWTPVIVSNSVVSEEEE .::.:.: :. .:::::::::: .:: ::. : ..::. :::::...::..:::::. CCDS73 QHLHMIDKRDGRFVIIRREKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEER 950 960 970 980 990 1000 800 810 820 830 840 pF1KB9 EEAEEGEN--EEPQCQERELEISVGKSVSHENKEQDSYSVESEKKPEVMAPVSSTRLSKQ : .:.: :. .: :.: :: :... ...: : CCDS73 EAEKEAERLMEQASCWEKE--------------EQ-----------EILSTRANSRQS-- 1010 1020 1030 850 860 870 880 890 900 pF1KB9 VLPHDSLPANSQPSRRGRWGRKNRKTQERFGDKDSKLLLEETSSAPQEQYGECGEKSEAT ::. : . . . ..: . :.. . : : . :: .:. : :. : CCDS73 -------PAKVQSKNKYLHSPESRPVT---GERGQLLELSKESSEEEEE--EEDEEEEEE 1040 1050 1060 1070 1080 910 920 930 940 950 960 pF1KB9 QEQYTESEEQLVASEEQPSQDGKPDLPKRRLSEGVEPWRGQLKKSPEALKCRLTEGSERL .:. :.::. ::. CCDS73 EEEEEEDEEE----EEE------------------------------------------- 1090 970 980 990 1000 1010 1020 pF1KB9 PRRYSEGDRAVLRGFSESSEEEEEPESPRSSSPPILTKP---TLKRKKPFLHRRRRVRKR ::::: : .:::: :::: ..:::.::. ...: ::: CCDS73 -------------------EEEEEEEENIQSSPPRLTKPQSVAIKRKRPFVLKKKRGRKR 1100 1110 1120 1130 1030 1040 1050 1060 1070 1080 pF1KB9 KHHNSSVVTETISETTEVLDEPFEDSDSERPMPRLEPTFEIDEEEEEEDENELFPREYFR .. ::::.:::::::::::.:::..:: :::::.:::: :: : ::: . :. :. CCDS73 RRINSSVTTETISETTEVLNEPFDNSDEERPMPQLEPTCEI---EVEEDGRKPVLRKAFQ 1140 1150 1160 1170 1180 1190 1090 1100 1110 1120 1130 1140 pF1KB9 RLSSQDVLRCQSSSKRKSKDEEEDEESDDADDTPILKPVSLLRKRDVKN-SPLEPDTSTP . : ..::.. :.::. : : . : .: . :. : CCDS73 H---------QPGKKRQT----EEEEGKDNHCFKNADPCRNNMNDDSSNLKEGSKDNPEP 1200 1210 1220 1230 1240 1150 1160 1170 1180 1190 1200 pF1KB9 LKKKKGWPKGKSRKPIHWKKRPGRKPGFKLSREIMPVSTQACVIEPIVSIPKAGRKPKIQ :: :. :::: .: .:.. :: ::::. : . .:: .. .. CCDS73 LKCKQVWPKGTKRGLSKWRQNKERKTGFKLNLYTPPETP----MEP-------DEQVTVE 1250 1260 1270 1280 1290 1210 1220 1230 1240 1250 1260 pF1KB9 ESEETVEPKEDMPLP----EERKEEEEMQAEAEEAEEGEEEDAASSEV-PAASPADSSNS :..:: : : . : : :: :: : :: .. : .: .. :. .: :. . CCDS73 EQKETSEGKTS-PSPIRIEEEVKETGEALLPQEENRREETCAPVSPNTSPGEKPEDDLIK 1300 1310 1320 1330 1340 1270 1280 1290 pF1KB9 PETETKEPEVEEEEEKPRVSEEQRQS---EEE-----QQELEEPE-------------PE :: : .: : :::::. . .::.. . :.. .:: :::: : CCDS73 PEEEEEEEEEEEEEEEEEEGEEEEGGGNVEKDPDGAKSQEKEEPEISTEKEDSARLDDHE 1350 1360 1370 1380 1390 1400 1300 1310 1320 1330 1340 1350 pF1KB9 EEEDAAAETAQNDDHDADDEDDGHLESTKKKELEEQPTREDVKEEPGVQESFLDANMQKS :::. : ..:.:::::::::.:.::.. : :: : ::. :: ::.::: :.: . CCDS73 EEEEEDEEPSHNEDHDADDEDDSHMESAEV-EKEELP-RESFKEVLENQETFLDLNVQPG 1410 1420 1430 1440 1450 1460 1360 1370 1380 1390 1400 pF1KB9 REKIKDKEETELD------SEEEQPSHDTSVVSEQ----MAGSEDDHEEDSHTKEELIEL . . . . .: :: .. . : .: :. : . ........:: :. CCDS73 HSNPEVLMDCGVDLTASCNSEPKELAGDPEAVPESDEEPPPGEQAQKQDQKNSKEVDTEF 1470 1480 1490 1500 1510 1520 1410 1420 1430 1440 1450 1460 pF1KB9 KEEEEIPHS-ELDLETVQAVQSLTQEESSEHEGAYQDCEETLAACQTLQSYTQADEDPQM :: . : . :.: :::::::::::: :::.. ..::: :: ::..::.::.::..::. CCDS73 KEGN--PATMEIDSETVQAVQSLTQE-SSEQDDTFQDCAETQEACRSLQNYTRADQSPQI 1530 1540 1550 1560 1570 1580 1470 1480 1490 1500 1510 1520 pF1KB9 -SMVEDCHASEHNSPISSVQSHPSQSVRSVSSPNVPALESGYTQISPEQGSLSAPSMQNM . ..::. :.:.::.:::.:::.::::::.::.:::::..:.::::.:...:.::.::: CCDS73 ATTLDDCQQSDHSSPVSSVHSHPGQSVRSVNSPSVPALENSYAQISPDQSAISVPSLQNM 1590 1600 1610 1620 1630 1640 1530 1540 1550 1560 1570 1580 pF1KB9 ETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENYENPSSYDSTMGGSICGNSSSQSSC :::::::::::::::::::::::::::::::::::::::::::::::::::::.:::.:: CCDS73 ETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENYENPSSYDSTMGGSICGNGSSQNSC 1650 1660 1670 1680 1690 1700 1590 1600 1610 1620 1630 1640 pF1KB9 SYGGLSSSSSLTQSSCVVTQQMASMGSSCSMMQQSSVQPAANCSIKSPQSCVVERPPSNQ ::..:.::: ::::::.:::::.....::::.::.:.. .::.::::.::::::::.. CCDS73 SYSNLTSSS-LTQSSCAVTQQMSNISGSCSMLQQTSISSPPTCSVKSPQGCVVERPPSSS 1710 1720 1730 1740 1750 1760 1650 1660 1670 1680 1690 1700 pF1KB9 QQQPPPPPPQQPQPPPPQPQPAPQPPPPQQQPQQQPQPQPQQPPPPPPPQQQPPLSQCSM :: :.:::: CCDS73 QQ----------------------------------------------------LAQCSM 1770 1710 1720 1730 1740 1750 1760 pF1KB9 NNSFTPAPMIMEIPESGSTGNISIYERI-PGDFGAGSYSQPSATFSLAKLQQLTNTIMDP .::: .. ::::. :..::..:::. .::::: : :::::::::::::::::..: CCDS73 AANFTPPMQLAEIPET-SNANIGLYERMGQSDFGAGHYPQPSATFSLAKLQQLTNTLID- 1780 1790 1800 1810 1820 1770 1780 1790 1800 1810 1820 pF1KB9 HAMPYSHSPAVTSYATSVSLS----NTGLAQLAPS-HPLAGTPQAQATMTPPPNLASTTM :..::::: ::::::.:.::: ::::.::. : : . : :::::::::::::. : CCDS73 HSLPYSHSAAVTSYANSASLSTPLSNTGLVQLSQSPHSVPGGPQAQATMTPPPNLTPPPM 1830 1840 1850 1860 1870 1880 1830 1840 1850 1860 1870 1880 pF1KB9 NLTSPLLQCNMSATNIGIPHTQRLQGQMPVKGHISIRSKSAPL-PSAAAHQQQLYGRSPS :: :::: ::.:.:::: :.:::: :. :::::.:.::: : :.::.::.:.:::: . CCDS73 NLPPPLLQRNMAASNIGISHSQRLQTQIASKGHISMRTKSASLSPAAATHQSQIYGRSQT 1890 1900 1910 1920 1930 1940 1890 1900 1910 1920 1930 pF1KB9 AVAMQAGPRALAVQRGMNMGVNLMPTPAYNVNS--MNMNTLNAMNSYRMTQPMMNSSYHS ::::. :.:..::::::.:::::.::::::: ::::::::::.: :.::::::.::: CCDS73 -VAMQGPARTLTMQRGMNMSVNLMPAPAYNVNSVNMNMNTLNAMNGYSMSQPMMNSGYHS 1950 1960 1970 1980 1990 2000 1940 1950 1960 1970 1980 1990 pF1KB9 NPAYMNQTAQYPMQMQMGMMGSQAYTQQPMQPNPHGNMMYTGPSHHSYMNAAGVPKQSLN : .::::: ::::::::::::.: :.::::: ::::::::.:.::.:::. :. ::::: CCDS73 NHGYMNQTPQYPMQMQMGMMGTQPYAQQPMQTPPHGNMMYTAPGHHGYMNT-GMSKQSLN 2010 2020 2030 2040 2050 2060 2000 pF1KB9 GPYMRR : :::: CCDS73 GSYMRR 2070 >>CCDS56036.1 KAT7 gene_id:11143|Hs108|chr17 (501 aa) initn: 1182 init1: 1127 opt: 1222 Z-score: 463.0 bits: 97.2 E(32554): 1.8e-19 Smith-Waterman score: 1225; 44.4% identity (70.5% similar) in 468 aa overlap (330-778:37-497) 300 310 320 330 340 350 pF1KB9 MPKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPIGRPKNRLKKQNTVSKGPFSKVRT- : . . : . ::. :.. ...: .... CCDS56 NAGSSSDGTEDSDFSTDLEHTDSSESDGTSRRSARVTRSSARLS-QSSQDSSPVRNLQSF 10 20 30 40 50 60 360 370 380 390 400 pF1KB9 G---PGRGRKRKITLSSQSASSSSEEGY---LERIDG------LDFCRDSNVSLKFNKKT : :. . :..: :.:. . . . : : .: .:: .... : ... CCDS56 GTEEPAYST-RRVTRSQQQPTPVTPKKYPLRQTRSSGSETEQVVDFSDRGHLTGKHERHF 70 80 90 100 110 120 410 420 430 440 450 460 pF1KB9 KGLIDGLTKFFTPSPDGRKARGEV-VDYSEQY-RIRKRGNRKSSTSDWPTDNQDGWDGKQ . :.: . . : : :: : . :.:. ..::. : : .. .. . CCDS56 S--ISGCPLYHNLSADECKAPTERQLRYKEKVAELRKKRNSGLS-KEQKEKYMEHRQTYG 130 140 150 160 170 180 470 480 490 500 510 520 pF1KB9 ENEERLFGSQEIMTEKDMELFRDIQEQA---LQKVGVTGPPDPQVRCPSVIEFGKYEIHT ...: :. ... .: :..::: : .: :.:. . : ..: ::.::. : CCDS56 NTREPLL--ENLTSEYDLDLFRRAQARASEDLEKLRLQGQITEGSNMIKTIAFGRYELDT 190 200 210 220 230 530 540 550 560 570 580 pF1KB9 WYSSPYPQEYSRLPKLYLCEFCLKYMKSRTILQQHMKKCGWFHPPANEIYRKNNISVFEV :: ::::.::.:: .::.::::::::::.:::..:: :: : :::..:::::..:::::: CCDS56 WYHSPYPEEYARLGRLYMCEFCLKYMKSQTILRRHMAKCVWKHPPGDEIYRKGSISVFEV 240 250 260 270 280 290 590 600 610 620 630 640 pF1KB9 DGNVSTIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTQNDVKGCHLVGYFSKEKHCQQK ::. . ::::::::::::::::::::::::::::::.:. : ::::.:::::::. . CCDS56 DGKKNKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVMTEADNTGCHLIGYFSKEKNSFLN 300 310 320 330 340 350 650 660 670 680 690 700 pF1KB9 YNVSCIMILPQYQRKGYGRFLIDFSYLLSKREGQAGSPEKPLSDLGRLSYMAYWKSVILE ::::::. .:::.:.:::..:::::::::: : ..::::.:::::: .:: .::: :.:. CCDS56 YNVSCILTMPQYMRQGYGKMLIDFSYLLSKVEEKVGSPERPLSDLGLISYRSYWKEVLLR 360 370 380 390 400 410 710 720 730 740 750 760 pF1KB9 CLYHQNDKQISIKKLSKLTGICPQDITSTLHHLRMLDFRSDQFVIIRREKLIQDHMAK-L :.. . :.::::..:. :.. : ::.:::. :.:: . . . ....:. ::.. .:: CCDS56 YLHNFQGKEISIKEISQETAVNPVDIVSTLQALQMLKYWKGKHLVLKRQDLIDEWIAKEA 420 430 440 450 460 470 770 780 790 800 810 820 pF1KB9 QLNLRPVDVDPECLRWTPVIVSNSVVSEEEEEEAEEGENEEPQCQERELEISVGKSVSHE . . .:: ::.::: CCDS56 KRSNSNKTMDPSCLKWTPPKGT 480 490 500 >>CCDS56038.1 KAT7 gene_id:11143|Hs108|chr17 (442 aa) initn: 1182 init1: 1127 opt: 1215 Z-score: 461.3 bits: 96.7 E(32554): 2.2e-19 Smith-Waterman score: 1215; 47.4% identity (73.6% similar) in 416 aa overlap (369-778:27-438) 340 350 360 370 380 390 pF1KB9 KNRLKKQNTVSKGPFSKVRTGPGRGRKRKITLSSQSASSSSEEGYLERIDGLDFCRDSNV : ::.: ..: . . . : .. . ..:. CCDS56 MPRRKRNAGSSSDGTEDSDFSTDLEHTDSSESDGTSRRSARVTR-SSARLSQSSQG 10 20 30 40 50 400 410 420 430 440 450 pF1KB9 SLKFNKKTKGLIDGLTKFFTPSPDGRKARGEV-VDYSEQY-RIRKRGNRKSSTSDWPTDN : ... . :.: . . : : :: : . :.:. ..::. : .. ... CCDS56 HLTGKHERHFSISGCPLYHNLSADECKAPTERQLRYKEKVAELRKKRN-SGLSKEQKEKY 60 70 80 90 100 110 460 470 480 490 500 510 pF1KB9 QDGWDGKQENEERLFGSQEIMTEKDMELFRDIQEQA---LQKVGVTGPPDPQVRCPSVIE .. . ...: :. ... .: :..::: : .: :.:. . : ..: CCDS56 MEHRQTYGNTREPLL--ENLTSEYDLDLFRRAQARASEDLEKLRLQGQITEGSNMIKTIA 120 130 140 150 160 170 520 530 540 550 560 570 pF1KB9 FGKYEIHTWYSSPYPQEYSRLPKLYLCEFCLKYMKSRTILQQHMKKCGWFHPPANEIYRK ::.::. ::: ::::.::.:: .::.::::::::::.:::..:: :: : :::..::::: CCDS56 FGRYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQTILRRHMAKCVWKHPPGDEIYRK 180 190 200 210 220 230 580 590 600 610 620 630 pF1KB9 NNISVFEVDGNVSTIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTQNDVKGCHLVGYFS ..::::::::. . ::::::::::::::::::::::::::::::.:. : ::::.:::: CCDS56 GSISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVMTEADNTGCHLIGYFS 240 250 260 270 280 290 640 650 660 670 680 690 pF1KB9 KEKHCQQKYNVSCIMILPQYQRKGYGRFLIDFSYLLSKREGQAGSPEKPLSDLGRLSYMA :::. .::::::. .:::.:.:::..:::::::::: : ..::::.:::::: .:: . CCDS56 KEKNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSKVEEKVGSPERPLSDLGLISYRS 300 310 320 330 340 350 700 710 720 730 740 750 pF1KB9 YWKSVILECLYHQNDKQISIKKLSKLTGICPQDITSTLHHLRMLDFRSDQFVIIRREKLI ::: :.:. :.. . :.::::..:. :.. : ::.:::. :.:: . . . ....:. :: CCDS56 YWKEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTLQALQMLKYWKGKHLVLKRQDLI 360 370 380 390 400 410 760 770 780 790 800 810 pF1KB9 QDHMAK-LQLNLRPVDVDPECLRWTPVIVSNSVVSEEEEEEAEEGENEEPQCQERELEIS .. .:: . . .:: ::.::: CCDS56 DEWIAKEAKRSNSNKTMDPSCLKWTPPKGT 420 430 440 >>CCDS56037.1 KAT7 gene_id:11143|Hs108|chr17 (472 aa) initn: 1182 init1: 1127 opt: 1209 Z-score: 458.8 bits: 96.3 E(32554): 3.1e-19 Smith-Waterman score: 1212; 45.5% identity (71.9% similar) in 437 aa overlap (359-778:34-468) 330 340 350 360 370 380 pF1KB9 RRYTNPIGRPKNRLKKQNTVSKGPFSKVRTGPGRGRKRKITLSSQSASSSSE---EGYLE : .: :. ..: :: :.::. : : CCDS56 RKRNAGSSSDGTEDSDFSTDLEHTDSSESDGTSR-RSARVTRSSARLSQSSQGHLTGKHE 10 20 30 40 50 60 390 400 410 420 430 pF1KB9 R---IDGLDFCRD---SNVSLKFNKKTKGLIDGLTKFFTPSPDGRKARGEVVDYSEQYRI : :.: . .. .. ... ... : . . . . . ..:.: . . .: : CCDS56 RHFSISGCPLYHNLSADECKVRAQSRDKQIEERMLSH-RQDDNNRHATRHQAPTERQLRY 70 80 90 100 110 120 440 450 460 470 480 490 pF1KB9 RKRGN--RKSSTSDWPTDNQDGW-DGKQE-NEERLFGSQEIMTEKDMELFRDIQEQA--- ... ::. .: .... . . .: .. : ... .: :..::: : .: CCDS56 KEKVAELRKKRNSGLSKEQKEKYMEHRQTYGNTREPLLENLTSEYDLDLFRRAQARASED 130 140 150 160 170 180 500 510 520 530 540 550 pF1KB9 LQKVGVTGPPDPQVRCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLCEFCLKYMKSRTI :.:. . : ..: ::.::. ::: ::::.::.:: .::.::::::::::.:: CCDS56 LEKLRLQGQITEGSNMIKTIAFGRYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQTI 190 200 210 220 230 240 560 570 580 590 600 610 pF1KB9 LQQHMKKCGWFHPPANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLFLDHKTLYYDVEP :..:: :: : :::..:::::..::::::::. . ::::::::::::::::::::::::: CCDS56 LRRHMAKCVWKHPPGDEIYRKGSISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVEP 250 260 270 280 290 300 620 630 640 650 660 670 pF1KB9 FLFYVLTQNDVKGCHLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGRFLIDFSYLLSKR :::::.:. : ::::.:::::::. .::::::. .:::.:.:::..:::::::::: CCDS56 FLFYVMTEADNTGCHLIGYFSKEKNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSKV 310 320 330 340 350 360 680 690 700 710 720 730 pF1KB9 EGQAGSPEKPLSDLGRLSYMAYWKSVILECLYHQNDKQISIKKLSKLTGICPQDITSTLH : ..::::.:::::: .:: .::: :.:. :.. . :.::::..:. :.. : ::.:::. CCDS56 EEKVGSPERPLSDLGLISYRSYWKEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTLQ 370 380 390 400 410 420 740 750 760 770 780 790 pF1KB9 HLRMLDFRSDQFVIIRREKLIQDHMAK-LQLNLRPVDVDPECLRWTPVIVSNSVVSEEEE :.:: . . . ....:. ::.. .:: . . .:: ::.::: CCDS56 ALQMLKYWKGKHLVLKRQDLIDEWIAKEAKRSNSNKTMDPSCLKWTPPKGT 430 440 450 460 470 800 810 820 830 840 850 pF1KB9 EEAEEGENEEPQCQERELEISVGKSVSHENKEQDSYSVESEKKPEVMAPVSSTRLSKQVL >>CCDS56035.1 KAT7 gene_id:11143|Hs108|chr17 (581 aa) initn: 1182 init1: 1127 opt: 1210 Z-score: 457.8 bits: 96.4 E(32554): 3.5e-19 Smith-Waterman score: 1210; 50.4% identity (75.2% similar) in 375 aa overlap (410-778:206-577) 380 390 400 410 420 430 pF1KB9 EEGYLERIDGLDFCRDSNVSLKFNKKTKGLIDGLTKFFTPSPDGRKARGEV-VDYSEQY- :.: . . : : :: : . :.:. CCDS56 HESYNFNMKCPTPGCNSLGHLTGKHERHFSISGCPLYHNLSADECKAPTERQLRYKEKVA 180 190 200 210 220 230 440 450 460 470 480 490 pF1KB9 RIRKRGNRKSSTSDWPTDNQDGWDGKQENEERLFGSQEIMTEKDMELFRDIQEQA---LQ ..::. : .. ... .. . ...: :. ... .: :..::: : .: :. CCDS56 ELRKKRN-SGLSKEQKEKYMEHRQTYGNTREPLL--ENLTSEYDLDLFRRAQARASEDLE 240 250 260 270 280 290 500 510 520 530 540 550 pF1KB9 KVGVTGPPDPQVRCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLCEFCLKYMKSRTILQ :. . : ..: ::.::. ::: ::::.::.:: .::.::::::::::.:::. CCDS56 KLRLQGQITEGSNMIKTIAFGRYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQTILR 300 310 320 330 340 350 560 570 580 590 600 610 pF1KB9 QHMKKCGWFHPPANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLFLDHKTLYYDVEPFL .:: :: : :::..:::::..::::::::. . ::::::::::::::::::::::::::: CCDS56 RHMAKCVWKHPPGDEIYRKGSISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVEPFL 360 370 380 390 400 410 620 630 640 650 660 670 pF1KB9 FYVLTQNDVKGCHLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGRFLIDFSYLLSKREG :::.:. : ::::.:::::::. .::::::. .:::.:.:::..:::::::::: : CCDS56 FYVMTEADNTGCHLIGYFSKEKNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSKVEE 420 430 440 450 460 470 680 690 700 710 720 730 pF1KB9 QAGSPEKPLSDLGRLSYMAYWKSVILECLYHQNDKQISIKKLSKLTGICPQDITSTLHHL ..::::.:::::: .:: .::: :.:. :.. . :.::::..:. :.. : ::.:::. : CCDS56 KVGSPERPLSDLGLISYRSYWKEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTLQAL 480 490 500 510 520 530 740 750 760 770 780 790 pF1KB9 RMLDFRSDQFVIIRREKLIQDHMAK-LQLNLRPVDVDPECLRWTPVIVSNSVVSEEEEEE .:: . . . ....:. ::.. .:: . . .:: ::.::: CCDS56 QMLKYWKGKHLVLKRQDLIDEWIAKEAKRSNSNKTMDPSCLKWTPPKGT 540 550 560 570 580 800 810 820 830 840 850 pF1KB9 AEEGENEEPQCQERELEISVGKSVSHENKEQDSYSVESEKKPEVMAPVSSTRLSKQVLPH >>CCDS11554.1 KAT7 gene_id:11143|Hs108|chr17 (611 aa) initn: 1182 init1: 1127 opt: 1209 Z-score: 457.1 bits: 96.4 E(32554): 3.9e-19 Smith-Waterman score: 1209; 56.6% identity (79.9% similar) in 309 aa overlap (474-778:299-607) 450 460 470 480 490 500 pF1KB9 NRKSSTSDWPTDNQDGWDGKQENEERLFGSQEIMTEKDMELFRDIQEQA---LQKVGVTG ... .: :..::: : .: :.:. . : CCDS11 KKRNSGLSKEQKEKYMEHRQTYGNTREPLLENLTSEYDLDLFRRAQARASEDLEKLRLQG 270 280 290 300 310 320 510 520 530 540 550 560 pF1KB9 PPDPQVRCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLCEFCLKYMKSRTILQQHMKKC ..: ::.::. ::: ::::.::.:: .::.::::::::::.:::..:: :: CCDS11 QITEGSNMIKTIAFGRYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQTILRRHMAKC 330 340 350 360 370 380 570 580 590 600 610 620 pF1KB9 GWFHPPANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTQ : :::..:::::..::::::::. . ::::::::::::::::::::::::::::::.:. CCDS11 VWKHPPGDEIYRKGSISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVMTE 390 400 410 420 430 440 630 640 650 660 670 680 pF1KB9 NDVKGCHLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGRFLIDFSYLLSKREGQAGSPE : ::::.:::::::. .::::::. .:::.:.:::..:::::::::: : ..:::: CCDS11 ADNTGCHLIGYFSKEKNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSKVEEKVGSPE 450 460 470 480 490 500 690 700 710 720 730 740 pF1KB9 KPLSDLGRLSYMAYWKSVILECLYHQNDKQISIKKLSKLTGICPQDITSTLHHLRMLDFR .:::::: .:: .::: :.:. :.. . :.::::..:. :.. : ::.:::. :.:: . CCDS11 RPLSDLGLISYRSYWKEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTLQALQMLKYW 510 520 530 540 550 560 750 760 770 780 790 pF1KB9 SDQFVIIRREKLIQDHMAK-LQLNLRPVDVDPECLRWTPVIVSNSVVSEEEEEEAEEGEN . . ....:. ::.. .:: . . .:: ::.::: CCDS11 KGKHLVLKRQDLIDEWIAKEAKRSNSNKTMDPSCLKWTPPKGT 570 580 590 600 610 800 810 820 830 840 850 pF1KB9 EEPQCQERELEISVGKSVSHENKEQDSYSVESEKKPEVMAPVSSTRLSKQVLPHDSLPAN 2004 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 17:16:03 2016 done: Fri Nov 4 17:16:04 2016 Total Scan time: 7.620 Total Display time: 0.860 Function used was FASTA [36.3.4 Apr, 2011]