FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9396, 3969 aa 1>>>pF1KE9396 3969 - 3969 aa - 3969 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 13.8452+/-0.00119; mu= -8.6754+/- 0.072 mean_var=498.3876+/-102.246, 0's: 0 Z-trim(115.0): 56 B-trim: 3 in 1/54 Lambda= 0.057450 statistics sampled from 15529 (15573) to 15529 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.739), E-opt: 0.2 (0.478), width: 16 Scan time: 10.090 The best scores are: opt bits E(32554) CCDS31686.1 KMT2A gene_id:4297|Hs108|chr11 (3969) 26471 2211.0 0 CCDS55791.1 KMT2A gene_id:4297|Hs108|chr11 (3972) 26455 2209.7 0 CCDS46055.1 KMT2B gene_id:9757|Hs108|chr19 (2715) 1674 155.6 4.9e-36 >>CCDS31686.1 KMT2A gene_id:4297|Hs108|chr11 (3969 aa) initn: 26471 init1: 26471 opt: 26471 Z-score: 11865.6 bits: 2211.0 E(32554): 0 Smith-Waterman score: 26471; 100.0% identity (100.0% similar) in 3969 aa overlap (1-3969:1-3969) 10 20 30 40 50 60 pF1KE9 MAHSCRWRFPARPGTTGGGGGGGRRGLGGAPRQRVPALLLPPGPPVGGGGPGAPPSPPAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MAHSCRWRFPARPGTTGGGGGGGRRGLGGAPRQRVPALLLPPGPPVGGGGPGAPPSPPAV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 AAAAAAAGSSGAGVPGGAAAASAASSSSASSSSSSSSSASSGPALLRVGPGFDAALQVSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 AAAAAAAGSSGAGVPGGAAAASAASSSSASSSSSSSSSASSGPALLRVGPGFDAALQVSA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 AIGTNLRRFRAVFGESGGGGGSGEDEQFLGFGSDEEVRVRSPTRSPSVKTSPRKPRGRPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 AIGTNLRRFRAVFGESGGGGGSGEDEQFLGFGSDEEVRVRSPTRSPSVKTSPRKPRGRPR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 SGSDRNSAILSDPSVFSPLNKSETKSGDKIKKKDSKSIEKKRGRPPTFPGVKIKITHGKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SGSDRNSAILSDPSVFSPLNKSETKSGDKIKKKDSKSIEKKRGRPPTFPGVKIKITHGKD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 ISELPKGNKEDSLKKIKRTPSATFQQATKIKKLRAGKLSPLKSKFKTGKLQIGRKGVQIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ISELPKGNKEDSLKKIKRTPSATFQQATKIKKLRAGKLSPLKSKFKTGKLQIGRKGVQIV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 RRRGRPPSTERIKTPSGLLINSELEKPQKVRKDKEGTPPLTKEDKTVVRQSPRRIKPVRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RRRGRPPSTERIKTPSGLLINSELEKPQKVRKDKEGTPPLTKEDKTVVRQSPRRIKPVRI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 IPSSKRTDATIAKQLLQRAKKGAQKKIEKEAAQLQGRKVKTQVKNIRQFIMPVVSAISSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IPSSKRTDATIAKQLLQRAKKGAQKKIEKEAAQLQGRKVKTQVKNIRQFIMPVVSAISSR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 IIKTPRRFIEDEDYDPPIKIARLESTPNSRFSAPSCGSSEKSSAASQHSSQMSSDSSRSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IIKTPRRFIEDEDYDPPIKIARLESTPNSRFSAPSCGSSEKSSAASQHSSQMSSDSSRSS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 SPSVDTSTDSQASEEIQVLPEERSDTPEVHPPLPISQSPENESNDRRSRRYSVSERSFGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SPSVDTSTDSQASEEIQVLPEERSDTPEVHPPLPISQSPENESNDRRSRRYSVSERSFGS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 RTTKKLSTLQSAPQQQTSSSPPPPLLTPPPPLQPASSISDHTPWLMPPTIPLASPFLPAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RTTKKLSTLQSAPQQQTSSSPPPPLLTPPPPLQPASSISDHTPWLMPPTIPLASPFLPAS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 TAPMQGKRKSILREPTFRWTSLKHSRSEPQYFSSAKYAKEGLIRKPIFDNFRPPPLTPED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TAPMQGKRKSILREPTFRWTSLKHSRSEPQYFSSAKYAKEGLIRKPIFDNFRPPPLTPED 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 VGFASGFSASGTAASARLFSPLHSGTRFDMHKRSPLLRAPRFTPSEAHSRIFESVTLPSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VGFASGFSASGTAASARLFSPLHSGTRFDMHKRSPLLRAPRFTPSEAHSRIFESVTLPSN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 RTSAGTSSSGVSNRKRKRKVFSPIRSEPRSPSHSMRTRSGRLSSSELSPLTPPSSVSSSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RTSAGTSSSGVSNRKRKRKVFSPIRSEPRSPSHSMRTRSGRLSSSELSPLTPPSSVSSSL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 SISVSPLATSALNPTFTFPSHSLTQSGESAEKNQRPRKQTSAPAEPFSSSSPTPLFPWFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SISVSPLATSALNPTFTFPSHSLTQSGESAEKNQRPRKQTSAPAEPFSSSSPTPLFPWFT 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 PGSQTERGRNKDKAPEELSKDRDADKSVEKDKSRERDREREKENKRESRKEKRKKGSEIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PGSQTERGRNKDKAPEELSKDRDADKSVEKDKSRERDREREKENKRESRKEKRKKGSEIQ 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 SSSALYPVGRVSKEKVVGEDVATSSSAKKATGRKKSSSHDSGTDITSVTLGDTTAVKTKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SSSALYPVGRVSKEKVVGEDVATSSSAKKATGRKKSSSHDSGTDITSVTLGDTTAVKTKI 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE9 LIKKGRGNLEKTNLDLGPTAPSLEKEKTLCLSTPSSSTVKHSTSSIGSMLAQADKLPMTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LIKKGRGNLEKTNLDLGPTAPSLEKEKTLCLSTPSSSTVKHSTSSIGSMLAQADKLPMTD 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE9 KRVASLLKKAKAQLCKIEKSKSLKQTDQPKAQGQESDSSETSVRGPRIKHVCRRAAVALG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KRVASLLKKAKAQLCKIEKSKSLKQTDQPKAQGQESDSSETSVRGPRIKHVCRRAAVALG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE9 RKRAVFPDDMPTLSALPWEEREKILSSMGNDDKSSIAGSEDAEPLAPPIKPIKPVTRNKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RKRAVFPDDMPTLSALPWEEREKILSSMGNDDKSSIAGSEDAEPLAPPIKPIKPVTRNKA 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE9 PQEPPVKKGRRSRRCGQCPGCQVPEDCGVCTNCLDKPKFGGRNIKKQCCKMRKCQNLQWM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PQEPPVKKGRRSRRCGQCPGCQVPEDCGVCTNCLDKPKFGGRNIKKQCCKMRKCQNLQWM 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE9 PSKAYLQKQAKAVKKKEKKSKTSEKKDSKESSVVKNVVDSSQKPTPSAREDPAPKKSSSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PSKAYLQKQAKAVKKKEKKSKTSEKKDSKESSVVKNVVDSSQKPTPSAREDPAPKKSSSE 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE9 PPPRKPVEEKSEEGNVSAPGPESKQATTPASRKSSKQVSQPALVIPPQPPTTGPPRKEVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PPPRKPVEEKSEEGNVSAPGPESKQATTPASRKSSKQVSQPALVIPPQPPTTGPPRKEVP 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE9 KTTPSEPKKKQPPPPESGPEQSKQKKVAPRPSIPVKQKPKEKEKPPPVNKQENAGTLNIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KTTPSEPKKKQPPPPESGPEQSKQKKVAPRPSIPVKQKPKEKEKPPPVNKQENAGTLNIL 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE9 STLSNGNSSKQKIPADGVHRIRVDFKEDCEAENVWEMGGLGILTSVPITPRVVCFLCASS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 STLSNGNSSKQKIPADGVHRIRVDFKEDCEAENVWEMGGLGILTSVPITPRVVCFLCASS 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE9 GHVEFVYCQVCCEPFHKFCLEENERPLEDQLENWCCRRCKFCHVCGRQHQATKQLLECNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GHVEFVYCQVCCEPFHKFCLEENERPLEDQLENWCCRRCKFCHVCGRQHQATKQLLECNK 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE9 CRNSYHPECLGPNYPTKPTKKKKVWICTKCVRCKSCGSTTPGKGWDAQWSHDFSLCHDCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CRNSYHPECLGPNYPTKPTKKKKVWICTKCVRCKSCGSTTPGKGWDAQWSHDFSLCHDCA 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE9 KLFAKGNFCPLCDKCYDDDDYESKMMQCGKCDRWVHSKCENLSDEMYEILSNLPESVAYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KLFAKGNFCPLCDKCYDDDDYESKMMQCGKCDRWVHSKCENLSDEMYEILSNLPESVAYT 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE9 CVNCTERHPAEWRLALEKELQISLKQVLTALLNSRTTSHLLRYRQAAKPPDLNPETEESI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CVNCTERHPAEWRLALEKELQISLKQVLTALLNSRTTSHLLRYRQAAKPPDLNPETEESI 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE9 PSRSSPEGPDPPVLTEVSKQDDQQPLDLEGVKRKMDQGNYTSVLEFSDDIVKIIQAAINS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PSRSSPEGPDPPVLTEVSKQDDQQPLDLEGVKRKMDQGNYTSVLEFSDDIVKIIQAAINS 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE9 DGGQPEIKKANSMVKSFFIRQMERVFPWFSVKKSRFWEPNKVSSNSGMLPNAVLPPSLDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DGGQPEIKKANSMVKSFFIRQMERVFPWFSVKKSRFWEPNKVSSNSGMLPNAVLPPSLDH 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE9 NYAQWQEREENSHTEQPPLMKKIIPAPKPKGPGEPDSPTPLHPPTPPILSTDRSREDSPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NYAQWQEREENSHTEQPPLMKKIIPAPKPKGPGEPDSPTPLHPPTPPILSTDRSREDSPE 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE9 LNPPPGIEDNRQCALCLTYGDDSANDAGRLLYIGQNEWTHVNCALWSAEVFEDDDGSLKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LNPPPGIEDNRQCALCLTYGDDSANDAGRLLYIGQNEWTHVNCALWSAEVFEDDDGSLKN 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE9 VHMAVIRGKQLRCEFCQKPGATVGCCLTSCTSNYHFMCSRAKNCVFLDDKKVYCQRHRDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VHMAVIRGKQLRCEFCQKPGATVGCCLTSCTSNYHFMCSRAKNCVFLDDKKVYCQRHRDL 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE9 IKGEVVPENGFEVFRRVFVDFEGISLRRKFLNGLEPENIHMMIGSMTIDCLGILNDLSDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IKGEVVPENGFEVFRRVFVDFEGISLRRKFLNGLEPENIHMMIGSMTIDCLGILNDLSDC 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE9 EDKLFPIGYQCSRVYWSTTDARKRCVYTCKIVECRPPVVEPDINSTVEHDENRTIAHSPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EDKLFPIGYQCSRVYWSTTDARKRCVYTCKIVECRPPVVEPDINSTVEHDENRTIAHSPT 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE9 SFTESSSKESQNTAEIISPPSPDRPPHSQTSGSCYYHVISKVPRIRTPSYSPTQRSPGCR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SFTESSSKESQNTAEIISPPSPDRPPHSQTSGSCYYHVISKVPRIRTPSYSPTQRSPGCR 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE9 PLPSAGSPTPTTHEIVTVGDPLLSSGLRSIGSRRHSTSSLSPQRSKLRIMSPMRTGNTYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PLPSAGSPTPTTHEIVTVGDPLLSSGLRSIGSRRHSTSSLSPQRSKLRIMSPMRTGNTYS 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KE9 RNNVSSVSTTGTATDLESSAKVVDHVLGPLNSSTSLGQNTSTSSNLQRTVVTVGNKNSHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RNNVSSVSTTGTATDLESSAKVVDHVLGPLNSSTSLGQNTSTSSNLQRTVVTVGNKNSHL 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KE9 DGSSSSEMKQSSASDLVSKSSSLKGEKTKVLSSKSSEGSAHNVAYPGIPKLAPQVHNTTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DGSSSSEMKQSSASDLVSKSSSLKGEKTKVLSSKSSEGSAHNVAYPGIPKLAPQVHNTTS 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 2400 pF1KE9 RELNVSKIGSFAEPSSVSFSSKEALSFPHLHLRGQRNDRDQHTDSTQSANSSPDEDTEVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RELNVSKIGSFAEPSSVSFSSKEALSFPHLHLRGQRNDRDQHTDSTQSANSSPDEDTEVK 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 2450 2460 pF1KE9 TLKLSGMSNRSSIINEHMGSSSRDRRQKGKKSCKETFKEKHSSKSFLEPGQVTTGEEGNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TLKLSGMSNRSSIINEHMGSSSRDRRQKGKKSCKETFKEKHSSKSFLEPGQVTTGEEGNL 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500 2510 2520 pF1KE9 KPEFMDEVLTPEYMGQRPCNNVSSDKIGDKGLSMPGVPKAPPMQVEGSAKELQAPRKRTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KPEFMDEVLTPEYMGQRPCNNVSSDKIGDKGLSMPGVPKAPPMQVEGSAKELQAPRKRTV 2470 2480 2490 2500 2510 2520 2530 2540 2550 2560 2570 2580 pF1KE9 KVTLTPLKMENESQSKNALKESSPASPLQIESTSPTEPISASENPGDGPVAQPSPNNTSC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KVTLTPLKMENESQSKNALKESSPASPLQIESTSPTEPISASENPGDGPVAQPSPNNTSC 2530 2540 2550 2560 2570 2580 2590 2600 2610 2620 2630 2640 pF1KE9 QDSQSNNYQNLPVQDRNLMLPDGPKPQEDGSFKRRYPRRSARARSNMFFGLTPLYGVRSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QDSQSNNYQNLPVQDRNLMLPDGPKPQEDGSFKRRYPRRSARARSNMFFGLTPLYGVRSY 2590 2600 2610 2620 2630 2640 2650 2660 2670 2680 2690 2700 pF1KE9 GEEDIPFYSSSTGKKRGKRSAEGQVDGADDLSTSDEDDLYYYNFTRTVISSGGEERLASH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GEEDIPFYSSSTGKKRGKRSAEGQVDGADDLSTSDEDDLYYYNFTRTVISSGGEERLASH 2650 2660 2670 2680 2690 2700 2710 2720 2730 2740 2750 2760 pF1KE9 NLFREEEQCDLPKISQLDGVDDGTESDTSVTATTRKSSQIPKRNGKENGTENLKIDRPED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NLFREEEQCDLPKISQLDGVDDGTESDTSVTATTRKSSQIPKRNGKENGTENLKIDRPED 2710 2720 2730 2740 2750 2760 2770 2780 2790 2800 2810 2820 pF1KE9 AGEKEHVTKSSVGHKNEPKMDNCHSVSRVKTQGQDSLEAQLSSLESSRRVHTSTPSDKNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 AGEKEHVTKSSVGHKNEPKMDNCHSVSRVKTQGQDSLEAQLSSLESSRRVHTSTPSDKNL 2770 2780 2790 2800 2810 2820 2830 2840 2850 2860 2870 2880 pF1KE9 LDTYNTELLKSDSDNNNSDDCGNILPSDIMDFVLKNTPSMQALGESPESSSSELLNLGEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LDTYNTELLKSDSDNNNSDDCGNILPSDIMDFVLKNTPSMQALGESPESSSSELLNLGEG 2830 2840 2850 2860 2870 2880 2890 2900 2910 2920 2930 2940 pF1KE9 LGLDSNREKDMGLFEVFSQQLPTTEPVDSSVSSSISAEEQFELPLELPSDLSVLTTRSPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LGLDSNREKDMGLFEVFSQQLPTTEPVDSSVSSSISAEEQFELPLELPSDLSVLTTRSPT 2890 2900 2910 2920 2930 2940 2950 2960 2970 2980 2990 3000 pF1KE9 VPSQNPSRLAVISDSGEKRVTITEKSVASSESDPALLSPGVDPTPEGHMTPDHFIQGHMD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VPSQNPSRLAVISDSGEKRVTITEKSVASSESDPALLSPGVDPTPEGHMTPDHFIQGHMD 2950 2960 2970 2980 2990 3000 3010 3020 3030 3040 3050 3060 pF1KE9 ADHISSPPCGSVEQGHGNNQDLTRNSSTPGLQVPVSPTVPIQNQKYVPNSTDSPGPSQIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ADHISSPPCGSVEQGHGNNQDLTRNSSTPGLQVPVSPTVPIQNQKYVPNSTDSPGPSQIS 3010 3020 3030 3040 3050 3060 3070 3080 3090 3100 3110 3120 pF1KE9 NAAVQTTPPHLKPATEKLIVVNQNMQPLYVLQTLPNGVTQKIQLTSSVSSTPSVMETNTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NAAVQTTPPHLKPATEKLIVVNQNMQPLYVLQTLPNGVTQKIQLTSSVSSTPSVMETNTS 3070 3080 3090 3100 3110 3120 3130 3140 3150 3160 3170 3180 pF1KE9 VLGPMGGGLTLTTGLNPSLPTSQSLFPSASKGLLPMSHHQHLHSFPAATQSSFPPNISNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VLGPMGGGLTLTTGLNPSLPTSQSLFPSASKGLLPMSHHQHLHSFPAATQSSFPPNISNP 3130 3140 3150 3160 3170 3180 3190 3200 3210 3220 3230 3240 pF1KE9 PSGLLIGVQPPPDPQLLVSESSQRTDLSTTVATPSSGLKKRPISRLQTRKNKKLAPSSTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PSGLLIGVQPPPDPQLLVSESSQRTDLSTTVATPSSGLKKRPISRLQTRKNKKLAPSSTP 3190 3200 3210 3220 3230 3240 3250 3260 3270 3280 3290 3300 pF1KE9 SNIAPSDVVSNMTLINFTPSQLPNHPSLLDLGSLNTSSHRTVPNIIKRSKSSIMYFEPAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SNIAPSDVVSNMTLINFTPSQLPNHPSLLDLGSLNTSSHRTVPNIIKRSKSSIMYFEPAP 3250 3260 3270 3280 3290 3300 3310 3320 3330 3340 3350 3360 pF1KE9 LLPQSVGGTAATAAGTSTISQDTSHLTSGSVSGLASSSSVLNVVSMQTTTTPTSSASVPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LLPQSVGGTAATAAGTSTISQDTSHLTSGSVSGLASSSSVLNVVSMQTTTTPTSSASVPG 3310 3320 3330 3340 3350 3360 3370 3380 3390 3400 3410 3420 pF1KE9 HVTLTNPRLLGTPDIGSISNLLIKASQQSLGIQDQPVALPPSSGMFPQLGTSQTPSTAAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 HVTLTNPRLLGTPDIGSISNLLIKASQQSLGIQDQPVALPPSSGMFPQLGTSQTPSTAAI 3370 3380 3390 3400 3410 3420 3430 3440 3450 3460 3470 3480 pF1KE9 TAASSICVLPSTQTTGITAASPSGEADEHYQLQHVNQLLASKTGIHSSQRDLDSASGPQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TAASSICVLPSTQTTGITAASPSGEADEHYQLQHVNQLLASKTGIHSSQRDLDSASGPQV 3430 3440 3450 3460 3470 3480 3490 3500 3510 3520 3530 3540 pF1KE9 SNFTQTVDAPNSMGLEQNKALSSAVQASPTSPGGSPSSPSSGQRSASPSVPGPTKPKPKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SNFTQTVDAPNSMGLEQNKALSSAVQASPTSPGGSPSSPSSGQRSASPSVPGPTKPKPKT 3490 3500 3510 3520 3530 3540 3550 3560 3570 3580 3590 3600 pF1KE9 KRFQLPLDKGNGKKHKVSHLRTSSSEAHIPDQETTSLTSGTGTPGAEAEQQDTASVEQSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KRFQLPLDKGNGKKHKVSHLRTSSSEAHIPDQETTSLTSGTGTPGAEAEQQDTASVEQSS 3550 3560 3570 3580 3590 3600 3610 3620 3630 3640 3650 3660 pF1KE9 QKECGQPAGQVAVLPEVQVTQNPANEQESAEPKTVEEEESNFSSPLMLWLQQEQKRKESI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QKECGQPAGQVAVLPEVQVTQNPANEQESAEPKTVEEEESNFSSPLMLWLQQEQKRKESI 3610 3620 3630 3640 3650 3660 3670 3680 3690 3700 3710 3720 pF1KE9 TEKKPKKGLVFEISSDDGFQICAESIEDAWKSLTDKVQEARSNARLKQLSFAGVNGLRML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TEKKPKKGLVFEISSDDGFQICAESIEDAWKSLTDKVQEARSNARLKQLSFAGVNGLRML 3670 3680 3690 3700 3710 3720 3730 3740 3750 3760 3770 3780 pF1KE9 GILHDAVVFLIEQLSGAKHCRNYKFRFHKPEEANEPPLNPHGSARAEVHLRKSAFDMFNF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GILHDAVVFLIEQLSGAKHCRNYKFRFHKPEEANEPPLNPHGSARAEVHLRKSAFDMFNF 3730 3740 3750 3760 3770 3780 3790 3800 3810 3820 3830 3840 pF1KE9 LASKHRQPPEYNPNDEEEEEVQLKSARRATSMDLPMPMRFRHLKKTSKEAVGVYRSPIHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LASKHRQPPEYNPNDEEEEEVQLKSARRATSMDLPMPMRFRHLKKTSKEAVGVYRSPIHG 3790 3800 3810 3820 3830 3840 3850 3860 3870 3880 3890 3900 pF1KE9 RGLFCKRNIDAGEMVIEYAGNVIRSIQTDKREKYYDSKGIGCYMFRIDDSEVVDATMHGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RGLFCKRNIDAGEMVIEYAGNVIRSIQTDKREKYYDSKGIGCYMFRIDDSEVVDATMHGN 3850 3860 3870 3880 3890 3900 3910 3920 3930 3940 3950 3960 pF1KE9 AARFINHSCEPNCYSRVINIDGQKHIVIFAMRKIYRGEELTYDYKFPIEDASNKLPCNCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 AARFINHSCEPNCYSRVINIDGQKHIVIFAMRKIYRGEELTYDYKFPIEDASNKLPCNCG 3910 3920 3930 3940 3950 3960 pF1KE9 AKKCRKFLN ::::::::: CCDS31 AKKCRKFLN >>CCDS55791.1 KMT2A gene_id:4297|Hs108|chr11 (3972 aa) initn: 15682 init1: 15682 opt: 26455 Z-score: 11858.4 bits: 2209.7 E(32554): 0 Smith-Waterman score: 26455; 99.9% identity (99.9% similar) in 3972 aa overlap (1-3969:1-3972) 10 20 30 40 50 60 pF1KE9 MAHSCRWRFPARPGTTGGGGGGGRRGLGGAPRQRVPALLLPPGPPVGGGGPGAPPSPPAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MAHSCRWRFPARPGTTGGGGGGGRRGLGGAPRQRVPALLLPPGPPVGGGGPGAPPSPPAV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 AAAAAAAGSSGAGVPGGAAAASAASSSSASSSSSSSSSASSGPALLRVGPGFDAALQVSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 AAAAAAAGSSGAGVPGGAAAASAASSSSASSSSSSSSSASSGPALLRVGPGFDAALQVSA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 AIGTNLRRFRAVFGESGGGGGSGEDEQFLGFGSDEEVRVRSPTRSPSVKTSPRKPRGRPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 AIGTNLRRFRAVFGESGGGGGSGEDEQFLGFGSDEEVRVRSPTRSPSVKTSPRKPRGRPR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 SGSDRNSAILSDPSVFSPLNKSETKSGDKIKKKDSKSIEKKRGRPPTFPGVKIKITHGKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SGSDRNSAILSDPSVFSPLNKSETKSGDKIKKKDSKSIEKKRGRPPTFPGVKIKITHGKD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 ISELPKGNKEDSLKKIKRTPSATFQQATKIKKLRAGKLSPLKSKFKTGKLQIGRKGVQIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ISELPKGNKEDSLKKIKRTPSATFQQATKIKKLRAGKLSPLKSKFKTGKLQIGRKGVQIV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 RRRGRPPSTERIKTPSGLLINSELEKPQKVRKDKEGTPPLTKEDKTVVRQSPRRIKPVRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RRRGRPPSTERIKTPSGLLINSELEKPQKVRKDKEGTPPLTKEDKTVVRQSPRRIKPVRI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 IPSSKRTDATIAKQLLQRAKKGAQKKIEKEAAQLQGRKVKTQVKNIRQFIMPVVSAISSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IPSSKRTDATIAKQLLQRAKKGAQKKIEKEAAQLQGRKVKTQVKNIRQFIMPVVSAISSR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 IIKTPRRFIEDEDYDPPIKIARLESTPNSRFSAPSCGSSEKSSAASQHSSQMSSDSSRSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IIKTPRRFIEDEDYDPPIKIARLESTPNSRFSAPSCGSSEKSSAASQHSSQMSSDSSRSS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 SPSVDTSTDSQASEEIQVLPEERSDTPEVHPPLPISQSPENESNDRRSRRYSVSERSFGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SPSVDTSTDSQASEEIQVLPEERSDTPEVHPPLPISQSPENESNDRRSRRYSVSERSFGS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 RTTKKLSTLQSAPQQQTSSSPPPPLLTPPPPLQPASSISDHTPWLMPPTIPLASPFLPAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RTTKKLSTLQSAPQQQTSSSPPPPLLTPPPPLQPASSISDHTPWLMPPTIPLASPFLPAS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 TAPMQGKRKSILREPTFRWTSLKHSRSEPQYFSSAKYAKEGLIRKPIFDNFRPPPLTPED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TAPMQGKRKSILREPTFRWTSLKHSRSEPQYFSSAKYAKEGLIRKPIFDNFRPPPLTPED 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 VGFASGFSASGTAASARLFSPLHSGTRFDMHKRSPLLRAPRFTPSEAHSRIFESVTLPSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VGFASGFSASGTAASARLFSPLHSGTRFDMHKRSPLLRAPRFTPSEAHSRIFESVTLPSN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 RTSAGTSSSGVSNRKRKRKVFSPIRSEPRSPSHSMRTRSGRLSSSELSPLTPPSSVSSSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RTSAGTSSSGVSNRKRKRKVFSPIRSEPRSPSHSMRTRSGRLSSSELSPLTPPSSVSSSL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 SISVSPLATSALNPTFTFPSHSLTQSGESAEKNQRPRKQTSAPAEPFSSSSPTPLFPWFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SISVSPLATSALNPTFTFPSHSLTQSGESAEKNQRPRKQTSAPAEPFSSSSPTPLFPWFT 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 PGSQTERGRNKDKAPEELSKDRDADKSVEKDKSRERDREREKENKRESRKEKRKKGSEIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PGSQTERGRNKDKAPEELSKDRDADKSVEKDKSRERDREREKENKRESRKEKRKKGSEIQ 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 SSSALYPVGRVSKEKVVGEDVATSSSAKKATGRKKSSSHDSGTDITSVTLGDTTAVKTKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SSSALYPVGRVSKEKVVGEDVATSSSAKKATGRKKSSSHDSGTDITSVTLGDTTAVKTKI 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE9 LIKKGRGNLEKTNLDLGPTAPSLEKEKTLCLSTPSSSTVKHSTSSIGSMLAQADKLPMTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LIKKGRGNLEKTNLDLGPTAPSLEKEKTLCLSTPSSSTVKHSTSSIGSMLAQADKLPMTD 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE9 KRVASLLKKAKAQLCKIEKSKSLKQTDQPKAQGQESDSSETSVRGPRIKHVCRRAAVALG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KRVASLLKKAKAQLCKIEKSKSLKQTDQPKAQGQESDSSETSVRGPRIKHVCRRAAVALG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE9 RKRAVFPDDMPTLSALPWEEREKILSSMGNDDKSSIAGSEDAEPLAPPIKPIKPVTRNKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RKRAVFPDDMPTLSALPWEEREKILSSMGNDDKSSIAGSEDAEPLAPPIKPIKPVTRNKA 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE9 PQEPPVKKGRRSRRCGQCPGCQVPEDCGVCTNCLDKPKFGGRNIKKQCCKMRKCQNLQWM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PQEPPVKKGRRSRRCGQCPGCQVPEDCGVCTNCLDKPKFGGRNIKKQCCKMRKCQNLQWM 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE9 PSKAYLQKQAKAVKKKEKKSKTSEKKDSKESSVVKNVVDSSQKPTPSAREDPAPKKSSSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PSKAYLQKQAKAVKKKEKKSKTSEKKDSKESSVVKNVVDSSQKPTPSAREDPAPKKSSSE 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE9 PPPRKPVEEKSEEGNVSAPGPESKQATTPASRKSSKQVSQPALVIPPQPPTTGPPRKEVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PPPRKPVEEKSEEGNVSAPGPESKQATTPASRKSSKQVSQPALVIPPQPPTTGPPRKEVP 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE9 KTTPSEPKKKQPPPPESGPEQSKQKKVAPRPSIPVKQKPKEKEKPPPVNKQENAGTLNIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KTTPSEPKKKQPPPPESGPEQSKQKKVAPRPSIPVKQKPKEKEKPPPVNKQENAGTLNIL 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE9 STLSNGNSSKQKIPADGVHRIRVDFKEDCEAENVWEMGGLGILTSVPITPRVVCFLCASS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 STLSNGNSSKQKIPADGVHRIRVDFKEDCEAENVWEMGGLGILTSVPITPRVVCFLCASS 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE9 GHVEFVYCQVCCEPFHKFCLEENERPLEDQLENWCCRRCKFCHVCGRQHQATKQLLECNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GHVEFVYCQVCCEPFHKFCLEENERPLEDQLENWCCRRCKFCHVCGRQHQATKQLLECNK 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE9 CRNSYHPECLGPNYPTKPTKKKKVWICTKCVRCKSCGSTTPGKGWDAQWSHDFSLCHDCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 CRNSYHPECLGPNYPTKPTKKKKVWICTKCVRCKSCGSTTPGKGWDAQWSHDFSLCHDCA 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 pF1KE9 KLFAKGNFCPLCDKCYDDDDYESKMMQCGKCDRWVHSKCENLS---DEMYEILSNLPESV ::::::::::::::::::::::::::::::::::::::::::: :::::::::::::: CCDS55 KLFAKGNFCPLCDKCYDDDDYESKMMQCGKCDRWVHSKCENLSGTEDEMYEILSNLPESV 1570 1580 1590 1600 1610 1620 1620 1630 1640 1650 1660 1670 pF1KE9 AYTCVNCTERHPAEWRLALEKELQISLKQVLTALLNSRTTSHLLRYRQAAKPPDLNPETE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 AYTCVNCTERHPAEWRLALEKELQISLKQVLTALLNSRTTSHLLRYRQAAKPPDLNPETE 1630 1640 1650 1660 1670 1680 1680 1690 1700 1710 1720 1730 pF1KE9 ESIPSRSSPEGPDPPVLTEVSKQDDQQPLDLEGVKRKMDQGNYTSVLEFSDDIVKIIQAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ESIPSRSSPEGPDPPVLTEVSKQDDQQPLDLEGVKRKMDQGNYTSVLEFSDDIVKIIQAA 1690 1700 1710 1720 1730 1740 1740 1750 1760 1770 1780 1790 pF1KE9 INSDGGQPEIKKANSMVKSFFIRQMERVFPWFSVKKSRFWEPNKVSSNSGMLPNAVLPPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 INSDGGQPEIKKANSMVKSFFIRQMERVFPWFSVKKSRFWEPNKVSSNSGMLPNAVLPPS 1750 1760 1770 1780 1790 1800 1800 1810 1820 1830 1840 1850 pF1KE9 LDHNYAQWQEREENSHTEQPPLMKKIIPAPKPKGPGEPDSPTPLHPPTPPILSTDRSRED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LDHNYAQWQEREENSHTEQPPLMKKIIPAPKPKGPGEPDSPTPLHPPTPPILSTDRSRED 1810 1820 1830 1840 1850 1860 1860 1870 1880 1890 1900 1910 pF1KE9 SPELNPPPGIEDNRQCALCLTYGDDSANDAGRLLYIGQNEWTHVNCALWSAEVFEDDDGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SPELNPPPGIEDNRQCALCLTYGDDSANDAGRLLYIGQNEWTHVNCALWSAEVFEDDDGS 1870 1880 1890 1900 1910 1920 1920 1930 1940 1950 1960 1970 pF1KE9 LKNVHMAVIRGKQLRCEFCQKPGATVGCCLTSCTSNYHFMCSRAKNCVFLDDKKVYCQRH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LKNVHMAVIRGKQLRCEFCQKPGATVGCCLTSCTSNYHFMCSRAKNCVFLDDKKVYCQRH 1930 1940 1950 1960 1970 1980 1980 1990 2000 2010 2020 2030 pF1KE9 RDLIKGEVVPENGFEVFRRVFVDFEGISLRRKFLNGLEPENIHMMIGSMTIDCLGILNDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RDLIKGEVVPENGFEVFRRVFVDFEGISLRRKFLNGLEPENIHMMIGSMTIDCLGILNDL 1990 2000 2010 2020 2030 2040 2040 2050 2060 2070 2080 2090 pF1KE9 SDCEDKLFPIGYQCSRVYWSTTDARKRCVYTCKIVECRPPVVEPDINSTVEHDENRTIAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SDCEDKLFPIGYQCSRVYWSTTDARKRCVYTCKIVECRPPVVEPDINSTVEHDENRTIAH 2050 2060 2070 2080 2090 2100 2100 2110 2120 2130 2140 2150 pF1KE9 SPTSFTESSSKESQNTAEIISPPSPDRPPHSQTSGSCYYHVISKVPRIRTPSYSPTQRSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SPTSFTESSSKESQNTAEIISPPSPDRPPHSQTSGSCYYHVISKVPRIRTPSYSPTQRSP 2110 2120 2130 2140 2150 2160 2160 2170 2180 2190 2200 2210 pF1KE9 GCRPLPSAGSPTPTTHEIVTVGDPLLSSGLRSIGSRRHSTSSLSPQRSKLRIMSPMRTGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GCRPLPSAGSPTPTTHEIVTVGDPLLSSGLRSIGSRRHSTSSLSPQRSKLRIMSPMRTGN 2170 2180 2190 2200 2210 2220 2220 2230 2240 2250 2260 2270 pF1KE9 TYSRNNVSSVSTTGTATDLESSAKVVDHVLGPLNSSTSLGQNTSTSSNLQRTVVTVGNKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TYSRNNVSSVSTTGTATDLESSAKVVDHVLGPLNSSTSLGQNTSTSSNLQRTVVTVGNKN 2230 2240 2250 2260 2270 2280 2280 2290 2300 2310 2320 2330 pF1KE9 SHLDGSSSSEMKQSSASDLVSKSSSLKGEKTKVLSSKSSEGSAHNVAYPGIPKLAPQVHN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SHLDGSSSSEMKQSSASDLVSKSSSLKGEKTKVLSSKSSEGSAHNVAYPGIPKLAPQVHN 2290 2300 2310 2320 2330 2340 2340 2350 2360 2370 2380 2390 pF1KE9 TTSRELNVSKIGSFAEPSSVSFSSKEALSFPHLHLRGQRNDRDQHTDSTQSANSSPDEDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TTSRELNVSKIGSFAEPSSVSFSSKEALSFPHLHLRGQRNDRDQHTDSTQSANSSPDEDT 2350 2360 2370 2380 2390 2400 2400 2410 2420 2430 2440 2450 pF1KE9 EVKTLKLSGMSNRSSIINEHMGSSSRDRRQKGKKSCKETFKEKHSSKSFLEPGQVTTGEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 EVKTLKLSGMSNRSSIINEHMGSSSRDRRQKGKKSCKETFKEKHSSKSFLEPGQVTTGEE 2410 2420 2430 2440 2450 2460 2460 2470 2480 2490 2500 2510 pF1KE9 GNLKPEFMDEVLTPEYMGQRPCNNVSSDKIGDKGLSMPGVPKAPPMQVEGSAKELQAPRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GNLKPEFMDEVLTPEYMGQRPCNNVSSDKIGDKGLSMPGVPKAPPMQVEGSAKELQAPRK 2470 2480 2490 2500 2510 2520 2520 2530 2540 2550 2560 2570 pF1KE9 RTVKVTLTPLKMENESQSKNALKESSPASPLQIESTSPTEPISASENPGDGPVAQPSPNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RTVKVTLTPLKMENESQSKNALKESSPASPLQIESTSPTEPISASENPGDGPVAQPSPNN 2530 2540 2550 2560 2570 2580 2580 2590 2600 2610 2620 2630 pF1KE9 TSCQDSQSNNYQNLPVQDRNLMLPDGPKPQEDGSFKRRYPRRSARARSNMFFGLTPLYGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TSCQDSQSNNYQNLPVQDRNLMLPDGPKPQEDGSFKRRYPRRSARARSNMFFGLTPLYGV 2590 2600 2610 2620 2630 2640 2640 2650 2660 2670 2680 2690 pF1KE9 RSYGEEDIPFYSSSTGKKRGKRSAEGQVDGADDLSTSDEDDLYYYNFTRTVISSGGEERL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RSYGEEDIPFYSSSTGKKRGKRSAEGQVDGADDLSTSDEDDLYYYNFTRTVISSGGEERL 2650 2660 2670 2680 2690 2700 2700 2710 2720 2730 2740 2750 pF1KE9 ASHNLFREEEQCDLPKISQLDGVDDGTESDTSVTATTRKSSQIPKRNGKENGTENLKIDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ASHNLFREEEQCDLPKISQLDGVDDGTESDTSVTATTRKSSQIPKRNGKENGTENLKIDR 2710 2720 2730 2740 2750 2760 2760 2770 2780 2790 2800 2810 pF1KE9 PEDAGEKEHVTKSSVGHKNEPKMDNCHSVSRVKTQGQDSLEAQLSSLESSRRVHTSTPSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PEDAGEKEHVTKSSVGHKNEPKMDNCHSVSRVKTQGQDSLEAQLSSLESSRRVHTSTPSD 2770 2780 2790 2800 2810 2820 2820 2830 2840 2850 2860 2870 pF1KE9 KNLLDTYNTELLKSDSDNNNSDDCGNILPSDIMDFVLKNTPSMQALGESPESSSSELLNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KNLLDTYNTELLKSDSDNNNSDDCGNILPSDIMDFVLKNTPSMQALGESPESSSSELLNL 2830 2840 2850 2860 2870 2880 2880 2890 2900 2910 2920 2930 pF1KE9 GEGLGLDSNREKDMGLFEVFSQQLPTTEPVDSSVSSSISAEEQFELPLELPSDLSVLTTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GEGLGLDSNREKDMGLFEVFSQQLPTTEPVDSSVSSSISAEEQFELPLELPSDLSVLTTR 2890 2900 2910 2920 2930 2940 2940 2950 2960 2970 2980 2990 pF1KE9 SPTVPSQNPSRLAVISDSGEKRVTITEKSVASSESDPALLSPGVDPTPEGHMTPDHFIQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SPTVPSQNPSRLAVISDSGEKRVTITEKSVASSESDPALLSPGVDPTPEGHMTPDHFIQG 2950 2960 2970 2980 2990 3000 3000 3010 3020 3030 3040 3050 pF1KE9 HMDADHISSPPCGSVEQGHGNNQDLTRNSSTPGLQVPVSPTVPIQNQKYVPNSTDSPGPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 HMDADHISSPPCGSVEQGHGNNQDLTRNSSTPGLQVPVSPTVPIQNQKYVPNSTDSPGPS 3010 3020 3030 3040 3050 3060 3060 3070 3080 3090 3100 3110 pF1KE9 QISNAAVQTTPPHLKPATEKLIVVNQNMQPLYVLQTLPNGVTQKIQLTSSVSSTPSVMET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QISNAAVQTTPPHLKPATEKLIVVNQNMQPLYVLQTLPNGVTQKIQLTSSVSSTPSVMET 3070 3080 3090 3100 3110 3120 3120 3130 3140 3150 3160 3170 pF1KE9 NTSVLGPMGGGLTLTTGLNPSLPTSQSLFPSASKGLLPMSHHQHLHSFPAATQSSFPPNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NTSVLGPMGGGLTLTTGLNPSLPTSQSLFPSASKGLLPMSHHQHLHSFPAATQSSFPPNI 3130 3140 3150 3160 3170 3180 3180 3190 3200 3210 3220 3230 pF1KE9 SNPPSGLLIGVQPPPDPQLLVSESSQRTDLSTTVATPSSGLKKRPISRLQTRKNKKLAPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SNPPSGLLIGVQPPPDPQLLVSESSQRTDLSTTVATPSSGLKKRPISRLQTRKNKKLAPS 3190 3200 3210 3220 3230 3240 3240 3250 3260 3270 3280 3290 pF1KE9 STPSNIAPSDVVSNMTLINFTPSQLPNHPSLLDLGSLNTSSHRTVPNIIKRSKSSIMYFE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 STPSNIAPSDVVSNMTLINFTPSQLPNHPSLLDLGSLNTSSHRTVPNIIKRSKSSIMYFE 3250 3260 3270 3280 3290 3300 3300 3310 3320 3330 3340 3350 pF1KE9 PAPLLPQSVGGTAATAAGTSTISQDTSHLTSGSVSGLASSSSVLNVVSMQTTTTPTSSAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PAPLLPQSVGGTAATAAGTSTISQDTSHLTSGSVSGLASSSSVLNVVSMQTTTTPTSSAS 3310 3320 3330 3340 3350 3360 3360 3370 3380 3390 3400 3410 pF1KE9 VPGHVTLTNPRLLGTPDIGSISNLLIKASQQSLGIQDQPVALPPSSGMFPQLGTSQTPST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VPGHVTLTNPRLLGTPDIGSISNLLIKASQQSLGIQDQPVALPPSSGMFPQLGTSQTPST 3370 3380 3390 3400 3410 3420 3420 3430 3440 3450 3460 3470 pF1KE9 AAITAASSICVLPSTQTTGITAASPSGEADEHYQLQHVNQLLASKTGIHSSQRDLDSASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 AAITAASSICVLPSTQTTGITAASPSGEADEHYQLQHVNQLLASKTGIHSSQRDLDSASG 3430 3440 3450 3460 3470 3480 3480 3490 3500 3510 3520 3530 pF1KE9 PQVSNFTQTVDAPNSMGLEQNKALSSAVQASPTSPGGSPSSPSSGQRSASPSVPGPTKPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PQVSNFTQTVDAPNSMGLEQNKALSSAVQASPTSPGGSPSSPSSGQRSASPSVPGPTKPK 3490 3500 3510 3520 3530 3540 3540 3550 3560 3570 3580 3590 pF1KE9 PKTKRFQLPLDKGNGKKHKVSHLRTSSSEAHIPDQETTSLTSGTGTPGAEAEQQDTASVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PKTKRFQLPLDKGNGKKHKVSHLRTSSSEAHIPDQETTSLTSGTGTPGAEAEQQDTASVE 3550 3560 3570 3580 3590 3600 3600 3610 3620 3630 3640 3650 pF1KE9 QSSQKECGQPAGQVAVLPEVQVTQNPANEQESAEPKTVEEEESNFSSPLMLWLQQEQKRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QSSQKECGQPAGQVAVLPEVQVTQNPANEQESAEPKTVEEEESNFSSPLMLWLQQEQKRK 3610 3620 3630 3640 3650 3660 3660 3670 3680 3690 3700 3710 pF1KE9 ESITEKKPKKGLVFEISSDDGFQICAESIEDAWKSLTDKVQEARSNARLKQLSFAGVNGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ESITEKKPKKGLVFEISSDDGFQICAESIEDAWKSLTDKVQEARSNARLKQLSFAGVNGL 3670 3680 3690 3700 3710 3720 3720 3730 3740 3750 3760 3770 pF1KE9 RMLGILHDAVVFLIEQLSGAKHCRNYKFRFHKPEEANEPPLNPHGSARAEVHLRKSAFDM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RMLGILHDAVVFLIEQLSGAKHCRNYKFRFHKPEEANEPPLNPHGSARAEVHLRKSAFDM 3730 3740 3750 3760 3770 3780 3780 3790 3800 3810 3820 3830 pF1KE9 FNFLASKHRQPPEYNPNDEEEEEVQLKSARRATSMDLPMPMRFRHLKKTSKEAVGVYRSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 FNFLASKHRQPPEYNPNDEEEEEVQLKSARRATSMDLPMPMRFRHLKKTSKEAVGVYRSP 3790 3800 3810 3820 3830 3840 3840 3850 3860 3870 3880 3890 pF1KE9 IHGRGLFCKRNIDAGEMVIEYAGNVIRSIQTDKREKYYDSKGIGCYMFRIDDSEVVDATM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IHGRGLFCKRNIDAGEMVIEYAGNVIRSIQTDKREKYYDSKGIGCYMFRIDDSEVVDATM 3850 3860 3870 3880 3890 3900 3900 3910 3920 3930 3940 3950 pF1KE9 HGNAARFINHSCEPNCYSRVINIDGQKHIVIFAMRKIYRGEELTYDYKFPIEDASNKLPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 HGNAARFINHSCEPNCYSRVINIDGQKHIVIFAMRKIYRGEELTYDYKFPIEDASNKLPC 3910 3920 3930 3940 3950 3960 3960 pF1KE9 NCGAKKCRKFLN :::::::::::: CCDS55 NCGAKKCRKFLN 3970 >>CCDS46055.1 KMT2B gene_id:9757|Hs108|chr19 (2715 aa) initn: 3463 init1: 1265 opt: 1674 Z-score: 760.4 bits: 155.6 E(32554): 4.9e-36 Smith-Waterman score: 3996; 29.7% identity (46.3% similar) in 4023 aa overlap (4-3969:15-2715) 10 20 30 40 pF1KE9 MAHSCRWRFPARPGTTGGGGGGGRRGLGGAPRQRVPALLLPPGPPVGGG : : :::.:: .::::: : :: .:: : :: :: :: CCDS46 MAAAAGGGSCPGPGSARGRFPGRPRGAGGGGGRGGRG-NGAERVRV-ALRR-------GG 10 20 30 40 50 50 60 70 80 90 100 pF1KE9 GPGAPPSPPAVAAAAAAAGSSGAGVPGGAAAASAASSSSASSSSSSSSSASSGPALLRVG : .: :.. :: .: . . .:: . : : CCDS46 GATGP----------------GGAEPGEDTAL--LRLLGLRRGLRRLRRLWAGPRVQR-G 60 70 80 90 110 120 130 140 150 160 pF1KE9 PGFDAALQVSAAIGTNLRRFRAVFGESGGGGGSGEDEQFLGFGSDEEVRVRSPTRSPSVK : : . :. : .. : ...:.: :: :::.: . : :: . CCDS46 RGRGR--------GRGWGPSRGCVPEEESSDGESDEEEFQGFHSDEDV-APSSLRSALRS 100 110 120 130 140 170 180 190 200 210 220 pF1KE9 TSPRKPRGRPRSGSDRNSAILSDPSVF----SPLNKSETKSGDKIKKKDSKSIEK--KRG : :::: : .... : : . .: . : :.. .. ... . .:. CCDS46 QRGRAPRGR---GRKHKTTPLPPPRLADVAPTPPKTPARKRGEEGTERMVQALTELLRRA 150 160 170 180 190 200 230 240 250 260 270 280 pF1KE9 RPPTFPGVKI-KITHGKDISELPKGNKEDSLKKIKRTPSATFQQATKIKKLRAGKLSPLK . : : . . . . : : .. ... .. .: : . :.: CCDS46 QAPQAPRSRACEPSTPRRSRGRPPGRPAGPCRRKQQAVVVAEAAVTIPKPEPPPPVVPVK 210 220 230 240 250 260 290 300 310 320 330 pF1KE9 SKFKTGKLQIGR-KGVQIVRRRG---RPPSTERIKTPSGLL--INSELEKPQKVRKDKEG . . : . : : :: : : : . .: : . . . . .::. . . CCDS46 HQTGSWKCKEGPGPGPGTPRRGGQSSRGGRGGRGRGRGGGLPFVIKFVSRAKKVKMGQLS 270 280 290 300 310 320 340 350 360 370 380 390 pF1KE9 TPPLTKEDKTVVRQSPRRIKPVRIIPSSKRTDATIAKQLLQRAKKGAQKKIEKEAAQLQG . . . ..: . . : : . :.. . :: :. ..: :.: . .: CCDS46 LGLESGQGQGQHEESWQDV-PQRRVGSGQGGSPCWKKQE-QKLDDEEEEKKEEEEKDKEG 330 340 350 360 370 400 410 420 430 440 450 pF1KE9 RKVKTQVKNIRQFIMPVVSAISSRIIKTPRRFIEDEDYDPPIKIARLESTPNSRFSAPSC . . . . . . .::.. ... : . .:: . ..: . : CCDS46 E--EKEERAVAEEMMPAAEKEEAKLPPPP---LTPPAPSPPPPLPPPSTSPPPPLCPPPP 380 390 400 410 420 430 460 470 480 490 500 pF1KE9 GSSEKSSAASQHSSQMSSDSSRSSSPSVDTSTDSQASEEIQVLPEERSDT------PE-V : ... .. : : : .: :. . . : .:.. :: . CCDS46 PPVSPPPLPSPPPPP-AQEEQEESPPPVVPATCSRKRGRPPLTPSQRAEREAARAGPEGT 440 450 460 470 480 490 510 520 530 540 550 560 pF1KE9 HPPLPISQS-----PENESN-DRRSRRYSVSERSF-GSRTTKKLSTLQSAPQQQTSSSPP :: : .. ::. . .: . . :.: .. . : . ..:.. . .:: CCDS46 SPPTPTPSTATGGPPEDSPTVAPKSTTFLKNIRQFIMPVVSARSSRVIKTPRRFMDEDPP 500 510 520 530 540 550 570 580 590 600 610 620 pF1KE9 -PPLLTPPPPLQPASSISDHTPWLMPPTI-PLASPFLPASTAPMQGKRKSILREPTFRWT :: . : :.: . : .: :. : .: :.. .:. ::.::::::::::: CCDS46 KPPKVEVSPVLRPPITTSPPVPQEPAPVPSPPRAPTPPSTPVPLPEKRRSILREPTFRWT 560 570 580 590 600 610 630 640 650 660 670 680 pF1KE9 SLKHSRSEPQYFSSAKYAKEGLIRKPIFDNFRPPPLTPEDVGFASGFSASGTAASARLFS :: .: : ::: .: : : .: :.: CCDS46 SL--TRELP-----------------------PPPPAPPPPPAPSPPPAPAT--SSR--R 620 630 640 690 700 710 720 730 740 pF1KE9 PLHSGTRFDMHKRSPLLRAPRFTPSEAHSRIFESVTLPSNRTSAGTSSSGVSNRKRKRKV :: :::::.::::::: .:.::: : :. . . CCDS46 PL-------------LLRAPQFTPSEAHLKIYESVLTP---PPLGAPEAPEPEPPPADD- 650 660 670 680 750 760 770 780 790 800 pF1KE9 FSPIRSEPRSPSHSMRTRSGRLSSSELSPLTPPSSVSSSLSISVSPLATSALNPTFTFPS :: . :::. . :...:: ...:. :.. .. ::: .. ::. . CCDS46 -SPAEPEPRAVG-----RTNHLSLPRFAPV-----VTTPVKAEVSPHGAPALSNGPQTQA 690 700 710 720 730 810 820 830 840 850 860 pF1KE9 HSLTQSGESAEKNQRPRKQTSAPAEPFSSSSPTPLFPWFTPGSQTERGRNKDKAPEELSK . : : .. . . : :. : .: . :.: . : :..: . :: CCDS46 Q-LLQPLQALQTQLLP--QALPPPQPQLQPPPSP--QQMPP---LEKARIAGVGSLPLS- 740 750 760 770 780 870 880 890 900 910 920 pF1KE9 DRDADKSVEKDKSRERDREREKENKRESRKEKRKKGSEIQSSSALYPVGRVSKEKVVGED .:: :. :. : . : ... ... .: : : :.. :.:.: CCDS46 ------GVE-----EKMFSLLKRAKVQLFKIDQQQQQKVAASMPLSPGGQM--EEVAG-- 790 800 810 820 830 930 940 950 960 970 980 pF1KE9 VATSSSAKKATGRKKSSSHDSGTDITSVTLGDTTAVKTKILIKKGRGNLEKTNLDLGPTA ..:. . : :.: ... :. : :.. CCDS46 -----AVKQISDRGPVRSEDESVEA-----------------KRER-----------PSG 840 850 990 1000 1010 1020 1030 1040 pF1KE9 PSLEKEKTLCLSTPSSSTVKHSTSSIGSMLAQADKLPMTDKRVASLLKKAKAQLCKIEKS : CCDS46 P----------------------------------------------------------- 1050 1060 1070 1080 1090 1100 pF1KE9 KSLKQTDQPKAQGQESDSSETSVRGPRIKHVCRRAAVALGRKRAVFPDDMPTLSALPWEE :. :.:::::::::.::::::. ::. :.:.: ::::: .. CCDS46 -------------------ESPVQGPRIKHVCRHAAVALGQARAMVPEDVPRLSALPLRD 860 870 880 890 900 1110 1120 1130 1140 pF1KE9 REKILSSMGNDDKSSIAGSEDAEP--------LAPPIKPIKPV----TRNKAPQEP-PVK :. .....: :: . .:.. : : .:. : ..:.. : . CCDS46 RQ----DLATEDTSSASETESVPSRSRRGKVEAAGPGGESEPTGSGGTLAHTPRRSLPSH 910 920 930 940 950 1150 1160 1170 1180 1190 1200 pF1KE9 KGRRSR--RCGQCPGCQVPEDCGVCTNCLDKPKFGGRNIKKQCCKMRKCQNLQWMPSKAY .:.. : :::.: :: .::: :.:::::::::: : ::::: .:::.... CCDS46 HGKKMRMARCGHCRGCLRVQDCGSCVNCLDKPKFGGPNTKKQCCVYRKCDKIE------- 960 970 980 990 1000 1210 1220 1230 1240 1250 1260 pF1KE9 LQKQAKAVKKKEKKSKTSEKKDSKESSVVKNVV--DSSQKPTPSAREDPAPKKSSSEPPP :. ... ::..: .::... ::...: : :.:..... : CCDS46 ----ARKMERLAKKGRT----------IVKTLLPWDSDESPEASPGP-PGPRRGAGAGGP 1010 1020 1030 1040 1050 1270 1280 1290 1300 1310 1320 pF1KE9 RKPVEEKSEEGNVSAPGPESKQATTPASRKSSKQ-VSQ-PALVIPPQPPTTGPPRKEVPK :. : :. :::: ... .:::... :.: :. : . . : .:. CCDS46 REEV--------VAHPGPEEQDSLL--QRKSARRCVKQRPSYDIFEDSDDSEPGGPPAPR 1060 1070 1080 1090 1100 1330 1340 1350 1360 1370 pF1KE9 TTPSEPKKKQPPPPESGPEQSKQKKVAPRPSIPVKQK---PKEKEKPPPVNKQENAGTLN :.... : :: :::. .: . .: . .: . :. : : CCDS46 RR--TPRENELPLPEP-EEQSRPRKPTLQPVLQLKARRRLDKDALAPGP----------- 1110 1120 1130 1140 1150 1380 1390 1400 1410 1420 1430 pF1KE9 ILSTLSNGNSSKQKIPADGVHRIRVDFKEDCEAENVWEMGGLGILTSVPITPRVVCFLCA .... :: ..::: : :::::.::::::::. :::: ::::..::::: : .::.::: CCDS46 -FASFPNGWTGKQKSP-DGVHRVRVDFKEDCDLENVWLMGGLSVLTSVPGGPPMVCLLCA 1160 1170 1180 1190 1200 1440 1450 1460 1470 1480 1490 pF1KE9 SSGHVEFVYCQVCCEPFHKFCLEENERPLEDQLENWCCRRCKFCHVCGRQHQATKQLLEC :.: :.:.:::::.::: ::::: :::: .. ..::::::::::::::. ...:.:::: CCDS46 SKGLHELVFCQVCCDPFHPFCLEEAERPLPQHHDTWCCRRCKFCHVCGRKGRGSKHLLEC 1210 1220 1230 1240 1250 1260 1500 1510 1520 1530 1540 1550 pF1KE9 NKCRNSYHPECLGPNYPTKPTKKKKVWICTKCVRCKSCGSTTPGKGWDAQWSHDFSLCHD ..::..::: ::::.:::. :.:.. :::. ::::::::.: :::.::..:: :.::: CCDS46 ERCRHAYHPACLGPSYPTRATRKRRHWICSACVRCKSCGAT-PGKNWDVEWSGDYSLCPR 1270 1280 1290 1300 1310 1320 1560 1570 1580 1590 1600 1610 pF1KE9 CAKLFAKGNFCPLCDKCYDDDDYESKMMQCGKCDRWVHSKCENLSDEMYEILSNLPESVA :..:. :::.::.: .::.:.:::::::::..::.:::.:::.:::: :::::.::.:: CCDS46 CTQLYEKGNYCPICTRCYEDNDYESKMMQCAQCDHWVHAKCEGLSDEDYEILSGLPDSVL 1330 1340 1350 1360 1370 1380 1620 1630 1640 1650 1660 1670 pF1KE9 YTCVNCTERHPAEWRLALEKELQISLKQVLTALLNSRTTSHLLRYRQAAKPPDLNPETEE ::: :. .:: :: :: .:.::: .::.:.... :: : CCDS46 YTCGPCAGAAQPRWREALSGALQGGLRQVLQGLLSSKVVGPLLLCTQC------------ 1390 1400 1410 1420 1430 1680 1690 1700 1710 1720 1730 pF1KE9 SIPSRSSPEGPDPPVLTEVSKQDDQQPLDLEGVKRKMDQGNYTSVLEFSDDIVKIIQAAI ::: .:: : :..:......:.: :: : .:.: :.. CCDS46 ---------GPD-------GKQLHPGPCGLQAVSQRFEDGHYKSVHSFMEDMVGILMR-- 1440 1450 1460 1470 1740 1750 1760 1770 1780 1790 pF1KE9 NSDGGQPEIKKANSMVKSFFIRQMERVFPWFSVKKSRFWEPNKVSSNSGMLPNAVLPPSL .:. :. ..:....:..... .: .: ::... ..:. . : :.:::::::::: CCDS46 HSEEGETPDRRAGGQMKGLLLKLLESAFGWFDAHDPKYWRRSTRLPN-GVLPNAVLPPSL 1480 1490 1500 1510 1520 1530 1800 1810 1820 1830 1840 1850 pF1KE9 DHNYAQWQEREENSHTEQPPLMKKIIPAPKPKGPGEPDSPTPLHPPTPPILSTDRSREDS :: ::::...: :..: .:: : :. . .: CCDS46 DHVYAQWRQQE-------------------------PETPESGQPPGDP--SAAFQGKDP 1540 1550 1560 1860 1870 1880 1890 1900 1910 pF1KE9 PELNPPPGIEDNRQCALCLTYGDDSANDAGRLLYIGQNEWTHVNCALWSAEVFEDDDGSL .. .:: ::::::: ::: ....::::::::::::::::::.:::::::..:::: CCDS46 AAFS---HLEDPRQCALCLKYGDADSKEAGRLLYIGQNEWTHVNCAIWSAEVFEENDGSL 1570 1580 1590 1600 1610 1620 1920 1930 1940 1950 1960 1970 pF1KE9 KNVHMAVIRGKQLRCEFCQKPGATVGCCLTSCTSNYHFMCSRAKNCVFLDDKKVYCQRHR :::: :: ::.:.:::.: ::::::::::.:: ::.::::.::. :.: :::::.::.: CCDS46 KNVHAAVARGRQMRCELCLKPGATVGCCLSSCLSNFHFMCARASYCIFQDDKKVFCQKHT 1630 1640 1650 1660 1670 1680 1980 1990 2000 2010 2020 2030 pF1KE9 DLIKG-EVVPENGFEVFRRVFVDFEGISLRRKFLNGLEPENIHMMIGSMTIDCLGILNDL ::. : :.: .::.:.:::.::::::...::::.::::. :...:::. :: :: :.:: CCDS46 DLLDGKEIVNPDGFDVLRRVYVDFEGINFKRKFLTGLEPDAINVLIGSIRIDSLGTLSDL 1690 1700 1710 1720 1730 1740 2040 2050 2060 2070 2080 2090 pF1KE9 SDCEDKLFPIGYQCSRVYWSTTDARKRCVYTCKIVECRP--PVVEPDINSTVEHDENRTI :::: .::::::::::.::::.:::.:: : :.:.: :: : :: ..: ::.:: CCDS46 SDCEGRLFPIGYQCSRLYWSTVDARRRCWYRCRILEYRPWGPREEPAHLEAAE--ENQTI 1750 1760 1770 1780 1790 1800 2100 2110 2120 2130 2140 2150 pF1KE9 AHSPTSFTESSSKESQNTAEIISPPSPDRPPHSQTSGSCYYHVISKVPRIRTPSYSPTQR .:::. .: ::. . :: . .. .:. .:: : CCDS46 VHSPAPSSE--------------PPGGEDPPLDTDV------LVPGAPE----RHSPIQN 1810 1820 1830 1840 2160 2170 2180 2190 2200 2210 pF1KE9 -SPGCRPLPSAGSPTPTTHEIVTVGDPLLSSGLRSIGSRRHSTSSLSPQRSKLRIMSPMR .: :: :...: :. . :.: : :. .:: CCDS46 LDPPLRP-DSGSAPPPAPR-------------------------SFSGARIKVPNYSP-- 1850 1860 1870 2220 2230 2240 2250 2260 2270 pF1KE9 TGNTYSRNNVSSVSTTGTATDLESSAKVVDHVLGPLNSSTSLGQNTSTSSNLQRTVVTVG :: ...:: .::: : CCDS46 -----SRRPLGGVS------------------FGPLPS---------------------- 1880 2280 2290 2300 2310 2320 2330 pF1KE9 NKNSHLDGSSSSEMKQSSASDLVSKSSSLKGEKTKVLSSKSSEGSAHNVAYPGIPKLAPQ :: CCDS46 ---------------------------------------------------PG------- 2340 2350 2360 2370 2380 2390 pF1KE9 VHNTTSRELNVSKIGSFAEPSSVSFSSKEALSFPHLHLRGQRNDRDQHTDSTQSANSSPD :::.. : CCDS46 ------------------SPSSLT------------H----------------------- 1890 2400 2410 2420 2430 2440 2450 pF1KE9 EDTEVKTLKLSGMSNRSSIINEHMGSSSRDRRQKGKKSCKETFKEKHSSKSFLEPGQVTT :. : :. CCDS46 ----------------------HI------------------------------P---TV 1900 2460 2470 2480 2490 2500 2510 pF1KE9 GEEGNLKPEFMDEVLTPEYMGQRPCNNVSSDKIGDKGLSMPGVPKAPPMQVEGSAKELQA :. :.: .: ..:: : .:. :: .. . CCDS46 GD-----PDFP----APPRRSRRPS---------------PLAPRPPP-------SRWAS 1910 1920 1930 2520 2530 2540 2550 2560 2570 pF1KE9 PRKRTVKVTLTPLKMENESQSKNALKESSPASPLQIESTSPTEPISASENPGDGPVAQPS : ::: .:: :.. :: ..: .: .: .: :. CCDS46 P----------PLK-------------TSP----QLRVPPPTSVVTAL-TPTSGELAPPG 1940 1950 1960 2580 2590 2600 2610 2620 2630 pF1KE9 PNNTSCQDSQSNNYQNLPVQDRNLMLPDGPKPQEDGSFKRRYPRRSARARSNMFFGLTPL : :. : :.. : . . :. . ... :. . : CCDS46 PA------------------------PSPPPPEDLGPDFEDMEVVSGLSAADLDFAAS-L 1970 1980 1990 2640 2650 2660 2670 2680 2690 pF1KE9 YGVRSYGEEDIPFYSSSTGKKRGKRSAEGQVDGADDLSTSDEDDLYYYNFTRTVISSGGE :.. . :: . ... :...: : :.... :. : .: ::.:. : CCDS46 LGTEPFQEEIVA--AGAMGSSHG-----GPGDSSEEESSPTS---RYIHFPVTVVSAPGL 2000 2010 2020 2030 2040 2700 2710 2720 2730 2740 2750 pF1KE9 ERLASHNLFREEEQCDLPKISQLDGVDDGTESDTSVTATTRKSSQIPKRNGKENGTENLK :. . :.: :::::::::.:.. .. : :. .: CCDS46 APSATPGA---------PRIEQLDGVDDGTDSEA-------EAVQQPRGQGTP------- 2050 2060 2070 2080 2760 2770 2780 2790 2800 2810 pF1KE9 IDRPEDAGEKEHVTKSSVGHKNEPKMDNCHSVSRVKTQGQDSLEAQLSSLESSRRVHTST : : . . ...: . .: CCDS46 ---PSGPGVVRAGVLGAAGDRARP------------------------------------ 2090 2100 2820 2830 2840 2850 2860 2870 pF1KE9 PSDKNLLDTYNTELLKSDSDNNNSDDCGNILPSDIMDFVLKNTPSMQALGESPESSSSEL : : :::.:.:::::: :: CCDS46 PED---------------------------LPSEIVDFVLKN------LG---------- 2110 2120 2880 2890 2900 2910 2920 2930 pF1KE9 LNLGEGLGLDSNREKDMGLFEVFSQQLPTTEPVDSSVSSSISAEEQFELPLELPSDLSVL : : : . :: ..:: . :. .. CCDS46 ---GPGDGGAGPRE----------ESLPPAPPLANG------------------------ 2130 2140 2940 2950 2960 2970 2980 2990 pF1KE9 TTRSPTVPSQNPSRLAVISDSGEKRVTITEKSVASSESDPALLSPGVDPTPEGHMTPDHF . :::. . ..:: ::: : CCDS46 -----SQPSQGLT------------------------ASPA------DPTRTFAWLP--- 2150 2160 3000 3010 3020 3030 3040 3050 pF1KE9 IQGHMDADHISSPPCGSVEQGHGNNQDLTRNSSTPGLQVPVSPTVPIQNQKYVPNSTDSP ..::..: : CCDS46 --------------------------------GAPGVRVL------------------SL 2170 3060 3070 3080 3090 3100 3110 pF1KE9 GPSQISNAAVQTTPPHLKPATEKLIVVNQNMQPLYVLQTLPNGVTQKIQLTSSVSSTPSV ::. :: :::: :.:.::. : . ..... .: CCDS46 GPAP--------EPP--KPATSKIILVNKLGQVF-------------VKMAGEGEPVPP- 2180 2190 2200 2210 3120 3130 3140 3150 3160 3170 pF1KE9 METNTSVLGPMGGGLTLTTGLNPSLPTSQSLFPSASKGLLPMSHHQHLHSFPAATQSSFP : : : ..:. ::: .: :. :.::. . :: CCDS46 -----PVKQP-----PLPPTISPTAPTSWTLPPGPLLGVLPVVGVVR----PA------- 2220 2230 2240 2250 3180 3190 3200 3210 3220 3230 pF1KE9 PNISNPPSGLLIGVQPPPDPQLLVSESSQRTDLSTTVATPSSGLKKRPISRLQTRKNKKL :: ::: : :: ::. :.: : . ..... . . CCDS46 -----PP--------PPPPPLTLV--------LSSGPASP-------PRQAIRVKRVSTF 2260 2270 2280 3240 3250 3260 3270 3280 3290 pF1KE9 APSSTPSNIAPSDVVSNMTLINFTPSQLPNHPSLLDLGSLNTSSHRTVPNIIKRSKSSIM . : : :: : . CCDS46 SGRSPP---APP------------PYK--------------------------------- 2290 3300 3310 3320 3330 3340 3350 pF1KE9 YFEPAPLLPQSVGGTAATAAGTSTISQDTSHLTSGSVSGLASSSSVLNVVSMQTTTTPTS :: : .. : : :.:: . : ::.:.. .. : :.: :: CCDS46 ----APRLDED--GEA---------SEDTPQ-----VPGLGSGG--FSRVRMKT---PT- 2300 2310 2320 2330 3360 3370 3380 3390 3400 3410 pF1KE9 SASVPGHVTLTNPRLLGTPDIGSISNLLIKASQQSLG-IQDQPVALPPSSGMFPQLGTSQ : : . : : : : :...: : .:.. :: .:. : : CCDS46 ---VRGVLDLDRP---GEP-----------AGEESPGPLQERSPLLP-----LPEDGPPQ 2340 2350 2360 3420 3430 3440 3450 3460 3470 pF1KE9 TPSTAAITAASSICVLPSTQTTGITAASPSGEADEHYQLQHVNQLLASKTGIHSSQRDLD .: CCDS46 VP---------------------------------------------------------- 2370 3480 3490 3500 3510 3520 3530 pF1KE9 SASGPQVSNFTQTVDAPNSMGLEQNKALSSAVQASPTSPGGSPSSPSSGQRSASPSVPGP :.: .. :: : ::. :.: : CCDS46 --------------DGPPDLLLE------------------SQWHHYSGEASSSEEEP-- 2380 2390 3540 3550 3560 3570 3580 3590 pF1KE9 TKPKPKTKRFQLPLDKGNGKKHKVSHLRTSSSEAHIPDQETTSLTSGTGTPGAEAEQQDT :.: :. : : : ::: CCDS46 --PSPDDKENQAPKRTG-------PHLR-------------------------------- 2400 2410 3600 3610 3620 3630 3640 3650 pF1KE9 ASVEQSSQKECGQPAGQVAVLPEVQVTQNPANEQESAEPKTVEEEESNFSSPLMLWLQQE CCDS46 ------------------------------------------------------------ 3660 3670 3680 3690 3700 3710 pF1KE9 QKRKESITEKKPKKGLVFEISSDDGFQICAESIEDAWKSLTDKVQEARSNARLKQLSFAG :::::.:::.. :::.: ::..: .::::::..:::..:::.: CCDS46 -----------------FEISSEDGFSVEAESLEGAWRTLIEKVQEARGHARLRHLSFSG 2420 2430 2440 2450 3720 3730 3740 3750 3760 3770 pF1KE9 VNGLRMLGILHDAVVFLIEQLSGAKHCRNYKFRFHKPEEANE-PPLNPHGSARAEVHLRK ..: :.::: ::::.:: ::: ::..:..::::.:. :..: :::::::.:::::.::: CCDS46 MSGARLLGIHHDAVIFLAEQLPGAQRCQHYKFRYHQQGEGQEEPPLNPHGAARAEVYLRK 2460 2470 2480 2490 2500 2510 3780 3790 3800 3810 3820 3830 pF1KE9 SAFDMFNFLASKHRQPPEYNPNDEEEEEVQLKSARRATSMDLPMPMRFRHLKKTSKEAVG .:::::::::.:: :: ::::.::::.:.:::::..::: ::::::::::::::: CCDS46 CTFDMFNFLASQHRVLPEGATCDEEEDEVQLRSTRRATSLELPMAMRFRHLKKTSKEAVG 2520 2530 2540 2550 2560 2570 3840 3850 3860 3870 3880 3890 pF1KE9 VYRSPIHGRGLFCKRNIDAGEMVIEYAGNVIRSIQTDKREKYYDSKGIGCYMFRIDDSEV :::: :::::::::::::::::::::.: ::::. ::::::.::.:::::::::.:: .: CCDS46 VYRSAIHGRGLFCKRNIDAGEMVIEYSGIVIRSVLTDKREKFYDGKGIGCYMFRMDDFDV 2580 2590 2600 2610 2620 2630 3900 3910 3920 3930 3940 3950 pF1KE9 VDATMHGNAARFINHSCEPNCYSRVINIDGQKHIVIFAMRKIYRGEELTYDYKFPIEDAS :::::::::::::::::::::.::::...:::::::::.:.: ::::::::::::::::: CCDS46 VDATMHGNAARFINHSCEPNCFSRVIHVEGQKHIVIFALRRILRGEELTYDYKFPIEDAS 2640 2650 2660 2670 2680 2690 3960 pF1KE9 NKLPCNCGAKKCRKFLN ::::::::::.::.::: CCDS46 NKLPCNCGAKRCRRFLN 2700 2710 3969 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 17:22:08 2016 done: Tue Nov 8 17:22:10 2016 Total Scan time: 10.090 Total Display time: 1.300 Function used was FASTA [36.3.4 Apr, 2011]