FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9669, 2997 aa 1>>>pF1KE9669 2997 - 2997 aa - 2997 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 14.3525+/-0.00141; mu= -14.2892+/- 0.085 mean_var=517.4663+/-105.387, 0's: 0 Z-trim(113.1): 107 B-trim: 394 in 1/52 Lambda= 0.056381 statistics sampled from 13680 (13771) to 13680 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.713), E-opt: 0.2 (0.423), width: 16 Scan time: 9.040 The best scores are: opt bits E(32554) CCDS47865.1 CHD7 gene_id:55636|Hs108|chr8 (2997) 20314 1669.3 0 CCDS45485.1 CHD9 gene_id:80205|Hs108|chr16 (2881) 6607 554.4 3.6e-156 CCDS53885.1 CHD8 gene_id:57680|Hs108|chr14 (2581) 6154 517.5 4.1e-145 CCDS45081.1 CHD8 gene_id:57680|Hs108|chr14 (2302) 6109 513.8 4.7e-144 CCDS13317.1 CHD6 gene_id:84181|Hs108|chr20 (2715) 5891 496.1 1.2e-138 CCDS76865.1 CHD9 gene_id:80205|Hs108|chr16 (2897) 5851 492.9 1.2e-137 CCDS83299.1 CHD7 gene_id:55636|Hs108|chr8 ( 948) 4183 356.9 3.3e-97 CCDS76510.1 CHD4 gene_id:1108|Hs108|chr12 (1905) 1655 151.5 4.7e-35 CCDS8552.1 CHD4 gene_id:1108|Hs108|chr12 (1912) 1655 151.5 4.7e-35 CCDS32555.1 CHD3 gene_id:1107|Hs108|chr17 (1966) 1633 149.7 1.7e-34 CCDS32554.1 CHD3 gene_id:1107|Hs108|chr17 (2000) 1633 149.7 1.7e-34 CCDS32553.2 CHD3 gene_id:1107|Hs108|chr17 (2059) 1633 149.7 1.7e-34 CCDS57.1 CHD5 gene_id:26038|Hs108|chr1 (1954) 1582 145.6 2.9e-33 CCDS14612.1 SMARCA1 gene_id:6594|Hs108|chrX (1054) 1146 109.9 8.4e-23 CCDS76019.1 SMARCA1 gene_id:6594|Hs108|chrX (1070) 1146 109.9 8.5e-23 CCDS34978.1 SMARCA2 gene_id:6595|Hs108|chr9 (1572) 1144 109.9 1.3e-22 CCDS34977.1 SMARCA2 gene_id:6595|Hs108|chr9 (1590) 1144 109.9 1.3e-22 CCDS54218.1 SMARCA4 gene_id:6597|Hs108|chr19 (1613) 1127 108.5 3.5e-22 CCDS54217.1 SMARCA4 gene_id:6597|Hs108|chr19 (1614) 1127 108.5 3.5e-22 CCDS45973.1 SMARCA4 gene_id:6597|Hs108|chr19 (1616) 1127 108.5 3.5e-22 CCDS45972.1 SMARCA4 gene_id:6597|Hs108|chr19 (1617) 1127 108.5 3.5e-22 CCDS12253.1 SMARCA4 gene_id:6597|Hs108|chr19 (1647) 1124 108.3 4.2e-22 CCDS83338.1 SMARCA2 gene_id:6595|Hs108|chr9 (1514) 831 84.4 5.8e-15 CCDS34204.1 CHD1 gene_id:1105|Hs108|chr5 (1710) 795 81.5 4.9e-14 CCDS10374.2 CHD2 gene_id:1106|Hs108|chr15 (1828) 776 80.0 1.5e-13 CCDS7229.1 ERCC6 gene_id:2074|Hs108|chr10 (1493) 722 75.5 2.7e-12 CCDS3761.1 SMARCA5 gene_id:8467|Hs108|chr4 (1052) 669 71.1 4e-11 >>CCDS47865.1 CHD7 gene_id:55636|Hs108|chr8 (2997 aa) initn: 20314 init1: 20314 opt: 20314 Z-score: 8942.5 bits: 1669.3 E(32554): 0 Smith-Waterman score: 20314; 100.0% identity (100.0% similar) in 2997 aa overlap (1-2997:1-2997) 10 20 30 40 50 60 pF1KE9 MADPGMMSLFGEDGNIFSEGLEGLGECGYPENPVNPMGQQMPIDQGFASLQPSLHHPSTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MADPGMMSLFGEDGNIFSEGLEGLGECGYPENPVNPMGQQMPIDQGFASLQPSLHHPSTN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 QNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPVPQVPHGGSGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPVPQVPHGGSGG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 GQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQPQPPQPAPSGPPAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQPQPPQPAPSGPPAQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 GHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPFIATSGPGHLSHVPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPFIATSGPGHLSHVPQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 QSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAVRPQTLNFSSRSQTVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAVRPQTLNFSSRSQTVP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 SPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVPRYPNAVGFPSNSGQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVPRYPNAVGFPSNSGQG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 LMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAMSNPAGTPPPQVRPGSAGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAMSNPAGTPPPQVRPGSAGI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 PMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGMSSAPRELTGHMRPNGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGMSSAPRELTGHMRPNGC 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 PGVGLGDPQAIQERLIPGQQHPGQQPSFQQLPTCPPLQPHPGLHHQSSPPHPHHQPWAQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PGVGLGDPQAIQERLIPGQQHPGQQPSFQQLPTCPPLQPHPGLHHQSSPPHPHHQPWAQL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 HPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQLVKSDDYLPSIEQQPQQKKKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQLVKSDDYLPSIEQQPQQKKKK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 KKNNHIVAEDPSKGFGKDDFPGGVDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEPKEPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KKNNHIVAEDPSKGFGKDDFPGGVDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEPKEPK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 EKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPKSSKKSSNKKPDSEASALKKKVNKGKTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPKSSKKSSNKKPDSEASALKKKVNKGKTE 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 GSENSDLDKTPPPSPPPEEDEDPGVQKRRSSRQVKRKRYTEDLEFKISDEEADDADAAGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GSENSDLDKTPPPSPPPEEDEDPGVQKRRSSRQVKRKRYTEDLEFKISDEEADDADAAGR 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 DSPSNTSQSEQQESVDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DSPSNTSQSEQQESVDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQW 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 ASIEDLEKDKRIQQKIKRFKAKQGQNKFLSEIEDELFNPDYVEVDRIMDFARSTDDRGEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ASIEDLEKDKRIQQKIKRFKAKQGQNKFLSEIEDELFNPDYVEVDRIMDFARSTDDRGEP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 VTHYLVKWCSLPYEDSTWERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VTHYLVKWCSLPYEDSTWERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSR 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE9 EYKNNNKLREYQLEGVNWLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EYKNNNKLREYQLEGVNWLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFL 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE9 VIAPLSTIPNWEREFRTWTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VIAPLSTIPNWEREFRTWTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAI 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE9 ITTFEMILTDCPELRNIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ITTFEMILTDCPELRNIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNT 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE9 VEELFSLLHFLEPSRFPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VEELFSLLHFLEPSRFPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAP 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE9 KEETIIEVELTNIQKKYYRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLING :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KEETIIEVELTNIQKKYYRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLING 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE9 AEEKILEEFKETHNAESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AEEKILEEFKETHNAESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLD 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE9 ILEDYLIQRRYPYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ILEDYLIQRRYPYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADT 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE9 CIIFDSDWNPQNDLQAQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 CIIFDSDWNPQNDLQAQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQ 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE9 SMSGRENATNGVQQLSKKEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SMSGRENATNGVQQLSKKEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITI 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE9 ESEGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ESEGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRK 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE9 QTRLYSAVKEDELMEFSDLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QTRLYSAVKEDELMEFSDLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGR 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE9 WTDILSHGRYKRQLTEQDVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 WTDILSHGRYKRQLTEQDVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALV 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE9 NHSGLSAPVPRGRKGKKVKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 NHSGLSAPVPRGRKGKKVKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLL 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE9 RVRMLYYLRQEVIGDQADKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RVRMLYYLRQEVIGDQADKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFK 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE9 HGYEKYNSMRADPALCFLERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HGYEKYNSMRADPALCFLERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPT 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE9 RTPFKDEIDEFANSPSEDKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RTPFKDEIDEFANSPSEDKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAY 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE9 QRSYKRQQMRQEALMKTDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QRSYKRQQMRQEALMKTDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVST 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE9 FGVIFDPVKQQFDWNQFRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 FGVIFDPVKQQFDWNQFRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLS 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE9 SIIEPITEERASRTLYRIELLRKIREQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SIIEPITEERASRTLYRIELLRKIREQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDL 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE9 LVGAAKHGVSRTDYHILNDPELSFLDAHKNFAQNRGAGNTSSLNPLAVGFVQTPPVISSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LVGAAKHGVSRTDYHILNDPELSFLDAHKNFAQNRGAGNTSSLNPLAVGFVQTPPVISSA 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE9 HIQDERVLEQAEGKVEEPENPAAKEKCEGKEEEEETDGSGKESKQECEAEASSVKNELKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HIQDERVLEQAEGKVEEPENPAAKEKCEGKEEEEETDGSGKESKQECEAEASSVKNELKG 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KE9 VEVGADTGSKSISEKGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMSTAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VEVGADTGSKSISEKGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMSTAR 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KE9 DETRDGFYMEDGDPSVAQLLHERTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DETRDGFYMEDGDPSVAQLLHERTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMF 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 2400 pF1KE9 DFQGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DFQGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQR 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 2450 2460 pF1KE9 RRRRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNFSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RRRRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNFSS 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500 2510 2520 pF1KE9 LSSKFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LSSKFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNVE 2470 2480 2490 2500 2510 2520 2530 2540 2550 2560 2570 2580 pF1KE9 GLDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GLDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTRL 2530 2540 2550 2560 2570 2580 2590 2600 2610 2620 2630 2640 pF1KE9 VGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINT 2590 2600 2610 2620 2630 2640 2650 2660 2670 2680 2690 2700 pF1KE9 LTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMF 2650 2660 2670 2680 2690 2700 2710 2720 2730 2740 2750 2760 pF1KE9 DRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQN 2710 2720 2730 2740 2750 2760 2770 2780 2790 2800 2810 2820 pF1KE9 LQNLQSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNNPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LQNLQSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNNPL 2770 2780 2790 2800 2810 2820 2830 2840 2850 2860 2870 2880 pF1KE9 SAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAATAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAATAP 2830 2840 2850 2860 2870 2880 2890 2900 2910 2920 2930 2940 pF1KE9 AGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEKAAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEKAAD 2890 2900 2910 2920 2930 2940 2950 2960 2970 2980 2990 pF1KE9 KAEGGPFKDGETLEGSDAEESLDKTAESSLLEDEIAQGEELDSLDGGDEIENNENDE ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KAEGGPFKDGETLEGSDAEESLDKTAESSLLEDEIAQGEELDSLDGGDEIENNENDE 2950 2960 2970 2980 2990 >>CCDS45485.1 CHD9 gene_id:80205|Hs108|chr16 (2881 aa) initn: 7270 init1: 3906 opt: 6607 Z-score: 2917.2 bits: 554.4 E(32554): 3.6e-156 Smith-Waterman score: 8930; 49.6% identity (71.4% similar) in 3122 aa overlap (1-2996:1-2874) 10 20 30 40 50 pF1KE9 MADPGMMSLFGEDGNIFSEGLEGLGECGYPE-NPVNPMGQQMPIDQGFASLQ-PSLHHPS :.:: ::..: .:.:.:.: ::::.. .. . .::. . ... . : :. ::.: . CCDS45 MTDP-MMDFF-DDANLFGETLEGLSDDAFVQPGPVS-LVDELNLGAEFEPLHIDSLNHVQ 10 20 30 40 50 60 70 80 90 100 110 pF1KE9 TNQNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPV-PQVPHGG . .. :.: :.. ::... :.: ..: ..:.. . :::::.. :. :: CCDS45 GTPTHQKMTDFEQLNQFDSIKFHHVNQS----FGSPAEHVLSPHSQFNCSPIHPQ----- 60 70 80 90 100 120 130 140 150 160 170 pF1KE9 SGGGQMGVYPGMQNERHGQSFVDSSSMWGPR-AVQVPDQIRAPYQQQQPQPQPPQPAPSG . :..: .. :.: ::: . :. . .: .:..:: CCDS45 --NQPNGLFPDVS---------DGSPMWGHQTATTISNQNGSPFHQQ------------- 110 120 130 140 180 190 200 210 220 pF1KE9 PPAQGHPQHMQQMGSYMARGDFSM----QQHGQ-----PQQRMSQFSQGQEGLNQGNPFI :: . :.: :..:. ::.. .:. : :: .... ::..:.:.. :. CCDS45 ----GHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQQNRNNLNPGQNSLSQSKNFM 150 160 170 180 190 200 230 240 250 260 270 280 pF1KE9 ATSGPG--HLSHVPQQSPSMAPSLRHSVQQFHH--HPSTALHGESVAHSPRFSPNPPQQG .::: ...: ::.. . . :.::: . .::. .: : .: :.: CCDS45 NVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAHFHKCS-SH---------QEG 210 220 230 240 250 290 300 310 320 330 340 pF1KE9 AVRPQTLNFSSRSQTVPSPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQS ::.. : .. : ...:: :.: . :: .... .. ... :. .. .. ::. CCDS45 -------NFNGPSPNMTSCSVSNSQQFSSH-YS-FSSNHISPNSLLQSSAVLASNHTNQT 260 270 280 290 300 350 360 370 380 390 400 pF1KE9 VPRYPNAVGFPSNSG-QGLMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAM . . .. .: . : . :. ..:. :::. : : .: :.:::.: : .::.. : CCDS45 LSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNY-SNSKLSPVH-M 310 320 330 340 350 410 420 430 440 450 460 pF1KE9 SNPAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFI . : :.. :. .: : . .: .... ..:. . .:..:: CCDS45 NFPD--------------PVDSGT--QMGHFN-DHVETNGFSSLEENLLHQVESQTEPFT 360 370 380 390 400 470 480 490 500 510 520 pF1KE9 GMSSAPRELTGHMRPNGCPGVGLGDPQAIQERLIP--GQQHPGQQPSFQQLPTCPPLQPH :.. :..: .:: :.: .. ::. : . : : CCDS45 GLD--PEDL-------------------LQEGLLPHFDESTFGQDNSSHILDHDLDRQF- 410 420 430 440 530 540 550 560 570 580 pF1KE9 PGLHHQSSPPHPHHQPWAQLHPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQL : . : : : . .. . : :. .. :.. :. . .: .. CCDS45 --TSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLCLQRQPPSSKKSDGSGTYT 450 460 470 480 490 590 600 610 620 630 pF1KE9 VKSDDYLPSIEQQPQQKK-----KKKKNNHIVAEDPSKG--FGKDDFPGGVDNQELNRNS .. . . .. :.:: :..: :.:..: .:. :. ..: .. ... : CCDS45 KLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKERGERNIPRVMSPENFPTAS 500 510 520 530 540 550 640 650 660 670 680 690 pF1KE9 LDGSQEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPK ..:..:.: .. .:: ::. ::.:: CCDS45 VEGKEEKKGRRMKSK----------------------------PKDKDSKKTKTC----- 560 570 580 700 710 720 730 740 750 pF1KE9 SSKKSSNKKPDSEASALKKKVNKGKTEGS-ENSDLDKTPPPSPPPEEDEDPGVQKRRSSR :: . . : . .: :: .: :.:.: : :: .. : . .:.: :::::.: CCDS45 -SKLKEKTKIGKLIITLGKK-QKRKNESSDEISDAEQMPQHT---LKDQDS--QKRRSNR 590 600 610 620 630 760 770 780 790 800 pF1KE9 QVKRKRYTEDLEFKISDEEADDADAAGRDS-PSNTSQSEQ---QESVDAEGPVVEKIMSS :.:::.:.::.: : :.::. . ..: : : : .. . .. .:.::.:: CCDS45 QIKRKKYAEDIEGKQSEEEVKGSMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSS 640 650 660 670 680 690 810 820 830 840 850 860 pF1KE9 RSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKIKRFKAKQGQN-K :.:::. : .. :::.:::::.:::::.::. :.: ::::::::::::: .:.: . CCDS45 RTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAH 700 710 720 730 740 750 870 880 890 900 910 920 pF1KE9 FLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYEDSTWERRQDIDQ :....:.: ::::::::::... . : : :::: .:::::::::::::::: ..:.: CCDS45 FFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDL 760 770 780 790 800 810 930 940 950 960 970 980 pF1KE9 AKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEGVNWLLFNWYNM :::::::.:.. .:.:.:..:::.. ::: ..::.:::.:.::::::::.::::::::: CCDS45 AKIEEFEQLQASRPDTRRLDRPPSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNR 820 830 840 850 860 870 990 1000 1010 1020 1030 1040 pF1KE9 RNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREFRTWTELNVVVY :::::::::::::::::::::::: : ::.::::.::::::: ::::::::::..::::: CCDS45 RNCILADEMGLGKTIQSITFLYEILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVY 880 890 900 910 920 930 1050 1060 1070 1080 1090 1100 pF1KE9 HGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELRNIPWRCVVIDE ::: ::. :: :::::.: :::.:.:.:.:.:::::::::: : :: : ::::.::: CCDS45 HGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDE 940 950 960 970 980 990 1110 1120 1130 1140 1150 1160 pF1KE9 AHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSETTFMQEF ::::::.:::::::::.:.:::::::::::::::::::::::::::: :::::.:::::: CCDS45 AHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEF 1000 1010 1020 1030 1040 1050 1170 1180 1190 1200 1210 1220 pF1KE9 GDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYRAILEKNF ::::::::::::::::::::::::::::::.::::::::::::::::::::::::::::: CCDS45 GDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNF 1060 1070 1080 1090 1100 1110 1230 1240 1250 1260 1270 1280 pF1KE9 TFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESPDFQLQAMI .:::::.::.:::::.::::::::::::::::.::::::: ::..:.: . ::.::::: CCDS45 SFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMI 1120 1130 1140 1150 1160 1170 1290 1300 1310 1320 1330 1340 pF1KE9 QAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDGRVRGNLRQ :.:::::::::::::.:::::.:::::::::::::::::::..:: :::::::::::::: CCDS45 QSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQ 1180 1190 1200 1210 1220 1230 1350 1360 1370 1380 1390 1400 pF1KE9 AAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS45 AAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQN 1240 1250 1260 1270 1280 1290 1410 1420 1430 1440 1450 1460 pF1KE9 KSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKKEIEDLLRK :.::.:::.:::::::::::.:::::::::::::::::::. ..:.:::::::::::::. CCDS45 KAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRR 1300 1310 1320 1330 1340 1350 1470 1480 1490 1500 1510 1520 pF1KE9 GAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFVASGNRTDISLD :::::.:.:::::::::::::::::::::.::::::::.::::::::::::::::::::: CCDS45 GAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLD 1360 1370 1380 1390 1400 1410 1530 1540 1550 1560 1570 1580 pF1KE9 DPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELMEFSDLESDSEEK :::::::::::::.::.:..:::.:::::::.::::: .::.: ::: :.:. ::...:: CCDS45 DPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRPFSATK-DELAELSEAESEGDEK 1420 1430 1440 1450 1460 1470 1590 1600 1610 1620 1630 1640 pF1KE9 PCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLTEQDVETICRTI : : ::: :.:.::.:.::::::::::::::::: .::::::.::::.:.::: :::.. CCDS45 P--KLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWREILSHGRFKRQLNEHDVEIICRAL 1480 1490 1500 1510 1520 1530 1650 1660 1670 1680 1690 1700 pF1KE9 LVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKGKKVKAQSTQPV :.::: ::.:::.::.::::::::: ::::: : :: ::::::::::::::::.:... CCDS45 LAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFD 1540 1550 1560 1570 1580 1590 1710 1720 1730 1740 1750 1760 pF1KE9 VQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADS .: :.:: . ::. :.:...::::.:::::::::::::::::.:::::.. .:...:.:. CCDS45 IQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDA 1600 1610 1620 1630 1640 1650 1770 1780 1790 1800 1810 1820 pF1KE9 SEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPALCFLERVGMPDA :. :::.::: :.::::.::: .::::::::::::::::::..::::::::::::: :: CCDS45 SDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDE 1660 1670 1680 1690 1700 1710 1830 1840 1850 1860 1870 1880 pF1KE9 KAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSPSEDKEESMEIH ::.:::::..:.. :: . :::::::. . :::.:.. ..::.. . CCDS45 KAVAAEQRANDYM-DG--------DVEDPEYKPAPAIFKDDIEDDVSSPGD----LVIAD 1720 1730 1740 1750 1760 1890 1900 1910 1920 1930 1940 pF1KE9 ATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQ-EALMKTDRRRRRPR . :. :.. ..:::. :.::::::::::::::. : .:..: . ... .: CCDS45 GDGQLMEGD----KVYWPTQSALTTRLRRLITAYQRTNKNRQIQQIQPTFSVPTSVMQPI 1770 1780 1790 1800 1810 1950 1960 1970 1980 1990 2000 pF1KE9 EEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWNQFRAFARLDK : .:. . : : :..:.::::::::::::::::::.::: . ::::..:::.::: : CCDS45 YEEATLNPKMAAKI-ERQQRWTRREEADFYRVVSTFGVVFDPDRGQFDWTKFRAMARLHK 1820 1830 1840 1850 1860 1870 2010 2020 2030 2040 2050 2060 pF1KE9 KSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTLYRIELLRKIR :.:.:::::. :..:::::::.: : . :.. .:.:::::::::::::::::::.: CCDS45 KTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNI--FIQPITEERASRTLYRIELLRKVR 1880 1890 1900 1910 1920 1930 2070 2080 2090 2100 2110 2120 pF1KE9 EQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDLLVGAAKHGVSRTDYHILNDPELSFL ::.:.:::: ::::::.:. ::: ::::: ::::::.::::::::::::::: ::::::. CCDS45 EQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVSRTDYHILRDPELSFM 1940 1950 1960 1970 1980 1990 2130 2140 2150 2160 pF1KE9 DAHKNFAQNRGAGNTSSL------------NPL--------AVGFVQTPPVISSAHIQDE :..:..:.. : . .: .:: : :.. ..: ....: CCDS45 AAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGIILEEMKVKSENLKEE 2000 2010 2020 2030 2040 2050 2170 2180 pF1KE9 --------------RVLEQAE-------------------GKVE----------EP--EN :.: ..: :: : :: : CCDS45 PQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCETDRRMVAARTEPLTPN 2060 2070 2080 2090 2100 2110 2190 2200 2210 2220 2230 pF1KE9 PAAKE---KCEGKEEEEETDGSGKESKQECEAEASSVKNELKGVEVGADTGSKS----IS ::.:. . .:.: ..:.....:. .. .:: .. . . :....:.: : CCDS45 PASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSRSGSSSSSSSSCSSAS 2120 2130 2140 2150 2160 2170 2240 2250 2260 2270 2280 pF1KE9 EKGSEEDEEEKLEDDDKSEESSQPEAGAVSRG-----KNFDEESNASMSTARDETRDGFY ..: . ....::::.. : : .: : .:::: ::.::..:::.:.: CCDS45 SSSSSSTSSSSSSSSSSSEESDSDEEEAQKRESTTHMKAYDEESVASLSTTQDETQDSFQ 2180 2190 2200 2210 2220 2230 2290 2300 2310 2320 2330 2340 pF1KE9 MEDGDPSVAQLLHE-RTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMFDFQGLIP :..: : : .:. .: :.::::::::::::.::..::::::: ::. .: . . CCDS45 MNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGKWPSARRS-YDANTVAS 2240 2250 2260 2270 2280 2290 2350 2360 2370 2380 2390 2400 pF1KE9 GYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQRRRRRRKI :: .::: ... :. . . .:. : :.::: .:.:. .: ..: . CCDS45 FYTTKLLDSPGAATEYSDPSVPTPPGAGVKEEHDQSTQMSKEGGLKLTFQKQGLAQKRPF 2300 2310 2320 2330 2340 2350 2410 2420 2430 2440 2450 2460 pF1KE9 EIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNFSSLSSKFIL . : .... : ..::: : .:: .: :: CCDS45 DGEDGALGQQQYL----TRLRELQSASE-----------------TSLVNF--------- 2360 2370 2380 2470 2480 2490 2500 2510 2520 pF1KE9 PNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNVEGLDLLFM :. : ::: : : :: :: ..:..: .:.::::::::::.:..:. CCDS45 PK-SIPVS------------GTSIQPTLGA-NGVILDNQPIVKKRRGRRKNVEGVDIFFF 2390 2400 2410 2420 2430 2530 2540 2550 2560 2570 2580 pF1KE9 SHKR----TSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTRLVGE .... .::. ..... ... . ..:: : .. .:::::.:::::.:. CCDS45 NRNKPPNHVSLGLTSSQISTGINPALSYTQPQGIP-----DTESPVPVINLKDGTRLAGD 2440 2450 2460 2470 2480 2590 2600 2610 2620 2630 2640 pF1KE9 DAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINTLTG :::: ::: .::: :: :. :. ...:. . .:::::::::::::::.:.::: CCDS45 DAPKRKDLEKWLKEHPGYVEDLGAFIPR----MQLHEGRPKQKRHRCRNPNKLDVNSLTG 2490 2500 2510 2520 2530 2540 2650 2660 2670 2680 2690 2700 pF1KE9 EERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFDRL :::: ..:.::..:.:::.:::.::: :.:.:: :..:::.: :.::::::.::::..:. CCDS45 EERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYERI 2550 2560 2570 2580 2590 2600 2710 2720 2730 2740 2750 pF1KE9 LTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTS-GINPLLVNSLFAGMDLTSLQ--- ::::::: : .::::::::: ::.:.:::::...:: . ::::.:.:. :.:::.:: CCDS45 LTGPVVR-EEVSRRGRRPKSGIAKATAAAAAASATSVSGNPLLANGLLPGVDLTTLQALQ 2610 2620 2630 2640 2650 2660 2760 2770 2780 2790 2800 2810 pF1KE9 -NLQNLQSLQL-AGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLN :::::::::. :::::.: :: . ::.::: ::..:..: :::::::..:.::::. CCDS45 QNLQNLQSLQVTAGLMGMPTGLPS----GGEAKNMAAMFPMLLSGMAGLPNLLGMGGLLT 2670 2680 2690 2700 2710 2820 2830 2840 2850 2860 2870 pF1KE9 NPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAA .: ..: . ..:. : : .: . : ...:: :: .::.. :...... CCDS45 KPTESGTEDKKGSDSK-ESEGKTERTESQSSENGGEN--------SVSSSPSTSSTAALN 2720 2730 2740 2750 2760 2880 2890 2900 2910 2920 2930 pF1KE9 TAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEK :: : .::::.::.:::.. .::.:.: :::. : .: . :. . . ..: CCDS45 TAAA---ANPLALNPLLLSNI----LYPGMLLTPGLN-LHIPTLS-----QSNTFDVQNK 2770 2780 2790 2800 2810 2940 2950 2960 2970 2980 2990 pF1KE9 AADKAEGGPFKDGETLEGSDAEESLDK--TAESSLLEDEIAQG-EELDSLDGGDEIENNE .: . . . : : : ... :: : : : :. .: :. :. .:.: .. CCDS45 NSDLGSSKSVEVKE--EDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASSGSDSTSSSS 2820 2830 2840 2850 2860 2870 pF1KE9 NDE .: CCDS45 EDSDSSNED 2880 >>CCDS53885.1 CHD8 gene_id:57680|Hs108|chr14 (2581 aa) initn: 6942 init1: 3921 opt: 6154 Z-score: 2718.7 bits: 517.5 E(32554): 4.1e-145 Smith-Waterman score: 7462; 47.3% identity (67.7% similar) in 2847 aa overlap (80-2868:6-2565) 50 60 70 80 90 100 pF1KE9 LQPSLHHPSTNQNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPP : :.:.:: . .. . . .: : CCDS53 MADPIMDLFDDPNLFGLDSLTD---DSFNQVTQDP 10 20 30 110 120 130 140 150 160 pF1KE9 VPQ---VPHGGSGGGQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQ . . .: . .. :: :. : . : .:: . . : :.. :: . .. . CCDS53 IEEALGLPSSLDSLDQM-------NQDGGGGDVGNSS--ASELVPPPEET-APTELSKES 40 50 60 70 80 170 180 190 200 210 220 pF1KE9 PQPPQPAPSGPPAQGHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPF : . . .: ..: .. . : . : . . : :..:: :.::::: CCDS53 TAPAPESITLHDYTTQPASQEQPAQ-------PVLQTSTPTSGLLQVSKSQEILSQGNPF 90 100 110 120 130 230 240 250 260 270 280 pF1KE9 IATSGPG-HLSHVPQQSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAV ...:. . : . : :. ::. . .. ::... : ::. CCDS53 MGVSATAVSSSSAGGQPPQSAPK----IVILKAPPSSSVTGAHVAQI------------- 140 150 160 170 290 300 310 320 330 340 pF1KE9 RPQTLNFSSRSQTVPSPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVP :. ...: .: : . .... .. .... : :.. ...:: . .:: CCDS53 --QAQGITSTAQ----PLVAGTANGGKVTFTKVLTGTPLRPGVSI---VSGNTVLAAKVP 180 190 200 210 220 350 360 370 380 390 400 pF1KE9 RYPNAVGFPSNSGQGLMHQQPIHPSGSLNQMNTQTMHPSQPQGTY-ASPPPMSPMKAMSN :: :. ..:: ..:. : .. : : :. :. ::..: ... CCDS53 GNQAAV------------QRIVQPSRPVKQLVLQPVKGSAPAGNPGATGPPLKPAVTLT- 230 240 250 260 270 410 420 430 440 450 460 pF1KE9 PAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGM . : : . . .. .:: : : : . .. . . :. . .. CCDS53 ---STPTQGESKRITLVLQ--------QPQ-SGGPQGHRHVVLGSLPGKIVLQGNQLAAL 280 290 300 310 320 470 480 490 500 510 520 pF1KE9 SSAPRELTGHMRPNGCPGVGLGDPQAIQE-RLIPGQQHPGQQPSFQQLPTCPPLQPHPGL ..: .. :. : . : : :. ...: : :..::. :: :. :. CCDS53 TQA-KNAQGQ--PAKVVTIQLQVQQPQQKIQIVP--QPPSSQPQPQQPPSTQPVTLSSV- 330 340 350 360 370 530 540 550 560 570 580 pF1KE9 HHQSSPPHPHHQPWAQLH-PSPQNTPQKVPVHQHSPSEPFLEK--PVPDMTQVSGPNAQL .:.. : ..: .: : .. : . : . : . ... .:.: .. CCDS53 -QQAQIMGPGQSPGQRLSVPVKVVLQPQAGSSQGASSGLSVVKVLSASEVAALSSPASSA 380 390 400 410 420 430 590 600 610 620 630 pF1KE9 VKSDDYLPSIEQQP-QQKKKKKKNNHIVAEDPSKGF--GKDDFPGGVDNQELNRNSLDGS .: :.. ...::..: :.:::: ... :....: ....:: :. CCDS53 PHSGGKTGMEENRRLEHQKKQEKANRIVAEAIARARARGEQNIPRVLNEDEL--PSVRPE 440 450 460 470 480 490 640 650 660 670 680 690 pF1KE9 QEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPKSSKK .: .::.....: . :: : ::. :: : : . :.: : : .:: CCDS53 EEGEKKRRKKSAGERLKEEK-------PKKSKTSGASKT-----KGKSKLNTITPVVGKK 500 510 520 530 540 700 710 720 730 740 750 pF1KE9 SSNKKPDSEASALKKKVNKGKTEGSENSDLDKTPPPSPPPEEDEDPGVQKRRSSRQVKRK . .. .:.:::.. : :: .:::. ..:::::.:::::: CCDS53 ------------------RKRNTSSDNSDVEVMPAQSP--REDEESSIQKRRSNRQVKRK 550 560 570 580 760 770 780 790 800 pF1KE9 RYTEDLEFKISD-EEADDADAAGRDSPS----NTSQSEQQESVDA-----EGP------V .:::::..::.: :: ...:..: .: . : . :.. . :.: . CCDS53 KYTEDLDIKITDDEEEEEVDVTGPIKPEPILPEPVQEPDGETLPSMQFFVENPSEEDAAI 590 600 610 620 630 640 810 820 830 840 850 860 pF1KE9 VEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKIKRFKA :.:..: : :::. ::. .: :::.:::::.:::::.::.: .:::::::.::.::::. CCDS53 VDKVLSMRIVKKELPSGQYTEAEEFFVKYKNYSYLHCEWATISQLEKDKRIHQKLKRFKT 650 660 670 680 690 700 870 880 890 900 910 920 pF1KE9 KQGQNKFLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYEDSTWER :..: . . . ..: :::::::::::.: ..: : : :::: .:::::::::::::::: CCDS53 KMAQMRHFFHEDEEPFNPDYVEVDRILDESHSIDKDNGEPVIYYLVKWCSLPYEDSTWEL 710 720 730 740 750 760 930 940 950 960 970 980 pF1KE9 RQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEGVNWLL ..:.:..::.::....::.:: .::.:: :. ::: : :.:::: :.::::::::::::: CCDS53 KEDVDEGKIREFKRIQSRHPELKRVNRPQASAWKKLELSHEYKNRNQLREYQLEGVNWLL 770 780 790 800 810 820 990 1000 1010 1020 1030 1040 pF1KE9 FNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREFRTWTE ::::: .:::::::::::::::::.:: :.: ::::::::::::::: :::::: :::: CCDS53 FNWYNRQNCILADEMGLGKTIQSIAFLQEVYNVGIHGPFLVIAPLSTITNWEREFNTWTE 830 840 850 860 870 880 1050 1060 1070 1080 1090 1100 pF1KE9 LNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELRNIPWR .:..::::: :::. :: :::: :: .::.: :.::: :.::::::::.::::::.: :: CCDS53 MNTIVYHGSLASRQMIQQYEMYCKDSRGRLIPGAYKFDALITTFEMILSDCPELREIEWR 890 900 910 920 930 940 1110 1120 1130 1140 1150 1160 pF1KE9 CVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSET ::.:::::::::::::::..:: :::::::::::::::::::::::::::::::.::::. CCDS53 CVIIDEAHRLKNRNCKLLDSLKHMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSQFPSES 950 960 970 980 990 1000 1170 1180 1190 1200 1210 1220 pF1KE9 TFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYRA :...::::::::::::::::::::::::::::::::::::.:::::::::::::::::: CCDS53 EFLKDFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKQETIIEVELTNIQKKYYRA 1010 1020 1030 1040 1050 1060 1230 1240 1250 1260 1270 1280 pF1KE9 ILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESPDF ::::::.:::::.:..:.:::::::::::::::::::::::::::: ::.:. . :: CCDS53 ILEKNFSFLSKGAGHTNMPNLLNTMMELRKCCNHPYLINGAEEKILTEFREACHIIPHDF 1070 1080 1090 1100 1110 1120 1290 1300 1310 1320 1330 1340 pF1KE9 QLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDGRV .::::...:::::::::::::::::::.::::::::::::::::::::::: :::::::: CCDS53 HLQAMVRSAGKLVLIDKLLPKLKAGGHKVLIFSQMVRCLDILEDYLIQRRYLYERIDGRV 1130 1140 1150 1160 1170 1180 1350 1360 1370 1380 1390 1400 pF1KE9 RGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARC 1190 1200 1210 1220 1230 1240 1410 1420 1430 1440 1450 1460 pF1KE9 HRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKKEI :::::::.::.::::::::::::::::::::::::::::::::::.. .:.::.::::: CCDS53 HRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRDGNITGIQQFSKKEI 1250 1260 1270 1280 1290 1300 1470 1480 1490 1500 1510 1520 pF1KE9 EDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFVASGNR :::::::::.:.:.:.::::::::::::::::::: ::::::::::::::::::::: :: CCDS53 EDLLRKGAYAAIMEEDDEGSKFCEEDIDQILLRRTTTITIESEGKGSTFAKASFVASENR 1310 1320 1330 1340 1350 1360 1530 1540 1550 1560 1570 1580 pF1KE9 TDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELMEFSDLE ::::::::::::::::::.::.: ::..::::::::::::::: .:..:.:.:.:::::: CCDS53 TDISLDDPNFWQKWAKKADLDMDLLNSKNNLVIDTPRVRKQTRHFSTLKDDDLVEFSDLE 1370 1380 1390 1400 1410 1420 1590 1600 1610 1620 1630 1640 pF1KE9 SDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLTEQDVE :...:.: . :: .:. ..:.:..::::::.::::::::: :::::::.::..::.::: CCDS53 SEDDERP--RSRR-HDRHHAYGRTDCFRVEKHLLVYGWGRWRDILSHGRFKRRMTERDVE 1430 1440 1450 1460 1470 1480 1650 1660 1670 1680 1690 1700 pF1KE9 TICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKGKKVKA ::::.:::::: ::.::::::.::::::.:. .:.:. : :::::: ::::::::::::. CCDS53 TICRAILVYCLLHYRGDENIKGFIWDLISPAENGKTKELQNHSGLSIPVPRGRKGKKVKS 1490 1500 1510 1520 1530 1540 1710 1720 1730 1740 1750 1760 pF1KE9 QSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKI ::: . . :::. . :::.:::..::::::::.:::::::::::::::::::::::.:. CCDS53 QSTFDI-HKADWIRKYNPDTLFQDESYKKHLKHQCNKVLLRVRMLYYLRQEVIGDQAEKV 1550 1560 1570 1580 1590 1770 1780 1790 1800 1810 1820 pF1KE9 LEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPALCFLER : :: .:: :.:.: . :::. :::.:::::::::::::::::::.:::::::::::. CCDS53 LGGAIASEIDIWFPVVDQLEVPTTWWDSEADKSLLIGVFKHGYEKYNTMRADPALCFLEK 1600 1610 1620 1630 1640 1650 1830 1840 1850 1860 1870 1880 pF1KE9 VGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSPSEDKE .: :: ::::::.: : ..: .: .::.. ::::::: . : ::. :: ..: . CCDS53 AGRPDDKAIAAEHRVLDNFSDIVEGVDFDKDCEDPEYKPLQGPPKDQDDE--GDPLMMMD 1660 1670 1680 1690 1700 1710 1890 1900 1910 1920 1930 1940 pF1KE9 ESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQEALMKTDRR : . . : ... . . :.:.:: :.::.:::::.:::::::::.::. :: . ::: CCDS53 EEISV-IDGDEAQVTQQPGHLFWPPGSALTARLRRLVTAYQRSYKREQMKIEAAERGDRR 1720 1730 1740 1750 1760 1770 1950 1960 1970 1980 1990 2000 pF1KE9 RRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWNQFRAF ::: . . : :. ::.:.:::::..::::::::::: .:: .:: :..::.: CCDS53 RRRCEAAFKLKEIARR----EKQQRWTRREQTDFYRVVSTFGVEYDPDTMQFHWDRFRTF 1780 1790 1800 1810 1820 1830 2010 2020 2030 2040 2050 2060 pF1KE9 ARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTLYRIEL ::::::.:::: ::: ::::::.:::.: ::::: . .:::::::::::::::::: CCDS53 ARLDKKTDESLTKYFHGFVAMCRQVCRLPPAAGDEPPDPNLFIEPITEERASRTLYRIEL 1840 1850 1860 1870 1880 1890 2070 2080 2090 2100 2110 pF1KE9 LRKIREQVLHHPQLGERLKLCQP-SLDLPEWWECGRHDRDLLVGAAKHGVSRTDYHILND ::..::::: :: : .:: :::: . .::.::: ::: .:: :::.::::.:: .:..: CCDS53 LRRLREQVLCHPLLEDRLALCQPPGPELPKWWEPVRHDGELLRGAARHGVSQTDCNIMQD 1900 1910 1920 1930 1940 1950 2120 2130 2140 2150 2160 2170 pF1KE9 PELSFLDAHKNFAQNRGAGNTS-SLNPLAVGFVQTPPVISSAHIQDERVLEQAEGKVEEP :..::: :. :. ::. :: . ::. .. ... . .: : .: . :: CCDS53 PDFSFLAARMNYMQNHQAGAPAPSLSRCSTPLLHQQYTSRTASPLPLRPDAPVEKSPEET 1960 1970 1980 1990 2000 2010 2180 2190 2200 2210 2220 2230 pF1KE9 ENPAAKEKCEGKEEEEETDGSGKESKQECEAEASS------VKNELKGVEVGADTGSKS- . . . . . :.:. . .. . :. : ..: :. . :.. . : : CCDS53 ATQVPSLESLTLKLEHEVVARSRPTPQDYEMRVSPSDTTPLVSRSVPPVKLEDEDDSDSE 2020 2030 2040 2050 2060 2070 2240 2250 2260 2270 2280 pF1KE9 --ISE----KGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMSTARDETRD .:. ..: . . . :.::. .. . ::.: .:::: :.. ..: CCDS53 LDLSKLSPSSSSSSSSSSSSSSTDESEDEKEEKLTDQSRSKLYDEESLLSLTM----SQD 2080 2090 2100 2110 2120 2290 2300 2310 2320 2330 2340 pF1KE9 GFYMEDGDPSVAQLL--HERTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMFDFQ :: :::. . .:: .:: : : ::::::.:::.: .:.:::.:::: .::.. CCDS53 GFPNEDGEQMTPELLLLQERQRA-SEWPKDRVLINRIDLVCQAVLSGKWPSSRRSQEMVT 2130 2140 2150 2160 2170 2180 2350 2360 2370 2380 2390 2400 pF1KE9 GLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQRRRR : : : .::: :.. .: :: :: : CCDS53 GGILGPGNHLLDSP---------------SLTPGE-YGDSP-----------VPTPR--- 2190 2200 2210 2410 2420 2430 2440 2450 2460 pF1KE9 RRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNFSSLSS . :: .. : .:...:: .....:..: CCDS53 -------SSSAA---SMAE-----EEASAVS------------------TAAAQFTKLRR 2220 2230 2240 2470 2480 2490 2500 2510 2520 pF1KE9 KFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLL--NGSLVDGEPPMKRRRGRRKNVEG . . .. ..: . ::. : .: : :: . ::.: .....: ::.. CCDS53 GMDEKEFTVQIKD---------EEGLKLTFQKHKLMANGVMGDGHPLFHKKKGNRKKLVE 2250 2260 2270 2280 2290 2530 2540 2550 2560 2570 2580 pF1KE9 LDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTRLV :.. : :: :. ..: .::::::: ::: :: CCDS53 LEVECM------------------EE----------PNHLDVDLETRIPVINKVDGTLLV 2300 2310 2320 2590 2600 2610 2620 2630 2640 pF1KE9 GEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINTL :::::. .: ::. :: ..:: : .. : . ::: .::.. :: ..: : CCDS53 GEDAPRRAELEMWLQGHPEFAVD-PRFLAYMED-------RRKQKWQRCKKNNKAELNCL 2330 2340 2350 2360 2370 2650 2660 2670 2680 2690 2700 pF1KE9 TGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFD : : : ..:.::::: : :..:. CCDS53 -GMEPVQTANSRNGKK-----------------------------------GHHTETVFN 2380 2390 2400 2710 2720 2730 2740 2750 2760 pF1KE9 RLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQNL :.: ::.. :....:.:: . .... : . .. : : ... : . ..::.. CCDS53 RVLPGPIA-PESSKKRARRMRPDLSKMMALMQGGSTGS----LSLHNTFQ-HSSSGLQSV 2410 2420 2430 2440 2450 2770 2780 2790 2800 2810 pF1KE9 QNL-QSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVF-------GL- ..: .: .. . : : . :: ..: . :: :. :: CCDS53 SSLGHSSATSASLPFMPFVM-----GGAPSSPHVDSSTMLHHHHHHPHPHHHHHHHPGLR 2460 2470 2480 2490 2500 2510 2820 2830 2840 2850 2860 2870 pF1KE9 -GGLLNNPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSAN : ..:...:.: :: .::.. .. :: ...: .. ..: : : CCDS53 APGYPSSPVTTASG-TTLRLPPLQPEEDDDEDEE---DDDDLSQGYDSSERDFSLIDDPM 2520 2530 2540 2550 2560 2880 2890 2900 2910 2920 2930 pF1KE9 GSVGAATAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAV CCDS53 MPANSDSSEDADD 2570 2580 >>CCDS45081.1 CHD8 gene_id:57680|Hs108|chr14 (2302 aa) initn: 6942 init1: 3921 opt: 6109 Z-score: 2699.7 bits: 513.8 E(32554): 4.7e-144 Smith-Waterman score: 7350; 51.1% identity (70.6% similar) in 2492 aa overlap (430-2868:12-2286) 400 410 420 430 440 450 pF1KE9 KAMSNPAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSR . .:: : : : . .. . . :. CCDS45 MKGESKRITLVLQQPQ-SGGPQGHRHVVLGSLPGKIVLQGN 10 20 30 40 460 470 480 490 500 510 pF1KE9 PFIGMSSAPRELTGHMRPNGCPGVGLGDPQAIQE-RLIPGQQHPGQQPSFQQLPTCPPLQ . ....: .. :. : . : : :. ...: : :..::. :: :. :. CCDS45 QLAALTQA-KNAQGQ--PAKVVTIQLQVQQPQQKIQIVP--QPPSSQPQPQQPPSTQPVT 50 60 70 80 90 520 530 540 550 560 570 pF1KE9 PHPGLHHQSSPPHPHHQPWAQLH-PSPQNTPQKVPVHQHSPSEPFLEK--PVPDMTQVSG .:.. : ..: .: : .. : . : . : . ... .:. CCDS45 LSSV--QQAQIMGPGQSPGQRLSVPVKVVLQPQAGSSQGASSGLSVVKVLSASEVAALSS 100 110 120 130 140 150 580 590 600 610 620 630 pF1KE9 PNAQLVKSDDYLPSIEQQP-QQKKKKKKNNHIVAEDPSKGF--GKDDFPGGVDNQELNRN : .. .: :.. ...::..: :.:::: ... :....: ....:: CCDS45 PASSAPHSGGKTGMEENRRLEHQKKQEKANRIVAEAIARARARGEQNIPRVLNEDELP-- 160 170 180 190 200 210 640 650 660 670 680 690 pF1KE9 SLDGSQEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEKKAKTATPKP :. .: .::.....: . :: : ::. :: : : . :.: : : CCDS45 SVRPEEEGEKKRRKKSAGERLKEEK-------PKKSKTSGASKT-----KGKSKLNTITP 220 230 240 250 700 710 720 730 740 750 pF1KE9 KSSKKSSNKKPDSEASALKKKVNKGKTEGSENSDLDKTPPPSPPPEEDEDPGVQKRRSSR .:: . .. .:.:::.. : :: .:::. ..:::::.: CCDS45 VVGKK------------------RKRNTSSDNSDVEVMPAQSP--REDEESSIQKRRSNR 260 270 280 290 760 770 780 790 800 pF1KE9 QVKRKRYTEDLEFKISD-EEADDADAAGRDSPS----NTSQSEQQESVDA-----EGP-- :::::.:::::..::.: :: ...:..: .: . : . :.. . :.: CCDS45 QVKRKKYTEDLDIKITDDEEEEEVDVTGPIKPEPILPEPVQEPDGETLPSMQFFVENPSE 300 310 320 330 340 350 810 820 830 840 850 pF1KE9 ----VVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKI .:.:..: : :::. ::. .: :::.:::::.:::::.::.: .:::::::.::. CCDS45 EDAAIVDKVLSMRIVKKELPSGQYTEAEEFFVKYKNYSYLHCEWATISQLEKDKRIHQKL 360 370 380 390 400 410 860 870 880 890 900 910 pF1KE9 KRFKAKQGQNKFLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYED ::::.:..: . . . ..: :::::::::::.: ..: : : :::: .:::::::::::: CCDS45 KRFKTKMAQMRHFFHEDEEPFNPDYVEVDRILDESHSIDKDNGEPVIYYLVKWCSLPYED 420 430 440 450 460 470 920 930 940 950 960 970 pF1KE9 STWERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEG :::: ..:.:..::.::....::.:: .::.:: :. ::: : :.:::: :.:::::::: CCDS45 STWELKEDVDEGKIREFKRIQSRHPELKRVNRPQASAWKKLELSHEYKNRNQLREYQLEG 480 490 500 510 520 530 980 990 1000 1010 1020 1030 pF1KE9 VNWLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREF :::::::::: .:::::::::::::::::.:: :.: ::::::::::::::: :::::: CCDS45 VNWLLFNWYNRQNCILADEMGLGKTIQSIAFLQEVYNVGIHGPFLVIAPLSTITNWEREF 540 550 560 570 580 590 1040 1050 1060 1070 1080 1090 pF1KE9 RTWTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELR ::::.:..::::: :::. :: :::: :: .::.: :.::: :.::::::::.:::::: CCDS45 NTWTEMNTIVYHGSLASRQMIQQYEMYCKDSRGRLIPGAYKFDALITTFEMILSDCPELR 600 610 620 630 640 650 1100 1110 1120 1130 1140 1150 pF1KE9 NIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSR .: ::::.:::::::::::::::..:: :::::::::::::::::::::::::::::::. CCDS45 EIEWRCVIIDEAHRLKNRNCKLLDSLKHMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSQ 660 670 680 690 700 710 1160 1170 1180 1190 1200 1210 pF1KE9 FPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQK ::::. :...::::::::::::::::::::::::::::::::::::.::::::::::::: CCDS45 FPSESEFLKDFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKQETIIEVELTNIQK 720 730 740 750 760 770 1220 1230 1240 1250 1260 1270 pF1KE9 KYYRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNA :::::::::::.:::::.:..:.:::::::::::::::::::::::::::: ::.:. . CCDS45 KYYRAILEKNFSFLSKGAGHTNMPNLLNTMMELRKCCNHPYLINGAEEKILTEFREACHI 780 790 800 810 820 830 1280 1290 1300 1310 1320 1330 pF1KE9 ESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYER ::.::::...:::::::::::::::::::.::::::::::::::::::::::: ::: CCDS45 IPHDFHLQAMVRSAGKLVLIDKLLPKLKAGGHKVLIFSQMVRCLDILEDYLIQRRYLYER 840 850 860 870 880 890 1340 1350 1360 1370 1380 1390 pF1KE9 IDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 IDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQ 900 910 920 930 940 950 1400 1410 1420 1430 1440 1450 pF1KE9 AQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQL ::::::::::::.::.::::::::::::::::::::::::::::::::::.. .:.::. CCDS45 AQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRDGNITGIQQF 960 970 980 990 1000 1010 1460 1470 1480 1490 1500 1510 pF1KE9 SKKEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFV ::::::::::::::.:.:.:.::::::::::::::::::: ::::::::::::::::::: CCDS45 SKKEIEDLLRKGAYAAIMEEDDEGSKFCEEDIDQILLRRTTTITIESEGKGSTFAKASFV 1020 1030 1040 1050 1060 1070 1520 1530 1540 1550 1560 1570 pF1KE9 ASGNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELME :: ::::::::::::::::::::.::.: ::..::::::::::::::: .:..:.:.:.: CCDS45 ASENRTDISLDDPNFWQKWAKKADLDMDLLNSKNNLVIDTPRVRKQTRHFSTLKDDDLVE 1080 1090 1100 1110 1120 1130 1580 1590 1600 1610 1620 1630 pF1KE9 FSDLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLT ::::::...:.: . :: .:. ..:.:..::::::.::::::::: :::::::.::..: CCDS45 FSDLESEDDERP--RSRR-HDRHHAYGRTDCFRVEKHLLVYGWGRWRDILSHGRFKRRMT 1140 1150 1160 1170 1180 1190 1640 1650 1660 1670 1680 1690 pF1KE9 EQDVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKG :.:::::::.:::::: ::.::::::.::::::.:. .:.:. : :::::: :::::::: CCDS45 ERDVETICRAILVYCLLHYRGDENIKGFIWDLISPAENGKTKELQNHSGLSIPVPRGRKG 1200 1210 1220 1230 1240 1250 1700 1710 1720 1730 1740 1750 pF1KE9 KKVKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGD ::::.::: . . :::. . :::.:::..::::::::.::::::::::::::::::::: CCDS45 KKVKSQSTFDI-HKADWIRKYNPDTLFQDESYKKHLKHQCNKVLLRVRMLYYLRQEVIGD 1260 1270 1280 1290 1300 1310 1760 1770 1780 1790 1800 1810 pF1KE9 QADKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPAL ::.:.: :: .:: :.:.: . :::. :::.:::::::::::::::::::.::::::: CCDS45 QAEKVLGGAIASEIDIWFPVVDQLEVPTTWWDSEADKSLLIGVFKHGYEKYNTMRADPAL 1320 1330 1340 1350 1360 1370 1820 1830 1840 1850 1860 1870 pF1KE9 CFLERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSP ::::..: :: ::::::.: : ..: .: .::.. ::::::: . : ::. :: ..: CCDS45 CFLEKAGRPDDKAIAAEHRVLDNFSDIVEGVDFDKDCEDPEYKPLQGPPKDQDDE--GDP 1380 1390 1400 1410 1420 1430 1880 1890 1900 1910 1920 1930 pF1KE9 SEDKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQEALM .: . . : ... . . :.:.:: :.::.:::::.:::::::::.::. :: CCDS45 LMMMDEEISV-IDGDEAQVTQQPGHLFWPPGSALTARLRRLVTAYQRSYKREQMKIEAAE 1440 1450 1460 1470 1480 1490 1940 1950 1960 1970 1980 1990 pF1KE9 KTDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWN . :::::: . . : :. ::.:.:::::..::::::::::: .:: .:: :. CCDS45 RGDRRRRRCEAAFKLKEIARR----EKQQRWTRREQTDFYRVVSTFGVEYDPDTMQFHWD 1500 1510 1520 1530 1540 2000 2010 2020 2030 2040 2050 pF1KE9 QFRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTL .::.:::::::.:::: ::: ::::::.:::.: ::::: . .::::::::::::: CCDS45 RFRTFARLDKKTDESLTKYFHGFVAMCRQVCRLPPAAGDEPPDPNLFIEPITEERASRTL 1550 1560 1570 1580 1590 1600 2060 2070 2080 2090 2100 2110 pF1KE9 YRIELLRKIREQVLHHPQLGERLKLCQP-SLDLPEWWECGRHDRDLLVGAAKHGVSRTDY :::::::..::::: :: : .:: :::: . .::.::: ::: .:: :::.::::.:: CCDS45 YRIELLRRLREQVLCHPLLEDRLALCQPPGPELPKWWEPVRHDGELLRGAARHGVSQTDC 1610 1620 1630 1640 1650 1660 2120 2130 2140 2150 2160 2170 pF1KE9 HILNDPELSFLDAHKNFAQNRGAGNTS-SLNPLAVGFVQTPPVISSAHIQDERVLEQAEG .:..::..::: :. :. ::. :: . ::. .. ... . .: : .: CCDS45 NIMQDPDFSFLAARMNYMQNHQAGAPAPSLSRCSTPLLHQQYTSRTASPLPLRPDAPVEK 1670 1680 1690 1700 1710 1720 2180 2190 2200 2210 2220 pF1KE9 KVEEPENPAAKEKCEGKEEEEETDGSGKESKQECEAEASS------VKNELKGVEVGADT . :: . . . . . :.:. . .. . :. : ..: :. . :.. . CCDS45 SPEETATQVPSLESLTLKLEHEVVARSRPTPQDYEMRVSPSDTTPLVSRSVPPVKLEDED 1730 1740 1750 1760 1770 1780 2230 2240 2250 2260 2270 2280 pF1KE9 GSKS---ISE----KGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMSTAR : : .:. ..: . . . :.::. .. . ::.: .:::: :.. CCDS45 DSDSELDLSKLSPSSSSSSSSSSSSSSTDESEDEKEEKLTDQSRSKLYDEESLLSLTM-- 1790 1800 1810 1820 1830 1840 2290 2300 2310 2320 2330 pF1KE9 DETRDGFYMEDGDPSVAQLL--HERTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQ ..::: :::. . .:: .:: : : ::::::.:::.: .:.:::.:::: .::. CCDS45 --SQDGFPNEDGEQMTPELLLLQERQRA-SEWPKDRVLINRIDLVCQAVLSGKWPSSRRS 1850 1860 1870 1880 1890 1900 2340 2350 2360 2370 2380 2390 pF1KE9 MFDFQGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPR . : : : .::: :.. .: :: :: CCDS45 QEMVTGGILGPGNHLLDSP---------------SLTPGE-YGDSP-----------VP- 1910 1920 1930 2400 2410 2420 2430 2440 2450 pF1KE9 QRRRRRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNF . :... .. : .:...:: .....: CCDS45 ------------TPRSSSAASMAE-----EEASAVS------------------TAAAQF 1940 1950 1960 2460 2470 2480 2490 2500 2510 pF1KE9 SSLSSKFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLL--NGSLVDGEPPMKRRRGRR ..: . . .. ..: . ::. : .: : :: . ::.: .....: : CCDS45 TKLRRGMDEKEFTVQIKD---------EEGLKLTFQKHKLMANGVMGDGHPLFHKKKGNR 1970 1980 1990 2000 2010 2520 2530 2540 2550 2560 2570 pF1KE9 KNVEGLDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLED :.. :.. : :: :. ..: .::::::: : CCDS45 KKLVELEVECM------------------EE----------PNHLDVDLETRIPVINKVD 2020 2030 2040 2580 2590 2600 2610 2620 2630 pF1KE9 GTRLVGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKL :: :::::::. .: ::. :: ..:: : .. : . ::: .::.. :: CCDS45 GTLLVGEDAPRRAELEMWLQGHPEFAVD-PRFLAYMED-------RRKQKWQRCKKNNKA 2050 2060 2070 2080 2090 2640 2650 2660 2670 2680 2690 pF1KE9 DINTLTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVP ..: : : : : ..:.::::: : CCDS45 ELNCL-GMEPVQTANSRNGKK-----------------------------------GHHT 2100 2110 2700 2710 2720 2730 2740 2750 pF1KE9 ESMFDRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLT :..:.:.: ::.. :....:.:: . .... : . .. : : ... : . . CCDS45 ETVFNRVLPGPIA-PESSKKRARRMRPDLSKMMALMQGGSTGS----LSLHNTFQ-HSSS 2120 2130 2140 2150 2160 2170 2760 2770 2780 2790 2800 2810 pF1KE9 SLQNLQNL-QSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVF----- .::....: .: .. . : : . :: ..: . :: :. CCDS45 GLQSVSSLGHSSATSASLPFMPFVM-----GGAPSSPHVDSSTMLHHHHHHPHPHHHHHH 2180 2190 2200 2210 2220 2820 2830 2840 2850 2860 pF1KE9 --GL--GGLLNNPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSA :: : ..:...:.: :: .::.. .. :: ...: .. ..: : CCDS45 HPGLRAPGYPSSPVTTASG-TTLRLPPLQPEEDDDEDEE---DDDDLSQGYDSSERDFSL 2230 2240 2250 2260 2270 2280 2870 2880 2890 2900 2910 2920 pF1KE9 ADSANGSVGAATAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAG : CCDS45 IDDPMMPANSDSSEDADD 2290 2300 >>CCDS13317.1 CHD6 gene_id:84181|Hs108|chr20 (2715 aa) initn: 5781 init1: 2981 opt: 5891 Z-score: 2602.8 bits: 496.1 E(32554): 1.2e-138 Smith-Waterman score: 7273; 49.3% identity (68.6% similar) in 2592 aa overlap (540-2800:18-2522) 510 520 530 540 550 560 pF1KE9 QLPTCPPLQPHPGLHHQSSPPHPHHQPWAQLHPSPQNTPQKVPVHQHSPSEPFLEKPVPD :. ::. . .: .::: :: . . . CCDS13 MKMKIQKKEKQLSNLKVLNHSPM-SDASVNFDYKSPS-PF-DCSTDQ 10 20 30 40 570 580 590 600 610 620 pF1KE9 MTQVSGPNAQLVKSDDYLPSIEQQPQQKKKKKKNNHIVAEDPSKGFG-------KDDFPG .. .. . . : : . :.. .: ..: :: : : : : :: CCDS13 EEKIEDVASHCLPQKD-LYTAEEEAATLFPRKMTSHNGMED-SGGGGTGVKKKRKKKEPG 50 60 70 80 90 100 630 640 650 660 670 pF1KE9 GVDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEP---KEPKEKKEPKEPKTPKAPKIPKE .:: .. ::.... : ::.. :.:::: ::::. :: :::: . : .. CCDS13 ---DQE---GAAKGSKDREPKPKRKREPKEPKEPRKAKEPKKAKEHKEPKQKDGAKKARK 110 120 130 140 150 680 690 700 710 720 pF1KE9 PKE----KKAKTATPKPKSSKKSSNKKPDSEASAL---KKKVNKGKTEGS-ENSDLDK-- :.: :.:: :. .....: ..: . ::: .: :.: . :. .::. CCDS13 PREASGTKEAKEKRSCTDSAARTKSRKASKEQGPTPVEKKKKGKRKSETTVESLELDQGL 160 170 180 190 200 210 730 740 750 760 770 780 pF1KE9 TPPPSPPPEED-EDPGVQKRRSSRQVKRKRYTEDLEFKISDEEADDADA--AGRDSPSNT : : :::. :. :::::.:::::..:.:::.::. :.... . ::: : .. CCDS13 TNPSLRSPEESTESTDSQKRRSGRQVKRRKYNEDLDFKVVDDDGETIAVLGAGRTSALSA 220 230 240 250 260 270 790 800 810 820 830 840 pF1KE9 S----QSEQQESVDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWAS : :.:. ::. ..:::..:..:.. . . ..: :::::.:::::::.::. CCDS13 STLAWQAEEPPEDDAN--IIEKILASKTVQEVHPGEPPFDLELFYVKYRNFSYLHCKWAT 280 290 300 310 320 330 850 860 870 880 890 900 pF1KE9 IEDLEKDKRIQQKIKRFKAKQGQNKFL-SEIEDELFNPDYVEVDRIMDFARSTD-DRGEP .:.:::: :: ::::::. ::.: : . .: ...::::::::::::.. :.. : . :: CCDS13 MEELEKDPRIAQKIKRFRNKQAQMKHIFTEPDEDLFNPDYVEVDRILEVAHTKDAETGEE 340 350 360 370 380 390 910 920 930 940 950 960 pF1KE9 VTHYLVKWCSLPYEDSTWERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSR ::::::::::::::.:::: ..:.: ::..:::.:. :: ..:::: .:.:.: :.:: CCDS13 VTHYLVKWCSLPYEESTWELEEDVDPAKVKEFESLQVL-PEIKHVERPASDSWQKLEKSR 400 410 420 430 440 450 970 980 990 1000 1010 1020 pF1KE9 EYKNNNKLREYQLEGVNWLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFL ::::.:.::::::::.::::::::: .:::::::::::::::::::: ::.:.::::::: CCDS13 EYKNSNQLREYQLEGMNWLLFNWYNRKNCILADEMGLGKTIQSITFLSEIFLRGIHGPFL 460 470 480 490 500 510 1030 1040 1050 1060 1070 1080 pF1KE9 VIAPLSTIPNWEREFRTWTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAI .::::::: :::::::::::.:..:::::: ::. :: ::: ..: :: ..: .:::.. CCDS13 IIAPLSTITNWEREFRTWTEMNAIVYHGSQISRQMIQQYEMVYRDAQGNPLSGVFKFHVV 520 530 540 550 560 570 1090 1100 1110 1120 1130 1140 pF1KE9 ITTFEMILTDCPELRNIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNT ::::::::.:::::..: : ::.:::::::::::::::::::.: ::::::::::::::. CCDS13 ITTFEMILADCPELKKIHWSCVIIDEAHRLKNRNCKLLEGLKLMALEHKVLLTGTPLQNS 580 590 600 610 620 630 1150 1160 1170 1180 1190 1200 pF1KE9 VEELFSLLHFLEPSRFPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAP ::::::::.:::::.:::::.:..:::::::::::.:::.:::::::::::.:::::::: CCDS13 VEELFSLLNFLEPSQFPSETAFLEEFGDLKTEEQVKKLQSILKPMMLRRLKDDVEKNLAP 640 650 660 670 680 690 1210 1220 1230 1240 1250 1260 pF1KE9 KEETIIEVELTNIQKKYYRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLING :.::::::::::::::::::::::::.::.::..: :.:::.:::::::::::::::::: CCDS13 KQETIIEVELTNIQKKYYRAILEKNFSFLTKGANQHNMPNLINTMMELRKCCNHPYLING 700 710 720 730 740 750 1270 1280 1290 1300 1310 1320 pF1KE9 AEEKILEEFKETHNAESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLD :::::::.:..::. ..::::::::::::::::::::::::: ::::.:::::::::::: CCDS13 AEEKILEDFRKTHSPDAPDFQLQAMIQAAGKLVLIDKLLPKLIAGGHKVLIFSQMVRCLD 760 770 780 790 800 810 1330 1340 1350 1360 1370 1380 pF1KE9 ILEDYLIQRRYPYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADT ::::::::::: :::::::::::::::::::: ::::::::::::::::::::::::::: CCDS13 ILEDYLIQRRYTYERIDGRVRGNLRQAAIDRFCKPDSDRFVFLLCTRAGGLGINLTAADT 820 830 840 850 860 870 1390 1400 1410 1420 1430 1440 pF1KE9 CIIFDSDWNPQNDLQAQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQ :::::::::::::::::::::::::::.::.::::::::::::::::::::::::::::: CCDS13 CIIFDSDWNPQNDLQAQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQ 880 890 900 910 920 930 1450 1460 1470 1480 1490 1500 pF1KE9 SMSGRENATNGVQQLSKKEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITI ... :...::::::::: :.::::::::::::::::::::::::::::::: :::::::: CCDS13 DIN-RKGGTNGVQQLSKMEVEDLLRKGAYGALMDEEDEGSKFCEEDIDQILQRRTHTITI 940 950 960 970 980 990 1510 1520 1530 1540 1550 1560 pF1KE9 ESEGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRK .::::::::::::::::::::::::::::::::::: :::: .: : ...:::: ::::: CCDS13 QSEGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKIAELDTEAKNEKESLVIDRPRVRK 1000 1010 1020 1030 1040 1050 1570 1580 1590 1600 1610 1620 pF1KE9 QTRLYSAVKEDELMEFSDLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGR ::. :.. .::::::::.:.:::.:.: .. :: .::.. : :.::::::::::..:::: CCDS13 QTKHYNSFEEDELMEFSELDSDSDERP-TRSRRLNDKARRYLRAECFRVEKNLLIFGWGR 1060 1070 1080 1090 1100 1110 1630 1640 1650 1660 1670 1680 pF1KE9 WTDILSHGRYKRQLTEQDVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALV : :::.:::.: .:.:.:.: :::..::::..::::::.::::::.::::: :::...: CCDS13 WKDILTHGRFKWHLNEKDMEMICRALLVYCVKHYKGDEKIKSFIWELITPTKDGQAQTLQ 1120 1130 1140 1150 1160 1170 1690 1700 1710 1720 1730 1740 pF1KE9 NHSGLSAPVPRGRKGKKVKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLL :::::::::::::::::.: : : ..::::::.:::......:.::::::.::::::: CCDS13 NHSGLSAPVPRGRKGKKTKNQLLIPELKDADWLATCNPEVVLHDDGYKKHLKQHCNKVLL 1180 1190 1200 1210 1220 1230 1750 1760 1770 1780 1790 1800 pF1KE9 RVRMLYYLRQEVIGDQADKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFK ::::::::. :..:. :.: .::. . : :: .:. . :.:.:::: :::::::::::: CCDS13 RVRMLYYLKAEILGEAAEKAFEGSPARELDVPLPDIDYMEIPVDWWDAEADKSLLIGVFK 1240 1250 1260 1270 1280 1290 1810 1820 1830 1840 1850 pF1KE9 HGYEKYNSMRADPALCFLERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDE-DPEYKP ::::.::.:::::::::::.::::: :...::: :: .: . :. :.::. . . CCDS13 HGYERYNAMRADPALCFLEKVGMPDEKSLSAEQGVTDGTSDIPERGNTDKEDNAEDKVDG 1300 1310 1320 1330 1340 1350 1860 1870 1880 1890 1900 1910 pF1KE9 TRTPFKDEIDEFANSPSEDKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITA . .. : . :: :..: . ...... . :: .:.::.:::::.:. CCDS13 LQKQTESSSDGGDGVFSEKKDDS-------RAAQDGSDPDKSPWPVSSALTARLRRLVTV 1360 1370 1380 1390 1400 1920 1930 1940 1950 1960 1970 pF1KE9 YQRSYKRQQMRQEALMKTDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVS ::: ... : : : .. .: : .: . : .: ...:::::.:::::.:: CCDS13 YQRCNRKELCRPEILGPGNQGYWVQEEMFRRT-SEMDLINKEAQKRWTRREQADFYRTVS 1410 1420 1430 1440 1450 1460 1980 1990 2000 2010 2020 2030 pF1KE9 TFGVIFDPVKQQFDWNQFRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDL .:::..: :. :::.::: ..:::::::::::.:: :::::: :::.:. : ::: CCDS13 SFGVVYDQEKKTFDWTQFRIISRLDKKSDESLEQYFYSFVAMCRNVCRLPTWKDGGPPDT 1470 1480 1490 1500 1510 1520 2040 2050 2060 2070 2080 2090 pF1KE9 SSIIEPITEERASRTLYRIELLRKIREQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRD . .::::::::.:::::::::::.:::::. ::: :::.::.::: :: :::::.:::: CCDS13 TIYVEPITEERAARTLYRIELLRKVREQVLKCPQLHERLQLCRPSLYLPVWWECGKHDRD 1530 1540 1550 1560 1570 1580 2100 2110 2120 2130 2140 pF1KE9 LLVGAAKHGVSRTDYHILNDPELSFLDAHKNFAQNRGAGNTSSLN--------------- ::.:.::::..::: .:.:::.::::::..:.::.. .:. . : CCDS13 LLIGTAKHGLNRTDCYIMNDPQLSFLDAYRNYAQHKRSGTQAPGNLCCLYQTNSKLYESL 1590 1600 1610 1620 1630 1640 2150 2160 2170 pF1KE9 ---------------PLAVGFVQT-------PPVISSAHI----------QDERVLEQA- : . :.. : : : .:: .: .. CCDS13 TYSQMSRTSESLENEPENLVRVESRDDHLSLPDVTCENFISKVQDVISINHDESLLPESL 1650 1660 1670 1680 1690 1700 2180 2190 pF1KE9 ----EGK---VEEP----ENPAAKEK---------------CE-GKEEEEETDG------ :: .:: :.:... . :. : : : ..: CCDS13 ESMMYGKKVLSQEPSSFQESPSTNTESRKDVITISISKDGNCQSGGPEAEIASGPTFMGS 1710 1720 1730 1740 1750 1760 2200 2210 2220 pF1KE9 ------------SGKE-----SKQE--CEAEASSVKNELKGVEV----------GADTG- .::. ::. : .::.. ... .:. : ..: CCDS13 LEAGGVAQANIKNGKHLLMSISKEGELCCSEAGQRPENIGQLEAKCLASPSLNPGNESGF 1770 1780 1790 1800 1810 1820 2230 2240 2250 pF1KE9 --------------------------SKSISEK-------GSEEDEEEKLEDDDKSEE-- .::. : ..::.:::. :... . CCDS13 VDMCSLSVCDSKRNLSSDQQLIDLLENKSLESKLILSQNHSDEEEEEEENEEENLAMAVG 1830 1840 1850 1860 1870 1880 2260 2270 2280 pF1KE9 -SSQPEA-------GAVSRGKN--F-DEESNASMSTAR---------------------- . .::. .:: :: : :: ...:. .: CCDS13 MGERPEVLHLTEPTTNISREKNQGFQDETKKGSLEVANQTPGLQRAFPAPAACQCHCKHM 1890 1900 1910 1920 1930 1940 pF1KE9 ------------------------------------------------------------ CCDS13 ERWMHGLENDEFEIEKPKAYIPDLFKSKTNTIAMEGEPTAIPSQPFKVKHELLKEPWKES 1950 1960 1970 1980 1990 2000 2290 pF1KE9 ----------------------------DETRDGF---------YMED----------GD : ::: : :. :: CCDS13 AEGQNVFPTYPLEGSELKSEDMDFENKDDYDRDGNCHSQDYPGKYSEEESKSSTSGITGD 2010 2020 2030 2040 2050 2060 2300 2310 2320 2330 2340 pF1KE9 ----------PSVAQLLHERT-FAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMFDF :..::::.:.: ..:: ::::::.::::::::..::::::: . :... CCDS13 IGDELQEARAPTIAQLLQEKTLYSFSEWPKDRVIINRLDNICHVVLKGKWPSS--QQYEP 2070 2080 2090 2100 2110 2120 2350 2360 2370 2380 2390 2400 pF1KE9 QGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQRRR .: .: ::. ..: .. :..: : : :. . . :. ::. : ..... CCDS13 SGTLP--TPVLTSSAGSRTSLSEPE---AAEHSFSNGAALAAQIHKESFLAPVFTKDEQK 2130 2140 2150 2160 2170 2410 2420 2430 2440 2450 2460 pF1KE9 RRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQ--EKVVDLSKASREATSSTSNFSS .:: :.:.:: :: :.: .. : .. .. :: :...::: .:. . ..:: : CCDS13 HRRPYEFEVERDAKARGLEQFSATHGHTPIIL-NGWHGESAMDLSCSSEGSPGATSPFPV 2180 2190 2200 2210 2220 2230 2470 2480 2490 2500 2510 pF1KE9 LSSKFILPNVSTPVSDAFKTQME-LLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNV .: . .:. .. :. .. .::::: . : ...:::: . .:::::::.: CCDS13 SASTPKIGAISS-LQGALGMDLSGILQAGLIHPVTGQIVNGSLRRDDAATRRRRGRRKHV 2240 2250 2260 2270 2280 2290 2520 2530 2540 2550 2560 2570 pF1KE9 EG-LDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGT :: .::.:. :. .:.: :: . . : : . .:: : : : .. CCDS13 EGGMDLIFL--KEQTLQAGILEVHE--DPGQATLSTTHPEGPG---PATSAPEPATAASS 2300 2310 2320 2330 2340 2580 2590 2600 2610 2620 2630 pF1KE9 RLVGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDI . .: . .:.:..::. . :....:.. .:. ::. ::::.: ::..:.:::. CCDS13 Q--AEKSIPSKSLLDWLRQQADYSLEVPGF---GAN--FSD--KPKQRRPRCKEPGKLDV 2350 2360 2370 2380 2390 2640 2650 2660 2670 2680 2690 pF1KE9 NTLTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPES ..:.::::::.. :. : . ::.::. CCDS13 SSLSGEERVPAIPKEPGLR-----------------------------------GFLPEN 2400 2410 2420 2700 2710 2720 2730 2740 2750 pF1KE9 MFDRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSL :.. :. :..: : ::::::.::. .: . .: : ::..::..:.:.:::::..: CCDS13 KFNHTLAEPILRDTGPRRRGRRPRSELLKAPSIVA--DSPSGMGPLFMNGLIAGMDLVGL 2430 2440 2450 2460 2470 2480 2760 2770 2780 2790 2800 2810 pF1KE9 QNLQNLQSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNN ::..:. .. :.::.::: :.:: : : ..:. ..::.:: CCDS13 QNMRNMPGIPLTGLVGFPAGFATMPT-GEEVKSTLSMLPMMLPGMAAVPQMFGVGGLLSP 2490 2500 2510 2520 2530 2540 2820 2830 2840 2850 2860 2870 pF1KE9 PLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAAT CCDS13 PMATTCTSTAPASLSSTTKSGTAVTEKTAEDKPSSHDVKTDTLAEDKPGPGPFSDQSEPA 2550 2560 2570 2580 2590 2600 >>CCDS76865.1 CHD9 gene_id:80205|Hs108|chr16 (2897 aa) initn: 7270 init1: 3906 opt: 5851 Z-score: 2584.8 bits: 492.9 E(32554): 1.2e-137 Smith-Waterman score: 8925; 49.5% identity (71.4% similar) in 3126 aa overlap (1-2996:1-2890) 10 20 30 40 50 pF1KE9 MADPGMMSLFGEDGNIFSEGLEGLGECGYPE-NPVNPMGQQMPIDQGFASLQ-PSLHHPS :.:: ::..: .:.:.:.: ::::.. .. . .::. . ... . : :. ::.: . CCDS76 MTDP-MMDFF-DDANLFGETLEGLSDDAFVQPGPVS-LVDELNLGAEFEPLHIDSLNHVQ 10 20 30 40 50 60 70 80 90 100 110 pF1KE9 TNQNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPV-PQVPHGG . .. :.: :.. ::... :.: ..: ..:.. . :::::.. :. :: CCDS76 GTPTHQKMTDFEQLNQFDSIKFHHVNQS----FGSPAEHVLSPHSQFNCSPIHPQ----- 60 70 80 90 100 120 130 140 150 160 170 pF1KE9 SGGGQMGVYPGMQNERHGQSFVDSSSMWGPR-AVQVPDQIRAPYQQQQPQPQPPQPAPSG . :..: .. :.: ::: . :. . .: .:..:: CCDS76 --NQPNGLFPDVS---------DGSPMWGHQTATTISNQNGSPFHQQ------------- 110 120 130 140 180 190 200 210 220 pF1KE9 PPAQGHPQHMQQMGSYMARGDFSM----QQHGQ-----PQQRMSQFSQGQEGLNQGNPFI :: . :.: :..:. ::.. .:. : :: .... ::..:.:.. :. CCDS76 ----GHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQQNRNNLNPGQNSLSQSKNFM 150 160 170 180 190 200 230 240 250 260 270 280 pF1KE9 ATSGPG--HLSHVPQQSPSMAPSLRHSVQQFHH--HPSTALHGESVAHSPRFSPNPPQQG .::: ...: ::.. . . :.::: . .::. .: : .: :.: CCDS76 NVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAHFHKCS-SH---------QEG 210 220 230 240 250 290 300 310 320 330 340 pF1KE9 AVRPQTLNFSSRSQTVPSPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQS ::.. : .. : ...:: :.: . :: .... .. ... :. .. .. ::. CCDS76 -------NFNGPSPNMTSCSVSNSQQFSSH-YS-FSSNHISPNSLLQSSAVLASNHTNQT 260 270 280 290 300 350 360 370 380 390 400 pF1KE9 VPRYPNAVGFPSNSG-QGLMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAM . . .. .: . : . :. ..:. :::. : : .: :.:::.: : .::.. : CCDS76 LSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNY-SNSKLSPVH-M 310 320 330 340 350 410 420 430 440 450 460 pF1KE9 SNPAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFI . : :.. :. .: : . .: .... ..:. . .:..:: CCDS76 NFPD--------------PVDSGT--QMGHFN-DHVETNGFSSLEENLLHQVESQTEPFT 360 370 380 390 400 470 480 490 500 510 520 pF1KE9 GMSSAPRELTGHMRPNGCPGVGLGDPQAIQERLIP--GQQHPGQQPSFQQLPTCPPLQPH :.. :..: .:: :.: .. ::. : . : : CCDS76 GLD--PEDL-------------------LQEGLLPHFDESTFGQDNSSHILDHDLDRQF- 410 420 430 440 530 540 550 560 570 580 pF1KE9 PGLHHQSSPPHPHHQPWAQLHPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQL : . : : : . .. . : :. .. :.. :. . .: .. CCDS76 --TSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLCLQRQPPSSKKSDGSGTYT 450 460 470 480 490 590 600 610 620 630 pF1KE9 VKSDDYLPSIEQQPQQKK-----KKKKNNHIVAEDPSKG--FGKDDFPGGVDNQELNRNS .. . . .. :.:: :..: :.:..: .:. :. ..: .. ... : CCDS76 KLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKERGERNIPRVMSPENFPTAS 500 510 520 530 540 550 640 650 660 670 680 690 pF1KE9 LDGSQEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPK ..:..:.: .. .:: ::. ::.:: CCDS76 VEGKEEKKGRRMKSK----------------------------PKDKDSKKTKTC----- 560 570 580 700 710 720 730 740 750 pF1KE9 SSKKSSNKKPDSEASALKKKVNKGKTEGS-ENSDLDKTPPPSPPPEEDEDPGVQKRRSSR :: . . : . .: :: .: :.:.: : :: .. : . .:.: :::::.: CCDS76 -SKLKEKTKIGKLIITLGKK-QKRKNESSDEISDAEQMPQHT---LKDQDS--QKRRSNR 590 600 610 620 630 760 770 780 790 800 pF1KE9 QVKRKRYTEDLEFKISDEEADDADAAGRDS-PSNTSQSEQ---QESVDAEGPVVEKIMSS :.:::.:.::.: : :.::. . ..: : : : .. . .. .:.::.:: CCDS76 QIKRKKYAEDIEGKQSEEEVKGSMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSS 640 650 660 670 680 690 810 820 830 840 850 860 pF1KE9 RSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKIKRFKAKQGQN-K :.:::. : .. :::.:::::.:::::.::. :.: ::::::::::::: .:.: . CCDS76 RTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAH 700 710 720 730 740 750 870 880 890 900 910 920 pF1KE9 FLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYEDSTWERRQDIDQ :....:.: ::::::::::... . : : :::: .:::::::::::::::: ..:.: CCDS76 FFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDL 760 770 780 790 800 810 930 940 950 960 970 980 pF1KE9 AKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEGVNWLLFNWYNM :::::::.:.. .:.:.:..:::.. ::: ..::.:::.:.::::::::.::::::::: CCDS76 AKIEEFEQLQASRPDTRRLDRPPSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNR 820 830 840 850 860 870 990 1000 1010 1020 1030 1040 pF1KE9 RNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREFRTWTELNVVVY :::::::::::::::::::::::: : ::.::::.::::::: ::::::::::..::::: CCDS76 RNCILADEMGLGKTIQSITFLYEILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVY 880 890 900 910 920 930 1050 1060 1070 1080 1090 1100 pF1KE9 HGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELRNIPWRCVVIDE ::: ::. :: :::::.: :::.:.:.:.:.:::::::::: : :: : ::::.::: CCDS76 HGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDE 940 950 960 970 980 990 1110 1120 1130 1140 1150 1160 pF1KE9 AHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSETTFMQEF ::::::.:::::::::.:.:::::::::::::::::::::::::::: :::::.:::::: CCDS76 AHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEF 1000 1010 1020 1030 1040 1050 1170 1180 1190 1200 1210 1220 pF1KE9 GDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYRAILEKNF ::::::::::::::::::::::::::::::.::::::::::::::::::::::::::::: CCDS76 GDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNF 1060 1070 1080 1090 1100 1110 1230 1240 1250 1260 1270 1280 pF1KE9 TFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESPDFQLQAMI .:::::.::.:::::.::::::::::::::::.::::::: ::..:.: . ::.::::: CCDS76 SFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMI 1120 1130 1140 1150 1160 1170 1290 1300 1310 1320 1330 1340 pF1KE9 QAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDGRVRGNLRQ :.:::::::::::::.:::::.:::::::::::::::::::..:: :::::::::::::: CCDS76 QSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQ 1180 1190 1200 1210 1220 1230 1350 1360 1370 1380 1390 1400 pF1KE9 AAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS76 AAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQN 1240 1250 1260 1270 1280 1290 1410 1420 1430 1440 1450 1460 pF1KE9 KSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKKEIEDLLRK :.::.:::.:::::::::::.:::::::::::::::::::. ..:.:::::::::::::. CCDS76 KAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRR 1300 1310 1320 1330 1340 1350 1470 1480 1490 1500 1510 1520 pF1KE9 GAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFVASGNRTDISLD :::::.:.:::::::::::::::::::::.::::::::.::::::::::::::::::::: CCDS76 GAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLD 1360 1370 1380 1390 1400 1410 1530 1540 1550 1560 1570 1580 pF1KE9 DPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELMEFSDLESDSEEK :::::::::::::.::.:..:::.:::::::.::::: .::.: ::: :.:. ::...:: CCDS76 DPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRPFSATK-DELAELSEAESEGDEK 1420 1430 1440 1450 1460 1470 1590 1600 1610 1620 1630 1640 pF1KE9 PCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLTEQDVETICRTI : : ::: :.:.::.:.::::::::::::::::: .::::::.::::.:.::: :::.. CCDS76 P--KLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWREILSHGRFKRQLNEHDVEIICRAL 1480 1490 1500 1510 1520 1530 1650 1660 1670 1680 1690 1700 pF1KE9 LVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKGKKVKAQSTQPV :.::: ::.:::.::.::::::::: ::::: : :: ::::::::::::::::.:... CCDS76 LAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFD 1540 1550 1560 1570 1580 1590 1710 1720 1730 1740 1750 1760 pF1KE9 VQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADS .: :.:: . ::. :.:...::::.:::::::::::::::::.:::::.. .:...:.:. CCDS76 IQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDA 1600 1610 1620 1630 1640 1650 1770 1780 1790 1800 1810 1820 pF1KE9 SEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPALCFLERVGMPDA :. :::.::: :.::::.::: .::::::::::::::::::..::::::::::::: :: CCDS76 SDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDE 1660 1670 1680 1690 1700 1710 1830 1840 1850 1860 1870 1880 pF1KE9 KAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSPSEDKEESMEIH ::.:::::..:.. :: . :::::::. . :::.:.. ..::.. . CCDS76 KAVAAEQRANDYM-DG--------DVEDPEYKPAPAIFKDDIEDDVSSPGD----LVIAD 1720 1730 1740 1750 1760 1890 1900 1910 1920 1930 1940 pF1KE9 ATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQ-EALMKTDRRRRRPR . :. :.. ..:::. :.::::::::::::::. : .:..: . ... .: CCDS76 GDGQLMEGD----KVYWPTQSALTTRLRRLITAYQRTNKNRQIQQIQPTFSVPTSVMQPI 1770 1780 1790 1800 1810 1950 1960 1970 1980 1990 2000 pF1KE9 EEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWNQFRAFARLDK : .:. . : : :..:.::::::::::::::::::.::: . ::::..:::.::: : CCDS76 YEEATLNPKMAAKI-ERQQRWTRREEADFYRVVSTFGVVFDPDRGQFDWTKFRAMARLHK 1820 1830 1840 1850 1860 1870 2010 2020 2030 2040 2050 2060 pF1KE9 KSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTLYRIELLRKIR :.:.:::::. :..:::::::.: : . :.. .:.:::::::::::::::::::.: CCDS76 KTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNI--FIQPITEERASRTLYRIELLRKVR 1880 1890 1900 1910 1920 1930 2070 2080 2090 2100 2110 2120 pF1KE9 EQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDLLVGAAKHGVSRTDYHILNDPELSFL ::.:.:::: ::::::.:. ::: ::::: ::::::.::::::::::::::: ::::::. CCDS76 EQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVSRTDYHILRDPELSFM 1940 1950 1960 1970 1980 1990 2130 2140 2150 2160 pF1KE9 DAHKNFAQNRGAGNTSSL------------NPL--------AVGFVQTPPVISSAHIQDE :..:..:.. : . .: .:: : :.. ..: ....: CCDS76 AAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGIILEEMKVKSENLKEE 2000 2010 2020 2030 2040 2050 2170 2180 pF1KE9 --------------RVLEQAE-------------------GKVE----------EP--EN :.: ..: :: : :: : CCDS76 PQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCETDRRMVAARTEPLTPN 2060 2070 2080 2090 2100 2110 2190 2200 2210 2220 2230 pF1KE9 PAAKE---KCEGKEEEEETDGSGKESKQECEAEASSVKNELKGVEVGADTGSKS----IS ::.:. . .:.: ..:.....:. .. .:: .. . . :....:.: : CCDS76 PASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSRSGSSSSSSSSCSSAS 2120 2130 2140 2150 2160 2170 2240 2250 2260 2270 2280 pF1KE9 EKGSEEDEEEKLEDDDKSEESSQPEAGAVSRG-----KNFDEESNASMSTARDETRDGFY ..: . ....::::.. : : .: : .:::: ::.::..:::.:.: CCDS76 SSSSSSTSSSSSSSSSSSEESDSDEEEAQKRESTTHMKAYDEESVASLSTTQDETQDSFQ 2180 2190 2200 2210 2220 2230 2290 2300 2310 2320 2330 2340 pF1KE9 MEDGDPSVAQLLHE-RTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMFDFQGLIP :..: : : .:. .: :.::::::::::::.::..::::::: ::. .: . . CCDS76 MNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGKWPSARRS-YDANTVAS 2240 2250 2260 2270 2280 2290 2350 2360 2370 2380 2390 2400 pF1KE9 GYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQRRRRRRKI :: .::: ... :. . . .:. : :.:: : .. :... . CCDS76 FYTTKLLDSPGAATEYSDPSVPTPPGAGVKEEHDQSTQMSK-------VKKHVREKEFTV 2300 2310 2320 2330 2340 2410 2420 2430 2440 2450 2460 pF1KE9 EIEAERAAKRRNLMEMVAQLRESQVVSENG----QEKVVDLSKASREATSSTSNFSSLSS .:. : . : . .:: : . .:.: :. .. : . . . .: :: CCDS76 KIKDEGGLKLTFQKQGLAQKRPFD--GEDGALGQQQYLTRLRELQSASETSLVNF----- 2350 2360 2370 2380 2390 2400 2470 2480 2490 2500 2510 2520 pF1KE9 KFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNVEGLD :. : ::: : : :: :: ..:..: .:.::::::::::.: CCDS76 ----PK-SIPVS------------GTSIQPTLGA-NGVILDNQPIVKKRRGRRKNVEGVD 2410 2420 2430 2440 2530 2540 2550 2560 2570 pF1KE9 LLFMSHKR----TSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTR ..:..... .::. ..... ... . ..:: : .. .:::::.:::: CCDS76 IFFFNRNKPPNHVSLGLTSSQISTGINPALSYTQPQGIP-----DTESPVPVINLKDGTR 2450 2460 2470 2480 2490 2580 2590 2600 2610 2620 2630 pF1KE9 LVGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDIN :.:.:::: ::: .::: :: :. :. ...:. . .:::::::::::::::.: CCDS76 LAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPR----MQLHEGRPKQKRHRCRNPNKLDVN 2500 2510 2520 2530 2540 2550 2640 2650 2660 2670 2680 2690 pF1KE9 TLTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESM .::::::: ..:.::..:.:::.:::.::: :.:.:: :..:::.: :.::::::.:::: CCDS76 SLTGEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESM 2560 2570 2580 2590 2600 2610 2700 2710 2720 2730 2740 2750 pF1KE9 FDRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTS-GINPLLVNSLFAGMDLTSL ..:.::::::: : .::::::::: ::.:.:::::...:: . ::::.:.:. :.:::.: CCDS76 YERILTGPVVR-EEVSRRGRRPKSGIAKATAAAAAASATSVSGNPLLANGLLPGVDLTTL 2620 2630 2640 2650 2660 2670 2760 2770 2780 2790 2800 2810 pF1KE9 Q----NLQNLQSLQL-AGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLG : :::::::::. :::::.: :: . ::.::: ::..:..: :::::::..:.: CCDS76 QALQQNLQNLQSLQVTAGLMGMPTGLPS----GGEAKNMAAMFPMLLSGMAGLPNLLGMG 2680 2690 2700 2710 2720 2820 2830 2840 2850 2860 2870 pF1KE9 GLLNNPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGS :::..: ..: . ..:. : : .: . : ...:: :: .::.. :.... CCDS76 GLLTKPTESGTEDKKGSDSK-ESEGKTERTESQSSENGGEN--------SVSSSPSTSST 2730 2740 2750 2760 2770 2880 2890 2900 2910 2920 2930 pF1KE9 VGAATAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGS .. :: : .::::.::.:::.. .::.:.: :::. : .: . :. . . CCDS76 AALNTAAA---ANPLALNPLLLSNI----LYPGMLLTPGLN-LHIPTLS-----QSNTFD 2780 2790 2800 2810 2820 2940 2950 2960 2970 2980 2990 pF1KE9 SEEKAADKAEGGPFKDGETLEGSDAEESLDK--TAESSLLEDEIAQG-EELDSLDGGDEI ..: .: . . . : : : ... :: : : : :. .: :. :. .:.: CCDS76 VQNKNSDLGSSKSVEVKE--EDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASSGSDST 2830 2840 2850 2860 2870 2880 pF1KE9 ENNENDE .. .: CCDS76 SSSSEDSDSSNED 2890 >>CCDS83299.1 CHD7 gene_id:55636|Hs108|chr8 (948 aa) initn: 4325 init1: 4183 opt: 4183 Z-score: 1858.6 bits: 356.9 E(32554): 3.3e-97 Smith-Waterman score: 4183; 100.0% identity (100.0% similar) in 572 aa overlap (1-572:1-572) 10 20 30 40 50 60 pF1KE9 MADPGMMSLFGEDGNIFSEGLEGLGECGYPENPVNPMGQQMPIDQGFASLQPSLHHPSTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 MADPGMMSLFGEDGNIFSEGLEGLGECGYPENPVNPMGQQMPIDQGFASLQPSLHHPSTN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 QNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPVPQVPHGGSGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 QNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPVPQVPHGGSGG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 GQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQPQPPQPAPSGPPAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 GQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQPQPPQPAPSGPPAQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 GHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPFIATSGPGHLSHVPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 GHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPFIATSGPGHLSHVPQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 QSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAVRPQTLNFSSRSQTVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 QSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAVRPQTLNFSSRSQTVP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 SPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVPRYPNAVGFPSNSGQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 SPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVPRYPNAVGFPSNSGQG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 LMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAMSNPAGTPPPQVRPGSAGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 LMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAMSNPAGTPPPQVRPGSAGI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 PMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGMSSAPRELTGHMRPNGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGMSSAPRELTGHMRPNGC 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 PGVGLGDPQAIQERLIPGQQHPGQQPSFQQLPTCPPLQPHPGLHHQSSPPHPHHQPWAQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PGVGLGDPQAIQERLIPGQQHPGQQPSFQQLPTCPPLQPHPGLHHQSSPPHPHHQPWAQL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 HPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQLVKSDDYLPSIEQQPQQKKKK :::::::::::::::::::::::::::::::: CCDS83 HPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQKPKQKRHRCRNPNKLDINTLTGEERVPV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 KKNNHIVAEDPSKGFGKDDFPGGVDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEPKEPK CCDS83 VNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFDRLLTGPVV 610 620 630 640 650 660 >-- initn: 2461 init1: 2461 opt: 2461 Z-score: 1101.6 bits: 216.9 E(32554): 4.9e-55 Smith-Waterman score: 2461; 100.0% identity (100.0% similar) in 376 aa overlap (2622-2997:573-948) 2600 2610 2620 2630 2640 2650 pF1KE9 VEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINTLTGEERVPVVN :::::::::::::::::::::::::::::: CCDS83 SPQNTPQKVPVHQHSPSEPFLEKPVPDMTQKPKQKRHRCRNPNKLDINTLTGEERVPVVN 550 560 570 580 590 600 2660 2670 2680 2690 2700 2710 pF1KE9 KRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFDRLLTGPVVRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 KRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFDRLLTGPVVRG 610 620 630 640 650 660 2720 2730 2740 2750 2760 2770 pF1KE9 EGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQNLQNLQSLQLAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 EGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQNLQNLQSLQLAG 670 680 690 700 710 720 2780 2790 2800 2810 2820 2830 pF1KE9 LMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNNPLSAATGNTTTAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 LMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNNPLSAATGNTTTAS 730 740 750 760 770 780 2840 2850 2860 2870 2880 2890 pF1KE9 SQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAATAPAGLPSNPLAFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 SQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAATAPAGLPSNPLAFN 790 800 810 820 830 840 2900 2910 2920 2930 2940 2950 pF1KE9 PFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEKAADKAEGGPFKDGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEKAADKAEGGPFKDGE 850 860 870 880 890 900 2960 2970 2980 2990 pF1KE9 TLEGSDAEESLDKTAESSLLEDEIAQGEELDSLDGGDEIENNENDE :::::::::::::::::::::::::::::::::::::::::::::: CCDS83 TLEGSDAEESLDKTAESSLLEDEIAQGEELDSLDGGDEIENNENDE 910 920 930 940 >>CCDS76510.1 CHD4 gene_id:1108|Hs108|chr12 (1905 aa) initn: 1696 init1: 630 opt: 1655 Z-score: 742.9 bits: 151.5 E(32554): 4.7e-35 Smith-Waterman score: 1834; 38.1% identity (63.9% similar) in 969 aa overlap (825-1686:535-1481) 800 810 820 830 840 850 pF1KE9 VDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRI-- .:.::....:: ::.:.: .:: .. CCDS76 QPPSPTPVPRPPDADPNTPSPKPLEGRPERQFFVKWQGMSYWHCSWVSELQLELHCQVMF 510 520 530 540 550 560 860 870 880 890 pF1KE9 ---QQKI--------------KRFKAKQGQNKFLSEIEDELF----NPDYVEVDRIMDFA :.: .. . ..... ..:.:.... .:... . ::.. CCDS76 RNYQRKNDMDEPPSGDFGGDEEKSRKRKNKDPKFAEMEERFYRYGIKPEWMMIHRILN-- 570 580 590 600 610 620 900 910 920 930 940 pF1KE9 RSTDDRGEPVTHYLVKWCSLPYEDSTWERR----QDIDQAKIEEFE--KLMSRE---P-- .:.: .:. .:::.:: .:::....:: . :: : : .. .:: : : CCDS76 HSVDKKGH--VHYLIKWRDLPYDQASWESEDVEIQDYDLFKQSYWNHRELMRGEEGRPGK 630 640 650 660 670 680 950 960 970 980 pF1KE9 -----ETERVERPP----ADDWKKSESSREYKN--NNKLREYQLEGVNWLLFNWYNMRNC . ...:::: .: : : . :: . .. :. ::.::.::: :.: . . CCDS76 KLKKVKLRKLERPPETPTVDPTVKYERQPEYLDATGGTLHPYQMEGLNWLRFSWAQGTDT 690 700 710 720 730 740 990 1000 1010 1020 1030 1040 pF1KE9 ILADEMGLGKTIQSITFLYEIYLKG-IHGPFLVIAPLSTIPNWEREFRTWT-ELNVVVYH :::::::::::.:. .::: .: .: .::::: :::::: ::::::. :. .. ::.: CCDS76 ILADEMGLGKTVQTAVFLYSLYKEGHSKGPFLVSAPLSTIINWEREFEMWAPDMYVVTYV 750 760 770 780 790 800 1050 1060 1070 1080 1090 pF1KE9 GSQASRRTIQLYEMYFKD-------PQGRVIK-GSYKFHAIITTFEMILTDCPELRNIPW :.. :: :. :. :.: .:. : .: :::...:..:.: : : .: : CCDS76 GDKDSRAIIRENEFSFEDNAIRGGKKASRMKKEASVKFHVLLTSYELITIDMAILGSIDW 810 820 830 840 850 860 1100 1110 1120 1130 1140 1150 pF1KE9 RCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSE :...:::::::: . :... :. ..:.::.:::::::::..:::: ::.:: : :: . CCDS76 ACLIVDEAHRLKNNQSKFFRVLNGYSLQHKLLLTGTPLQNNLEELFHLLNFLTPERFHNL 870 880 890 900 910 920 1160 1170 1180 1190 1200 1210 pF1KE9 TTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYR :..::.:. :.:..::. .: : :::::: :: ::. : : :..:::. .:::::. CCDS76 EGFLEEFADIAKEDQIKKLHDMLGPHMLRRLKADVFKNMPSKTELIVRVELSPMQKKYYK 930 940 950 960 970 980 1220 1230 1240 1250 1260 1270 pF1KE9 AILEKNFTFLS-KGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESP :: .:: :. .::: : .:::..:.:.::::::::. : .: : .. CCDS76 YILTRNFEALNARGGG--NQVSLLNVVMDLKKCCNHPYLFPVA---AMEAPKMPNGM--- 990 1000 1010 1020 1030 1280 1290 1300 1310 1320 1330 pF1KE9 DFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDG .. .:.:.:.:::.:..:.: .:: :::::::::::.. ::.:::.: .. : :::::: CCDS76 -YDGSALIRASGKLLLLQKMLKNLKEGGHRVLIFSQMTKMLDLLEDFLEHEGYKYERIDG 1040 1050 1060 1070 1080 1090 1340 1350 1360 1370 1380 1390 pF1KE9 RVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQA . ::.:: :::::. : ...: ::: ::::::::::..::: ::.::::::.::.:: . CCDS76 GITGNMRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIYDSDWNPHNDIQAFS 1100 1110 1120 1130 1140 1150 1400 1410 1420 1430 1440 1450 pF1KE9 RCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKK : :::::.:.: :::..:: : :... . :. :. : . :.. : .... .::. CCDS76 RAHRIGQNKKVMIYRFVTRASVEERITQVAKKKMMLTHLVVRPGLGSKTGS-----MSKQ 1160 1170 1180 1190 1200 1460 1470 1480 1490 1500 pF1KE9 EIEDLLRKGAYGALMDEEDEGSKFCEEDID-----------QILLRRTHTITIESEGKG- :..:.:. :. . :: .:. .: : . :: :.. : ..: .: CCDS76 ELDDILKFGTEELFKDEATDGGGDNKEGEDSSVIHYDDKAIERLLDRNQDETEDTELQGM 1210 1220 1230 1240 1250 1260 1510 1520 1530 1540 1550 pF1KE9 ----STFAKASFVAS----GNRTDISLD--------DPNFWQKWAKKAELDIDALNGRNN :.: :..:. :.. .. . ::..:.: .. . . .:: CCDS76 NEYLSSFKVAQYVVREEEMGEEEEVEREIIKQEESVDPDYWEKLLRHHYEQQQEDLARN- 1270 1280 1290 1300 1310 1320 1560 1570 1580 1590 pF1KE9 LVIDTPRVRKQTRLYSAVKEDELME--FSDLESD----SEE------KPCAKPRRPQDKS . :.:::. .. .::. . :: .:: ::: . ::::. :. CCDS76 -LGKGKRIRKQVNYNDGSQEDRDWQDDQSDNQSDYSVASEEGDEDFDERSEAPRRPSRKG 1330 1340 1350 1360 1370 1380 1600 1610 1620 1630 1640 pF1KE9 QGYARSECF-----RVEKNLLVYGWG-RWTDILSHGRYKRQLTEQDVET---ICRTILVY ... . :: :. : :.. : . .. .. . ::. : . : . CCDS76 LRNDKDKPLPPLLARVGGNIEVLGFNARQRKAFLNAIMRYGMPPQDAFTTQWLVRDLRGK 1390 1400 1410 1420 1430 1440 1650 1660 1670 1680 1690 1700 pF1KE9 CLNHYKGDENIKSFIWDLITPTADG-QTRAL-VNHSGLSAPVPRGRKGKKVKAQSTQPVV ...:. .. :. : : ::: .: : : . ::: CCDS76 SEKEFKA--YVSLFMRHLCEPGADGAETFADGVPREGLSRQHVLTRIGVMSLIRKKVQEF 1450 1460 1470 1480 1490 1500 1710 1720 1730 1740 1750 1760 pF1KE9 QDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADSS CCDS76 EHVNGRWSMPELAEVEENKKMSQPGSPSPKTPTPSTPGDTQPNTPAPVPPAEDGIKIEEN 1510 1520 1530 1540 1550 1560 >>CCDS8552.1 CHD4 gene_id:1108|Hs108|chr12 (1912 aa) initn: 1813 init1: 630 opt: 1655 Z-score: 742.9 bits: 151.5 E(32554): 4.7e-35 Smith-Waterman score: 1834; 38.1% identity (63.9% similar) in 969 aa overlap (825-1686:542-1488) 800 810 820 830 840 850 pF1KE9 VDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRI-- .:.::....:: ::.:.: .:: .. CCDS85 QPPSPTPVPRPPDADPNTPSPKPLEGRPERQFFVKWQGMSYWHCSWVSELQLELHCQVMF 520 530 540 550 560 570 860 870 880 890 pF1KE9 ---QQKI--------------KRFKAKQGQNKFLSEIEDELF----NPDYVEVDRIMDFA :.: .. . ..... ..:.:.... .:... . ::.. CCDS85 RNYQRKNDMDEPPSGDFGGDEEKSRKRKNKDPKFAEMEERFYRYGIKPEWMMIHRILN-- 580 590 600 610 620 900 910 920 930 940 pF1KE9 RSTDDRGEPVTHYLVKWCSLPYEDSTWERR----QDIDQAKIEEFE--KLMSRE---P-- .:.: .:. .:::.:: .:::....:: . :: : : .. .:: : : CCDS85 HSVDKKGH--VHYLIKWRDLPYDQASWESEDVEIQDYDLFKQSYWNHRELMRGEEGRPGK 630 640 650 660 670 680 950 960 970 980 pF1KE9 -----ETERVERPP----ADDWKKSESSREYKN--NNKLREYQLEGVNWLLFNWYNMRNC . ...:::: .: : : . :: . .. :. ::.::.::: :.: . . CCDS85 KLKKVKLRKLERPPETPTVDPTVKYERQPEYLDATGGTLHPYQMEGLNWLRFSWAQGTDT 690 700 710 720 730 740 990 1000 1010 1020 1030 1040 pF1KE9 ILADEMGLGKTIQSITFLYEIYLKG-IHGPFLVIAPLSTIPNWEREFRTWT-ELNVVVYH :::::::::::.:. .::: .: .: .::::: :::::: ::::::. :. .. ::.: CCDS85 ILADEMGLGKTVQTAVFLYSLYKEGHSKGPFLVSAPLSTIINWEREFEMWAPDMYVVTYV 750 760 770 780 790 800 1050 1060 1070 1080 1090 pF1KE9 GSQASRRTIQLYEMYFKD-------PQGRVIK-GSYKFHAIITTFEMILTDCPELRNIPW :.. :: :. :. :.: .:. : .: :::...:..:.: : : .: : CCDS85 GDKDSRAIIRENEFSFEDNAIRGGKKASRMKKEASVKFHVLLTSYELITIDMAILGSIDW 810 820 830 840 850 860 1100 1110 1120 1130 1140 1150 pF1KE9 RCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSE :...:::::::: . :... :. ..:.::.:::::::::..:::: ::.:: : :: . CCDS85 ACLIVDEAHRLKNNQSKFFRVLNGYSLQHKLLLTGTPLQNNLEELFHLLNFLTPERFHNL 870 880 890 900 910 920 1160 1170 1180 1190 1200 1210 pF1KE9 TTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYR :..::.:. :.:..::. .: : :::::: :: ::. : : :..:::. .:::::. CCDS85 EGFLEEFADIAKEDQIKKLHDMLGPHMLRRLKADVFKNMPSKTELIVRVELSPMQKKYYK 930 940 950 960 970 980 1220 1230 1240 1250 1260 1270 pF1KE9 AILEKNFTFLS-KGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESP :: .:: :. .::: : .:::..:.:.::::::::. : .: : .. CCDS85 YILTRNFEALNARGGG--NQVSLLNVVMDLKKCCNHPYLFPVA---AMEAPKMPNGM--- 990 1000 1010 1020 1030 1280 1290 1300 1310 1320 1330 pF1KE9 DFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDG .. .:.:.:.:::.:..:.: .:: :::::::::::.. ::.:::.: .. : :::::: CCDS85 -YDGSALIRASGKLLLLQKMLKNLKEGGHRVLIFSQMTKMLDLLEDFLEHEGYKYERIDG 1040 1050 1060 1070 1080 1090 1340 1350 1360 1370 1380 1390 pF1KE9 RVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQA . ::.:: :::::. : ...: ::: ::::::::::..::: ::.::::::.::.:: . CCDS85 GITGNMRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIYDSDWNPHNDIQAFS 1100 1110 1120 1130 1140 1150 1400 1410 1420 1430 1440 1450 pF1KE9 RCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKK : :::::.:.: :::..:: : :... . :. :. : . :.. : .... .::. CCDS85 RAHRIGQNKKVMIYRFVTRASVEERITQVAKKKMMLTHLVVRPGLGSKTGS-----MSKQ 1160 1170 1180 1190 1200 1210 1460 1470 1480 1490 1500 pF1KE9 EIEDLLRKGAYGALMDEEDEGSKFCEEDID-----------QILLRRTHTITIESEGKG- :..:.:. :. . :: .:. .: : . :: :.. : ..: .: CCDS85 ELDDILKFGTEELFKDEATDGGGDNKEGEDSSVIHYDDKAIERLLDRNQDETEDTELQGM 1220 1230 1240 1250 1260 1270 1510 1520 1530 1540 1550 pF1KE9 ----STFAKASFVAS----GNRTDISLD--------DPNFWQKWAKKAELDIDALNGRNN :.: :..:. :.. .. . ::..:.: .. . . .:: CCDS85 NEYLSSFKVAQYVVREEEMGEEEEVEREIIKQEESVDPDYWEKLLRHHYEQQQEDLARN- 1280 1290 1300 1310 1320 1330 1560 1570 1580 1590 pF1KE9 LVIDTPRVRKQTRLYSAVKEDELME--FSDLESD----SEE------KPCAKPRRPQDKS . :.:::. .. .::. . :: .:: ::: . ::::. :. CCDS85 -LGKGKRIRKQVNYNDGSQEDRDWQDDQSDNQSDYSVASEEGDEDFDERSEAPRRPSRKG 1340 1350 1360 1370 1380 1390 1600 1610 1620 1630 1640 pF1KE9 QGYARSECF-----RVEKNLLVYGWG-RWTDILSHGRYKRQLTEQDVET---ICRTILVY ... . :: :. : :.. : . .. .. . ::. : . : . CCDS85 LRNDKDKPLPPLLARVGGNIEVLGFNARQRKAFLNAIMRYGMPPQDAFTTQWLVRDLRGK 1400 1410 1420 1430 1440 1450 1650 1660 1670 1680 1690 1700 pF1KE9 CLNHYKGDENIKSFIWDLITPTADG-QTRAL-VNHSGLSAPVPRGRKGKKVKAQSTQPVV ...:. .. :. : : ::: .: : : . ::: CCDS85 SEKEFKA--YVSLFMRHLCEPGADGAETFADGVPREGLSRQHVLTRIGVMSLIRKKVQEF 1460 1470 1480 1490 1500 1710 1720 1730 1740 1750 1760 pF1KE9 QDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADSS CCDS85 EHVNGRWSMPELAEVEENKKMSQPGSPSPKTPTPSTPGDTQPNTPAPVPPAEDGIKIEEN 1510 1520 1530 1540 1550 1560 >>CCDS32555.1 CHD3 gene_id:1107|Hs108|chr17 (1966 aa) initn: 1664 init1: 610 opt: 1633 Z-score: 733.0 bits: 149.7 E(32554): 1.7e-34 Smith-Waterman score: 1809; 38.4% identity (62.4% similar) in 963 aa overlap (825-1686:549-1484) 800 810 820 830 840 pF1KE9 VDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLE-----KD ::.::. ..:: ::.::. .:: CCDS32 EPPVAVPAPQQADGNPDVPPPRPLQGRSEREFFVKWVGLSYWHCSWAKELQLEIFHLVMY 520 530 540 550 560 570 850 860 870 880 pF1KE9 KRIQQKIK----------------RFKAKQGQNKFLSEIEDELF----NPDYVEVDRIMD . :.: . .. .. .:.:.. . .:... : ::.. CCDS32 RNYQRKNDMDEPPPLDYGSGEDDGKSDKRKVKDPHYAEMEEKYYRFGIKPEWMTVHRIIN 580 590 600 610 620 630 890 900 910 920 930 pF1KE9 FARSTDDRGEPVTHYLVKWCSLPYEDSTWERRQDIDQAKIEEFEK-----------LMSR .:.: .:. :::::: .:::..::::. :. .: :.:. .:.. CCDS32 --HSVDKKGN--YHYLVKWRDLPYDQSTWEE----DEMNIPEYEEHKQSYWRHRELIMGE 640 650 660 670 680 690 940 950 960 970 980 pF1KE9 EPETERVER----------PPA----DDWKKSESSREY--KNNNKLREYQLEGVNWLLFN .: : . ::. : : :.. .. ... :. :::::.::: :. CCDS32 DPAQPRKYKKKKKELQGDGPPSSPTNDPTVKYETQPRFITATGGTLHMYQLEGLNWLRFS 700 710 720 730 740 750 990 1000 1010 1020 1030 1040 pF1KE9 WYNMRNCILADEMGLGKTIQSITFLYEIYLKG-IHGPFLVIAPLSTIPNWEREFRTWT-E : . . :::::::::::::.:.::: .: .: .::::: :::::: ::::::. :. . CCDS32 WAQGTDTILADEMGLGKTIQTIVFLYSLYKEGHTKGPFLVSAPLSTIINWEREFQMWAPK 760 770 780 790 800 810 1050 1060 1070 1080 1090 pF1KE9 LNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYK--------FHAIITTFEMILTDCP . ::.: :.. :: :. :. :.: . : ..: ::...:..:.: : CCDS32 FYVVTYTGDKDSRAIIRENEFSFEDNAIKGGKKAFKMKREAQVKFHVLLTSYELITIDQA 820 830 840 850 860 870 1100 1110 1120 1130 1140 1150 pF1KE9 ELRNIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLE : .: : :.:.:::::::: . :... :. . ..::.:::::::::..:::: ::.:: CCDS32 ALGSIRWACLVVDEAHRLKNNQSKFFRVLNGYKIDHKLLLTGTPLQNNLEELFHLLNFLT 880 890 900 910 920 930 1160 1170 1180 1190 1200 1210 pF1KE9 PSRFPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTN : :: . :..::.:.. :.:..::. .: : :::::: :: ::. : : :..:::. CCDS32 PERFNNLEGFLEEFADISKEDQIKKLHDLLGPHMLRRLKADVFKNMPAKTELIVRVELSP 940 950 960 970 980 990 1220 1230 1240 1250 1260 1270 pF1KE9 IQKKYYRAILEKNFTFL-SKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKE .:::::. :: .:: : :.::: : .::: ::.:.::::::::. : : CCDS32 MQKKYYKYILTRNFEALNSRGGG--NQVSLLNIMMDLKKCCNHPYLFPVAAM-------E 1000 1010 1020 1030 1040 1280 1290 1300 1310 1320 1330 pF1KE9 THNAESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRY . . : .. :.:...:::.:..:.: ::: ::::::::::.. ::.:::.: . : CCDS32 SPKLPSGAYEGGALIKSSGKLMLLQKMLRKLKEQGHRVLIFSQMTKMLDLLEDFLDYEGY 1050 1060 1070 1080 1090 1100 1340 1350 1360 1370 1380 1390 pF1KE9 PYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQ :::::: . : ::: :::::. : ...: ::: ::::::::::..::: :::::::::. CCDS32 KYERIDGGITGALRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIFDSDWNPH 1110 1120 1130 1140 1150 1160 1400 1410 1420 1430 1440 1450 pF1KE9 NDLQAQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNG ::.:: .: :::::...: :::..:: : :... . :. :. : . :.. : . .. CCDS32 NDIQAFSRAHRIGQANKVMIYRFVTRASVEERITQVAKRKMMLTHLVVRPGLGSKAGS-- 1170 1180 1190 1200 1210 1460 1470 1480 1490 1500 pF1KE9 VQQLSKKEIEDLLRKGAYGALMDE-----EDEGSKFCEEDIDQI--LLRRTHTITIESEG .::.:..:.:. :. . :: ..: :. . : . : :: :.. : ... CCDS32 ---MSKQELDDILKFGTEELFKDENEGENKEEDSSVIHYDNEAIARLLDRNQDATEDTDV 1220 1230 1240 1250 1260 1270 1510 1520 1530 1540 pF1KE9 KG-----STFAKASFVASGN-------RTDISLD---DPNFWQKWAKKAELDIDALNGRN .. :.: :..:. . : :. . ::..:.: .. . . .:: CCDS32 QNMNEYLSSFKVAQYVVREEDKIEEIEREIIKQEENVDPDYWEKLLRHHYEQQQEDLARN 1280 1290 1300 1310 1320 1330 1550 1560 1570 1580 1590 1600 pF1KE9 NLVIDTPRVRKQTRLYSAVKEDELMEFSDLESDSEEKPCAKPRRPQDKSQG--YARSE-- . :::::. .:..::. . :. :::. .::. . :. :.: CCDS32 --LGKGKRVRKQVNYNDAAQEDQDNQ-SEYSVGSEEEDEDFDERPEGRRQSKRQLRNEKD 1340 1350 1360 1370 1380 1390 1610 1620 1630 1640 1650 pF1KE9 ------CFRVEKNLLVYGWG-RWTDILSHGRYKRQLTEQDVET---ICRTILVYCLNHYK :: :. : :.. : . .. .. . ::. : . : . ...: CCDS32 KPLPPLLARVGGNIEVLGFNTRQRKAFLNAVMRWGMPPQDAFTTQWLVRDLRGKTEKEFK 1400 1410 1420 1430 1440 1450 1660 1670 1680 1690 1700 1710 pF1KE9 GDENIKSFIWDLITPTADG-QTRAL-VNHSGLSAPVPRGRKGKKVKAQSTQPVVQDADWL . .. :. : : ::: .: : : . ::: CCDS32 A--YVSLFMRHLCEPGADGSETFADGVPREGLSRQQVLTRIGVMSLVKKKVQEFEHINGR 1460 1470 1480 1490 1500 1510 1720 1730 1740 1750 1760 1770 pF1KE9 ASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADSSEADVWI CCDS32 WSMPELMPDPSADSKRSSRASSPTKTSPTTPEASATNSPCTSKPATPAPSEKGEGIRTPL 1520 1530 1540 1550 1560 1570 2997 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 19:38:43 2016 done: Sun Nov 6 19:38:45 2016 Total Scan time: 9.040 Total Display time: 2.710 Function used was FASTA [36.3.4 Apr, 2011]