FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9669, 2997 aa
1>>>pF1KE9669 2997 - 2997 aa - 2997 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 14.3525+/-0.00141; mu= -14.2892+/- 0.085
mean_var=517.4663+/-105.387, 0's: 0 Z-trim(113.1): 107 B-trim: 394 in 1/52
Lambda= 0.056381
statistics sampled from 13680 (13771) to 13680 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.713), E-opt: 0.2 (0.423), width: 16
Scan time: 9.040
The best scores are: opt bits E(32554)
CCDS47865.1 CHD7 gene_id:55636|Hs108|chr8 (2997) 20314 1669.3 0
CCDS45485.1 CHD9 gene_id:80205|Hs108|chr16 (2881) 6607 554.4 3.6e-156
CCDS53885.1 CHD8 gene_id:57680|Hs108|chr14 (2581) 6154 517.5 4.1e-145
CCDS45081.1 CHD8 gene_id:57680|Hs108|chr14 (2302) 6109 513.8 4.7e-144
CCDS13317.1 CHD6 gene_id:84181|Hs108|chr20 (2715) 5891 496.1 1.2e-138
CCDS76865.1 CHD9 gene_id:80205|Hs108|chr16 (2897) 5851 492.9 1.2e-137
CCDS83299.1 CHD7 gene_id:55636|Hs108|chr8 ( 948) 4183 356.9 3.3e-97
CCDS76510.1 CHD4 gene_id:1108|Hs108|chr12 (1905) 1655 151.5 4.7e-35
CCDS8552.1 CHD4 gene_id:1108|Hs108|chr12 (1912) 1655 151.5 4.7e-35
CCDS32555.1 CHD3 gene_id:1107|Hs108|chr17 (1966) 1633 149.7 1.7e-34
CCDS32554.1 CHD3 gene_id:1107|Hs108|chr17 (2000) 1633 149.7 1.7e-34
CCDS32553.2 CHD3 gene_id:1107|Hs108|chr17 (2059) 1633 149.7 1.7e-34
CCDS57.1 CHD5 gene_id:26038|Hs108|chr1 (1954) 1582 145.6 2.9e-33
CCDS14612.1 SMARCA1 gene_id:6594|Hs108|chrX (1054) 1146 109.9 8.4e-23
CCDS76019.1 SMARCA1 gene_id:6594|Hs108|chrX (1070) 1146 109.9 8.5e-23
CCDS34978.1 SMARCA2 gene_id:6595|Hs108|chr9 (1572) 1144 109.9 1.3e-22
CCDS34977.1 SMARCA2 gene_id:6595|Hs108|chr9 (1590) 1144 109.9 1.3e-22
CCDS54218.1 SMARCA4 gene_id:6597|Hs108|chr19 (1613) 1127 108.5 3.5e-22
CCDS54217.1 SMARCA4 gene_id:6597|Hs108|chr19 (1614) 1127 108.5 3.5e-22
CCDS45973.1 SMARCA4 gene_id:6597|Hs108|chr19 (1616) 1127 108.5 3.5e-22
CCDS45972.1 SMARCA4 gene_id:6597|Hs108|chr19 (1617) 1127 108.5 3.5e-22
CCDS12253.1 SMARCA4 gene_id:6597|Hs108|chr19 (1647) 1124 108.3 4.2e-22
CCDS83338.1 SMARCA2 gene_id:6595|Hs108|chr9 (1514) 831 84.4 5.8e-15
CCDS34204.1 CHD1 gene_id:1105|Hs108|chr5 (1710) 795 81.5 4.9e-14
CCDS10374.2 CHD2 gene_id:1106|Hs108|chr15 (1828) 776 80.0 1.5e-13
CCDS7229.1 ERCC6 gene_id:2074|Hs108|chr10 (1493) 722 75.5 2.7e-12
CCDS3761.1 SMARCA5 gene_id:8467|Hs108|chr4 (1052) 669 71.1 4e-11
>>CCDS47865.1 CHD7 gene_id:55636|Hs108|chr8 (2997 aa)
initn: 20314 init1: 20314 opt: 20314 Z-score: 8942.5 bits: 1669.3 E(32554): 0
Smith-Waterman score: 20314; 100.0% identity (100.0% similar) in 2997 aa overlap (1-2997:1-2997)
10 20 30 40 50 60
pF1KE9 MADPGMMSLFGEDGNIFSEGLEGLGECGYPENPVNPMGQQMPIDQGFASLQPSLHHPSTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MADPGMMSLFGEDGNIFSEGLEGLGECGYPENPVNPMGQQMPIDQGFASLQPSLHHPSTN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 QNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPVPQVPHGGSGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPVPQVPHGGSGG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 GQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQPQPPQPAPSGPPAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQPQPPQPAPSGPPAQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 GHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPFIATSGPGHLSHVPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPFIATSGPGHLSHVPQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 QSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAVRPQTLNFSSRSQTVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAVRPQTLNFSSRSQTVP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 SPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVPRYPNAVGFPSNSGQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVPRYPNAVGFPSNSGQG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 LMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAMSNPAGTPPPQVRPGSAGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAMSNPAGTPPPQVRPGSAGI
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 PMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGMSSAPRELTGHMRPNGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGMSSAPRELTGHMRPNGC
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 PGVGLGDPQAIQERLIPGQQHPGQQPSFQQLPTCPPLQPHPGLHHQSSPPHPHHQPWAQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PGVGLGDPQAIQERLIPGQQHPGQQPSFQQLPTCPPLQPHPGLHHQSSPPHPHHQPWAQL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 HPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQLVKSDDYLPSIEQQPQQKKKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 HPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQLVKSDDYLPSIEQQPQQKKKK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 KKNNHIVAEDPSKGFGKDDFPGGVDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEPKEPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 KKNNHIVAEDPSKGFGKDDFPGGVDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEPKEPK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 EKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPKSSKKSSNKKPDSEASALKKKVNKGKTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPKSSKKSSNKKPDSEASALKKKVNKGKTE
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 GSENSDLDKTPPPSPPPEEDEDPGVQKRRSSRQVKRKRYTEDLEFKISDEEADDADAAGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GSENSDLDKTPPPSPPPEEDEDPGVQKRRSSRQVKRKRYTEDLEFKISDEEADDADAAGR
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 DSPSNTSQSEQQESVDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DSPSNTSQSEQQESVDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQW
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE9 ASIEDLEKDKRIQQKIKRFKAKQGQNKFLSEIEDELFNPDYVEVDRIMDFARSTDDRGEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 ASIEDLEKDKRIQQKIKRFKAKQGQNKFLSEIEDELFNPDYVEVDRIMDFARSTDDRGEP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE9 VTHYLVKWCSLPYEDSTWERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 VTHYLVKWCSLPYEDSTWERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSR
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE9 EYKNNNKLREYQLEGVNWLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EYKNNNKLREYQLEGVNWLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFL
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE9 VIAPLSTIPNWEREFRTWTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 VIAPLSTIPNWEREFRTWTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAI
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE9 ITTFEMILTDCPELRNIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 ITTFEMILTDCPELRNIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNT
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE9 VEELFSLLHFLEPSRFPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 VEELFSLLHFLEPSRFPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAP
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE9 KEETIIEVELTNIQKKYYRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLING
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 KEETIIEVELTNIQKKYYRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLING
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE9 AEEKILEEFKETHNAESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 AEEKILEEFKETHNAESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLD
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE9 ILEDYLIQRRYPYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 ILEDYLIQRRYPYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADT
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE9 CIIFDSDWNPQNDLQAQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 CIIFDSDWNPQNDLQAQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQ
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE9 SMSGRENATNGVQQLSKKEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SMSGRENATNGVQQLSKKEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITI
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE9 ESEGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 ESEGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRK
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE9 QTRLYSAVKEDELMEFSDLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QTRLYSAVKEDELMEFSDLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGR
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE9 WTDILSHGRYKRQLTEQDVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 WTDILSHGRYKRQLTEQDVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALV
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE9 NHSGLSAPVPRGRKGKKVKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 NHSGLSAPVPRGRKGKKVKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLL
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE9 RVRMLYYLRQEVIGDQADKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RVRMLYYLRQEVIGDQADKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFK
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE9 HGYEKYNSMRADPALCFLERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 HGYEKYNSMRADPALCFLERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPT
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE9 RTPFKDEIDEFANSPSEDKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RTPFKDEIDEFANSPSEDKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAY
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE9 QRSYKRQQMRQEALMKTDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QRSYKRQQMRQEALMKTDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVST
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE9 FGVIFDPVKQQFDWNQFRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 FGVIFDPVKQQFDWNQFRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLS
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE9 SIIEPITEERASRTLYRIELLRKIREQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SIIEPITEERASRTLYRIELLRKIREQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDL
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE9 LVGAAKHGVSRTDYHILNDPELSFLDAHKNFAQNRGAGNTSSLNPLAVGFVQTPPVISSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LVGAAKHGVSRTDYHILNDPELSFLDAHKNFAQNRGAGNTSSLNPLAVGFVQTPPVISSA
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE9 HIQDERVLEQAEGKVEEPENPAAKEKCEGKEEEEETDGSGKESKQECEAEASSVKNELKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 HIQDERVLEQAEGKVEEPENPAAKEKCEGKEEEEETDGSGKESKQECEAEASSVKNELKG
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE9 VEVGADTGSKSISEKGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMSTAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 VEVGADTGSKSISEKGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMSTAR
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE9 DETRDGFYMEDGDPSVAQLLHERTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DETRDGFYMEDGDPSVAQLLHERTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMF
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE9 DFQGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DFQGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQR
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE9 RRRRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNFSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RRRRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNFSS
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KE9 LSSKFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LSSKFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNVE
2470 2480 2490 2500 2510 2520
2530 2540 2550 2560 2570 2580
pF1KE9 GLDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GLDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTRL
2530 2540 2550 2560 2570 2580
2590 2600 2610 2620 2630 2640
pF1KE9 VGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 VGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINT
2590 2600 2610 2620 2630 2640
2650 2660 2670 2680 2690 2700
pF1KE9 LTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMF
2650 2660 2670 2680 2690 2700
2710 2720 2730 2740 2750 2760
pF1KE9 DRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQN
2710 2720 2730 2740 2750 2760
2770 2780 2790 2800 2810 2820
pF1KE9 LQNLQSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNNPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LQNLQSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNNPL
2770 2780 2790 2800 2810 2820
2830 2840 2850 2860 2870 2880
pF1KE9 SAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAATAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAATAP
2830 2840 2850 2860 2870 2880
2890 2900 2910 2920 2930 2940
pF1KE9 AGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEKAAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 AGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEKAAD
2890 2900 2910 2920 2930 2940
2950 2960 2970 2980 2990
pF1KE9 KAEGGPFKDGETLEGSDAEESLDKTAESSLLEDEIAQGEELDSLDGGDEIENNENDE
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 KAEGGPFKDGETLEGSDAEESLDKTAESSLLEDEIAQGEELDSLDGGDEIENNENDE
2950 2960 2970 2980 2990
>>CCDS45485.1 CHD9 gene_id:80205|Hs108|chr16 (2881 aa)
initn: 7270 init1: 3906 opt: 6607 Z-score: 2917.2 bits: 554.4 E(32554): 3.6e-156
Smith-Waterman score: 8930; 49.6% identity (71.4% similar) in 3122 aa overlap (1-2996:1-2874)
10 20 30 40 50
pF1KE9 MADPGMMSLFGEDGNIFSEGLEGLGECGYPE-NPVNPMGQQMPIDQGFASLQ-PSLHHPS
:.:: ::..: .:.:.:.: ::::.. .. . .::. . ... . : :. ::.: .
CCDS45 MTDP-MMDFF-DDANLFGETLEGLSDDAFVQPGPVS-LVDELNLGAEFEPLHIDSLNHVQ
10 20 30 40 50
60 70 80 90 100 110
pF1KE9 TNQNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPV-PQVPHGG
. .. :.: :.. ::... :.: ..: ..:.. . :::::.. :. ::
CCDS45 GTPTHQKMTDFEQLNQFDSIKFHHVNQS----FGSPAEHVLSPHSQFNCSPIHPQ-----
60 70 80 90 100
120 130 140 150 160 170
pF1KE9 SGGGQMGVYPGMQNERHGQSFVDSSSMWGPR-AVQVPDQIRAPYQQQQPQPQPPQPAPSG
. :..: .. :.: ::: . :. . .: .:..::
CCDS45 --NQPNGLFPDVS---------DGSPMWGHQTATTISNQNGSPFHQQ-------------
110 120 130 140
180 190 200 210 220
pF1KE9 PPAQGHPQHMQQMGSYMARGDFSM----QQHGQ-----PQQRMSQFSQGQEGLNQGNPFI
:: . :.: :..:. ::.. .:. : :: .... ::..:.:.. :.
CCDS45 ----GHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQQNRNNLNPGQNSLSQSKNFM
150 160 170 180 190 200
230 240 250 260 270 280
pF1KE9 ATSGPG--HLSHVPQQSPSMAPSLRHSVQQFHH--HPSTALHGESVAHSPRFSPNPPQQG
.::: ...: ::.. . . :.::: . .::. .: : .: :.:
CCDS45 NVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAHFHKCS-SH---------QEG
210 220 230 240 250
290 300 310 320 330 340
pF1KE9 AVRPQTLNFSSRSQTVPSPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQS
::.. : .. : ...:: :.: . :: .... .. ... :. .. .. ::.
CCDS45 -------NFNGPSPNMTSCSVSNSQQFSSH-YS-FSSNHISPNSLLQSSAVLASNHTNQT
260 270 280 290 300
350 360 370 380 390 400
pF1KE9 VPRYPNAVGFPSNSG-QGLMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAM
. . .. .: . : . :. ..:. :::. : : .: :.:::.: : .::.. :
CCDS45 LSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNY-SNSKLSPVH-M
310 320 330 340 350
410 420 430 440 450 460
pF1KE9 SNPAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFI
. : :.. :. .: : . .: .... ..:. . .:..::
CCDS45 NFPD--------------PVDSGT--QMGHFN-DHVETNGFSSLEENLLHQVESQTEPFT
360 370 380 390 400
470 480 490 500 510 520
pF1KE9 GMSSAPRELTGHMRPNGCPGVGLGDPQAIQERLIP--GQQHPGQQPSFQQLPTCPPLQPH
:.. :..: .:: :.: .. ::. : . : :
CCDS45 GLD--PEDL-------------------LQEGLLPHFDESTFGQDNSSHILDHDLDRQF-
410 420 430 440
530 540 550 560 570 580
pF1KE9 PGLHHQSSPPHPHHQPWAQLHPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQL
: . : : : . .. . : :. .. :.. :. . .: ..
CCDS45 --TSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLCLQRQPPSSKKSDGSGTYT
450 460 470 480 490
590 600 610 620 630
pF1KE9 VKSDDYLPSIEQQPQQKK-----KKKKNNHIVAEDPSKG--FGKDDFPGGVDNQELNRNS
.. . . .. :.:: :..: :.:..: .:. :. ..: .. ... :
CCDS45 KLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKERGERNIPRVMSPENFPTAS
500 510 520 530 540 550
640 650 660 670 680 690
pF1KE9 LDGSQEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPK
..:..:.: .. .:: ::. ::.::
CCDS45 VEGKEEKKGRRMKSK----------------------------PKDKDSKKTKTC-----
560 570 580
700 710 720 730 740 750
pF1KE9 SSKKSSNKKPDSEASALKKKVNKGKTEGS-ENSDLDKTPPPSPPPEEDEDPGVQKRRSSR
:: . . : . .: :: .: :.:.: : :: .. : . .:.: :::::.:
CCDS45 -SKLKEKTKIGKLIITLGKK-QKRKNESSDEISDAEQMPQHT---LKDQDS--QKRRSNR
590 600 610 620 630
760 770 780 790 800
pF1KE9 QVKRKRYTEDLEFKISDEEADDADAAGRDS-PSNTSQSEQ---QESVDAEGPVVEKIMSS
:.:::.:.::.: : :.::. . ..: : : : .. . .. .:.::.::
CCDS45 QIKRKKYAEDIEGKQSEEEVKGSMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSS
640 650 660 670 680 690
810 820 830 840 850 860
pF1KE9 RSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKIKRFKAKQGQN-K
:.:::. : .. :::.:::::.:::::.::. :.: ::::::::::::: .:.: .
CCDS45 RTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAH
700 710 720 730 740 750
870 880 890 900 910 920
pF1KE9 FLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYEDSTWERRQDIDQ
:....:.: ::::::::::... . : : :::: .:::::::::::::::: ..:.:
CCDS45 FFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDL
760 770 780 790 800 810
930 940 950 960 970 980
pF1KE9 AKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEGVNWLLFNWYNM
:::::::.:.. .:.:.:..:::.. ::: ..::.:::.:.::::::::.:::::::::
CCDS45 AKIEEFEQLQASRPDTRRLDRPPSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNR
820 830 840 850 860 870
990 1000 1010 1020 1030 1040
pF1KE9 RNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREFRTWTELNVVVY
:::::::::::::::::::::::: : ::.::::.::::::: ::::::::::..:::::
CCDS45 RNCILADEMGLGKTIQSITFLYEILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVY
880 890 900 910 920 930
1050 1060 1070 1080 1090 1100
pF1KE9 HGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELRNIPWRCVVIDE
::: ::. :: :::::.: :::.:.:.:.:.:::::::::: : :: : ::::.:::
CCDS45 HGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDE
940 950 960 970 980 990
1110 1120 1130 1140 1150 1160
pF1KE9 AHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSETTFMQEF
::::::.:::::::::.:.:::::::::::::::::::::::::::: :::::.::::::
CCDS45 AHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEF
1000 1010 1020 1030 1040 1050
1170 1180 1190 1200 1210 1220
pF1KE9 GDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYRAILEKNF
::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::
CCDS45 GDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNF
1060 1070 1080 1090 1100 1110
1230 1240 1250 1260 1270 1280
pF1KE9 TFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESPDFQLQAMI
.:::::.::.:::::.::::::::::::::::.::::::: ::..:.: . ::.:::::
CCDS45 SFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMI
1120 1130 1140 1150 1160 1170
1290 1300 1310 1320 1330 1340
pF1KE9 QAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDGRVRGNLRQ
:.:::::::::::::.:::::.:::::::::::::::::::..:: ::::::::::::::
CCDS45 QSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQ
1180 1190 1200 1210 1220 1230
1350 1360 1370 1380 1390 1400
pF1KE9 AAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQS
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.
CCDS45 AAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQN
1240 1250 1260 1270 1280 1290
1410 1420 1430 1440 1450 1460
pF1KE9 KSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKKEIEDLLRK
:.::.:::.:::::::::::.:::::::::::::::::::. ..:.:::::::::::::.
CCDS45 KAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRR
1300 1310 1320 1330 1340 1350
1470 1480 1490 1500 1510 1520
pF1KE9 GAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFVASGNRTDISLD
:::::.:.:::::::::::::::::::::.::::::::.:::::::::::::::::::::
CCDS45 GAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLD
1360 1370 1380 1390 1400 1410
1530 1540 1550 1560 1570 1580
pF1KE9 DPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELMEFSDLESDSEEK
:::::::::::::.::.:..:::.:::::::.::::: .::.: ::: :.:. ::...::
CCDS45 DPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRPFSATK-DELAELSEAESEGDEK
1420 1430 1440 1450 1460 1470
1590 1600 1610 1620 1630 1640
pF1KE9 PCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLTEQDVETICRTI
: : ::: :.:.::.:.::::::::::::::::: .::::::.::::.:.::: :::..
CCDS45 P--KLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWREILSHGRFKRQLNEHDVEIICRAL
1480 1490 1500 1510 1520 1530
1650 1660 1670 1680 1690 1700
pF1KE9 LVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKGKKVKAQSTQPV
:.::: ::.:::.::.::::::::: ::::: : :: ::::::::::::::::.:...
CCDS45 LAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFD
1540 1550 1560 1570 1580 1590
1710 1720 1730 1740 1750 1760
pF1KE9 VQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADS
.: :.:: . ::. :.:...::::.:::::::::::::::::.:::::.. .:...:.:.
CCDS45 IQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDA
1600 1610 1620 1630 1640 1650
1770 1780 1790 1800 1810 1820
pF1KE9 SEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPALCFLERVGMPDA
:. :::.::: :.::::.::: .::::::::::::::::::..::::::::::::: ::
CCDS45 SDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDE
1660 1670 1680 1690 1700 1710
1830 1840 1850 1860 1870 1880
pF1KE9 KAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSPSEDKEESMEIH
::.:::::..:.. :: . :::::::. . :::.:.. ..::.. .
CCDS45 KAVAAEQRANDYM-DG--------DVEDPEYKPAPAIFKDDIEDDVSSPGD----LVIAD
1720 1730 1740 1750 1760
1890 1900 1910 1920 1930 1940
pF1KE9 ATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQ-EALMKTDRRRRRPR
. :. :.. ..:::. :.::::::::::::::. : .:..: . ... .:
CCDS45 GDGQLMEGD----KVYWPTQSALTTRLRRLITAYQRTNKNRQIQQIQPTFSVPTSVMQPI
1770 1780 1790 1800 1810
1950 1960 1970 1980 1990 2000
pF1KE9 EEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWNQFRAFARLDK
: .:. . : : :..:.::::::::::::::::::.::: . ::::..:::.::: :
CCDS45 YEEATLNPKMAAKI-ERQQRWTRREEADFYRVVSTFGVVFDPDRGQFDWTKFRAMARLHK
1820 1830 1840 1850 1860 1870
2010 2020 2030 2040 2050 2060
pF1KE9 KSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTLYRIELLRKIR
:.:.:::::. :..:::::::.: : . :.. .:.:::::::::::::::::::.:
CCDS45 KTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNI--FIQPITEERASRTLYRIELLRKVR
1880 1890 1900 1910 1920 1930
2070 2080 2090 2100 2110 2120
pF1KE9 EQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDLLVGAAKHGVSRTDYHILNDPELSFL
::.:.:::: ::::::.:. ::: ::::: ::::::.::::::::::::::: ::::::.
CCDS45 EQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVSRTDYHILRDPELSFM
1940 1950 1960 1970 1980 1990
2130 2140 2150 2160
pF1KE9 DAHKNFAQNRGAGNTSSL------------NPL--------AVGFVQTPPVISSAHIQDE
:..:..:.. : . .: .:: : :.. ..: ....:
CCDS45 AAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGIILEEMKVKSENLKEE
2000 2010 2020 2030 2040 2050
2170 2180
pF1KE9 --------------RVLEQAE-------------------GKVE----------EP--EN
:.: ..: :: : :: :
CCDS45 PQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCETDRRMVAARTEPLTPN
2060 2070 2080 2090 2100 2110
2190 2200 2210 2220 2230
pF1KE9 PAAKE---KCEGKEEEEETDGSGKESKQECEAEASSVKNELKGVEVGADTGSKS----IS
::.:. . .:.: ..:.....:. .. .:: .. . . :....:.: :
CCDS45 PASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSRSGSSSSSSSSCSSAS
2120 2130 2140 2150 2160 2170
2240 2250 2260 2270 2280
pF1KE9 EKGSEEDEEEKLEDDDKSEESSQPEAGAVSRG-----KNFDEESNASMSTARDETRDGFY
..: . ....::::.. : : .: : .:::: ::.::..:::.:.:
CCDS45 SSSSSSTSSSSSSSSSSSEESDSDEEEAQKRESTTHMKAYDEESVASLSTTQDETQDSFQ
2180 2190 2200 2210 2220 2230
2290 2300 2310 2320 2330 2340
pF1KE9 MEDGDPSVAQLLHE-RTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMFDFQGLIP
:..: : : .:. .: :.::::::::::::.::..::::::: ::. .: . .
CCDS45 MNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGKWPSARRS-YDANTVAS
2240 2250 2260 2270 2280 2290
2350 2360 2370 2380 2390 2400
pF1KE9 GYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQRRRRRRKI
:: .::: ... :. . . .:. : :.::: .:.:. .: ..: .
CCDS45 FYTTKLLDSPGAATEYSDPSVPTPPGAGVKEEHDQSTQMSKEGGLKLTFQKQGLAQKRPF
2300 2310 2320 2330 2340 2350
2410 2420 2430 2440 2450 2460
pF1KE9 EIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNFSSLSSKFIL
. : .... : ..::: : .:: .: ::
CCDS45 DGEDGALGQQQYL----TRLRELQSASE-----------------TSLVNF---------
2360 2370 2380
2470 2480 2490 2500 2510 2520
pF1KE9 PNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNVEGLDLLFM
:. : ::: : : :: :: ..:..: .:.::::::::::.:..:.
CCDS45 PK-SIPVS------------GTSIQPTLGA-NGVILDNQPIVKKRRGRRKNVEGVDIFFF
2390 2400 2410 2420 2430
2530 2540 2550 2560 2570 2580
pF1KE9 SHKR----TSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTRLVGE
.... .::. ..... ... . ..:: : .. .:::::.:::::.:.
CCDS45 NRNKPPNHVSLGLTSSQISTGINPALSYTQPQGIP-----DTESPVPVINLKDGTRLAGD
2440 2450 2460 2470 2480
2590 2600 2610 2620 2630 2640
pF1KE9 DAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINTLTG
:::: ::: .::: :: :. :. ...:. . .:::::::::::::::.:.:::
CCDS45 DAPKRKDLEKWLKEHPGYVEDLGAFIPR----MQLHEGRPKQKRHRCRNPNKLDVNSLTG
2490 2500 2510 2520 2530 2540
2650 2660 2670 2680 2690 2700
pF1KE9 EERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFDRL
:::: ..:.::..:.:::.:::.::: :.:.:: :..:::.: :.::::::.::::..:.
CCDS45 EERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYERI
2550 2560 2570 2580 2590 2600
2710 2720 2730 2740 2750
pF1KE9 LTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTS-GINPLLVNSLFAGMDLTSLQ---
::::::: : .::::::::: ::.:.:::::...:: . ::::.:.:. :.:::.::
CCDS45 LTGPVVR-EEVSRRGRRPKSGIAKATAAAAAASATSVSGNPLLANGLLPGVDLTTLQALQ
2610 2620 2630 2640 2650 2660
2760 2770 2780 2790 2800 2810
pF1KE9 -NLQNLQSLQL-AGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLN
:::::::::. :::::.: :: . ::.::: ::..:..: :::::::..:.::::.
CCDS45 QNLQNLQSLQVTAGLMGMPTGLPS----GGEAKNMAAMFPMLLSGMAGLPNLLGMGGLLT
2670 2680 2690 2700 2710
2820 2830 2840 2850 2860 2870
pF1KE9 NPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAA
.: ..: . ..:. : : .: . : ...:: :: .::.. :......
CCDS45 KPTESGTEDKKGSDSK-ESEGKTERTESQSSENGGEN--------SVSSSPSTSSTAALN
2720 2730 2740 2750 2760
2880 2890 2900 2910 2920 2930
pF1KE9 TAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEK
:: : .::::.::.:::.. .::.:.: :::. : .: . :. . . ..:
CCDS45 TAAA---ANPLALNPLLLSNI----LYPGMLLTPGLN-LHIPTLS-----QSNTFDVQNK
2770 2780 2790 2800 2810
2940 2950 2960 2970 2980 2990
pF1KE9 AADKAEGGPFKDGETLEGSDAEESLDK--TAESSLLEDEIAQG-EELDSLDGGDEIENNE
.: . . . : : : ... :: : : : :. .: :. :. .:.: ..
CCDS45 NSDLGSSKSVEVKE--EDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASSGSDSTSSSS
2820 2830 2840 2850 2860 2870
pF1KE9 NDE
.:
CCDS45 EDSDSSNED
2880
>>CCDS53885.1 CHD8 gene_id:57680|Hs108|chr14 (2581 aa)
initn: 6942 init1: 3921 opt: 6154 Z-score: 2718.7 bits: 517.5 E(32554): 4.1e-145
Smith-Waterman score: 7462; 47.3% identity (67.7% similar) in 2847 aa overlap (80-2868:6-2565)
50 60 70 80 90 100
pF1KE9 LQPSLHHPSTNQNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPP
: :.:.:: . .. . . .: :
CCDS53 MADPIMDLFDDPNLFGLDSLTD---DSFNQVTQDP
10 20 30
110 120 130 140 150 160
pF1KE9 VPQ---VPHGGSGGGQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQ
. . .: . .. :: :. : . : .:: . . : :.. :: . .. .
CCDS53 IEEALGLPSSLDSLDQM-------NQDGGGGDVGNSS--ASELVPPPEET-APTELSKES
40 50 60 70 80
170 180 190 200 210 220
pF1KE9 PQPPQPAPSGPPAQGHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPF
: . . .: ..: .. . : . : . . : :..:: :.:::::
CCDS53 TAPAPESITLHDYTTQPASQEQPAQ-------PVLQTSTPTSGLLQVSKSQEILSQGNPF
90 100 110 120 130
230 240 250 260 270 280
pF1KE9 IATSGPG-HLSHVPQQSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAV
...:. . : . : :. ::. . .. ::... : ::.
CCDS53 MGVSATAVSSSSAGGQPPQSAPK----IVILKAPPSSSVTGAHVAQI-------------
140 150 160 170
290 300 310 320 330 340
pF1KE9 RPQTLNFSSRSQTVPSPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVP
:. ...: .: : . .... .. .... : :.. ...:: . .::
CCDS53 --QAQGITSTAQ----PLVAGTANGGKVTFTKVLTGTPLRPGVSI---VSGNTVLAAKVP
180 190 200 210 220
350 360 370 380 390 400
pF1KE9 RYPNAVGFPSNSGQGLMHQQPIHPSGSLNQMNTQTMHPSQPQGTY-ASPPPMSPMKAMSN
:: :. ..:: ..:. : .. : : :. :. ::..: ...
CCDS53 GNQAAV------------QRIVQPSRPVKQLVLQPVKGSAPAGNPGATGPPLKPAVTLT-
230 240 250 260 270
410 420 430 440 450 460
pF1KE9 PAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGM
. : : . . .. .:: : : : . .. . . :. . ..
CCDS53 ---STPTQGESKRITLVLQ--------QPQ-SGGPQGHRHVVLGSLPGKIVLQGNQLAAL
280 290 300 310 320
470 480 490 500 510 520
pF1KE9 SSAPRELTGHMRPNGCPGVGLGDPQAIQE-RLIPGQQHPGQQPSFQQLPTCPPLQPHPGL
..: .. :. : . : : :. ...: : :..::. :: :. :.
CCDS53 TQA-KNAQGQ--PAKVVTIQLQVQQPQQKIQIVP--QPPSSQPQPQQPPSTQPVTLSSV-
330 340 350 360 370
530 540 550 560 570 580
pF1KE9 HHQSSPPHPHHQPWAQLH-PSPQNTPQKVPVHQHSPSEPFLEK--PVPDMTQVSGPNAQL
.:.. : ..: .: : .. : . : . : . ... .:.: ..
CCDS53 -QQAQIMGPGQSPGQRLSVPVKVVLQPQAGSSQGASSGLSVVKVLSASEVAALSSPASSA
380 390 400 410 420 430
590 600 610 620 630
pF1KE9 VKSDDYLPSIEQQP-QQKKKKKKNNHIVAEDPSKGF--GKDDFPGGVDNQELNRNSLDGS
.: :.. ...::..: :.:::: ... :....: ....:: :.
CCDS53 PHSGGKTGMEENRRLEHQKKQEKANRIVAEAIARARARGEQNIPRVLNEDEL--PSVRPE
440 450 460 470 480 490
640 650 660 670 680 690
pF1KE9 QEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPKSSKK
.: .::.....: . :: : ::. :: : : . :.: : : .::
CCDS53 EEGEKKRRKKSAGERLKEEK-------PKKSKTSGASKT-----KGKSKLNTITPVVGKK
500 510 520 530 540
700 710 720 730 740 750
pF1KE9 SSNKKPDSEASALKKKVNKGKTEGSENSDLDKTPPPSPPPEEDEDPGVQKRRSSRQVKRK
. .. .:.:::.. : :: .:::. ..:::::.::::::
CCDS53 ------------------RKRNTSSDNSDVEVMPAQSP--REDEESSIQKRRSNRQVKRK
550 560 570 580
760 770 780 790 800
pF1KE9 RYTEDLEFKISD-EEADDADAAGRDSPS----NTSQSEQQESVDA-----EGP------V
.:::::..::.: :: ...:..: .: . : . :.. . :.: .
CCDS53 KYTEDLDIKITDDEEEEEVDVTGPIKPEPILPEPVQEPDGETLPSMQFFVENPSEEDAAI
590 600 610 620 630 640
810 820 830 840 850 860
pF1KE9 VEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKIKRFKA
:.:..: : :::. ::. .: :::.:::::.:::::.::.: .:::::::.::.::::.
CCDS53 VDKVLSMRIVKKELPSGQYTEAEEFFVKYKNYSYLHCEWATISQLEKDKRIHQKLKRFKT
650 660 670 680 690 700
870 880 890 900 910 920
pF1KE9 KQGQNKFLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYEDSTWER
:..: . . . ..: :::::::::::.: ..: : : :::: .::::::::::::::::
CCDS53 KMAQMRHFFHEDEEPFNPDYVEVDRILDESHSIDKDNGEPVIYYLVKWCSLPYEDSTWEL
710 720 730 740 750 760
930 940 950 960 970 980
pF1KE9 RQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEGVNWLL
..:.:..::.::....::.:: .::.:: :. ::: : :.:::: :.:::::::::::::
CCDS53 KEDVDEGKIREFKRIQSRHPELKRVNRPQASAWKKLELSHEYKNRNQLREYQLEGVNWLL
770 780 790 800 810 820
990 1000 1010 1020 1030 1040
pF1KE9 FNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREFRTWTE
::::: .:::::::::::::::::.:: :.: ::::::::::::::: :::::: ::::
CCDS53 FNWYNRQNCILADEMGLGKTIQSIAFLQEVYNVGIHGPFLVIAPLSTITNWEREFNTWTE
830 840 850 860 870 880
1050 1060 1070 1080 1090 1100
pF1KE9 LNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELRNIPWR
.:..::::: :::. :: :::: :: .::.: :.::: :.::::::::.::::::.: ::
CCDS53 MNTIVYHGSLASRQMIQQYEMYCKDSRGRLIPGAYKFDALITTFEMILSDCPELREIEWR
890 900 910 920 930 940
1110 1120 1130 1140 1150 1160
pF1KE9 CVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSET
::.:::::::::::::::..:: :::::::::::::::::::::::::::::::.::::.
CCDS53 CVIIDEAHRLKNRNCKLLDSLKHMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSQFPSES
950 960 970 980 990 1000
1170 1180 1190 1200 1210 1220
pF1KE9 TFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYRA
:...::::::::::::::::::::::::::::::::::::.::::::::::::::::::
CCDS53 EFLKDFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKQETIIEVELTNIQKKYYRA
1010 1020 1030 1040 1050 1060
1230 1240 1250 1260 1270 1280
pF1KE9 ILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESPDF
::::::.:::::.:..:.:::::::::::::::::::::::::::: ::.:. . ::
CCDS53 ILEKNFSFLSKGAGHTNMPNLLNTMMELRKCCNHPYLINGAEEKILTEFREACHIIPHDF
1070 1080 1090 1100 1110 1120
1290 1300 1310 1320 1330 1340
pF1KE9 QLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDGRV
.::::...:::::::::::::::::::.::::::::::::::::::::::: ::::::::
CCDS53 HLQAMVRSAGKLVLIDKLLPKLKAGGHKVLIFSQMVRCLDILEDYLIQRRYLYERIDGRV
1130 1140 1150 1160 1170 1180
1350 1360 1370 1380 1390 1400
pF1KE9 RGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARC
1190 1200 1210 1220 1230 1240
1410 1420 1430 1440 1450 1460
pF1KE9 HRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKKEI
:::::::.::.::::::::::::::::::::::::::::::::::.. .:.::.:::::
CCDS53 HRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRDGNITGIQQFSKKEI
1250 1260 1270 1280 1290 1300
1470 1480 1490 1500 1510 1520
pF1KE9 EDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFVASGNR
:::::::::.:.:.:.::::::::::::::::::: ::::::::::::::::::::: ::
CCDS53 EDLLRKGAYAAIMEEDDEGSKFCEEDIDQILLRRTTTITIESEGKGSTFAKASFVASENR
1310 1320 1330 1340 1350 1360
1530 1540 1550 1560 1570 1580
pF1KE9 TDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELMEFSDLE
::::::::::::::::::.::.: ::..::::::::::::::: .:..:.:.:.::::::
CCDS53 TDISLDDPNFWQKWAKKADLDMDLLNSKNNLVIDTPRVRKQTRHFSTLKDDDLVEFSDLE
1370 1380 1390 1400 1410 1420
1590 1600 1610 1620 1630 1640
pF1KE9 SDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLTEQDVE
:...:.: . :: .:. ..:.:..::::::.::::::::: :::::::.::..::.:::
CCDS53 SEDDERP--RSRR-HDRHHAYGRTDCFRVEKHLLVYGWGRWRDILSHGRFKRRMTERDVE
1430 1440 1450 1460 1470 1480
1650 1660 1670 1680 1690 1700
pF1KE9 TICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKGKKVKA
::::.:::::: ::.::::::.::::::.:. .:.:. : :::::: ::::::::::::.
CCDS53 TICRAILVYCLLHYRGDENIKGFIWDLISPAENGKTKELQNHSGLSIPVPRGRKGKKVKS
1490 1500 1510 1520 1530 1540
1710 1720 1730 1740 1750 1760
pF1KE9 QSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKI
::: . . :::. . :::.:::..::::::::.:::::::::::::::::::::::.:.
CCDS53 QSTFDI-HKADWIRKYNPDTLFQDESYKKHLKHQCNKVLLRVRMLYYLRQEVIGDQAEKV
1550 1560 1570 1580 1590
1770 1780 1790 1800 1810 1820
pF1KE9 LEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPALCFLER
: :: .:: :.:.: . :::. :::.:::::::::::::::::::.:::::::::::.
CCDS53 LGGAIASEIDIWFPVVDQLEVPTTWWDSEADKSLLIGVFKHGYEKYNTMRADPALCFLEK
1600 1610 1620 1630 1640 1650
1830 1840 1850 1860 1870 1880
pF1KE9 VGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSPSEDKE
.: :: ::::::.: : ..: .: .::.. ::::::: . : ::. :: ..: .
CCDS53 AGRPDDKAIAAEHRVLDNFSDIVEGVDFDKDCEDPEYKPLQGPPKDQDDE--GDPLMMMD
1660 1670 1680 1690 1700 1710
1890 1900 1910 1920 1930 1940
pF1KE9 ESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQEALMKTDRR
: . . : ... . . :.:.:: :.::.:::::.:::::::::.::. :: . :::
CCDS53 EEISV-IDGDEAQVTQQPGHLFWPPGSALTARLRRLVTAYQRSYKREQMKIEAAERGDRR
1720 1730 1740 1750 1760 1770
1950 1960 1970 1980 1990 2000
pF1KE9 RRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWNQFRAF
::: . . : :. ::.:.:::::..::::::::::: .:: .:: :..::.:
CCDS53 RRRCEAAFKLKEIARR----EKQQRWTRREQTDFYRVVSTFGVEYDPDTMQFHWDRFRTF
1780 1790 1800 1810 1820 1830
2010 2020 2030 2040 2050 2060
pF1KE9 ARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTLYRIEL
::::::.:::: ::: ::::::.:::.: ::::: . .::::::::::::::::::
CCDS53 ARLDKKTDESLTKYFHGFVAMCRQVCRLPPAAGDEPPDPNLFIEPITEERASRTLYRIEL
1840 1850 1860 1870 1880 1890
2070 2080 2090 2100 2110
pF1KE9 LRKIREQVLHHPQLGERLKLCQP-SLDLPEWWECGRHDRDLLVGAAKHGVSRTDYHILND
::..::::: :: : .:: :::: . .::.::: ::: .:: :::.::::.:: .:..:
CCDS53 LRRLREQVLCHPLLEDRLALCQPPGPELPKWWEPVRHDGELLRGAARHGVSQTDCNIMQD
1900 1910 1920 1930 1940 1950
2120 2130 2140 2150 2160 2170
pF1KE9 PELSFLDAHKNFAQNRGAGNTS-SLNPLAVGFVQTPPVISSAHIQDERVLEQAEGKVEEP
:..::: :. :. ::. :: . ::. .. ... . .: : .: . ::
CCDS53 PDFSFLAARMNYMQNHQAGAPAPSLSRCSTPLLHQQYTSRTASPLPLRPDAPVEKSPEET
1960 1970 1980 1990 2000 2010
2180 2190 2200 2210 2220 2230
pF1KE9 ENPAAKEKCEGKEEEEETDGSGKESKQECEAEASS------VKNELKGVEVGADTGSKS-
. . . . . :.:. . .. . :. : ..: :. . :.. . : :
CCDS53 ATQVPSLESLTLKLEHEVVARSRPTPQDYEMRVSPSDTTPLVSRSVPPVKLEDEDDSDSE
2020 2030 2040 2050 2060 2070
2240 2250 2260 2270 2280
pF1KE9 --ISE----KGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMSTARDETRD
.:. ..: . . . :.::. .. . ::.: .:::: :.. ..:
CCDS53 LDLSKLSPSSSSSSSSSSSSSSTDESEDEKEEKLTDQSRSKLYDEESLLSLTM----SQD
2080 2090 2100 2110 2120
2290 2300 2310 2320 2330 2340
pF1KE9 GFYMEDGDPSVAQLL--HERTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMFDFQ
:: :::. . .:: .:: : : ::::::.:::.: .:.:::.:::: .::..
CCDS53 GFPNEDGEQMTPELLLLQERQRA-SEWPKDRVLINRIDLVCQAVLSGKWPSSRRSQEMVT
2130 2140 2150 2160 2170 2180
2350 2360 2370 2380 2390 2400
pF1KE9 GLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQRRRR
: : : .::: :.. .: :: :: :
CCDS53 GGILGPGNHLLDSP---------------SLTPGE-YGDSP-----------VPTPR---
2190 2200 2210
2410 2420 2430 2440 2450 2460
pF1KE9 RRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNFSSLSS
. :: .. : .:...:: .....:..:
CCDS53 -------SSSAA---SMAE-----EEASAVS------------------TAAAQFTKLRR
2220 2230 2240
2470 2480 2490 2500 2510 2520
pF1KE9 KFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLL--NGSLVDGEPPMKRRRGRRKNVEG
. . .. ..: . ::. : .: : :: . ::.: .....: ::..
CCDS53 GMDEKEFTVQIKD---------EEGLKLTFQKHKLMANGVMGDGHPLFHKKKGNRKKLVE
2250 2260 2270 2280 2290
2530 2540 2550 2560 2570 2580
pF1KE9 LDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTRLV
:.. : :: :. ..: .::::::: ::: ::
CCDS53 LEVECM------------------EE----------PNHLDVDLETRIPVINKVDGTLLV
2300 2310 2320
2590 2600 2610 2620 2630 2640
pF1KE9 GEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINTL
:::::. .: ::. :: ..:: : .. : . ::: .::.. :: ..: :
CCDS53 GEDAPRRAELEMWLQGHPEFAVD-PRFLAYMED-------RRKQKWQRCKKNNKAELNCL
2330 2340 2350 2360 2370
2650 2660 2670 2680 2690 2700
pF1KE9 TGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFD
: : : ..:.::::: : :..:.
CCDS53 -GMEPVQTANSRNGKK-----------------------------------GHHTETVFN
2380 2390 2400
2710 2720 2730 2740 2750 2760
pF1KE9 RLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQNL
:.: ::.. :....:.:: . .... : . .. : : ... : . ..::..
CCDS53 RVLPGPIA-PESSKKRARRMRPDLSKMMALMQGGSTGS----LSLHNTFQ-HSSSGLQSV
2410 2420 2430 2440 2450
2770 2780 2790 2800 2810
pF1KE9 QNL-QSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVF-------GL-
..: .: .. . : : . :: ..: . :: :. ::
CCDS53 SSLGHSSATSASLPFMPFVM-----GGAPSSPHVDSSTMLHHHHHHPHPHHHHHHHPGLR
2460 2470 2480 2490 2500 2510
2820 2830 2840 2850 2860 2870
pF1KE9 -GGLLNNPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSAN
: ..:...:.: :: .::.. .. :: ...: .. ..: : :
CCDS53 APGYPSSPVTTASG-TTLRLPPLQPEEDDDEDEE---DDDDLSQGYDSSERDFSLIDDPM
2520 2530 2540 2550 2560
2880 2890 2900 2910 2920 2930
pF1KE9 GSVGAATAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAV
CCDS53 MPANSDSSEDADD
2570 2580
>>CCDS45081.1 CHD8 gene_id:57680|Hs108|chr14 (2302 aa)
initn: 6942 init1: 3921 opt: 6109 Z-score: 2699.7 bits: 513.8 E(32554): 4.7e-144
Smith-Waterman score: 7350; 51.1% identity (70.6% similar) in 2492 aa overlap (430-2868:12-2286)
400 410 420 430 440 450
pF1KE9 KAMSNPAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSR
. .:: : : : . .. . . :.
CCDS45 MKGESKRITLVLQQPQ-SGGPQGHRHVVLGSLPGKIVLQGN
10 20 30 40
460 470 480 490 500 510
pF1KE9 PFIGMSSAPRELTGHMRPNGCPGVGLGDPQAIQE-RLIPGQQHPGQQPSFQQLPTCPPLQ
. ....: .. :. : . : : :. ...: : :..::. :: :. :.
CCDS45 QLAALTQA-KNAQGQ--PAKVVTIQLQVQQPQQKIQIVP--QPPSSQPQPQQPPSTQPVT
50 60 70 80 90
520 530 540 550 560 570
pF1KE9 PHPGLHHQSSPPHPHHQPWAQLH-PSPQNTPQKVPVHQHSPSEPFLEK--PVPDMTQVSG
.:.. : ..: .: : .. : . : . : . ... .:.
CCDS45 LSSV--QQAQIMGPGQSPGQRLSVPVKVVLQPQAGSSQGASSGLSVVKVLSASEVAALSS
100 110 120 130 140 150
580 590 600 610 620 630
pF1KE9 PNAQLVKSDDYLPSIEQQP-QQKKKKKKNNHIVAEDPSKGF--GKDDFPGGVDNQELNRN
: .. .: :.. ...::..: :.:::: ... :....: ....::
CCDS45 PASSAPHSGGKTGMEENRRLEHQKKQEKANRIVAEAIARARARGEQNIPRVLNEDELP--
160 170 180 190 200 210
640 650 660 670 680 690
pF1KE9 SLDGSQEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEKKAKTATPKP
:. .: .::.....: . :: : ::. :: : : . :.: : :
CCDS45 SVRPEEEGEKKRRKKSAGERLKEEK-------PKKSKTSGASKT-----KGKSKLNTITP
220 230 240 250
700 710 720 730 740 750
pF1KE9 KSSKKSSNKKPDSEASALKKKVNKGKTEGSENSDLDKTPPPSPPPEEDEDPGVQKRRSSR
.:: . .. .:.:::.. : :: .:::. ..:::::.:
CCDS45 VVGKK------------------RKRNTSSDNSDVEVMPAQSP--REDEESSIQKRRSNR
260 270 280 290
760 770 780 790 800
pF1KE9 QVKRKRYTEDLEFKISD-EEADDADAAGRDSPS----NTSQSEQQESVDA-----EGP--
:::::.:::::..::.: :: ...:..: .: . : . :.. . :.:
CCDS45 QVKRKKYTEDLDIKITDDEEEEEVDVTGPIKPEPILPEPVQEPDGETLPSMQFFVENPSE
300 310 320 330 340 350
810 820 830 840 850
pF1KE9 ----VVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKI
.:.:..: : :::. ::. .: :::.:::::.:::::.::.: .:::::::.::.
CCDS45 EDAAIVDKVLSMRIVKKELPSGQYTEAEEFFVKYKNYSYLHCEWATISQLEKDKRIHQKL
360 370 380 390 400 410
860 870 880 890 900 910
pF1KE9 KRFKAKQGQNKFLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYED
::::.:..: . . . ..: :::::::::::.: ..: : : :::: .::::::::::::
CCDS45 KRFKTKMAQMRHFFHEDEEPFNPDYVEVDRILDESHSIDKDNGEPVIYYLVKWCSLPYED
420 430 440 450 460 470
920 930 940 950 960 970
pF1KE9 STWERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEG
:::: ..:.:..::.::....::.:: .::.:: :. ::: : :.:::: :.::::::::
CCDS45 STWELKEDVDEGKIREFKRIQSRHPELKRVNRPQASAWKKLELSHEYKNRNQLREYQLEG
480 490 500 510 520 530
980 990 1000 1010 1020 1030
pF1KE9 VNWLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREF
:::::::::: .:::::::::::::::::.:: :.: ::::::::::::::: ::::::
CCDS45 VNWLLFNWYNRQNCILADEMGLGKTIQSIAFLQEVYNVGIHGPFLVIAPLSTITNWEREF
540 550 560 570 580 590
1040 1050 1060 1070 1080 1090
pF1KE9 RTWTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELR
::::.:..::::: :::. :: :::: :: .::.: :.::: :.::::::::.::::::
CCDS45 NTWTEMNTIVYHGSLASRQMIQQYEMYCKDSRGRLIPGAYKFDALITTFEMILSDCPELR
600 610 620 630 640 650
1100 1110 1120 1130 1140 1150
pF1KE9 NIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSR
.: ::::.:::::::::::::::..:: :::::::::::::::::::::::::::::::.
CCDS45 EIEWRCVIIDEAHRLKNRNCKLLDSLKHMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSQ
660 670 680 690 700 710
1160 1170 1180 1190 1200 1210
pF1KE9 FPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQK
::::. :...::::::::::::::::::::::::::::::::::::.:::::::::::::
CCDS45 FPSESEFLKDFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKQETIIEVELTNIQK
720 730 740 750 760 770
1220 1230 1240 1250 1260 1270
pF1KE9 KYYRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNA
:::::::::::.:::::.:..:.:::::::::::::::::::::::::::: ::.:. .
CCDS45 KYYRAILEKNFSFLSKGAGHTNMPNLLNTMMELRKCCNHPYLINGAEEKILTEFREACHI
780 790 800 810 820 830
1280 1290 1300 1310 1320 1330
pF1KE9 ESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYER
::.::::...:::::::::::::::::::.::::::::::::::::::::::: :::
CCDS45 IPHDFHLQAMVRSAGKLVLIDKLLPKLKAGGHKVLIFSQMVRCLDILEDYLIQRRYLYER
840 850 860 870 880 890
1340 1350 1360 1370 1380 1390
pF1KE9 IDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 IDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQ
900 910 920 930 940 950
1400 1410 1420 1430 1440 1450
pF1KE9 AQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQL
::::::::::::.::.::::::::::::::::::::::::::::::::::.. .:.::.
CCDS45 AQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRDGNITGIQQF
960 970 980 990 1000 1010
1460 1470 1480 1490 1500 1510
pF1KE9 SKKEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFV
::::::::::::::.:.:.:.::::::::::::::::::: :::::::::::::::::::
CCDS45 SKKEIEDLLRKGAYAAIMEEDDEGSKFCEEDIDQILLRRTTTITIESEGKGSTFAKASFV
1020 1030 1040 1050 1060 1070
1520 1530 1540 1550 1560 1570
pF1KE9 ASGNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELME
:: ::::::::::::::::::::.::.: ::..::::::::::::::: .:..:.:.:.:
CCDS45 ASENRTDISLDDPNFWQKWAKKADLDMDLLNSKNNLVIDTPRVRKQTRHFSTLKDDDLVE
1080 1090 1100 1110 1120 1130
1580 1590 1600 1610 1620 1630
pF1KE9 FSDLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLT
::::::...:.: . :: .:. ..:.:..::::::.::::::::: :::::::.::..:
CCDS45 FSDLESEDDERP--RSRR-HDRHHAYGRTDCFRVEKHLLVYGWGRWRDILSHGRFKRRMT
1140 1150 1160 1170 1180 1190
1640 1650 1660 1670 1680 1690
pF1KE9 EQDVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKG
:.:::::::.:::::: ::.::::::.::::::.:. .:.:. : :::::: ::::::::
CCDS45 ERDVETICRAILVYCLLHYRGDENIKGFIWDLISPAENGKTKELQNHSGLSIPVPRGRKG
1200 1210 1220 1230 1240 1250
1700 1710 1720 1730 1740 1750
pF1KE9 KKVKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGD
::::.::: . . :::. . :::.:::..::::::::.:::::::::::::::::::::
CCDS45 KKVKSQSTFDI-HKADWIRKYNPDTLFQDESYKKHLKHQCNKVLLRVRMLYYLRQEVIGD
1260 1270 1280 1290 1300 1310
1760 1770 1780 1790 1800 1810
pF1KE9 QADKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPAL
::.:.: :: .:: :.:.: . :::. :::.:::::::::::::::::::.:::::::
CCDS45 QAEKVLGGAIASEIDIWFPVVDQLEVPTTWWDSEADKSLLIGVFKHGYEKYNTMRADPAL
1320 1330 1340 1350 1360 1370
1820 1830 1840 1850 1860 1870
pF1KE9 CFLERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSP
::::..: :: ::::::.: : ..: .: .::.. ::::::: . : ::. :: ..:
CCDS45 CFLEKAGRPDDKAIAAEHRVLDNFSDIVEGVDFDKDCEDPEYKPLQGPPKDQDDE--GDP
1380 1390 1400 1410 1420 1430
1880 1890 1900 1910 1920 1930
pF1KE9 SEDKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQEALM
.: . . : ... . . :.:.:: :.::.:::::.:::::::::.::. ::
CCDS45 LMMMDEEISV-IDGDEAQVTQQPGHLFWPPGSALTARLRRLVTAYQRSYKREQMKIEAAE
1440 1450 1460 1470 1480 1490
1940 1950 1960 1970 1980 1990
pF1KE9 KTDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWN
. :::::: . . : :. ::.:.:::::..::::::::::: .:: .:: :.
CCDS45 RGDRRRRRCEAAFKLKEIARR----EKQQRWTRREQTDFYRVVSTFGVEYDPDTMQFHWD
1500 1510 1520 1530 1540
2000 2010 2020 2030 2040 2050
pF1KE9 QFRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTL
.::.:::::::.:::: ::: ::::::.:::.: ::::: . .:::::::::::::
CCDS45 RFRTFARLDKKTDESLTKYFHGFVAMCRQVCRLPPAAGDEPPDPNLFIEPITEERASRTL
1550 1560 1570 1580 1590 1600
2060 2070 2080 2090 2100 2110
pF1KE9 YRIELLRKIREQVLHHPQLGERLKLCQP-SLDLPEWWECGRHDRDLLVGAAKHGVSRTDY
:::::::..::::: :: : .:: :::: . .::.::: ::: .:: :::.::::.::
CCDS45 YRIELLRRLREQVLCHPLLEDRLALCQPPGPELPKWWEPVRHDGELLRGAARHGVSQTDC
1610 1620 1630 1640 1650 1660
2120 2130 2140 2150 2160 2170
pF1KE9 HILNDPELSFLDAHKNFAQNRGAGNTS-SLNPLAVGFVQTPPVISSAHIQDERVLEQAEG
.:..::..::: :. :. ::. :: . ::. .. ... . .: : .:
CCDS45 NIMQDPDFSFLAARMNYMQNHQAGAPAPSLSRCSTPLLHQQYTSRTASPLPLRPDAPVEK
1670 1680 1690 1700 1710 1720
2180 2190 2200 2210 2220
pF1KE9 KVEEPENPAAKEKCEGKEEEEETDGSGKESKQECEAEASS------VKNELKGVEVGADT
. :: . . . . . :.:. . .. . :. : ..: :. . :.. .
CCDS45 SPEETATQVPSLESLTLKLEHEVVARSRPTPQDYEMRVSPSDTTPLVSRSVPPVKLEDED
1730 1740 1750 1760 1770 1780
2230 2240 2250 2260 2270 2280
pF1KE9 GSKS---ISE----KGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMSTAR
: : .:. ..: . . . :.::. .. . ::.: .:::: :..
CCDS45 DSDSELDLSKLSPSSSSSSSSSSSSSSTDESEDEKEEKLTDQSRSKLYDEESLLSLTM--
1790 1800 1810 1820 1830 1840
2290 2300 2310 2320 2330
pF1KE9 DETRDGFYMEDGDPSVAQLL--HERTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQ
..::: :::. . .:: .:: : : ::::::.:::.: .:.:::.:::: .::.
CCDS45 --SQDGFPNEDGEQMTPELLLLQERQRA-SEWPKDRVLINRIDLVCQAVLSGKWPSSRRS
1850 1860 1870 1880 1890 1900
2340 2350 2360 2370 2380 2390
pF1KE9 MFDFQGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPR
. : : : .::: :.. .: :: ::
CCDS45 QEMVTGGILGPGNHLLDSP---------------SLTPGE-YGDSP-----------VP-
1910 1920 1930
2400 2410 2420 2430 2440 2450
pF1KE9 QRRRRRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSNF
. :... .. : .:...:: .....:
CCDS45 ------------TPRSSSAASMAE-----EEASAVS------------------TAAAQF
1940 1950 1960
2460 2470 2480 2490 2500 2510
pF1KE9 SSLSSKFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLL--NGSLVDGEPPMKRRRGRR
..: . . .. ..: . ::. : .: : :: . ::.: .....: :
CCDS45 TKLRRGMDEKEFTVQIKD---------EEGLKLTFQKHKLMANGVMGDGHPLFHKKKGNR
1970 1980 1990 2000 2010
2520 2530 2540 2550 2560 2570
pF1KE9 KNVEGLDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLED
:.. :.. : :: :. ..: .::::::: :
CCDS45 KKLVELEVECM------------------EE----------PNHLDVDLETRIPVINKVD
2020 2030 2040
2580 2590 2600 2610 2620 2630
pF1KE9 GTRLVGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKL
:: :::::::. .: ::. :: ..:: : .. : . ::: .::.. ::
CCDS45 GTLLVGEDAPRRAELEMWLQGHPEFAVD-PRFLAYMED-------RRKQKWQRCKKNNKA
2050 2060 2070 2080 2090
2640 2650 2660 2670 2680 2690
pF1KE9 DINTLTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVP
..: : : : : ..:.::::: :
CCDS45 ELNCL-GMEPVQTANSRNGKK-----------------------------------GHHT
2100 2110
2700 2710 2720 2730 2740 2750
pF1KE9 ESMFDRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLT
:..:.:.: ::.. :....:.:: . .... : . .. : : ... : . .
CCDS45 ETVFNRVLPGPIA-PESSKKRARRMRPDLSKMMALMQGGSTGS----LSLHNTFQ-HSSS
2120 2130 2140 2150 2160 2170
2760 2770 2780 2790 2800 2810
pF1KE9 SLQNLQNL-QSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVF-----
.::....: .: .. . : : . :: ..: . :: :.
CCDS45 GLQSVSSLGHSSATSASLPFMPFVM-----GGAPSSPHVDSSTMLHHHHHHPHPHHHHHH
2180 2190 2200 2210 2220
2820 2830 2840 2850 2860
pF1KE9 --GL--GGLLNNPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSA
:: : ..:...:.: :: .::.. .. :: ...: .. ..: :
CCDS45 HPGLRAPGYPSSPVTTASG-TTLRLPPLQPEEDDDEDEE---DDDDLSQGYDSSERDFSL
2230 2240 2250 2260 2270 2280
2870 2880 2890 2900 2910 2920
pF1KE9 ADSANGSVGAATAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAG
:
CCDS45 IDDPMMPANSDSSEDADD
2290 2300
>>CCDS13317.1 CHD6 gene_id:84181|Hs108|chr20 (2715 aa)
initn: 5781 init1: 2981 opt: 5891 Z-score: 2602.8 bits: 496.1 E(32554): 1.2e-138
Smith-Waterman score: 7273; 49.3% identity (68.6% similar) in 2592 aa overlap (540-2800:18-2522)
510 520 530 540 550 560
pF1KE9 QLPTCPPLQPHPGLHHQSSPPHPHHQPWAQLHPSPQNTPQKVPVHQHSPSEPFLEKPVPD
:. ::. . .: .::: :: . . .
CCDS13 MKMKIQKKEKQLSNLKVLNHSPM-SDASVNFDYKSPS-PF-DCSTDQ
10 20 30 40
570 580 590 600 610 620
pF1KE9 MTQVSGPNAQLVKSDDYLPSIEQQPQQKKKKKKNNHIVAEDPSKGFG-------KDDFPG
.. .. . . : : . :.. .: ..: :: : : : : ::
CCDS13 EEKIEDVASHCLPQKD-LYTAEEEAATLFPRKMTSHNGMED-SGGGGTGVKKKRKKKEPG
50 60 70 80 90 100
630 640 650 660 670
pF1KE9 GVDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEP---KEPKEKKEPKEPKTPKAPKIPKE
.:: .. ::.... : ::.. :.:::: ::::. :: :::: . : ..
CCDS13 ---DQE---GAAKGSKDREPKPKRKREPKEPKEPRKAKEPKKAKEHKEPKQKDGAKKARK
110 120 130 140 150
680 690 700 710 720
pF1KE9 PKE----KKAKTATPKPKSSKKSSNKKPDSEASAL---KKKVNKGKTEGS-ENSDLDK--
:.: :.:: :. .....: ..: . ::: .: :.: . :. .::.
CCDS13 PREASGTKEAKEKRSCTDSAARTKSRKASKEQGPTPVEKKKKGKRKSETTVESLELDQGL
160 170 180 190 200 210
730 740 750 760 770 780
pF1KE9 TPPPSPPPEED-EDPGVQKRRSSRQVKRKRYTEDLEFKISDEEADDADA--AGRDSPSNT
: : :::. :. :::::.:::::..:.:::.::. :.... . ::: : ..
CCDS13 TNPSLRSPEESTESTDSQKRRSGRQVKRRKYNEDLDFKVVDDDGETIAVLGAGRTSALSA
220 230 240 250 260 270
790 800 810 820 830 840
pF1KE9 S----QSEQQESVDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWAS
: :.:. ::. ..:::..:..:.. . . ..: :::::.:::::::.::.
CCDS13 STLAWQAEEPPEDDAN--IIEKILASKTVQEVHPGEPPFDLELFYVKYRNFSYLHCKWAT
280 290 300 310 320 330
850 860 870 880 890 900
pF1KE9 IEDLEKDKRIQQKIKRFKAKQGQNKFL-SEIEDELFNPDYVEVDRIMDFARSTD-DRGEP
.:.:::: :: ::::::. ::.: : . .: ...::::::::::::.. :.. : . ::
CCDS13 MEELEKDPRIAQKIKRFRNKQAQMKHIFTEPDEDLFNPDYVEVDRILEVAHTKDAETGEE
340 350 360 370 380 390
910 920 930 940 950 960
pF1KE9 VTHYLVKWCSLPYEDSTWERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSR
::::::::::::::.:::: ..:.: ::..:::.:. :: ..:::: .:.:.: :.::
CCDS13 VTHYLVKWCSLPYEESTWELEEDVDPAKVKEFESLQVL-PEIKHVERPASDSWQKLEKSR
400 410 420 430 440 450
970 980 990 1000 1010 1020
pF1KE9 EYKNNNKLREYQLEGVNWLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFL
::::.:.::::::::.::::::::: .:::::::::::::::::::: ::.:.:::::::
CCDS13 EYKNSNQLREYQLEGMNWLLFNWYNRKNCILADEMGLGKTIQSITFLSEIFLRGIHGPFL
460 470 480 490 500 510
1030 1040 1050 1060 1070 1080
pF1KE9 VIAPLSTIPNWEREFRTWTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAI
.::::::: :::::::::::.:..:::::: ::. :: ::: ..: :: ..: .:::..
CCDS13 IIAPLSTITNWEREFRTWTEMNAIVYHGSQISRQMIQQYEMVYRDAQGNPLSGVFKFHVV
520 530 540 550 560 570
1090 1100 1110 1120 1130 1140
pF1KE9 ITTFEMILTDCPELRNIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNT
::::::::.:::::..: : ::.:::::::::::::::::::.: ::::::::::::::.
CCDS13 ITTFEMILADCPELKKIHWSCVIIDEAHRLKNRNCKLLEGLKLMALEHKVLLTGTPLQNS
580 590 600 610 620 630
1150 1160 1170 1180 1190 1200
pF1KE9 VEELFSLLHFLEPSRFPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAP
::::::::.:::::.:::::.:..:::::::::::.:::.:::::::::::.::::::::
CCDS13 VEELFSLLNFLEPSQFPSETAFLEEFGDLKTEEQVKKLQSILKPMMLRRLKDDVEKNLAP
640 650 660 670 680 690
1210 1220 1230 1240 1250 1260
pF1KE9 KEETIIEVELTNIQKKYYRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLING
:.::::::::::::::::::::::::.::.::..: :.:::.::::::::::::::::::
CCDS13 KQETIIEVELTNIQKKYYRAILEKNFSFLTKGANQHNMPNLINTMMELRKCCNHPYLING
700 710 720 730 740 750
1270 1280 1290 1300 1310 1320
pF1KE9 AEEKILEEFKETHNAESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLD
:::::::.:..::. ..::::::::::::::::::::::::: ::::.::::::::::::
CCDS13 AEEKILEDFRKTHSPDAPDFQLQAMIQAAGKLVLIDKLLPKLIAGGHKVLIFSQMVRCLD
760 770 780 790 800 810
1330 1340 1350 1360 1370 1380
pF1KE9 ILEDYLIQRRYPYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADT
::::::::::: :::::::::::::::::::: :::::::::::::::::::::::::::
CCDS13 ILEDYLIQRRYTYERIDGRVRGNLRQAAIDRFCKPDSDRFVFLLCTRAGGLGINLTAADT
820 830 840 850 860 870
1390 1400 1410 1420 1430 1440
pF1KE9 CIIFDSDWNPQNDLQAQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQ
:::::::::::::::::::::::::::.::.:::::::::::::::::::::::::::::
CCDS13 CIIFDSDWNPQNDLQAQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQ
880 890 900 910 920 930
1450 1460 1470 1480 1490 1500
pF1KE9 SMSGRENATNGVQQLSKKEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITI
... :...::::::::: :.::::::::::::::::::::::::::::::: ::::::::
CCDS13 DIN-RKGGTNGVQQLSKMEVEDLLRKGAYGALMDEEDEGSKFCEEDIDQILQRRTHTITI
940 950 960 970 980 990
1510 1520 1530 1540 1550 1560
pF1KE9 ESEGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRK
.::::::::::::::::::::::::::::::::::: :::: .: : ...:::: :::::
CCDS13 QSEGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKIAELDTEAKNEKESLVIDRPRVRK
1000 1010 1020 1030 1040 1050
1570 1580 1590 1600 1610 1620
pF1KE9 QTRLYSAVKEDELMEFSDLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGR
::. :.. .::::::::.:.:::.:.: .. :: .::.. : :.::::::::::..::::
CCDS13 QTKHYNSFEEDELMEFSELDSDSDERP-TRSRRLNDKARRYLRAECFRVEKNLLIFGWGR
1060 1070 1080 1090 1100 1110
1630 1640 1650 1660 1670 1680
pF1KE9 WTDILSHGRYKRQLTEQDVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALV
: :::.:::.: .:.:.:.: :::..::::..::::::.::::::.::::: :::...:
CCDS13 WKDILTHGRFKWHLNEKDMEMICRALLVYCVKHYKGDEKIKSFIWELITPTKDGQAQTLQ
1120 1130 1140 1150 1160 1170
1690 1700 1710 1720 1730 1740
pF1KE9 NHSGLSAPVPRGRKGKKVKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLL
:::::::::::::::::.: : : ..::::::.:::......:.::::::.:::::::
CCDS13 NHSGLSAPVPRGRKGKKTKNQLLIPELKDADWLATCNPEVVLHDDGYKKHLKQHCNKVLL
1180 1190 1200 1210 1220 1230
1750 1760 1770 1780 1790 1800
pF1KE9 RVRMLYYLRQEVIGDQADKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFK
::::::::. :..:. :.: .::. . : :: .:. . :.:.:::: ::::::::::::
CCDS13 RVRMLYYLKAEILGEAAEKAFEGSPARELDVPLPDIDYMEIPVDWWDAEADKSLLIGVFK
1240 1250 1260 1270 1280 1290
1810 1820 1830 1840 1850
pF1KE9 HGYEKYNSMRADPALCFLERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDE-DPEYKP
::::.::.:::::::::::.::::: :...::: :: .: . :. :.::. . .
CCDS13 HGYERYNAMRADPALCFLEKVGMPDEKSLSAEQGVTDGTSDIPERGNTDKEDNAEDKVDG
1300 1310 1320 1330 1340 1350
1860 1870 1880 1890 1900 1910
pF1KE9 TRTPFKDEIDEFANSPSEDKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITA
. .. : . :: :..: . ...... . :: .:.::.:::::.:.
CCDS13 LQKQTESSSDGGDGVFSEKKDDS-------RAAQDGSDPDKSPWPVSSALTARLRRLVTV
1360 1370 1380 1390 1400
1920 1930 1940 1950 1960 1970
pF1KE9 YQRSYKRQQMRQEALMKTDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVS
::: ... : : : .. .: : .: . : .: ...:::::.:::::.::
CCDS13 YQRCNRKELCRPEILGPGNQGYWVQEEMFRRT-SEMDLINKEAQKRWTRREQADFYRTVS
1410 1420 1430 1440 1450 1460
1980 1990 2000 2010 2020 2030
pF1KE9 TFGVIFDPVKQQFDWNQFRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDL
.:::..: :. :::.::: ..:::::::::::.:: :::::: :::.:. : :::
CCDS13 SFGVVYDQEKKTFDWTQFRIISRLDKKSDESLEQYFYSFVAMCRNVCRLPTWKDGGPPDT
1470 1480 1490 1500 1510 1520
2040 2050 2060 2070 2080 2090
pF1KE9 SSIIEPITEERASRTLYRIELLRKIREQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRD
. .::::::::.:::::::::::.:::::. ::: :::.::.::: :: :::::.::::
CCDS13 TIYVEPITEERAARTLYRIELLRKVREQVLKCPQLHERLQLCRPSLYLPVWWECGKHDRD
1530 1540 1550 1560 1570 1580
2100 2110 2120 2130 2140
pF1KE9 LLVGAAKHGVSRTDYHILNDPELSFLDAHKNFAQNRGAGNTSSLN---------------
::.:.::::..::: .:.:::.::::::..:.::.. .:. . :
CCDS13 LLIGTAKHGLNRTDCYIMNDPQLSFLDAYRNYAQHKRSGTQAPGNLCCLYQTNSKLYESL
1590 1600 1610 1620 1630 1640
2150 2160 2170
pF1KE9 ---------------PLAVGFVQT-------PPVISSAHI----------QDERVLEQA-
: . :.. : : : .:: .: ..
CCDS13 TYSQMSRTSESLENEPENLVRVESRDDHLSLPDVTCENFISKVQDVISINHDESLLPESL
1650 1660 1670 1680 1690 1700
2180 2190
pF1KE9 ----EGK---VEEP----ENPAAKEK---------------CE-GKEEEEETDG------
:: .:: :.:... . :. : : : ..:
CCDS13 ESMMYGKKVLSQEPSSFQESPSTNTESRKDVITISISKDGNCQSGGPEAEIASGPTFMGS
1710 1720 1730 1740 1750 1760
2200 2210 2220
pF1KE9 ------------SGKE-----SKQE--CEAEASSVKNELKGVEV----------GADTG-
.::. ::. : .::.. ... .:. : ..:
CCDS13 LEAGGVAQANIKNGKHLLMSISKEGELCCSEAGQRPENIGQLEAKCLASPSLNPGNESGF
1770 1780 1790 1800 1810 1820
2230 2240 2250
pF1KE9 --------------------------SKSISEK-------GSEEDEEEKLEDDDKSEE--
.::. : ..::.:::. :... .
CCDS13 VDMCSLSVCDSKRNLSSDQQLIDLLENKSLESKLILSQNHSDEEEEEEENEEENLAMAVG
1830 1840 1850 1860 1870 1880
2260 2270 2280
pF1KE9 -SSQPEA-------GAVSRGKN--F-DEESNASMSTAR----------------------
. .::. .:: :: : :: ...:. .:
CCDS13 MGERPEVLHLTEPTTNISREKNQGFQDETKKGSLEVANQTPGLQRAFPAPAACQCHCKHM
1890 1900 1910 1920 1930 1940
pF1KE9 ------------------------------------------------------------
CCDS13 ERWMHGLENDEFEIEKPKAYIPDLFKSKTNTIAMEGEPTAIPSQPFKVKHELLKEPWKES
1950 1960 1970 1980 1990 2000
2290
pF1KE9 ----------------------------DETRDGF---------YMED----------GD
: ::: : :. ::
CCDS13 AEGQNVFPTYPLEGSELKSEDMDFENKDDYDRDGNCHSQDYPGKYSEEESKSSTSGITGD
2010 2020 2030 2040 2050 2060
2300 2310 2320 2330 2340
pF1KE9 ----------PSVAQLLHERT-FAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMFDF
:..::::.:.: ..:: ::::::.::::::::..::::::: . :...
CCDS13 IGDELQEARAPTIAQLLQEKTLYSFSEWPKDRVIINRLDNICHVVLKGKWPSS--QQYEP
2070 2080 2090 2100 2110 2120
2350 2360 2370 2380 2390 2400
pF1KE9 QGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQRRR
.: .: ::. ..: .. :..: : : :. . . :. ::. : .....
CCDS13 SGTLP--TPVLTSSAGSRTSLSEPE---AAEHSFSNGAALAAQIHKESFLAPVFTKDEQK
2130 2140 2150 2160 2170
2410 2420 2430 2440 2450 2460
pF1KE9 RRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQ--EKVVDLSKASREATSSTSNFSS
.:: :.:.:: :: :.: .. : .. .. :: :...::: .:. . ..:: :
CCDS13 HRRPYEFEVERDAKARGLEQFSATHGHTPIIL-NGWHGESAMDLSCSSEGSPGATSPFPV
2180 2190 2200 2210 2220 2230
2470 2480 2490 2500 2510
pF1KE9 LSSKFILPNVSTPVSDAFKTQME-LLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNV
.: . .:. .. :. .. .::::: . : ...:::: . .:::::::.:
CCDS13 SASTPKIGAISS-LQGALGMDLSGILQAGLIHPVTGQIVNGSLRRDDAATRRRRGRRKHV
2240 2250 2260 2270 2280 2290
2520 2530 2540 2550 2560 2570
pF1KE9 EG-LDLLFMSHKRTSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGT
:: .::.:. :. .:.: :: . . : : . .:: : : : ..
CCDS13 EGGMDLIFL--KEQTLQAGILEVHE--DPGQATLSTTHPEGPG---PATSAPEPATAASS
2300 2310 2320 2330 2340
2580 2590 2600 2610 2620 2630
pF1KE9 RLVGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDI
. .: . .:.:..::. . :....:.. .:. ::. ::::.: ::..:.:::.
CCDS13 Q--AEKSIPSKSLLDWLRQQADYSLEVPGF---GAN--FSD--KPKQRRPRCKEPGKLDV
2350 2360 2370 2380 2390
2640 2650 2660 2670 2680 2690
pF1KE9 NTLTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPES
..:.::::::.. :. : . ::.::.
CCDS13 SSLSGEERVPAIPKEPGLR-----------------------------------GFLPEN
2400 2410 2420
2700 2710 2720 2730 2740 2750
pF1KE9 MFDRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSL
:.. :. :..: : ::::::.::. .: . .: : ::..::..:.:.:::::..:
CCDS13 KFNHTLAEPILRDTGPRRRGRRPRSELLKAPSIVA--DSPSGMGPLFMNGLIAGMDLVGL
2430 2440 2450 2460 2470 2480
2760 2770 2780 2790 2800 2810
pF1KE9 QNLQNLQSLQLAGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNN
::..:. .. :.::.::: :.:: : : ..:. ..::.::
CCDS13 QNMRNMPGIPLTGLVGFPAGFATMPT-GEEVKSTLSMLPMMLPGMAAVPQMFGVGGLLSP
2490 2500 2510 2520 2530 2540
2820 2830 2840 2850 2860 2870
pF1KE9 PLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAAT
CCDS13 PMATTCTSTAPASLSSTTKSGTAVTEKTAEDKPSSHDVKTDTLAEDKPGPGPFSDQSEPA
2550 2560 2570 2580 2590 2600
>>CCDS76865.1 CHD9 gene_id:80205|Hs108|chr16 (2897 aa)
initn: 7270 init1: 3906 opt: 5851 Z-score: 2584.8 bits: 492.9 E(32554): 1.2e-137
Smith-Waterman score: 8925; 49.5% identity (71.4% similar) in 3126 aa overlap (1-2996:1-2890)
10 20 30 40 50
pF1KE9 MADPGMMSLFGEDGNIFSEGLEGLGECGYPE-NPVNPMGQQMPIDQGFASLQ-PSLHHPS
:.:: ::..: .:.:.:.: ::::.. .. . .::. . ... . : :. ::.: .
CCDS76 MTDP-MMDFF-DDANLFGETLEGLSDDAFVQPGPVS-LVDELNLGAEFEPLHIDSLNHVQ
10 20 30 40 50
60 70 80 90 100 110
pF1KE9 TNQNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPV-PQVPHGG
. .. :.: :.. ::... :.: ..: ..:.. . :::::.. :. ::
CCDS76 GTPTHQKMTDFEQLNQFDSIKFHHVNQS----FGSPAEHVLSPHSQFNCSPIHPQ-----
60 70 80 90 100
120 130 140 150 160 170
pF1KE9 SGGGQMGVYPGMQNERHGQSFVDSSSMWGPR-AVQVPDQIRAPYQQQQPQPQPPQPAPSG
. :..: .. :.: ::: . :. . .: .:..::
CCDS76 --NQPNGLFPDVS---------DGSPMWGHQTATTISNQNGSPFHQQ-------------
110 120 130 140
180 190 200 210 220
pF1KE9 PPAQGHPQHMQQMGSYMARGDFSM----QQHGQ-----PQQRMSQFSQGQEGLNQGNPFI
:: . :.: :..:. ::.. .:. : :: .... ::..:.:.. :.
CCDS76 ----GHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQQNRNNLNPGQNSLSQSKNFM
150 160 170 180 190 200
230 240 250 260 270 280
pF1KE9 ATSGPG--HLSHVPQQSPSMAPSLRHSVQQFHH--HPSTALHGESVAHSPRFSPNPPQQG
.::: ...: ::.. . . :.::: . .::. .: : .: :.:
CCDS76 NVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAHFHKCS-SH---------QEG
210 220 230 240 250
290 300 310 320 330 340
pF1KE9 AVRPQTLNFSSRSQTVPSPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQS
::.. : .. : ...:: :.: . :: .... .. ... :. .. .. ::.
CCDS76 -------NFNGPSPNMTSCSVSNSQQFSSH-YS-FSSNHISPNSLLQSSAVLASNHTNQT
260 270 280 290 300
350 360 370 380 390 400
pF1KE9 VPRYPNAVGFPSNSG-QGLMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAM
. . .. .: . : . :. ..:. :::. : : .: :.:::.: : .::.. :
CCDS76 LSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNY-SNSKLSPVH-M
310 320 330 340 350
410 420 430 440 450 460
pF1KE9 SNPAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFI
. : :.. :. .: : . .: .... ..:. . .:..::
CCDS76 NFPD--------------PVDSGT--QMGHFN-DHVETNGFSSLEENLLHQVESQTEPFT
360 370 380 390 400
470 480 490 500 510 520
pF1KE9 GMSSAPRELTGHMRPNGCPGVGLGDPQAIQERLIP--GQQHPGQQPSFQQLPTCPPLQPH
:.. :..: .:: :.: .. ::. : . : :
CCDS76 GLD--PEDL-------------------LQEGLLPHFDESTFGQDNSSHILDHDLDRQF-
410 420 430 440
530 540 550 560 570 580
pF1KE9 PGLHHQSSPPHPHHQPWAQLHPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQL
: . : : : . .. . : :. .. :.. :. . .: ..
CCDS76 --TSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLCLQRQPPSSKKSDGSGTYT
450 460 470 480 490
590 600 610 620 630
pF1KE9 VKSDDYLPSIEQQPQQKK-----KKKKNNHIVAEDPSKG--FGKDDFPGGVDNQELNRNS
.. . . .. :.:: :..: :.:..: .:. :. ..: .. ... :
CCDS76 KLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKERGERNIPRVMSPENFPTAS
500 510 520 530 540 550
640 650 660 670 680 690
pF1KE9 LDGSQEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEKKAKTATPKPK
..:..:.: .. .:: ::. ::.::
CCDS76 VEGKEEKKGRRMKSK----------------------------PKDKDSKKTKTC-----
560 570 580
700 710 720 730 740 750
pF1KE9 SSKKSSNKKPDSEASALKKKVNKGKTEGS-ENSDLDKTPPPSPPPEEDEDPGVQKRRSSR
:: . . : . .: :: .: :.:.: : :: .. : . .:.: :::::.:
CCDS76 -SKLKEKTKIGKLIITLGKK-QKRKNESSDEISDAEQMPQHT---LKDQDS--QKRRSNR
590 600 610 620 630
760 770 780 790 800
pF1KE9 QVKRKRYTEDLEFKISDEEADDADAAGRDS-PSNTSQSEQ---QESVDAEGPVVEKIMSS
:.:::.:.::.: : :.::. . ..: : : : .. . .. .:.::.::
CCDS76 QIKRKKYAEDIEGKQSEEEVKGSMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSS
640 650 660 670 680 690
810 820 830 840 850 860
pF1KE9 RSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKIKRFKAKQGQN-K
:.:::. : .. :::.:::::.:::::.::. :.: ::::::::::::: .:.: .
CCDS76 RTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAH
700 710 720 730 740 750
870 880 890 900 910 920
pF1KE9 FLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYEDSTWERRQDIDQ
:....:.: ::::::::::... . : : :::: .:::::::::::::::: ..:.:
CCDS76 FFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDL
760 770 780 790 800 810
930 940 950 960 970 980
pF1KE9 AKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEGVNWLLFNWYNM
:::::::.:.. .:.:.:..:::.. ::: ..::.:::.:.::::::::.:::::::::
CCDS76 AKIEEFEQLQASRPDTRRLDRPPSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNR
820 830 840 850 860 870
990 1000 1010 1020 1030 1040
pF1KE9 RNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREFRTWTELNVVVY
:::::::::::::::::::::::: : ::.::::.::::::: ::::::::::..:::::
CCDS76 RNCILADEMGLGKTIQSITFLYEILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVY
880 890 900 910 920 930
1050 1060 1070 1080 1090 1100
pF1KE9 HGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELRNIPWRCVVIDE
::: ::. :: :::::.: :::.:.:.:.:.:::::::::: : :: : ::::.:::
CCDS76 HGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDE
940 950 960 970 980 990
1110 1120 1130 1140 1150 1160
pF1KE9 AHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSETTFMQEF
::::::.:::::::::.:.:::::::::::::::::::::::::::: :::::.::::::
CCDS76 AHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEF
1000 1010 1020 1030 1040 1050
1170 1180 1190 1200 1210 1220
pF1KE9 GDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYRAILEKNF
::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::
CCDS76 GDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNF
1060 1070 1080 1090 1100 1110
1230 1240 1250 1260 1270 1280
pF1KE9 TFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESPDFQLQAMI
.:::::.::.:::::.::::::::::::::::.::::::: ::..:.: . ::.:::::
CCDS76 SFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMI
1120 1130 1140 1150 1160 1170
1290 1300 1310 1320 1330 1340
pF1KE9 QAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDGRVRGNLRQ
:.:::::::::::::.:::::.:::::::::::::::::::..:: ::::::::::::::
CCDS76 QSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQ
1180 1190 1200 1210 1220 1230
1350 1360 1370 1380 1390 1400
pF1KE9 AAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQS
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.
CCDS76 AAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQN
1240 1250 1260 1270 1280 1290
1410 1420 1430 1440 1450 1460
pF1KE9 KSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKKEIEDLLRK
:.::.:::.:::::::::::.:::::::::::::::::::. ..:.:::::::::::::.
CCDS76 KAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRR
1300 1310 1320 1330 1340 1350
1470 1480 1490 1500 1510 1520
pF1KE9 GAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFVASGNRTDISLD
:::::.:.:::::::::::::::::::::.::::::::.:::::::::::::::::::::
CCDS76 GAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLD
1360 1370 1380 1390 1400 1410
1530 1540 1550 1560 1570 1580
pF1KE9 DPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELMEFSDLESDSEEK
:::::::::::::.::.:..:::.:::::::.::::: .::.: ::: :.:. ::...::
CCDS76 DPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRPFSATK-DELAELSEAESEGDEK
1420 1430 1440 1450 1460 1470
1590 1600 1610 1620 1630 1640
pF1KE9 PCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLTEQDVETICRTI
: : ::: :.:.::.:.::::::::::::::::: .::::::.::::.:.::: :::..
CCDS76 P--KLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWREILSHGRFKRQLNEHDVEIICRAL
1480 1490 1500 1510 1520 1530
1650 1660 1670 1680 1690 1700
pF1KE9 LVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKGKKVKAQSTQPV
:.::: ::.:::.::.::::::::: ::::: : :: ::::::::::::::::.:...
CCDS76 LAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFD
1540 1550 1560 1570 1580 1590
1710 1720 1730 1740 1750 1760
pF1KE9 VQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADS
.: :.:: . ::. :.:...::::.:::::::::::::::::.:::::.. .:...:.:.
CCDS76 IQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDA
1600 1610 1620 1630 1640 1650
1770 1780 1790 1800 1810 1820
pF1KE9 SEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPALCFLERVGMPDA
:. :::.::: :.::::.::: .::::::::::::::::::..::::::::::::: ::
CCDS76 SDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDE
1660 1670 1680 1690 1700 1710
1830 1840 1850 1860 1870 1880
pF1KE9 KAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSPSEDKEESMEIH
::.:::::..:.. :: . :::::::. . :::.:.. ..::.. .
CCDS76 KAVAAEQRANDYM-DG--------DVEDPEYKPAPAIFKDDIEDDVSSPGD----LVIAD
1720 1730 1740 1750 1760
1890 1900 1910 1920 1930 1940
pF1KE9 ATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQ-EALMKTDRRRRRPR
. :. :.. ..:::. :.::::::::::::::. : .:..: . ... .:
CCDS76 GDGQLMEGD----KVYWPTQSALTTRLRRLITAYQRTNKNRQIQQIQPTFSVPTSVMQPI
1770 1780 1790 1800 1810
1950 1960 1970 1980 1990 2000
pF1KE9 EEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWNQFRAFARLDK
: .:. . : : :..:.::::::::::::::::::.::: . ::::..:::.::: :
CCDS76 YEEATLNPKMAAKI-ERQQRWTRREEADFYRVVSTFGVVFDPDRGQFDWTKFRAMARLHK
1820 1830 1840 1850 1860 1870
2010 2020 2030 2040 2050 2060
pF1KE9 KSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTLYRIELLRKIR
:.:.:::::. :..:::::::.: : . :.. .:.:::::::::::::::::::.:
CCDS76 KTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNI--FIQPITEERASRTLYRIELLRKVR
1880 1890 1900 1910 1920 1930
2070 2080 2090 2100 2110 2120
pF1KE9 EQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDLLVGAAKHGVSRTDYHILNDPELSFL
::.:.:::: ::::::.:. ::: ::::: ::::::.::::::::::::::: ::::::.
CCDS76 EQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVSRTDYHILRDPELSFM
1940 1950 1960 1970 1980 1990
2130 2140 2150 2160
pF1KE9 DAHKNFAQNRGAGNTSSL------------NPL--------AVGFVQTPPVISSAHIQDE
:..:..:.. : . .: .:: : :.. ..: ....:
CCDS76 AAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGIILEEMKVKSENLKEE
2000 2010 2020 2030 2040 2050
2170 2180
pF1KE9 --------------RVLEQAE-------------------GKVE----------EP--EN
:.: ..: :: : :: :
CCDS76 PQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCETDRRMVAARTEPLTPN
2060 2070 2080 2090 2100 2110
2190 2200 2210 2220 2230
pF1KE9 PAAKE---KCEGKEEEEETDGSGKESKQECEAEASSVKNELKGVEVGADTGSKS----IS
::.:. . .:.: ..:.....:. .. .:: .. . . :....:.: :
CCDS76 PASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSRSGSSSSSSSSCSSAS
2120 2130 2140 2150 2160 2170
2240 2250 2260 2270 2280
pF1KE9 EKGSEEDEEEKLEDDDKSEESSQPEAGAVSRG-----KNFDEESNASMSTARDETRDGFY
..: . ....::::.. : : .: : .:::: ::.::..:::.:.:
CCDS76 SSSSSSTSSSSSSSSSSSEESDSDEEEAQKRESTTHMKAYDEESVASLSTTQDETQDSFQ
2180 2190 2200 2210 2220 2230
2290 2300 2310 2320 2330 2340
pF1KE9 MEDGDPSVAQLLHE-RTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRRQMFDFQGLIP
:..: : : .:. .: :.::::::::::::.::..::::::: ::. .: . .
CCDS76 MNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGKWPSARRS-YDANTVAS
2240 2250 2260 2270 2280 2290
2350 2360 2370 2380 2390 2400
pF1KE9 GYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVPRQRRRRRRKI
:: .::: ... :. . . .:. : :.:: : .. :... .
CCDS76 FYTTKLLDSPGAATEYSDPSVPTPPGAGVKEEHDQSTQMSK-------VKKHVREKEFTV
2300 2310 2320 2330 2340
2410 2420 2430 2440 2450 2460
pF1KE9 EIEAERAAKRRNLMEMVAQLRESQVVSENG----QEKVVDLSKASREATSSTSNFSSLSS
.:. : . : . .:: : . .:.: :. .. : . . . .: ::
CCDS76 KIKDEGGLKLTFQKQGLAQKRPFD--GEDGALGQQQYLTRLRELQSASETSLVNF-----
2350 2360 2370 2380 2390 2400
2470 2480 2490 2500 2510 2520
pF1KE9 KFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRKNVEGLD
:. : ::: : : :: :: ..:..: .:.::::::::::.:
CCDS76 ----PK-SIPVS------------GTSIQPTLGA-NGVILDNQPIVKKRRGRRKNVEGVD
2410 2420 2430 2440
2530 2540 2550 2560 2570
pF1KE9 LLFMSHKR----TSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVINLEDGTR
..:..... .::. ..... ... . ..:: : .. .:::::.::::
CCDS76 IFFFNRNKPPNHVSLGLTSSQISTGINPALSYTQPQGIP-----DTESPVPVINLKDGTR
2450 2460 2470 2480 2490
2580 2590 2600 2610 2620 2630
pF1KE9 LVGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDIN
:.:.:::: ::: .::: :: :. :. ...:. . .:::::::::::::::.:
CCDS76 LAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPR----MQLHEGRPKQKRHRCRNPNKLDVN
2500 2510 2520 2530 2540 2550
2640 2650 2660 2670 2680 2690
pF1KE9 TLTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESM
.::::::: ..:.::..:.:::.:::.::: :.:.:: :..:::.: :.::::::.::::
CCDS76 SLTGEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESM
2560 2570 2580 2590 2600 2610
2700 2710 2720 2730 2740 2750
pF1KE9 FDRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTS-GINPLLVNSLFAGMDLTSL
..:.::::::: : .::::::::: ::.:.:::::...:: . ::::.:.:. :.:::.:
CCDS76 YERILTGPVVR-EEVSRRGRRPKSGIAKATAAAAAASATSVSGNPLLANGLLPGVDLTTL
2620 2630 2640 2650 2660 2670
2760 2770 2780 2790 2800 2810
pF1KE9 Q----NLQNLQSLQL-AGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLG
: :::::::::. :::::.: :: . ::.::: ::..:..: :::::::..:.:
CCDS76 QALQQNLQNLQSLQVTAGLMGMPTGLPS----GGEAKNMAAMFPMLLSGMAGLPNLLGMG
2680 2690 2700 2710 2720
2820 2830 2840 2850 2860 2870
pF1KE9 GLLNNPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGS
:::..: ..: . ..:. : : .: . : ...:: :: .::.. :....
CCDS76 GLLTKPTESGTEDKKGSDSK-ESEGKTERTESQSSENGGEN--------SVSSSPSTSST
2730 2740 2750 2760 2770
2880 2890 2900 2910 2920 2930
pF1KE9 VGAATAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGS
.. :: : .::::.::.:::.. .::.:.: :::. : .: . :. . .
CCDS76 AALNTAAA---ANPLALNPLLLSNI----LYPGMLLTPGLN-LHIPTLS-----QSNTFD
2780 2790 2800 2810 2820
2940 2950 2960 2970 2980 2990
pF1KE9 SEEKAADKAEGGPFKDGETLEGSDAEESLDK--TAESSLLEDEIAQG-EELDSLDGGDEI
..: .: . . . : : : ... :: : : : :. .: :. :. .:.:
CCDS76 VQNKNSDLGSSKSVEVKE--EDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASSGSDST
2830 2840 2850 2860 2870 2880
pF1KE9 ENNENDE
.. .:
CCDS76 SSSSEDSDSSNED
2890
>>CCDS83299.1 CHD7 gene_id:55636|Hs108|chr8 (948 aa)
initn: 4325 init1: 4183 opt: 4183 Z-score: 1858.6 bits: 356.9 E(32554): 3.3e-97
Smith-Waterman score: 4183; 100.0% identity (100.0% similar) in 572 aa overlap (1-572:1-572)
10 20 30 40 50 60
pF1KE9 MADPGMMSLFGEDGNIFSEGLEGLGECGYPENPVNPMGQQMPIDQGFASLQPSLHHPSTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 MADPGMMSLFGEDGNIFSEGLEGLGECGYPENPVNPMGQQMPIDQGFASLQPSLHHPSTN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 QNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPVPQVPHGGSGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 QNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTPPVPQVPHGGSGG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 GQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQPQPPQPAPSGPPAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 GQMGVYPGMQNERHGQSFVDSSSMWGPRAVQVPDQIRAPYQQQQPQPQPPQPAPSGPPAQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 GHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPFIATSGPGHLSHVPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 GHPQHMQQMGSYMARGDFSMQQHGQPQQRMSQFSQGQEGLNQGNPFIATSGPGHLSHVPQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 QSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAVRPQTLNFSSRSQTVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 QSPSMAPSLRHSVQQFHHHPSTALHGESVAHSPRFSPNPPQQGAVRPQTLNFSSRSQTVP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 SPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVPRYPNAVGFPSNSGQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 SPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLGLTNNTPMNQSVPRYPNAVGFPSNSGQG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 LMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAMSNPAGTPPPQVRPGSAGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 LMHQQPIHPSGSLNQMNTQTMHPSQPQGTYASPPPMSPMKAMSNPAGTPPPQVRPGSAGI
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 PMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGMSSAPRELTGHMRPNGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 PMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGPRNMQQSRPFIGMSSAPRELTGHMRPNGC
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 PGVGLGDPQAIQERLIPGQQHPGQQPSFQQLPTCPPLQPHPGLHHQSSPPHPHHQPWAQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 PGVGLGDPQAIQERLIPGQQHPGQQPSFQQLPTCPPLQPHPGLHHQSSPPHPHHQPWAQL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 HPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQVSGPNAQLVKSDDYLPSIEQQPQQKKKK
::::::::::::::::::::::::::::::::
CCDS83 HPSPQNTPQKVPVHQHSPSEPFLEKPVPDMTQKPKQKRHRCRNPNKLDINTLTGEERVPV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 KKNNHIVAEDPSKGFGKDDFPGGVDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEPKEPK
CCDS83 VNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFDRLLTGPVV
610 620 630 640 650 660
>--
initn: 2461 init1: 2461 opt: 2461 Z-score: 1101.6 bits: 216.9 E(32554): 4.9e-55
Smith-Waterman score: 2461; 100.0% identity (100.0% similar) in 376 aa overlap (2622-2997:573-948)
2600 2610 2620 2630 2640 2650
pF1KE9 VEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNPNKLDINTLTGEERVPVVN
::::::::::::::::::::::::::::::
CCDS83 SPQNTPQKVPVHQHSPSEPFLEKPVPDMTQKPKQKRHRCRNPNKLDINTLTGEERVPVVN
550 560 570 580 590 600
2660 2670 2680 2690 2700 2710
pF1KE9 KRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFDRLLTGPVVRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 KRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSGFVPESMFDRLLTGPVVRG
610 620 630 640 650 660
2720 2730 2740 2750 2760 2770
pF1KE9 EGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQNLQNLQSLQLAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 EGASRRGRRPKSEIARAAAAAAAVASTSGINPLLVNSLFAGMDLTSLQNLQNLQSLQLAG
670 680 690 700 710 720
2780 2790 2800 2810 2820 2830
pF1KE9 LMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNNPLSAATGNTTTAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 LMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLPNVFGLGGLLNNPLSAATGNTTTAS
730 740 750 760 770 780
2840 2850 2860 2870 2880 2890
pF1KE9 SQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAATAPAGLPSNPLAFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 SQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAADSANGSVGAATAPAGLPSNPLAFN
790 800 810 820 830 840
2900 2910 2920 2930 2940 2950
pF1KE9 PFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEKAADKAEGGPFKDGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 PFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGLQNAVGSSEEKAADKAEGGPFKDGE
850 860 870 880 890 900
2960 2970 2980 2990
pF1KE9 TLEGSDAEESLDKTAESSLLEDEIAQGEELDSLDGGDEIENNENDE
::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 TLEGSDAEESLDKTAESSLLEDEIAQGEELDSLDGGDEIENNENDE
910 920 930 940
>>CCDS76510.1 CHD4 gene_id:1108|Hs108|chr12 (1905 aa)
initn: 1696 init1: 630 opt: 1655 Z-score: 742.9 bits: 151.5 E(32554): 4.7e-35
Smith-Waterman score: 1834; 38.1% identity (63.9% similar) in 969 aa overlap (825-1686:535-1481)
800 810 820 830 840 850
pF1KE9 VDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRI--
.:.::....:: ::.:.: .:: ..
CCDS76 QPPSPTPVPRPPDADPNTPSPKPLEGRPERQFFVKWQGMSYWHCSWVSELQLELHCQVMF
510 520 530 540 550 560
860 870 880 890
pF1KE9 ---QQKI--------------KRFKAKQGQNKFLSEIEDELF----NPDYVEVDRIMDFA
:.: .. . ..... ..:.:.... .:... . ::..
CCDS76 RNYQRKNDMDEPPSGDFGGDEEKSRKRKNKDPKFAEMEERFYRYGIKPEWMMIHRILN--
570 580 590 600 610 620
900 910 920 930 940
pF1KE9 RSTDDRGEPVTHYLVKWCSLPYEDSTWERR----QDIDQAKIEEFE--KLMSRE---P--
.:.: .:. .:::.:: .:::....:: . :: : : .. .:: : :
CCDS76 HSVDKKGH--VHYLIKWRDLPYDQASWESEDVEIQDYDLFKQSYWNHRELMRGEEGRPGK
630 640 650 660 670 680
950 960 970 980
pF1KE9 -----ETERVERPP----ADDWKKSESSREYKN--NNKLREYQLEGVNWLLFNWYNMRNC
. ...:::: .: : : . :: . .. :. ::.::.::: :.: . .
CCDS76 KLKKVKLRKLERPPETPTVDPTVKYERQPEYLDATGGTLHPYQMEGLNWLRFSWAQGTDT
690 700 710 720 730 740
990 1000 1010 1020 1030 1040
pF1KE9 ILADEMGLGKTIQSITFLYEIYLKG-IHGPFLVIAPLSTIPNWEREFRTWT-ELNVVVYH
:::::::::::.:. .::: .: .: .::::: :::::: ::::::. :. .. ::.:
CCDS76 ILADEMGLGKTVQTAVFLYSLYKEGHSKGPFLVSAPLSTIINWEREFEMWAPDMYVVTYV
750 760 770 780 790 800
1050 1060 1070 1080 1090
pF1KE9 GSQASRRTIQLYEMYFKD-------PQGRVIK-GSYKFHAIITTFEMILTDCPELRNIPW
:.. :: :. :. :.: .:. : .: :::...:..:.: : : .: :
CCDS76 GDKDSRAIIRENEFSFEDNAIRGGKKASRMKKEASVKFHVLLTSYELITIDMAILGSIDW
810 820 830 840 850 860
1100 1110 1120 1130 1140 1150
pF1KE9 RCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSE
:...:::::::: . :... :. ..:.::.:::::::::..:::: ::.:: : :: .
CCDS76 ACLIVDEAHRLKNNQSKFFRVLNGYSLQHKLLLTGTPLQNNLEELFHLLNFLTPERFHNL
870 880 890 900 910 920
1160 1170 1180 1190 1200 1210
pF1KE9 TTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYR
:..::.:. :.:..::. .: : :::::: :: ::. : : :..:::. .:::::.
CCDS76 EGFLEEFADIAKEDQIKKLHDMLGPHMLRRLKADVFKNMPSKTELIVRVELSPMQKKYYK
930 940 950 960 970 980
1220 1230 1240 1250 1260 1270
pF1KE9 AILEKNFTFLS-KGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESP
:: .:: :. .::: : .:::..:.:.::::::::. : .: : ..
CCDS76 YILTRNFEALNARGGG--NQVSLLNVVMDLKKCCNHPYLFPVA---AMEAPKMPNGM---
990 1000 1010 1020 1030
1280 1290 1300 1310 1320 1330
pF1KE9 DFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDG
.. .:.:.:.:::.:..:.: .:: :::::::::::.. ::.:::.: .. : ::::::
CCDS76 -YDGSALIRASGKLLLLQKMLKNLKEGGHRVLIFSQMTKMLDLLEDFLEHEGYKYERIDG
1040 1050 1060 1070 1080 1090
1340 1350 1360 1370 1380 1390
pF1KE9 RVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQA
. ::.:: :::::. : ...: ::: ::::::::::..::: ::.::::::.::.:: .
CCDS76 GITGNMRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIYDSDWNPHNDIQAFS
1100 1110 1120 1130 1140 1150
1400 1410 1420 1430 1440 1450
pF1KE9 RCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKK
: :::::.:.: :::..:: : :... . :. :. : . :.. : .... .::.
CCDS76 RAHRIGQNKKVMIYRFVTRASVEERITQVAKKKMMLTHLVVRPGLGSKTGS-----MSKQ
1160 1170 1180 1190 1200
1460 1470 1480 1490 1500
pF1KE9 EIEDLLRKGAYGALMDEEDEGSKFCEEDID-----------QILLRRTHTITIESEGKG-
:..:.:. :. . :: .:. .: : . :: :.. : ..: .:
CCDS76 ELDDILKFGTEELFKDEATDGGGDNKEGEDSSVIHYDDKAIERLLDRNQDETEDTELQGM
1210 1220 1230 1240 1250 1260
1510 1520 1530 1540 1550
pF1KE9 ----STFAKASFVAS----GNRTDISLD--------DPNFWQKWAKKAELDIDALNGRNN
:.: :..:. :.. .. . ::..:.: .. . . .::
CCDS76 NEYLSSFKVAQYVVREEEMGEEEEVEREIIKQEESVDPDYWEKLLRHHYEQQQEDLARN-
1270 1280 1290 1300 1310 1320
1560 1570 1580 1590
pF1KE9 LVIDTPRVRKQTRLYSAVKEDELME--FSDLESD----SEE------KPCAKPRRPQDKS
. :.:::. .. .::. . :: .:: ::: . ::::. :.
CCDS76 -LGKGKRIRKQVNYNDGSQEDRDWQDDQSDNQSDYSVASEEGDEDFDERSEAPRRPSRKG
1330 1340 1350 1360 1370 1380
1600 1610 1620 1630 1640
pF1KE9 QGYARSECF-----RVEKNLLVYGWG-RWTDILSHGRYKRQLTEQDVET---ICRTILVY
... . :: :. : :.. : . .. .. . ::. : . : .
CCDS76 LRNDKDKPLPPLLARVGGNIEVLGFNARQRKAFLNAIMRYGMPPQDAFTTQWLVRDLRGK
1390 1400 1410 1420 1430 1440
1650 1660 1670 1680 1690 1700
pF1KE9 CLNHYKGDENIKSFIWDLITPTADG-QTRAL-VNHSGLSAPVPRGRKGKKVKAQSTQPVV
...:. .. :. : : ::: .: : : . :::
CCDS76 SEKEFKA--YVSLFMRHLCEPGADGAETFADGVPREGLSRQHVLTRIGVMSLIRKKVQEF
1450 1460 1470 1480 1490 1500
1710 1720 1730 1740 1750 1760
pF1KE9 QDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADSS
CCDS76 EHVNGRWSMPELAEVEENKKMSQPGSPSPKTPTPSTPGDTQPNTPAPVPPAEDGIKIEEN
1510 1520 1530 1540 1550 1560
>>CCDS8552.1 CHD4 gene_id:1108|Hs108|chr12 (1912 aa)
initn: 1813 init1: 630 opt: 1655 Z-score: 742.9 bits: 151.5 E(32554): 4.7e-35
Smith-Waterman score: 1834; 38.1% identity (63.9% similar) in 969 aa overlap (825-1686:542-1488)
800 810 820 830 840 850
pF1KE9 VDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRI--
.:.::....:: ::.:.: .:: ..
CCDS85 QPPSPTPVPRPPDADPNTPSPKPLEGRPERQFFVKWQGMSYWHCSWVSELQLELHCQVMF
520 530 540 550 560 570
860 870 880 890
pF1KE9 ---QQKI--------------KRFKAKQGQNKFLSEIEDELF----NPDYVEVDRIMDFA
:.: .. . ..... ..:.:.... .:... . ::..
CCDS85 RNYQRKNDMDEPPSGDFGGDEEKSRKRKNKDPKFAEMEERFYRYGIKPEWMMIHRILN--
580 590 600 610 620
900 910 920 930 940
pF1KE9 RSTDDRGEPVTHYLVKWCSLPYEDSTWERR----QDIDQAKIEEFE--KLMSRE---P--
.:.: .:. .:::.:: .:::....:: . :: : : .. .:: : :
CCDS85 HSVDKKGH--VHYLIKWRDLPYDQASWESEDVEIQDYDLFKQSYWNHRELMRGEEGRPGK
630 640 650 660 670 680
950 960 970 980
pF1KE9 -----ETERVERPP----ADDWKKSESSREYKN--NNKLREYQLEGVNWLLFNWYNMRNC
. ...:::: .: : : . :: . .. :. ::.::.::: :.: . .
CCDS85 KLKKVKLRKLERPPETPTVDPTVKYERQPEYLDATGGTLHPYQMEGLNWLRFSWAQGTDT
690 700 710 720 730 740
990 1000 1010 1020 1030 1040
pF1KE9 ILADEMGLGKTIQSITFLYEIYLKG-IHGPFLVIAPLSTIPNWEREFRTWT-ELNVVVYH
:::::::::::.:. .::: .: .: .::::: :::::: ::::::. :. .. ::.:
CCDS85 ILADEMGLGKTVQTAVFLYSLYKEGHSKGPFLVSAPLSTIINWEREFEMWAPDMYVVTYV
750 760 770 780 790 800
1050 1060 1070 1080 1090
pF1KE9 GSQASRRTIQLYEMYFKD-------PQGRVIK-GSYKFHAIITTFEMILTDCPELRNIPW
:.. :: :. :. :.: .:. : .: :::...:..:.: : : .: :
CCDS85 GDKDSRAIIRENEFSFEDNAIRGGKKASRMKKEASVKFHVLLTSYELITIDMAILGSIDW
810 820 830 840 850 860
1100 1110 1120 1130 1140 1150
pF1KE9 RCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFPSE
:...:::::::: . :... :. ..:.::.:::::::::..:::: ::.:: : :: .
CCDS85 ACLIVDEAHRLKNNQSKFFRVLNGYSLQHKLLLTGTPLQNNLEELFHLLNFLTPERFHNL
870 880 890 900 910 920
1160 1170 1180 1190 1200 1210
pF1KE9 TTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKYYR
:..::.:. :.:..::. .: : :::::: :: ::. : : :..:::. .:::::.
CCDS85 EGFLEEFADIAKEDQIKKLHDMLGPHMLRRLKADVFKNMPSKTELIVRVELSPMQKKYYK
930 940 950 960 970 980
1220 1230 1240 1250 1260 1270
pF1KE9 AILEKNFTFLS-KGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAESP
:: .:: :. .::: : .:::..:.:.::::::::. : .: : ..
CCDS85 YILTRNFEALNARGGG--NQVSLLNVVMDLKKCCNHPYLFPVA---AMEAPKMPNGM---
990 1000 1010 1020 1030
1280 1290 1300 1310 1320 1330
pF1KE9 DFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERIDG
.. .:.:.:.:::.:..:.: .:: :::::::::::.. ::.:::.: .. : ::::::
CCDS85 -YDGSALIRASGKLLLLQKMLKNLKEGGHRVLIFSQMTKMLDLLEDFLEHEGYKYERIDG
1040 1050 1060 1070 1080 1090
1340 1350 1360 1370 1380 1390
pF1KE9 RVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQA
. ::.:: :::::. : ...: ::: ::::::::::..::: ::.::::::.::.:: .
CCDS85 GITGNMRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIYDSDWNPHNDIQAFS
1100 1110 1120 1130 1140 1150
1400 1410 1420 1430 1440 1450
pF1KE9 RCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSKK
: :::::.:.: :::..:: : :... . :. :. : . :.. : .... .::.
CCDS85 RAHRIGQNKKVMIYRFVTRASVEERITQVAKKKMMLTHLVVRPGLGSKTGS-----MSKQ
1160 1170 1180 1190 1200 1210
1460 1470 1480 1490 1500
pF1KE9 EIEDLLRKGAYGALMDEEDEGSKFCEEDID-----------QILLRRTHTITIESEGKG-
:..:.:. :. . :: .:. .: : . :: :.. : ..: .:
CCDS85 ELDDILKFGTEELFKDEATDGGGDNKEGEDSSVIHYDDKAIERLLDRNQDETEDTELQGM
1220 1230 1240 1250 1260 1270
1510 1520 1530 1540 1550
pF1KE9 ----STFAKASFVAS----GNRTDISLD--------DPNFWQKWAKKAELDIDALNGRNN
:.: :..:. :.. .. . ::..:.: .. . . .::
CCDS85 NEYLSSFKVAQYVVREEEMGEEEEVEREIIKQEESVDPDYWEKLLRHHYEQQQEDLARN-
1280 1290 1300 1310 1320 1330
1560 1570 1580 1590
pF1KE9 LVIDTPRVRKQTRLYSAVKEDELME--FSDLESD----SEE------KPCAKPRRPQDKS
. :.:::. .. .::. . :: .:: ::: . ::::. :.
CCDS85 -LGKGKRIRKQVNYNDGSQEDRDWQDDQSDNQSDYSVASEEGDEDFDERSEAPRRPSRKG
1340 1350 1360 1370 1380 1390
1600 1610 1620 1630 1640
pF1KE9 QGYARSECF-----RVEKNLLVYGWG-RWTDILSHGRYKRQLTEQDVET---ICRTILVY
... . :: :. : :.. : . .. .. . ::. : . : .
CCDS85 LRNDKDKPLPPLLARVGGNIEVLGFNARQRKAFLNAIMRYGMPPQDAFTTQWLVRDLRGK
1400 1410 1420 1430 1440 1450
1650 1660 1670 1680 1690 1700
pF1KE9 CLNHYKGDENIKSFIWDLITPTADG-QTRAL-VNHSGLSAPVPRGRKGKKVKAQSTQPVV
...:. .. :. : : ::: .: : : . :::
CCDS85 SEKEFKA--YVSLFMRHLCEPGADGAETFADGVPREGLSRQHVLTRIGVMSLIRKKVQEF
1460 1470 1480 1490 1500
1710 1720 1730 1740 1750 1760
pF1KE9 QDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADSS
CCDS85 EHVNGRWSMPELAEVEENKKMSQPGSPSPKTPTPSTPGDTQPNTPAPVPPAEDGIKIEEN
1510 1520 1530 1540 1550 1560
>>CCDS32555.1 CHD3 gene_id:1107|Hs108|chr17 (1966 aa)
initn: 1664 init1: 610 opt: 1633 Z-score: 733.0 bits: 149.7 E(32554): 1.7e-34
Smith-Waterman score: 1809; 38.4% identity (62.4% similar) in 963 aa overlap (825-1686:549-1484)
800 810 820 830 840
pF1KE9 VDAEGPVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLE-----KD
::.::. ..:: ::.::. .::
CCDS32 EPPVAVPAPQQADGNPDVPPPRPLQGRSEREFFVKWVGLSYWHCSWAKELQLEIFHLVMY
520 530 540 550 560 570
850 860 870 880
pF1KE9 KRIQQKIK----------------RFKAKQGQNKFLSEIEDELF----NPDYVEVDRIMD
. :.: . .. .. .:.:.. . .:... : ::..
CCDS32 RNYQRKNDMDEPPPLDYGSGEDDGKSDKRKVKDPHYAEMEEKYYRFGIKPEWMTVHRIIN
580 590 600 610 620 630
890 900 910 920 930
pF1KE9 FARSTDDRGEPVTHYLVKWCSLPYEDSTWERRQDIDQAKIEEFEK-----------LMSR
.:.: .:. :::::: .:::..::::. :. .: :.:. .:..
CCDS32 --HSVDKKGN--YHYLVKWRDLPYDQSTWEE----DEMNIPEYEEHKQSYWRHRELIMGE
640 650 660 670 680 690
940 950 960 970 980
pF1KE9 EPETERVER----------PPA----DDWKKSESSREY--KNNNKLREYQLEGVNWLLFN
.: : . ::. : : :.. .. ... :. :::::.::: :.
CCDS32 DPAQPRKYKKKKKELQGDGPPSSPTNDPTVKYETQPRFITATGGTLHMYQLEGLNWLRFS
700 710 720 730 740 750
990 1000 1010 1020 1030 1040
pF1KE9 WYNMRNCILADEMGLGKTIQSITFLYEIYLKG-IHGPFLVIAPLSTIPNWEREFRTWT-E
: . . :::::::::::::.:.::: .: .: .::::: :::::: ::::::. :. .
CCDS32 WAQGTDTILADEMGLGKTIQTIVFLYSLYKEGHTKGPFLVSAPLSTIINWEREFQMWAPK
760 770 780 790 800 810
1050 1060 1070 1080 1090
pF1KE9 LNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYK--------FHAIITTFEMILTDCP
. ::.: :.. :: :. :. :.: . : ..: ::...:..:.: :
CCDS32 FYVVTYTGDKDSRAIIRENEFSFEDNAIKGGKKAFKMKREAQVKFHVLLTSYELITIDQA
820 830 840 850 860 870
1100 1110 1120 1130 1140 1150
pF1KE9 ELRNIPWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLE
: .: : :.:.:::::::: . :... :. . ..::.:::::::::..:::: ::.::
CCDS32 ALGSIRWACLVVDEAHRLKNNQSKFFRVLNGYKIDHKLLLTGTPLQNNLEELFHLLNFLT
880 890 900 910 920 930
1160 1170 1180 1190 1200 1210
pF1KE9 PSRFPSETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTN
: :: . :..::.:.. :.:..::. .: : :::::: :: ::. : : :..:::.
CCDS32 PERFNNLEGFLEEFADISKEDQIKKLHDLLGPHMLRRLKADVFKNMPAKTELIVRVELSP
940 950 960 970 980 990
1220 1230 1240 1250 1260 1270
pF1KE9 IQKKYYRAILEKNFTFL-SKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKE
.:::::. :: .:: : :.::: : .::: ::.:.::::::::. : :
CCDS32 MQKKYYKYILTRNFEALNSRGGG--NQVSLLNIMMDLKKCCNHPYLFPVAAM-------E
1000 1010 1020 1030 1040
1280 1290 1300 1310 1320 1330
pF1KE9 THNAESPDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRY
. . : .. :.:...:::.:..:.: ::: ::::::::::.. ::.:::.: . :
CCDS32 SPKLPSGAYEGGALIKSSGKLMLLQKMLRKLKEQGHRVLIFSQMTKMLDLLEDFLDYEGY
1050 1060 1070 1080 1090 1100
1340 1350 1360 1370 1380 1390
pF1KE9 PYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQ
:::::: . : ::: :::::. : ...: ::: ::::::::::..::: :::::::::.
CCDS32 KYERIDGGITGALRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIFDSDWNPH
1110 1120 1130 1140 1150 1160
1400 1410 1420 1430 1440 1450
pF1KE9 NDLQAQARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNG
::.:: .: :::::...: :::..:: : :... . :. :. : . :.. : . ..
CCDS32 NDIQAFSRAHRIGQANKVMIYRFVTRASVEERITQVAKRKMMLTHLVVRPGLGSKAGS--
1170 1180 1190 1200 1210
1460 1470 1480 1490 1500
pF1KE9 VQQLSKKEIEDLLRKGAYGALMDE-----EDEGSKFCEEDIDQI--LLRRTHTITIESEG
.::.:..:.:. :. . :: ..: :. . : . : :: :.. : ...
CCDS32 ---MSKQELDDILKFGTEELFKDENEGENKEEDSSVIHYDNEAIARLLDRNQDATEDTDV
1220 1230 1240 1250 1260 1270
1510 1520 1530 1540
pF1KE9 KG-----STFAKASFVASGN-------RTDISLD---DPNFWQKWAKKAELDIDALNGRN
.. :.: :..:. . : :. . ::..:.: .. . . .::
CCDS32 QNMNEYLSSFKVAQYVVREEDKIEEIEREIIKQEENVDPDYWEKLLRHHYEQQQEDLARN
1280 1290 1300 1310 1320 1330
1550 1560 1570 1580 1590 1600
pF1KE9 NLVIDTPRVRKQTRLYSAVKEDELMEFSDLESDSEEKPCAKPRRPQDKSQG--YARSE--
. :::::. .:..::. . :. :::. .::. . :. :.:
CCDS32 --LGKGKRVRKQVNYNDAAQEDQDNQ-SEYSVGSEEEDEDFDERPEGRRQSKRQLRNEKD
1340 1350 1360 1370 1380 1390
1610 1620 1630 1640 1650
pF1KE9 ------CFRVEKNLLVYGWG-RWTDILSHGRYKRQLTEQDVET---ICRTILVYCLNHYK
:: :. : :.. : . .. .. . ::. : . : . ...:
CCDS32 KPLPPLLARVGGNIEVLGFNTRQRKAFLNAVMRWGMPPQDAFTTQWLVRDLRGKTEKEFK
1400 1410 1420 1430 1440 1450
1660 1670 1680 1690 1700 1710
pF1KE9 GDENIKSFIWDLITPTADG-QTRAL-VNHSGLSAPVPRGRKGKKVKAQSTQPVVQDADWL
. .. :. : : ::: .: : : . :::
CCDS32 A--YVSLFMRHLCEPGADGSETFADGVPREGLSRQQVLTRIGVMSLVKKKVQEFEHINGR
1460 1470 1480 1490 1500 1510
1720 1730 1740 1750 1760 1770
pF1KE9 ASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQADKILEGADSSEADVWI
CCDS32 WSMPELMPDPSADSKRSSRASSPTKTSPTTPEASATNSPCTSKPATPAPSEKGEGIRTPL
1520 1530 1540 1550 1560 1570
2997 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 19:38:43 2016 done: Sun Nov 6 19:38:45 2016
Total Scan time: 9.040 Total Display time: 2.710
Function used was FASTA [36.3.4 Apr, 2011]