FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8471, 912 aa 1>>>pF1KB8471 912 - 912 aa - 912 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4737+/-0.000861; mu= 14.2169+/- 0.052 mean_var=184.6280+/-36.629, 0's: 0 Z-trim(113.8): 27 B-trim: 159 in 1/52 Lambda= 0.094390 statistics sampled from 14368 (14392) to 14368 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.759), E-opt: 0.2 (0.442), width: 16 Scan time: 5.020 The best scores are: opt bits E(32554) CCDS33157.1 DNMT3A gene_id:1788|Hs108|chr2 ( 912) 6390 883.0 0 CCDS1718.2 DNMT3A gene_id:1788|Hs108|chr2 ( 723) 4928 683.8 3.1e-196 CCDS13205.1 DNMT3B gene_id:1789|Hs108|chr20 ( 853) 2711 381.9 2.7e-105 CCDS13206.1 DNMT3B gene_id:1789|Hs108|chr20 ( 833) 2391 338.4 3.4e-92 CCDS13204.1 DNMT3B gene_id:1789|Hs108|chr20 ( 845) 2391 338.4 3.5e-92 CCDS56184.1 DNMT3B gene_id:1789|Hs108|chr20 ( 694) 1788 256.2 1.6e-67 CCDS56183.1 DNMT3B gene_id:1789|Hs108|chr20 ( 728) 1788 256.2 1.6e-67 CCDS13207.1 DNMT3B gene_id:1789|Hs108|chr20 ( 770) 1788 256.2 1.7e-67 CCDS46232.1 DNMT3A gene_id:1788|Hs108|chr2 ( 166) 1023 151.4 1.3e-36 CCDS46650.1 DNMT3L gene_id:29947|Hs108|chr21 ( 386) 650 101.0 4.7e-21 CCDS13705.1 DNMT3L gene_id:29947|Hs108|chr21 ( 387) 650 101.0 4.7e-21 >>CCDS33157.1 DNMT3A gene_id:1788|Hs108|chr2 (912 aa) initn: 6390 init1: 6390 opt: 6390 Z-score: 4711.2 bits: 883.0 E(32554): 0 Smith-Waterman score: 6390; 100.0% identity (100.0% similar) in 912 aa overlap (1-912:1-912) 10 20 30 40 50 60 pF1KB8 MPAMPSSGPGDTSSSAAEREEDRKDGEEQEEPRGKEERQEPSTTARKVGRPGRKRKHPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MPAMPSSGPGDTSSSAAEREEDRKDGEEQEEPRGKEERQEPSTTARKVGRPGRKRKHPPV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 ESGDTPKDPAVISKSPSMAQDSGASELLPNGDLEKRSEPQPEEGSPAGGQKGGAPAEGEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ESGDTPKDPAVISKSPSMAQDSGASELLPNGDLEKRSEPQPEEGSPAGGQKGGAPAEGEG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 AAETLPEASRAVENGCCTPKEGRGAPAEAGKEQKETNIESMKMEGSRGRLRGGLGWESSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 AAETLPEASRAVENGCCTPKEGRGAPAEAGKEQKETNIESMKMEGSRGRLRGGLGWESSL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 RQRPMPRLTFQAGDPYYISKRKRDEWLARWKREAEKKAKVIAGMNAVEENQGPGESQKVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RQRPMPRLTFQAGDPYYISKRKRDEWLARWKREAEKKAKVIAGMNAVEENQGPGESQKVE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 EASPPAVQQPTDPASPTVATTPEPVGSDAGDKNATKAGDDEPEYEDGRGFGIGELVWGKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EASPPAVQQPTDPASPTVATTPEPVGSDAGDKNATKAGDDEPEYEDGRGFGIGELVWGKL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 RGFSWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFSVVCVEKLMPLSSFCSAFHQATYN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RGFSWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFSVVCVEKLMPLSSFCSAFHQATYN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 KQPMYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAKAVEVQNKPMIEWALGGFQPSGPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KQPMYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAKAVEVQNKPMIEWALGGFQPSGPK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 GLEPPEEEKNPYKEVYTDMWVEPEAAAYAPPPPAKKPRKSTAEKPKVKEIIDERTRERLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GLEPPEEEKNPYKEVYTDMWVEPEAAAYAPPPPAKKPRKSTAEKPKVKEIIDERTRERLV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 YEVRQKCRNIEDICISCGSLNVTLEHPLFVGGMCQNCKNCFLECAYQYDDDGYQSYCTIC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YEVRQKCRNIEDICISCGSLNVTLEHPLFVGGMCQNCKNCFLECAYQYDDDGYQSYCTIC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 CGGREVLMCGNNNCCRCFCVECVDLLVGPGAAQAAIKEDPWNCYMCGHKGTYGLLRRRED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CGGREVLMCGNNNCCRCFCVECVDLLVGPGAAQAAIKEDPWNCYMCGHKGTYGLLRRRED 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 WPSRLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 WPSRLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRY 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 IASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 IASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPAR 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB8 KGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB8 DAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSI 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB8 KQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRH 850 860 870 880 890 900 910 pF1KB8 LFAPLKEYFACV :::::::::::: CCDS33 LFAPLKEYFACV 910 >>CCDS1718.2 DNMT3A gene_id:1788|Hs108|chr2 (723 aa) initn: 4928 init1: 4928 opt: 4928 Z-score: 3636.5 bits: 683.8 E(32554): 3.1e-196 Smith-Waterman score: 4928; 100.0% identity (100.0% similar) in 699 aa overlap (214-912:25-723) 190 200 210 220 230 240 pF1KB8 PMPRLTFQAGDPYYISKRKRDEWLARWKREAEKKAKVIAGMNAVEENQGPGESQKVEEAS :::::::::::::::::::::::::::::: CCDS17 MGILERVVRRNGRVDRSLKDECDTAEKKAKVIAGMNAVEENQGPGESQKVEEAS 10 20 30 40 50 250 260 270 280 290 300 pF1KB8 PPAVQQPTDPASPTVATTPEPVGSDAGDKNATKAGDDEPEYEDGRGFGIGELVWGKLRGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 PPAVQQPTDPASPTVATTPEPVGSDAGDKNATKAGDDEPEYEDGRGFGIGELVWGKLRGF 60 70 80 90 100 110 310 320 330 340 350 360 pF1KB8 SWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFSVVCVEKLMPLSSFCSAFHQATYNKQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 SWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFSVVCVEKLMPLSSFCSAFHQATYNKQP 120 130 140 150 160 170 370 380 390 400 410 420 pF1KB8 MYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAKAVEVQNKPMIEWALGGFQPSGPKGLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 MYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAKAVEVQNKPMIEWALGGFQPSGPKGLE 180 190 200 210 220 230 430 440 450 460 470 480 pF1KB8 PPEEEKNPYKEVYTDMWVEPEAAAYAPPPPAKKPRKSTAEKPKVKEIIDERTRERLVYEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 PPEEEKNPYKEVYTDMWVEPEAAAYAPPPPAKKPRKSTAEKPKVKEIIDERTRERLVYEV 240 250 260 270 280 290 490 500 510 520 530 540 pF1KB8 RQKCRNIEDICISCGSLNVTLEHPLFVGGMCQNCKNCFLECAYQYDDDGYQSYCTICCGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 RQKCRNIEDICISCGSLNVTLEHPLFVGGMCQNCKNCFLECAYQYDDDGYQSYCTICCGG 300 310 320 330 340 350 550 560 570 580 590 600 pF1KB8 REVLMCGNNNCCRCFCVECVDLLVGPGAAQAAIKEDPWNCYMCGHKGTYGLLRRREDWPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 REVLMCGNNNCCRCFCVECVDLLVGPGAAQAAIKEDPWNCYMCGHKGTYGLLRRREDWPS 360 370 380 390 400 410 610 620 630 640 650 660 pF1KB8 RLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 RLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIAS 420 430 440 450 460 470 670 680 690 700 710 720 pF1KB8 EVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 EVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGL 480 490 500 510 520 530 730 740 750 760 770 780 pF1KB8 YEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 YEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAK 540 550 560 570 580 590 790 800 810 820 830 840 pF1KB8 EVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 EVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQG 600 610 620 630 640 650 850 860 870 880 890 900 pF1KB8 KDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS17 KDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFA 660 670 680 690 700 710 910 pF1KB8 PLKEYFACV ::::::::: CCDS17 PLKEYFACV 720 >>CCDS13205.1 DNMT3B gene_id:1789|Hs108|chr20 (853 aa) initn: 2812 init1: 2281 opt: 2711 Z-score: 2004.0 bits: 381.9 E(32554): 2.7e-105 Smith-Waterman score: 2802; 51.0% identity (71.9% similar) in 861 aa overlap (80-911:12-852) 50 60 70 80 90 100 pF1KB8 RPGRKRKHPPVESGDTPKDPAVISKSPSMAQDSGASE--LLPNGDLEKRSEPQPE--EG- .:.:. : .: :: .: .: :. CCDS13 MKGDTRHLNGEEDAGGREDSILVNGACSDQSSDSPPILEAI 10 20 30 40 110 120 130 140 150 160 pF1KB8 -SPA-GGQKGGAPAEGEGAAETLPEASRAVENGCCTPKEGRGAPAEAGKEQKETNIESMK .: :..... . .. : .. . .: .: .:. : .:: .: CCDS13 RTPEIRGRRSSSRLSKREVSSLLSYTQDLTGDGDGEDGDGSDTPV-MPKLFRETRTRS-- 50 60 70 80 90 170 180 190 200 210 220 pF1KB8 MEGSRGRLRGGLGWESSLRQRPMPRLTFQAGDPYYISKRKRDEWLARWKREAEKKAKVIA :. : :.. . : :.:: :: : .... :. : : ...: . : CCDS13 -ESPAVRTRNNNSVSSRERHRPSPRSTRGRQGRNHVDESPV-EFPAT--RSLRRRATASA 100 110 120 130 140 150 230 240 250 260 270 pF1KB8 GMNAVEENQGPGESQKVE--EASPPAVQQPTDPASP--TVATTPEPVGSDAGDKNATKAG : . . :. .. . . . : . ..: .: . : .. . .: .. CCDS13 G---TPWPSPPSSYLTIDLTDDTEDTHGTPQSSSTPYARLAQDSQQGGMESPQVEADSGD 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB8 DDEPEYEDGRGFGIGELVWGKLRGFSWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFSV : ::.::. ::::.:::::..::::::. .::: :.. .: : :::.:::::::: CCDS13 GDSSEYQDGKEFGIGDLVWGKIKGFSWWPAMVVSWKATSKRQAMSGMRWVQWFGDGKFSE 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB8 VCVEKLMPLSSFCSAFHQATYNKQPMYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAKA : ..::. :. : . :. ::.:: ::::.:..:. : :::: :: :. .:. CCDS13 VSADKLVALGLFSQHFNLATFNKLVSYRKAMYHALEKARVRAGKTFP----SSPGDS--- 280 290 300 310 320 400 410 420 430 440 pF1KB8 VEVQNKPMIEWALGGFQPSGPKGLEP----PEEEKNPYK------------EVYTDMWVE .: : :::.::: :::.:.: .::.: : .:. . : : . CCDS13 LEDQLKPMLEWAHGGFKPTGIEGLKPNNTQPVVNKSKVRRAGSRKLESRKYENKTRRRTA 330 340 350 360 370 380 450 460 470 480 490 500 pF1KB8 PEAAA--YAPPPPAKKPRKSTAEKPKVKEIIDERTRERLVYEVRQKCRNIEDICISCGSL ..:. : : : : . : . : ...::... .: .. ..:: :.::: CCDS13 DDSATSDYCPAPKRLKTNCYNNGKDRGDE---DQSREQMASDVANNKSSLEDGCLSCGRK 390 400 410 420 430 440 510 520 530 540 550 560 pF1KB8 NVTLEHPLFVGGMCQNCKNCFLECAYQYDDDGYQSYCTICCGGREVLMCGNNNCCRCFCV : . :::: ::.::.:.. ::: :.:::::::::::.:: :::.:.:.:..::::::: CCDS13 NPVSFHPLFEGGLCQTCRDRFLELFYMYDDDGYQSYCTVCCEGRELLLCSNTSCCRCFCV 450 460 470 480 490 500 570 580 590 600 610 620 pF1KB8 ECVDLLVGPGAAQAAIKEDPWNCYMCGHKGTYGLLRRREDWPSRLQMFFANNHDQEFDPP ::...::: :.: : ..::.:::: . .:.::::.:: ::: ::... :.. : CCDS13 ECLEVLVGTGTAAEAKLQEPWSCYMCLPQRCHGVLRRRKDWNVRLQAFFTSDTGLEYEAP 510 520 530 540 550 560 630 640 650 660 670 680 pF1KB8 KVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGK :.:: .:: .:.:::::::::::::: ::::.:::.: .:.::::::.::.:: :.:.:. CCDS13 KLYPAIPAARRRPIRVLSLFDGIATGYLVLKELGIKVGKYVASEVCEESIAVGTVKHEGN 570 580 590 600 610 620 690 700 710 720 730 740 pF1KB8 IMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHD : ::.:::..:.:.:.:::::::::::::::::: ::::::::::::::::::::.::. CCDS13 IKYVNDVRNITKKNIEEWGPFDLVIGGSPCNDLSNVNPARKGLYEGTGRLFFEFYHLLNY 630 640 650 660 670 680 750 760 770 780 790 800 pF1KB8 ARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPG .::::::::::::.::::::: :.:::::::::: ::::::: .:::::::::::::::: CCDS13 SRPKEGDDRPFFWMFENVVAMKVGDKRDISRFLECNPVMIDAIKVSAAHRARYFWGNLPG 690 700 710 720 730 740 810 820 830 840 850 860 pF1KB8 MNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILW ::::. .. :::::::.:::..::::..::.::::.::::::::.: ::: :: :::.:: CCDS13 MNRPVIASKNDKLELQDCLEYNRIAKLKKVQTITTKSNSIKQGKNQLFPVVMNGKEDVLW 750 760 770 780 790 800 870 880 890 900 910 pF1KB8 CTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV :::.::.:::::::::::::.: :::.:::::::::::::::::::.:::: CCDS13 CTELERIFGFPVHYTDVSNMGRGARQKLLGRSWSVPVIRHLFAPLKDYFACE 810 820 830 840 850 >>CCDS13206.1 DNMT3B gene_id:1789|Hs108|chr20 (833 aa) initn: 2711 init1: 2281 opt: 2391 Z-score: 1768.6 bits: 338.4 E(32554): 3.4e-92 Smith-Waterman score: 2832; 51.6% identity (73.2% similar) in 843 aa overlap (80-911:12-832) 50 60 70 80 90 100 pF1KB8 RPGRKRKHPPVESGDTPKDPAVISKSPSMAQDSGASE--LLPNGDLEKRSEPQPE--EG- .:.:. : .: :: .: .: :. CCDS13 MKGDTRHLNGEEDAGGREDSILVNGACSDQSSDSPPILEAI 10 20 30 40 110 120 130 140 150 160 pF1KB8 -SPA-GGQKGGAPAEGEGAAETLPEASRAVENGCCTPKEGRGAPAEAGKEQKETNIESMK .: :..... . .. : .. . .: .: .:. : .:: .: CCDS13 RTPEIRGRRSSSRLSKREVSSLLSYTQDLTGDGDGEDGDGSDTPV-MPKLFRETRTRS-- 50 60 70 80 90 170 180 190 200 210 220 pF1KB8 MEGSRGRLRGGLGWESSLRQRPMPRLTFQAGDPYYISKRKRDEWLARWKREAEKKAKVIA :. : :.. . : :.:: :: : .... :. : : ...: . : CCDS13 -ESPAVRTRNNNSVSSRERHRPSPRSTRGRQGRNHVDESPV-EFPAT--RSLRRRATASA 100 110 120 130 140 150 230 240 250 260 270 pF1KB8 GMNAVEENQGPGESQKVE--EASPPAVQQPTDPASP--TVATTPEPVGSDAGDKNATKAG : . . :. .. . . . : . ..: .: . : .. . .: .. CCDS13 G---TPWPSPPSSYLTIDLTDDTEDTHGTPQSSSTPYARLAQDSQQGGMESPQVEADSGD 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB8 DDEPEYEDGRGFGIGELVWGKLRGFSWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFSV : ::.::. ::::.:::::..::::::. .::: :.. .: : :::.:::::::: CCDS13 GDSSEYQDGKEFGIGDLVWGKIKGFSWWPAMVVSWKATSKRQAMSGMRWVQWFGDGKFSE 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB8 VCVEKLMPLSSFCSAFHQATYNKQPMYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAKA : ..::. :. : . :. ::.:: ::::.:..:. : :::: :: :. .:. CCDS13 VSADKLVALGLFSQHFNLATFNKLVSYRKAMYHALEKARVRAGKTFP----SSPGDS--- 280 290 300 310 320 400 410 420 430 440 450 pF1KB8 VEVQNKPMIEWALGGFQPSGPKGLEPPEEEKNPYKEVYTDMWVEPEAAAYAPPPPAKKPR .: : :::.::: :::.:.: .::.: .. .: ... . .. : : : : CCDS13 LEDQLKPMLEWAHGGFKPTGIEGLKP--NNTQPENKTRRRTADDSATSDYCPAPKRLKTN 330 340 350 360 370 380 460 470 480 490 500 510 pF1KB8 KSTAEKPKVKEIIDERTRERLVYEVRQKCRNIEDICISCGSLNVTLEHPLFVGGMCQNCK . : . : ...::... .: .. ..:: :.::: : . :::: ::.::.:. CCDS13 CYNNGKDRGDE---DQSREQMASDVANNKSSLEDGCLSCGRKNPVSFHPLFEGGLCQTCR 390 400 410 420 430 520 530 540 550 560 570 pF1KB8 NCFLECAYQYDDDGYQSYCTICCGGREVLMCGNNNCCRCFCVECVDLLVGPGAAQAAIKE . ::: :.:::::::::::.:: :::.:.:.:..:::::::::...::: :.: : . CCDS13 DRFLELFYMYDDDGYQSYCTVCCEGRELLLCSNTSCCRCFCVECLEVLVGTGTAAEAKLQ 440 450 460 470 480 490 580 590 600 610 620 630 pF1KB8 DPWNCYMCGHKGTYGLLRRREDWPSRLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVLS .::.:::: . .:.::::.:: ::: ::... :.. ::.:: .:: .:.:::::: CCDS13 EPWSCYMCLPQRCHGVLRRRKDWNVRLQAFFTSDTGLEYEAPKLYPAIPAARRRPIRVLS 500 510 520 530 540 550 640 650 660 670 680 690 pF1KB8 LFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEW :::::::: ::::.:::.: .:.::::::.::.:: :.:.:.: ::.:::..:.:.:.:: CCDS13 LFDGIATGYLVLKELGIKVGKYVASEVCEESIAVGTVKHEGNIKYVNDVRNITKKNIEEW 560 570 580 590 600 610 700 710 720 730 740 750 pF1KB8 GPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENV :::::::::::::::: ::::::::::::::::::::.::. .::::::::::::.:::: CCDS13 GPFDLVIGGSPCNDLSNVNPARKGLYEGTGRLFFEFYHLLNYSRPKEGDDRPFFWMFENV 620 630 640 650 660 670 760 770 780 790 800 810 pF1KB8 VAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQEC ::: :.:::::::::: ::::::: .::::::::::::::::::::. .. :::::::.: CCDS13 VAMKVGDKRDISRFLECNPVMIDAIKVSAAHRARYFWGNLPGMNRPVIASKNDKLELQDC 680 690 700 710 720 730 820 830 840 850 860 870 pF1KB8 LEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVS ::..::::..::.::::.::::::::.: ::: :: :::.:::::.::.::::::::::: CCDS13 LEYNRIAKLKKVQTITTKSNSIKQGKNQLFPVVMNGKEDVLWCTELERIFGFPVHYTDVS 740 750 760 770 780 790 880 890 900 910 pF1KB8 NMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV ::.: :::.:::::::::::::::::::.:::: CCDS13 NMGRGARQKLLGRSWSVPVIRHLFAPLKDYFACE 800 810 820 830 >>CCDS13204.1 DNMT3B gene_id:1789|Hs108|chr20 (845 aa) initn: 2711 init1: 2281 opt: 2391 Z-score: 1768.5 bits: 338.4 E(32554): 3.5e-92 Smith-Waterman score: 2832; 51.6% identity (73.2% similar) in 843 aa overlap (80-911:24-844) 50 60 70 80 90 100 pF1KB8 RPGRKRKHPPVESGDTPKDPAVISKSPSMAQDSGASE--LLPNGDLEKRSEPQPE--EG- .:.:. : .: :: .: .: :. CCDS13 MEPSPEPPSLESMKGDTRHLNGEEDAGGREDSILVNGACSDQSSDSPPILEAI 10 20 30 40 50 110 120 130 140 150 160 pF1KB8 -SPA-GGQKGGAPAEGEGAAETLPEASRAVENGCCTPKEGRGAPAEAGKEQKETNIESMK .: :..... . .. : .. . .: .: .:. : .:: .: CCDS13 RTPEIRGRRSSSRLSKREVSSLLSYTQDLTGDGDGEDGDGSDTPV-MPKLFRETRTRS-- 60 70 80 90 100 110 170 180 190 200 210 220 pF1KB8 MEGSRGRLRGGLGWESSLRQRPMPRLTFQAGDPYYISKRKRDEWLARWKREAEKKAKVIA :. : :.. . : :.:: :: : .... :. : : ...: . : CCDS13 -ESPAVRTRNNNSVSSRERHRPSPRSTRGRQGRNHVDESPV-EFPAT--RSLRRRATASA 120 130 140 150 160 230 240 250 260 270 pF1KB8 GMNAVEENQGPGESQKVE--EASPPAVQQPTDPASP--TVATTPEPVGSDAGDKNATKAG : . . :. .. . . . : . ..: .: . : .. . .: .. CCDS13 G---TPWPSPPSSYLTIDLTDDTEDTHGTPQSSSTPYARLAQDSQQGGMESPQVEADSGD 170 180 190 200 210 220 280 290 300 310 320 330 pF1KB8 DDEPEYEDGRGFGIGELVWGKLRGFSWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFSV : ::.::. ::::.:::::..::::::. .::: :.. .: : :::.:::::::: CCDS13 GDSSEYQDGKEFGIGDLVWGKIKGFSWWPAMVVSWKATSKRQAMSGMRWVQWFGDGKFSE 230 240 250 260 270 280 340 350 360 370 380 390 pF1KB8 VCVEKLMPLSSFCSAFHQATYNKQPMYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAKA : ..::. :. : . :. ::.:: ::::.:..:. : :::: :: :. .:. CCDS13 VSADKLVALGLFSQHFNLATFNKLVSYRKAMYHALEKARVRAGKTFP----SSPGDS--- 290 300 310 320 330 400 410 420 430 440 450 pF1KB8 VEVQNKPMIEWALGGFQPSGPKGLEPPEEEKNPYKEVYTDMWVEPEAAAYAPPPPAKKPR .: : :::.::: :::.:.: .::.: .. .: ... . .. : : : : CCDS13 LEDQLKPMLEWAHGGFKPTGIEGLKP--NNTQPENKTRRRTADDSATSDYCPAPKRLKTN 340 350 360 370 380 390 460 470 480 490 500 510 pF1KB8 KSTAEKPKVKEIIDERTRERLVYEVRQKCRNIEDICISCGSLNVTLEHPLFVGGMCQNCK . : . : ...::... .: .. ..:: :.::: : . :::: ::.::.:. CCDS13 CYNNGKDRGDE---DQSREQMASDVANNKSSLEDGCLSCGRKNPVSFHPLFEGGLCQTCR 400 410 420 430 440 450 520 530 540 550 560 570 pF1KB8 NCFLECAYQYDDDGYQSYCTICCGGREVLMCGNNNCCRCFCVECVDLLVGPGAAQAAIKE . ::: :.:::::::::::.:: :::.:.:.:..:::::::::...::: :.: : . CCDS13 DRFLELFYMYDDDGYQSYCTVCCEGRELLLCSNTSCCRCFCVECLEVLVGTGTAAEAKLQ 460 470 480 490 500 510 580 590 600 610 620 630 pF1KB8 DPWNCYMCGHKGTYGLLRRREDWPSRLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVLS .::.:::: . .:.::::.:: ::: ::... :.. ::.:: .:: .:.:::::: CCDS13 EPWSCYMCLPQRCHGVLRRRKDWNVRLQAFFTSDTGLEYEAPKLYPAIPAARRRPIRVLS 520 530 540 550 560 570 640 650 660 670 680 690 pF1KB8 LFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEW :::::::: ::::.:::.: .:.::::::.::.:: :.:.:.: ::.:::..:.:.:.:: CCDS13 LFDGIATGYLVLKELGIKVGKYVASEVCEESIAVGTVKHEGNIKYVNDVRNITKKNIEEW 580 590 600 610 620 630 700 710 720 730 740 750 pF1KB8 GPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENV :::::::::::::::: ::::::::::::::::::::.::. .::::::::::::.:::: CCDS13 GPFDLVIGGSPCNDLSNVNPARKGLYEGTGRLFFEFYHLLNYSRPKEGDDRPFFWMFENV 640 650 660 670 680 690 760 770 780 790 800 810 pF1KB8 VAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQEC ::: :.:::::::::: ::::::: .::::::::::::::::::::. .. :::::::.: CCDS13 VAMKVGDKRDISRFLECNPVMIDAIKVSAAHRARYFWGNLPGMNRPVIASKNDKLELQDC 700 710 720 730 740 750 820 830 840 850 860 870 pF1KB8 LEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVS ::..::::..::.::::.::::::::.: ::: :: :::.:::::.::.::::::::::: CCDS13 LEYNRIAKLKKVQTITTKSNSIKQGKNQLFPVVMNGKEDVLWCTELERIFGFPVHYTDVS 760 770 780 790 800 810 880 890 900 910 pF1KB8 NMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV ::.: :::.:::::::::::::::::::.:::: CCDS13 NMGRGARQKLLGRSWSVPVIRHLFAPLKDYFACE 820 830 840 >>CCDS56184.1 DNMT3B gene_id:1789|Hs108|chr20 (694 aa) initn: 2108 init1: 1678 opt: 1788 Z-score: 1325.8 bits: 256.2 E(32554): 1.6e-67 Smith-Waterman score: 2373; 48.3% identity (67.1% similar) in 778 aa overlap (134-911:24-693) 110 120 130 140 150 160 pF1KB8 GSPAGGQKGGAPAEGEGAAETLPEASRAVENGCCTPKEGRGAPAEAGKEQKETNIESMKM :: :. . . . : . . : . . CCDS56 MKGDTRHLNGEEDAGGREDSILVNGACSDQSSDSPPILEAIRTPEIRGRRSSS 10 20 30 40 50 170 180 190 200 210 220 pF1KB8 EGSRGRLRGGLGWESSLRQRPMPRLTFQAGDPYYISKRKRDEWLARWKREAEKKAKVIAG . :. .. . :.. .:::.: : .:: : : . .: CCDS56 RLSKREVSSLLSYTQSLRRRA----TASAGTP--------------WPSPPSSYL-TIDL 60 70 80 90 230 240 250 260 270 280 pF1KB8 MNAVEENQGPGESQKVEEASPPAVQQPTDPASPTVATTPEPVGSDAGDKNATKAGDDEPE . .:...: .: .: : .. : . . . :. : .:.:: : : CCDS56 TDDTEDTHGTPQS-----SSTPYARLAQDSQQGGMES-PQ-VEADSGD-------GDSSE 100 110 120 130 140 290 300 310 320 330 340 pF1KB8 YEDGRGFGIGELVWGKLRGFSWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFSVVCVEK :.::. ::::.:::::..::::::. .::: :.. .: : :::.:::::::: : ..: CCDS56 YQDGKEFGIGDLVWGKIKGFSWWPAMVVSWKATSKRQAMSGMRWVQWFGDGKFSEVSADK 150 160 170 180 190 200 350 360 370 380 390 400 pF1KB8 LMPLSSFCSAFHQATYNKQPMYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAKAVEVQN :. :. : . :. ::.:: ::::.:..:. : :::: :: :. . ..: : CCDS56 LVALGLFSQHFNLATFNKLVSYRKAMYHALEKARVRAGKTFP-------SSPGDSLEDQL 210 220 230 240 250 410 420 430 440 450 460 pF1KB8 KPMIEWALGGFQPSGPKGLEPPEEEKNPYKEVYTDMWVEPEAAAYAPPPPAKKPRKSTAE :::.::: :::.:.: .::.: .. .: ... . .. : : : : . CCDS56 KPMLEWAHGGFKPTGIEGLKP--NNTQPENKTRRRTADDSATSDYCPAPKRLKTNCYNNG 260 270 280 290 300 310 470 480 490 500 510 520 pF1KB8 KPKVKEIIDERTRERLVYEVRQKCRNIEDICISCGSLNVTLEHPLFVGGMCQNCKNCFLE : . : ...::... .: .. ..:: :.::: : . :::: ::.::.:.. ::: CCDS56 KDRGDE---DQSREQMASDVANNKSSLEDGCLSCGRKNPVSFHPLFEGGLCQTCRDRFLE 320 330 340 350 360 530 540 550 560 570 580 pF1KB8 CAYQYDDDGYQSYCTICCGGREVLMCGNNNCCRCFCVECVDLLVGPGAAQAAIKEDPWNC :.:::::::::::.:: :::.:.:.:..:::::::::...::: :.: : ..::.: CCDS56 LFYMYDDDGYQSYCTVCCEGRELLLCSNTSCCRCFCVECLEVLVGTGTAAEAKLQEPWSC 370 380 390 400 410 420 590 600 610 620 630 640 pF1KB8 YMCGHKGTYGLLRRREDWPSRLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGI ::: . .:.::::.:: ::: ::... :.. ::.:: .:: .:.::::::::::: CCDS56 YMCLPQRCHGVLRRRKDWNVRLQAFFTSDTGLEYEAPKLYPAIPAARRRPIRVLSLFDGI 430 440 450 460 470 480 650 660 670 680 690 700 pF1KB8 ATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDL ::: ::::.:::.: .:.::::::.::.:: :.:.:.: ::.:::..:.:.:.::::::: CCDS56 ATGYLVLKELGIKVGKYVASEVCEESIAVGTVKHEGNIKYVNDVRNITKKNIEEWGPFDL 490 500 510 520 530 540 710 720 730 740 750 760 pF1KB8 VIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGV ::::::::::: ::::::::::::::::::::.::. .::::::::::::.::::::: : CCDS56 VIGGSPCNDLSNVNPARKGLYEGTGRLFFEFYHLLNYSRPKEGDDRPFFWMFENVVAMKV 550 560 570 580 590 600 770 780 790 800 810 820 pF1KB8 SDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGR .:::::::::: ::::::: .::::::::::::::::::: CCDS56 GDKRDISRFLECNPVMIDAIKVSAAHRARYFWGNLPGMNR-------------------- 610 620 630 640 830 840 850 860 870 880 pF1KB8 IAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRL .:::::::::::::.: CCDS56 -------------------------------------------IFGFPVHYTDVSNMGRG 650 660 890 900 910 pF1KB8 ARQRLLGRSWSVPVIRHLFAPLKEYFACV :::.:::::::::::::::::::.:::: CCDS56 ARQKLLGRSWSVPVIRHLFAPLKDYFACE 670 680 690 >>CCDS56183.1 DNMT3B gene_id:1789|Hs108|chr20 (728 aa) initn: 2108 init1: 1678 opt: 1788 Z-score: 1325.5 bits: 256.2 E(32554): 1.6e-67 Smith-Waterman score: 2371; 53.2% identity (71.5% similar) in 664 aa overlap (250-911:139-727) 220 230 240 250 260 270 pF1KB8 VIAGMNAVEENQGPGESQKVEEASPPAVQQPTDPASP--TVATTPEPVGSDAGDKNATKA : . ..: .: . : .. . .: .. CCDS56 TASAGTPWPSPPSSYLTIDLTDDTEDTHGTPQSSSTPYARLAQDSQQGGMESPQVEADSG 110 120 130 140 150 160 280 290 300 310 320 330 pF1KB8 GDDEPEYEDGRGFGIGELVWGKLRGFSWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFS : ::.::. ::::.:::::..::::::. .::: :.. .: : :::.:::::::: CCDS56 DGDSSEYQDGKEFGIGDLVWGKIKGFSWWPAMVVSWKATSKRQAMSGMRWVQWFGDGKFS 170 180 190 200 210 220 340 350 360 370 380 390 pF1KB8 VVCVEKLMPLSSFCSAFHQATYNKQPMYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAK : ..::. :. : . :. ::.:: ::::.:..:. : :::: :: :. . CCDS56 EVSADKLVALGLFSQHFNLATFNKLVSYRKAMYHALEKARVRAGKTFP-------SSPGD 230 240 250 260 270 280 400 410 420 430 440 450 pF1KB8 AVEVQNKPMIEWALGGFQPSGPKGLEPPEEEKNPYKEVYTDMWVEPEAAAYAPPPPAKKP ..: : :::.::: :::.:.: .::.: .. .: ... . .. : : : : CCDS56 SLEDQLKPMLEWAHGGFKPTGIEGLKP--NNTQPENKTRRRTADDSATSDYCPAPKRLKT 290 300 310 320 330 460 470 480 490 500 510 pF1KB8 RKSTAEKPKVKEIIDERTRERLVYEVRQKCRNIEDICISCGSLNVTLEHPLFVGGMCQNC . : . : ...::... .: .. ..:: :.::: : . :::: ::.::.: CCDS56 NCYNNGKDRGDE---DQSREQMASDVANNKSSLEDGCLSCGRKNPVSFHPLFEGGLCQTC 340 350 360 370 380 390 520 530 540 550 560 570 pF1KB8 KNCFLECAYQYDDDGYQSYCTICCGGREVLMCGNNNCCRCFCVECVDLLVGPGAAQAAIK .. ::: :.:::::::::::.:: :::.:.:.:..:::::::::...::: :.: : CCDS56 RDRFLELFYMYDDDGYQSYCTVCCEGRELLLCSNTSCCRCFCVECLEVLVGTGTAAEAKL 400 410 420 430 440 450 580 590 600 610 620 630 pF1KB8 EDPWNCYMCGHKGTYGLLRRREDWPSRLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVL ..::.:::: . .:.::::.:: ::: ::... :.. ::.:: .:: .:.::::: CCDS56 QEPWSCYMCLPQRCHGVLRRRKDWNVRLQAFFTSDTGLEYEAPKLYPAIPAARRRPIRVL 460 470 480 490 500 510 640 650 660 670 680 690 pF1KB8 SLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQE ::::::::: ::::.:::.: .:.::::::.::.:: :.:.:.: ::.:::..:.:.:.: CCDS56 SLFDGIATGYLVLKELGIKVGKYVASEVCEESIAVGTVKHEGNIKYVNDVRNITKKNIEE 520 530 540 550 560 570 700 710 720 730 740 750 pF1KB8 WGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFEN ::::::::::::::::: ::::::::::::::::::::.::. .::::::::::::.::: CCDS56 WGPFDLVIGGSPCNDLSNVNPARKGLYEGTGRLFFEFYHLLNYSRPKEGDDRPFFWMFEN 580 590 600 610 620 630 760 770 780 790 800 810 pF1KB8 VVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQE :::: :.:::::::::: ::::::: .::::::::::::::::::: CCDS56 VVAMKVGDKRDISRFLECNPVMIDAIKVSAAHRARYFWGNLPGMNR-------------- 640 650 660 670 680 820 830 840 850 860 870 pF1KB8 CLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDV .:::::::::: CCDS56 -------------------------------------------------IFGFPVHYTDV 690 880 890 900 910 pF1KB8 SNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV :::.: :::.:::::::::::::::::::.:::: CCDS56 SNMGRGARQKLLGRSWSVPVIRHLFAPLKDYFACE 700 710 720 >>CCDS13207.1 DNMT3B gene_id:1789|Hs108|chr20 (770 aa) initn: 2108 init1: 1678 opt: 1788 Z-score: 1325.2 bits: 256.2 E(32554): 1.7e-67 Smith-Waterman score: 2383; 46.3% identity (66.3% similar) in 843 aa overlap (80-911:12-769) 50 60 70 80 90 100 pF1KB8 RPGRKRKHPPVESGDTPKDPAVISKSPSMAQDSGASE--LLPNGDLEKRSEPQPE--EG- .:.:. : .: :: .: .: :. CCDS13 MKGDTRHLNGEEDAGGREDSILVNGACSDQSSDSPPILEAI 10 20 30 40 110 120 130 140 150 160 pF1KB8 -SPA-GGQKGGAPAEGEGAAETLPEASRAVENGCCTPKEGRGAPAEAGKEQKETNIESMK .: :..... . .. : .. . .: .: .:. : .:: .: CCDS13 RTPEIRGRRSSSRLSKREVSSLLSYTQDLTGDGDGEDGDGSDTPV-MPKLFRETRTRS-- 50 60 70 80 90 170 180 190 200 210 220 pF1KB8 MEGSRGRLRGGLGWESSLRQRPMPRLTFQAGDPYYISKRKRDEWLARWKREAEKKAKVIA :. : :.. . : :.:: :: : .... :. : : ...: . : CCDS13 -ESPAVRTRNNNSVSSRERHRPSPRSTRGRQGRNHVDESPV-EFPAT--RSLRRRATASA 100 110 120 130 140 150 230 240 250 260 270 pF1KB8 GMNAVEENQGPGESQKVE--EASPPAVQQPTDPASP--TVATTPEPVGSDAGDKNATKAG : . . :. .. . . . : . ..: .: . : .. . .: .. CCDS13 G---TPWPSPPSSYLTIDLTDDTEDTHGTPQSSSTPYARLAQDSQQGGMESPQVEADSGD 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB8 DDEPEYEDGRGFGIGELVWGKLRGFSWWPGRIVSWWMTGRSRAAEGTRWVMWFGDGKFSV : ::.::. ::::.:::::..::::::. .::: :.. .: : :::.:::::::: CCDS13 GDSSEYQDGKEFGIGDLVWGKIKGFSWWPAMVVSWKATSKRQAMSGMRWVQWFGDGKFSE 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB8 VCVEKLMPLSSFCSAFHQATYNKQPMYRKAIYEVLQVASSRAGKLFPVCHDSDESDTAKA : ..::. :. : . :. ::.:: ::::.:..:. : :::: :: :. .:. CCDS13 VSADKLVALGLFSQHFNLATFNKLVSYRKAMYHALEKARVRAGKTFP----SSPGDS--- 280 290 300 310 320 400 410 420 430 440 450 pF1KB8 VEVQNKPMIEWALGGFQPSGPKGLEPPEEEKNPYKEVYTDMWVEPEAAAYAPPPPAKKPR .: : :::.::: :::.:.: .::.: .. .: ... . .. : : : : CCDS13 LEDQLKPMLEWAHGGFKPTGIEGLKP--NNTQPENKTRRRTADDSATSDYCPAPKRLKTN 330 340 350 360 370 380 460 470 480 490 500 510 pF1KB8 KSTAEKPKVKEIIDERTRERLVYEVRQKCRNIEDICISCGSLNVTLEHPLFVGGMCQNCK . : . : ...::... .: .. ..:: :.::: : . :::: ::.::.:. CCDS13 CYNNGKDRGDE---DQSREQMASDVANNKSSLEDGCLSCGRKNPVSFHPLFEGGLCQTCR 390 400 410 420 430 520 530 540 550 560 570 pF1KB8 NCFLECAYQYDDDGYQSYCTICCGGREVLMCGNNNCCRCFCVECVDLLVGPGAAQAAIKE . ::: :.:::::::::::.:: :::.:.:.:..:::::::::...::: :.: : . CCDS13 DRFLELFYMYDDDGYQSYCTVCCEGRELLLCSNTSCCRCFCVECLEVLVGTGTAAEAKLQ 440 450 460 470 480 490 580 590 600 610 620 630 pF1KB8 DPWNCYMCGHKGTYGLLRRREDWPSRLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVLS .::.:::: . .:.::::.:: ::: ::... :.. ::.:: .:: .:.:::::: CCDS13 EPWSCYMCLPQRCHGVLRRRKDWNVRLQAFFTSDTGLEYEAPKLYPAIPAARRRPIRVLS 500 510 520 530 540 550 640 650 660 670 680 690 pF1KB8 LFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEW :::::::: ::::.:::.: .:.::::::.::.:: :.:.:.: ::.:::..:.:.:.:: CCDS13 LFDGIATGYLVLKELGIKVGKYVASEVCEESIAVGTVKHEGNIKYVNDVRNITKKNIEEW 560 570 580 590 600 610 700 710 720 730 740 750 pF1KB8 GPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENV :::::::::::::::: ::::::::::::::::::::.::. .::::::::::::.:::: CCDS13 GPFDLVIGGSPCNDLSNVNPARKGLYEGTGRLFFEFYHLLNYSRPKEGDDRPFFWMFENV 620 630 640 650 660 670 760 770 780 790 800 810 pF1KB8 VAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQEC ::: :.:::::::::: ::::::: .::::::::::::::::::: CCDS13 VAMKVGDKRDISRFLECNPVMIDAIKVSAAHRARYFWGNLPGMNR--------------- 680 690 700 710 720 820 830 840 850 860 870 pF1KB8 LEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVS .::::::::::: CCDS13 ------------------------------------------------IFGFPVHYTDVS 730 880 890 900 910 pF1KB8 NMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV ::.: :::.:::::::::::::::::::.:::: CCDS13 NMGRGARQKLLGRSWSVPVIRHLFAPLKDYFACE 740 750 760 770 >>CCDS46232.1 DNMT3A gene_id:1788|Hs108|chr2 (166 aa) initn: 1057 init1: 1023 opt: 1023 Z-score: 770.7 bits: 151.4 E(32554): 1.3e-36 Smith-Waterman score: 1023; 99.3% identity (100.0% similar) in 151 aa overlap (1-151:1-151) 10 20 30 40 50 60 pF1KB8 MPAMPSSGPGDTSSSAAEREEDRKDGEEQEEPRGKEERQEPSTTARKVGRPGRKRKHPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MPAMPSSGPGDTSSSAAEREEDRKDGEEQEEPRGKEERQEPSTTARKVGRPGRKRKHPPV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 ESGDTPKDPAVISKSPSMAQDSGASELLPNGDLEKRSEPQPEEGSPAGGQKGGAPAEGEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ESGDTPKDPAVISKSPSMAQDSGASELLPNGDLEKRSEPQPEEGSPAGGQKGGAPAEGEG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 AAETLPEASRAVENGCCTPKEGRGAPAEAGKEQKETNIESMKMEGSRGRLRGGLGWESSL ::::::::::::::::::::::::::::::. CCDS46 AAETLPEASRAVENGCCTPKEGRGAPAEAGESSAPGAASSGPTSIP 130 140 150 160 190 200 210 220 230 240 pF1KB8 RQRPMPRLTFQAGDPYYISKRKRDEWLARWKREAEKKAKVIAGMNAVEENQGPGESQKVE >>CCDS46650.1 DNMT3L gene_id:29947|Hs108|chr21 (386 aa) initn: 958 init1: 565 opt: 650 Z-score: 491.5 bits: 101.0 E(32554): 4.7e-21 Smith-Waterman score: 885; 40.8% identity (66.0% similar) in 341 aa overlap (476-815:35-345) 450 460 470 480 490 500 pF1KB8 AAYAPPPPAKKPRKSTAEKPKVKEIIDERTRERLVYEVRQKCRNIEDICISCGSLNVTLE :. ..:::. . :::::::: ::::.: . CCDS46 PALDPEAEPSMDVILVGSSELSSSVSPGTGRDLIAYEVKANQRNIEDICICCGSLQVHTQ 10 20 30 40 50 60 510 520 530 540 550 560 pF1KB8 HPLFVGGMCQNCKNCFLECAYQYDDDGYQSYCTICCGGREVLMCGNNNCCRCFCVECVDL :::: ::.: ::. ::. . ::::::::::.:::.:. .:.::: .: ::.: :::: CCDS46 HPLFEGGICAPCKDKFLDALFLYDDDGYQSYCSICCSGETLLICGNPDCTRCYCFECVDS 70 80 90 100 110 120 570 580 590 600 610 620 pF1KB8 LVGPGAAQAAIKEDPWNCYMCGHKGTYGLLRRREDWPSRLQMFFANNHDQEFDPPKVYPP :::::.. . . : ::.: .. :::.::. : :.:. :. ....: .: ... CCDS46 LVGPGTSGKVHAMSNWVCYLCLPSSRSGLLQRRRKWRSQLKAFY--DRESE-NPLEMFET 130 140 150 160 170 180 630 640 650 660 670 680 pF1KB8 VPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVG ::. .:.:.::::::. : : .::. :.. :...: : CCDS46 VPVWRRQPVRVLSLFEDIKKEL---TSLGFL----------ESGSDPGQLKH------VV 190 200 210 220 690 700 710 720 730 740 pF1KB8 DVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKE :: ....: ..:::::::: :..: : . . . .:.:.:::. :::: CCDS46 DVTDTVRKDVEEWGPFDLVYGATP--------PLGHTCDRPPSWYLFQFHRLLQYARPKP 230 240 250 260 270 750 760 770 780 790 800 pF1KB8 GDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGM-NRP :. :::::.: . .... : ::::: .:: : . .. . : :.:.:.. .: CCDS46 GSPRPFFWMFVDNLVLNKEDLDVASRFLEMEPVTIPDVHGGSLQNAVRVWSNIPAIRSRH 280 290 300 310 320 330 810 820 830 840 850 860 pF1KB8 LASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEM : . ...: : CCDS46 WALVSEEELSLLAQNKQSSKLAAKWPTKLVKNCFLPLREYFKYFSTELTSSL 340 350 360 370 380 912 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 17:50:04 2016 done: Sat Nov 5 17:50:05 2016 Total Scan time: 5.020 Total Display time: 0.280 Function used was FASTA [36.3.4 Apr, 2011]