FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9898, 2002 aa 1>>>pF1KB9898 2002 - 2002 aa - 2002 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.4036+/-0.00121; mu= -3.6273+/- 0.073 mean_var=282.7341+/-58.349, 0's: 0 Z-trim(110.9): 20 B-trim: 127 in 1/51 Lambda= 0.076276 statistics sampled from 11976 (11993) to 11976 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.682), E-opt: 0.2 (0.368), width: 16 Scan time: 5.210 The best scores are: opt bits E(32554) CCDS47120.1 TET2 gene_id:54790|Hs108|chr4 (2002) 13593 1510.9 0 CCDS3666.1 TET2 gene_id:54790|Hs108|chr4 (1165) 7703 862.6 0 CCDS46339.2 TET3 gene_id:200424|Hs108|chr2 (1795) 2045 240.1 6.2e-62 CCDS7281.1 TET1 gene_id:80312|Hs108|chr10 (2136) 1812 214.5 3.8e-54 >>CCDS47120.1 TET2 gene_id:54790|Hs108|chr4 (2002 aa) initn: 13593 init1: 13593 opt: 13593 Z-score: 8092.4 bits: 1510.9 E(32554): 0 Smith-Waterman score: 13593; 100.0% identity (100.0% similar) in 2002 aa overlap (1-2002:1-2002) 10 20 30 40 50 60 pF1KB9 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB9 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB9 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB9 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB9 RRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLYSELTETLRKYGTLTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLYSELTETLRKYGTLTN 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB9 RRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSKIPRKFKLLGDDPKEEE 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KB9 KLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKEGRPFSGVTACLDFCAH 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KB9 AHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVSDVDEFGSVEAQEEKKR 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KB9 SGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSSLENSSNKNEKEKSAPSRTK 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KB9 QTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQRPQQQQPHHPQTESVNSY 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KB9 SASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQAAGSYLNSSNPMNPYPG 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KB9 LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPSQDPLSKLSLPPIHTLYQ 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KB9 PRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPPYPTHEMDGHFMGATSRL 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KB9 PPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQNKENDMLSHTANGLSKM 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KB9 LPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDNDEVWSDSEQSFLDPDIG 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KB9 GVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGLALWEAK 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KB9 MAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MAEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSLAERTMSVTT 1930 1940 1950 1960 1970 1980 1990 2000 pF1KB9 DSTVTTSPYAFTRVTGPYNRYI :::::::::::::::::::::: CCDS47 DSTVTTSPYAFTRVTGPYNRYI 1990 2000 >>CCDS3666.1 TET2 gene_id:54790|Hs108|chr4 (1165 aa) initn: 7697 init1: 7697 opt: 7703 Z-score: 4593.2 bits: 862.6 E(32554): 0 Smith-Waterman score: 7703; 97.9% identity (98.5% similar) in 1168 aa overlap (1-1168:1-1163) 10 20 30 40 50 60 pF1KB9 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 MEQDRTNHVEGNRLSPFLIPSPPICQTEPLATKLQNGSPLPERAHPEVNGDTKWHSFKSY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 YGIPCMKGSQNSRVSPDFTQESRGYSKCLQNGGIKRTVSEPSLSGLLQIKKLKQDQKANG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 ERRNFGVSQERNPGESSQPNVSDLSDKKESVSSVAQENAVKDFTSFSTHNCSGPENPELQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 ILNEQEGKSANYHDKNIVLLKNKAVLMPNGATVSASSVEHTHGELLEKTLSQYYPDCVSI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 AVQKTTSHINAINSQATNELSCEITHPSHTSGQINSAQTSNSELPPKPAAVVSEACDADD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 ADNASKLAAMLNTCSFQKPEQLQQQKSVFEICPSPAENNIQGTTKLASGEEFCSGSSSNL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 QAPGGSSERYLKQNEMNGAYFKQSSVFTKDSFSATTTPPPPSQLLLSPPPPLPQVPQLPS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 EGKSTLNGGVLEEHHHYPNQSNTTLLREVKIEGKPEAPPSQSPNPSTHVCSPSPMLSERP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 QNNCVNRNDIQTAGTMTVPLCSEKTRPMSEHLKHNPPIFGSSGELQDNCQQLMRNKEQEI 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 LKGRDKEQTRDLVPPTQHYLKPGWIELKAPRFHQAESHLKRNEASLPSILQYQPNLSNQM 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 TSKQYTGNSNMPGGLPRQAYTQKTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 HFSKTDHLPKAHVQSLCGTRFHFQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 HKPHKQAAQTQPSQSSHLPQNQQQQQKLQIKNKEEILQTFPHPQSNNDQQREGSFFGQTK 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 VEECFHGENQYSKSSEFETHNVQMGLEEVQNINRRNSPYSQTMKSSACKIQVSCSNNTHL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 VSENKEQTTHPELFAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQEQKSQQASVLQGYK 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 NRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQKDTQKHAALRWHLLQKQ 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 EQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWKKVTKQENPPASCDNVQ 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB9 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 QKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTVLTRQTTAAELDSHTPA 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB9 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVEQII :::::::::::::::::::::::::::::::::::::::::::::::::::::::: . CCDS36 LEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVKTQYDFPSCRCVGKCQ 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB9 EKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGKEGKSSQGCPIAKWVV . : :: :. :..: . : : CCDS36 KCTE----TH-GVYPELANLSSDMGFSFFF 1150 1160 >>CCDS46339.2 TET3 gene_id:200424|Hs108|chr2 (1795 aa) initn: 2573 init1: 1834 opt: 2045 Z-score: 1225.3 bits: 240.1 E(32554): 6.2e-62 Smith-Waterman score: 2481; 42.5% identity (63.5% similar) in 1133 aa overlap (915-1934:636-1729) 890 900 910 920 930 940 pF1KB9 EQEQKSQQASVLQGYKNRNQDMSGQQAAQLAQQRYLIHNHANVFPVPDQGGSHTQTPPQK :.:. : : :.: . :: . ::. CCDS46 PIQIKKSRPREAQPLFPPVRQIVLEGLRSPASQEVQAHPPA---PLPASQGSAVPLPPEP 610 620 630 640 650 660 950 960 970 980 990 1000 pF1KB9 DTQKHAALRWHLLQKQEQQQTQQPQTESCHSQMHRPIKVEPGCKPHACMHTAPPENKTWK . :. . .... : :. .:. : . . .: . : ..: . CCDS46 SLA--------LFAPSPSRDSLLPPTQ----EMRSPSPMT-ALQPGSTGPLPPADDKLEE 670 680 690 700 1010 1020 1030 1040 1050 1060 pF1KB9 KVTKQENPPASCDNVQQKSIIETMEQHLKQFHAKSLFDHKALTLKSQKQVKVEMSGPVTV . . : .. .. . .. . .: . .. .. .: ::.:.: :: ::: CCDS46 LIRQFEAEFGDSFGLPGPPSVPIQDPENQQTCLPA--PESPFATRSPKQIKIESSGAVTV 710 720 730 740 750 760 1070 1080 1090 1100 1110 1120 pF1KB9 LTRQTTAAELDSHTPALEQQTTSSEKTPTKRTA--ASVLNNFIESPSKLLDTPIKNLLDT :. : .... ..: :::: . .:..:.::: : :::: :.:::: CCDS46 LS-----------TTCFHSEEGGQEATPTKAENPLTPTLSGFLESPLKYLDTPTKSLLDT 770 780 790 800 810 1130 1140 1150 1160 1170 1180 pF1KB9 PVK-TQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVI :.: .: .::.: :::::.::::::.:::::.::.::.:::.::::.:.::::::::.:: CCDS46 PAKRAQAEFPTCDCVEQIVEKDEGPYYTHLGSGPTVASIRELMEERYGEKGKAIRIEKVI 820 830 840 850 860 870 1190 1200 1210 1220 1230 1240 pF1KB9 YTGKEGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLA :::::::::.::::::::.:: . :::::::::.:::: :. ::::::::.::::: ::. CCDS46 YTGKEGKSSRGCPIAKWVIRRHTLEEKLLCLVRHRAGHHCQNAVIVILILAWEGIPRSLG 880 890 900 910 920 930 1250 1260 1270 1280 1290 1300 pF1KB9 DKLYSELTETLRKYGTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFA : ::.:::.::::::. :.:::.::..::::::: ::.:::::::::::::::.::::.: CCDS46 DTLYQELTDTLRKYGNPTSRRCGLNDDRTCACQGKDPNTCGASFSFGCSWSMYFNGCKYA 940 950 960 970 980 990 1310 1320 1330 1340 1350 1360 pF1KB9 RSKIPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLG ::: ::::.: ::.::::: :.. .:.:.: .:: ::.:::.::.::. :. : .:::: CCDS46 RSKTPRKFRLAGDNPKEEEVLRKSFQDLATEVAPLYKRLAPQAYQNQVTNEEIAIDCRLG 1000 1010 1020 1030 1040 1050 1370 1380 1390 1400 1410 1420 pF1KB9 LKEGRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLY :::::::.:::::.:::::::.: ::. :: :.:::::.:::: : :::::::::::: CCDS46 LKEGRPFAGVTACMDFCAHAHKDQHNLYNGCTVVCTLTKEDNRCVGKIPEDEQLHVLPLY 1060 1070 1080 1090 1100 1110 1430 1440 1450 1460 1470 1480 pF1KB9 KVSDVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPVKTCRQRKLEAKKAAAEKLSS :....::::: : :. : :::::::..: :.:: : ::.:.::::.:::.:::::: CCDS46 KMANTDEFGSEENQNAKVGSGAIQVLTAFPREVRRLPEPAKSCRQRQLEARKAAAEK--- 1120 1130 1140 1150 1160 1170 1490 1500 1510 1520 1530 pF1KB9 LENSSNKNEKEK-SAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQP----QPLQK--- .: .::: :.: . :: . : :.: . ::. .: .: .. CCDS46 -----KKIQKEKLSTPEKIKQEALELAGITSDPGLSLKGGLSQQGLKPSLKVEPQNHFSS 1180 1190 1200 1210 1220 1540 1550 1560 1570 pF1KB9 ------------------QPPQPQQQQRPQQQQPHH--PQTESVNSYSASGS--TNPYMR .: .: ... . . .. :. :::.. .. . . :. CCDS46 FKYSGNAVVESYSVLGNCRPSDPYSMNSVYSYHSYYAQPSLTSVNGFHSKYALPSFSYYG 1230 1240 1250 1260 1270 1280 1580 1590 1600 pF1KB9 RP--NPVSPY----PNS-SHTSD------------IYGSTSPM----NFYSTSSQAAGSY : ::: : :.. .:... ...: :: .: :::. . CCDS46 FPSSNPVFPSQFLGPGAWGHSGSSGSFEKKPDLHALHNSLSPAYGGAEFAELPSQAVPTD 1290 1300 1310 1320 1330 1340 1610 1620 1630 1640 1650 pF1KB9 LNSSNPMN--P-YPG----------LLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQ- . .: . : ::: ::.. .. :: ... . : : .: .: CCDS46 AHHPTPHHQQPAYPGPKEYLLPKAPLLHSVSRDPSPFAQSS-NCYNRSIKQEPVDPLTQA 1350 1360 1370 1380 1390 1400 1660 1670 1680 1690 1700 pF1KB9 ---PMDLYRYPSQDPLSKLSLP--PIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSC : : .. .. :::..: : : : : :.: :. .. ..: : CCDS46 EPVPRDAGKM-GKTPLSEVSQNGGPSHLWGQYSGGPSMSPKRTNGVGGSWGVFSSGESPA 1410 1420 1430 1440 1450 1460 1710 1720 1730 1740 1750 pF1KB9 TIRPNVHHVGKLPPYPTHEMDGH---FMG----ATSRLPPNL-SNPNMDYKNGEHHS--- . .. : :.: ::. : : :.:. : ..: : :. : CCDS46 IVPDKLSSFGASCLAPSHFTDGQWGLFPGEGQQAASHSGGRLRGKPWSPCKFGNSTSALA 1470 1480 1490 1500 1510 1520 1760 1770 1780 1790 1800 pF1KB9 -PSHIIHNYSAAPGMFNSSLHALH-LQNKE-NDMLSHT----ANGLSKM--------LPA :: . .. . : :::.:.. .:.: : : .. : : :.. :: CCDS46 GPSLTEKPWALGAGDFNSALKGSPGFQDKLWNPMKGEEGRIPAAGASQLDRAWQSFGLPL 1530 1540 1550 1560 1570 1580 1810 1820 1830 1840 1850 pF1KB9 LNHDRTACVQGGLHKLSDANGQEKQP---------LALVQGVASGAEDNDEVWSDSEQSF . .. . . .:: : . :. : . .: ... :...:.:::::..: CCDS46 GSSEKLFGALKSEEKLWDPFSLEEGPAEEPPSKGAVKEEKGGGGAEEEEEELWSDSEHNF 1590 1600 1610 1620 1630 1640 1860 1870 1880 1890 1900 1910 pF1KB9 LDPDIGGVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQHKSMNEPKHGL :: .::::::::.:::::::::.::::::::::.::: :::::::::::::..:.:.::: CCDS46 LDENIGGVAVAPAHGSILIECARRELHATTPLKKPNRCHPTRISLVFYQHKNLNQPNHGL 1650 1660 1670 1680 1690 1700 1920 1930 1940 1950 1960 1970 pF1KB9 ALWEAKM---AEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEPTYLRFIKSL ::::::: ::.:: ..:: . CCDS46 ALWEAKMKQLAERARARQEEAARLGLGQQEAKLYGKKRKWGGTVVAEPQQKEKKGVVPTR 1710 1720 1730 1740 1750 1760 >>CCDS7281.1 TET1 gene_id:80312|Hs108|chr10 (2136 aa) initn: 2130 init1: 999 opt: 1812 Z-score: 1085.6 bits: 214.5 E(32554): 3.8e-54 Smith-Waterman score: 2168; 34.4% identity (59.4% similar) in 1390 aa overlap (653-2002:941-2136) 630 640 650 660 670 680 pF1KB9 KTTQLEHKSQMYQVEMNQGQSQGTVDQHLQFQKPSHQVHFSKTDHLPKAHVQSLCGTRFH .: :. : . : .: :. . :: :.: CCDS72 SKSEKDEESEQRTASLLNSCKAILYTVRKDLQDPNLQGEPPKLNHCPSLEKQSSCNTVVF 920 930 940 950 960 970 690 700 710 720 730 740 pF1KB9 FQQRADSQTEKLMSPVLKQHLNQQASETEPFSNSHLLQHKPHKQAAQTQPSQSSHLPQNQ ..:: : . .:.:. .... ..:: .. .. . :.::.. :. CCDS72 -----NGQTTTLSN----SHINSATNQAS--TKSHEYSKVTNSLSLFIPKSNSSKIDTNK 980 990 1000 1010 750 760 770 780 790 800 pF1KB9 QQQQKL-QIKNKEEILQTFPHPQSNNDQQREGSFFGQTKVEECFHGENQYSKSSEFETHN . : . . : . :. .: :. ::. . .... ..: . : . ...: .. CCDS72 SIAQGIITLDNCSNDLHQLP-PR-NNEVEYCNQLLDSSKKLDSDDLSCQDATHTQIE-ED 1020 1030 1040 1050 1060 1070 810 820 830 840 850 pF1KB9 VQMGLEEVQNINRRN--SPYSQTMKSS-----ACKIQVSCSNNTHLVSENKEQTTHPEL- : : .. .: . : .: .. ..:. .:..: . ... .... ...: . CCDS72 VATQLTQLASIIKINYIKPEDKKVESTPTSLVTCNVQQKYNQEKGTIQQKPPSSVHNNHG 1080 1090 1100 1110 1120 1130 860 870 880 890 900 910 pF1KB9 --FAGNKTQNLHHMQYFPNNVIPKQDLLHRCFQEQE-QKSQQASVLQGYKNRNQDMSGQQ .. .:. . .. . :. :. .::.. :: .. : . : : : CCDS72 SSLTKQKNPTQKKTKSTPSRDRRKKKPTVVSYQENDRQKWEKLSYMYGTICDIWIASKFQ 1140 1150 1160 1170 1180 1190 920 930 940 950 960 pF1KB9 AAQLAQQRYLIHNHANVFPVPDQGG------SHTQTPPQKDTQKHAALRWHLLQKQEQQQ ...: . :. .:: ... ..:.. : : : ::. .. CCDS72 --NFGQ--FCPHDFPTVFGKISSSTKIWKPLAQTRSIMQPKTV-FPPLTQIKLQRYPESA 1200 1210 1220 1230 1240 1250 970 980 990 1000 1010 pF1KB9 TQQPQTESCHSQMHRPIKVEPGCKP------HACMHTAPPENKTWKKVTKQENPPASCDN .. ..: : .:.: . : .. .. . :. . .:. .:: .: : CCDS72 EEKVKVEPLDSLSLFHLKTESNGKAFTDKAYNSQVQLTVNANQKAHPLTQPSSPPNQCAN 1260 1270 1280 1290 1300 1310 1020 1030 1040 1050 1060 pF1KB9 VQ--------QKSIIET-MEQHLKQF----HAKSLFDHKALTLKSQKQVKVEMSGPVTVL :. :. . : :.:.: . : : ..::::.. :.: :: .::. CCDS72 VMAGDDQIRFQQVVKEQLMHQRLPTLPGISHETPL-PESALTLRN---VNVVCSGGITVV 1320 1330 1340 1350 1360 1070 1080 1090 1100 1110 1120 pF1KB9 TRQTTAAELDSHTPALEQQTTSSEKTPTKRTAASVLNNFIESPSKLLDTPIKNLLDTPVK . .. :. .:: : :. :. .:: . ... .: :::.. . CCDS72 STKSE-----------EEVCSSSFGTSEFSTVDSAQKNFNDYAMNFFTNPTKNLVS--IT 1370 1380 1390 1400 1410 1130 1140 1150 1160 1170 1180 pF1KB9 TQYDFPSCRCVEQIIEKDEGPFYTHLGAGPNVAAIREIMEERFGQKGKAIRIERVIYTGK . ..:.: :....:.::.::.::::::::.:::.:::::.:.::::.::::: :.:::: CCDS72 KDSELPTCSCLDRVIQKDKGPYYTHLGAGPSVAAVREIMENRYGQKGNAIRIEIVVYTGK 1420 1430 1440 1450 1460 1470 1190 1200 1210 1220 1230 1240 pF1KB9 EGKSSQGCPIAKWVVRRSSSEEKLLCLVRERAGHTCEAAVIVILILVWEGIPLSLADKLY :::::.::::::::.::::.:::.:::::.:.:: : .::.:.::.::.:::: .::.:: CCDS72 EGKSSHGCPIAKWVLRRSSDEEKVLCLVRQRTGHHCPTAVMVVLIMVWDGIPLPMADRLY 1480 1490 1500 1510 1520 1530 1250 1260 1270 1280 1290 1300 pF1KB9 SELTETLRKY-GTLTNRRCALNEERTCACQGLDPETCGASFSFGCSWSMYYNGCKFARSK .::::.:..: : :.:::.:::.:::.:::.::::::::::::::::::.:::::.:: CCDS72 TELTENLKSYNGHPTDRRCTLNENRTCTCQGIDPETCGASFSFGCSWSMYFNGCKFGRSP 1540 1550 1560 1570 1580 1590 1310 1320 1330 1340 1350 1360 pF1KB9 IPRKFKLLGDDPKEEEKLESHLQNLSTLMAPTYKKLAPDAYNNQIEYEHRAPECRLGLKE ::.:.. ..: .:..::..::.:.: .:: ::. :: ::.::.:::. : ::::: :: CCDS72 SPRRFRIDPSSPLHEKNLEDNLQSLATRLAPIYKQYAPVAYQNQVEYENVARECRLGSKE 1600 1610 1620 1630 1640 1650 1370 1380 1390 1400 1410 1420 pF1KB9 GRPFSGVTACLDFCAHAHRDLHNMQNGSTLVCTLTREDNREFGGKPEDEQLHVLPLYKVS :::::::::::::::: :::.:::.::::.:::::::::: .: :.:::::::::::.: CCDS72 GRPFSGVTACLDFCAHPHRDIHNMNNGSTVVCTLTREDNRSLGVIPQDEQLHVLPLYKLS 1660 1670 1680 1690 1700 1710 1430 1440 1450 1460 1470 1480 pF1KB9 DVDEFGSVEAQEEKKRSGAIQVLSSFRRKVRMLAEPV-KTCRQRKLEAKKAAAEKLSSLE :.::::: :..: : .::::.::. :.: ...:: .. ..: .. :.:. ..: CCDS72 DTDEFGSKEGMEAKIKSGAIEVLAPRRKKRTCFTQPVPRSGKKRAAMMTEVLAHKIRAVE 1720 1730 1740 1750 1760 1770 1490 1500 1510 1520 1530 1540 pF1KB9 NSSNKNEKEKSAPSRTKQTENASQAKQLAELLRLSGPVMQQSQQPQPLQKQPPQPQQQQR .. :.:. . : : :. ..: : : .... :: :. .:. . CCDS72 KKPIPRIKRKNNSTTT----NNSKPSSLPTL----G---SNTETVQPEVKSETEPHFILK 1780 1790 1800 1810 1820 1550 1560 1570 1580 1590 1600 pF1KB9 PQQQQPHHPQTESVNSYSASGSTNPYMRRPNPVSPYPNSSHTSDIYGSTSPMNFYSTSSQ .......:: :. :.::. . : .:..: . . .. CCDS72 ---------SSDNTKTYSLMPSA------PHPVKEASPGFSWSPKTASATPAPLKNDATA 1830 1840 1850 1860 1610 1620 1630 1640 1650 1660 pF1KB9 AAGSYLNSSNPMNPYPGLLNQNTQYPSYQCNGNLSVDNCSPYLGSYSPQSQPMDLYRYPS . : ::.: .: .: :: : . : :. CCDS72 SCGFSERSSTPHCTMP--------------SGRLSGANAAAADG--------------PG 1870 1880 1890 1900 1670 1680 1690 1700 1710 1720 pF1KB9 QDPLSKLSLPPIHTLYQPRFGNSQSFTSKYLGYGNQNMQGDGFSSCTIRPNVHHVGKLPP . :.... :. :: : ...: .. CCDS72 ISQLGEVA--PLPTLSAP----------------------------VMEPLINS------ 1910 1920 1730 1740 1750 1760 1770 1780 pF1KB9 YPTHEMDGHFMGATSRLPPNLSNPNMDYKNGEHHSPSHIIHNYSAAPGMFNSSLHALHLQ :. :.: : :. .:: :.:: . ..: . :: : CCDS72 EPS-------TGVTEPLTPH--QPN--------HQPSFL-----TSPQDLASSPMEEDEQ 1930 1940 1950 1960 1790 1800 1810 1820 1830 1840 pF1KB9 NKENDMLSHTANGLSKMLPALNHDRTACVQGGLHKLSDANGQEKQPLALVQGVASGAEDN ..: : : :. : :: : .:: : CCDS72 HSEADEPPSDE-------P-LSDD----------PLSPA--EEKLPHI------------ 1970 1980 1990 1850 1860 1870 1880 1890 1900 pF1KB9 DEVWSDSEQSFLDPDIGGVAVAPTHGSILIECAKRELHATTPLKNPNRNHPTRISLVFYQ :: :::::. ::: .:::::.::.:::.:::::.::::::::...::::::::.:::::: CCDS72 DEYWSDSEHIFLDANIGGVAIAPAHGSVLIECARRELHATTPVEHPNRNHPTRLSLVFYQ 2000 2010 2020 2030 2040 2050 1910 1920 1930 1940 1950 1960 pF1KB9 HKSMNEPKHGLALWEAKM-AEKAREKEEECEKYGPDYVPQKSHGKKVKREPAEPHETSEP ::..:.:.::. : . :. :..:..:. .:. .: . :...:: CCDS72 HKNLNKPQHGFELNKIKFEAKEAKNKK------------MKASEQKDQAANEGPEQSSEV 2060 2070 2080 2090 1970 1980 1990 2000 pF1KB9 TYLRFIKSLAERTMSVTTDSTVTTSPYAFTRVTGPYNRYI . : : : ......: :..::.::::.:.:.::::... CCDS72 NELNQIPS--HKALTLTHDNVVTVSPYALTHVAGPYNHWV 2100 2110 2120 2130 2002 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Feb 10 15:01:55 2017 done: Fri Feb 10 15:01:56 2017 Total Scan time: 5.210 Total Display time: 0.290 Function used was FASTA [36.3.4 Apr, 2011]