FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1769, 2080 aa 1>>>pF1KSDA1769 2080 - 2080 aa - 2080 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1663+/-0.0009; mu= 21.1681+/- 0.054 mean_var=88.8651+/-17.648, 0's: 0 Z-trim(107.8): 32 B-trim: 0 in 0/51 Lambda= 0.136053 statistics sampled from 9748 (9777) to 9748 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.635), E-opt: 0.2 (0.3), width: 16 Scan time: 5.870 The best scores are: opt bits E(32554) CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080) 14093 2777.4 0 CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649) 14050 2769.0 0 CCDS42374.1 HELZ gene_id:9931|Hs108|chr17 (1942) 770 162.3 1.8e-38 CCDS82192.1 HELZ gene_id:9931|Hs108|chr17 (1943) 770 162.3 1.8e-38 CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 ( 971) 433 96.0 8.2e-19 CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054) 433 96.0 8.7e-19 CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 ( 796) 323 74.4 2.2e-12 CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 ( 928) 323 74.4 2.5e-12 CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 ( 958) 323 74.4 2.5e-12 CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 603) 302 70.2 3e-11 CCDS42834.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 885) 302 70.3 4.2e-11 >>CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080 aa) initn: 14093 init1: 14093 opt: 14093 Z-score: 14936.8 bits: 2777.4 E(32554): 0 Smith-Waterman score: 14093; 99.8% identity (100.0% similar) in 2080 aa overlap (1-2080:1-2080) 10 20 30 40 50 60 pF1KSD MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVMYTDRPLSQTDPVTLQYCCLTDDRQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVMYTDRPLSQTDPVTLQYCCLTDDRQA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD FRPPTRAELARHRVVVTTTSQARELRVPVGFFSHILIDEAAQMLECEALTPLAYASHGTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 FRPPTRAELARHRVVVTTTSQARELRVPVGFFSHILIDEAAQMLECEALTPLAYASHGTR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LVLAGDHMQVTPRLFSVARARAAEHTLLHRLFLCYQQETHEVARQSRLVFHENYRCTDAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LVLAGDHMQVTPRLFSVARARAAEHTLLHRLFLCYQQETHEVARQSRLVFHENYRCTDAI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD VSFISRHFYVAKGNPIHARGKVPPHPRHYPLMFCHVAGNPDRDMSMASWLNLAEIAQVVE ::::::::::::::::::::::::::::::::::::::.::::::::::::::::::::: CCDS13 VSFISRHFYVAKGNPIHARGKVPPHPRHYPLMFCHVAGSPDRDMSMASWLNLAEIAQVVE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD KVQEAYNTWPSCWGGREQRCICVVSHGAQVSALRQELRRRDLGQVSVGSFEILPGRQFRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KVQEAYNTWPSCWGGREQRCICVVSHGAQVSALRQELRRRDLGQVSVGSFEILPGRQFRV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD VVLSTVHTCQSLLSPGALAPEFFTDARVLNTVLTRAQSQLVVVGDAVALCSFGACGKLWE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VVLSTVHTCQSLLSPGALAPEFFTDARVLNTVLTRAQSQLVVVGDAVALCSFGACGKLWE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SFIRECVERHSVCPEGLSMEQVEQGVAQRRRWPPRGTQAGAAGNWEAAPEPVGDLAEEQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SFIRECVERHSVCPEGLSMEQVEQGVAQRRRWPPRGTQAGAAGNWEAAPEPVGDLAEEQA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD AVVTAMVKAEPGDEALSPASRDITATTAQTEAAAAPAGDAVKEDVVPGACAAGAAAAAGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AVVTAMVKAEPGDEALSPASRDITATTAQTEAAAAPAGDAVKEDVVPGACAAGAAAAAGV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD ESTEAEDAEADFWPWDGELNADDAILRELLDESQKVMVTVGEDGLLDTVARPESLQQARL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ESTEAEDAEADFWPWDGELNADDAILRELLDESQKVMVTVGEDGLLDTVARPESLQQARL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD YENLPPAALRKLLRAEPERYRHCSFVPETFERASAIPLDDASSGPIQVRGRLDCGMAFAG :::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::: CCDS13 YENLPPAALRKLLHAEPERYRHCSFVPETFERASAIPLDDASSGPIQVRGRLDCGMAFAG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD DEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVPINGSVTKIFVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVPINGSVTKIFVA 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD ELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPE 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD ASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCRAFLTFTVDPQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCRAFLTFTVDPQG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD ACNLDDALSVRDLGPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ACNLDDALSVRDLGPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD SLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD GAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLGFRAAHIMVKEYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLGFRAAHIMVKEYM 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD IQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHGGGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 IQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHGGGG 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD SPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDDMHPFLAPAGRDLRKALERSAFGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDDMHPFLAPAGRDLRKALERSAFGR 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD CARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHGGSAYSARDIDGLCQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 CARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHGGSAYSARDIDGLCQA 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD FSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRCFRLLFPSNRETLPDPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 FSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRCFRLLFPSNRETLPDPC 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KSD PVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPGTVPDPHTLAVETALWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPGTVPDPHTLAVETALWK 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KSD QLLELVELQRWPEAAALIQEKGEASQRRELVQVQRSHCGHFLEVARELGSGDTLQVQLGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QLLELVELQRWPEAAALIQEKGEASQRRELVQVQRSHCGHFLEVARELGSGDTLQVQLGT 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KSD SLQHGFLVPSPQLWTVAPGFSLCLEHVERPGDCFSGRVYRAPRDRYRDVDEYACVWEPFC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SLQHGFLVPSPQLWTVAPGFSLCLEHVERPGDCFSGRVYRAPRDRYRDVDEYACVWEPFC 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KSD ALESATGAVAENDSVTLQHLSVSWEASRTPQGQLQGAFRLEAAFLEENCADINFSCCYLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ALESATGAVAENDSVTLQHLSVSWEASRTPQGQLQGAFRLEAAFLEENCADINFSCCYLC 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KSD IRLEGLLAPTASPRPGPSSLGPGLNVDPGTYTWVAHGQTEDWDQERRADRQEAPRRVHLF :::::: ::::::::::::::::::::::::::::::::.:::::::::::::::::::: CCDS13 IRLEGLPAPTASPRPGPSSLGPGLNVDPGTYTWVAHGQTQDWDQERRADRQEAPRRVHLF 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KSD VHHMGMEKVPEEVLRPGTLFTVELLPKQLPDLRKEEAVRGLEEASPLVTSIALGRPVPQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VHHMGMEKVPEEVLRPGTLFTVELLPKQLPDLRKEEAVRGLEEASPLVTSIALGRPVPQP 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KSD LCRVIPSRFLERQTYNIPGGRHKLNPSQNVAVREALEKPFTVIQGPPGTGKTIVGLHIVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LCRVIPSRFLERQTYNIPGGRHKLNPSQNVAVREALEKPFTVIQGPPGTGKTIVGLHIVF 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KSD WFHKSNQEQVQPGGPPRGEKRLGGPCILYCGPSNKSVDVLAGLLLRRMELKPLRVYSEQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 WFHKSNQEQVQPGGPPRGEKRLGGPCILYCGPSNKSVDVLAGLLLRRMELKPLRVYSEQA 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KSD EASEFPVPRVGSRKLLRKSPREGRPNQSLRSITLHHRIRQAPNPYSSEIKAFDTRLQRGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EASEFPVPRVGSRKLLRKSPREGRPNQSLRSITLHHRIRQAPNPYSSEIKAFDTRLQRGE 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KSD LFSREDLVWYKKVLWEARKFELDRHEVILCTCSCAASASLKILDVRQILVDEAGMATEPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LFSREDLVWYKKVLWEARKFELDRHEVILCTCSCAASASLKILDVRQILVDEAGMATEPE 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KSD TLIPLVQFPQAEKVVLLGDHKQLRPVVKNERLQNLGLDRSLFERYHEDAHMLDTQYRMHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 TLIPLVQFPQAEKVVLLGDHKQLRPVVKNERLQNLGLDRSLFERYHEDAHMLDTQYRMHE 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KSD GICAFPSVAFYKSKLKTWQGLRRPPSVLGHAGKESCPVIFGHVQGHERSLLVSTDEGNEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GICAFPSVAFYKSKLKTWQGLRRPPSVLGHAGKESCPVIFGHVQGHERSLLVSTDEGNEN 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KSD SKANLEEVAEVVRITKQLTLGRTVEPQDIAVLTPYNAQASEISKALRREGIAGVAVSSIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SKANLEEVAEVVRITKQLTLGRTVEPQDIAVLTPYNAQASEISKALRREGIAGVAVSSIT 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KSD KSQGSEWRYVLVSTVRTCAKSDLDQRPTKSWLKKFLGFVVDPNQVNVAVTRAQEGLCLIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KSQGSEWRYVLVSTVRTCAKSDLDQRPTKSWLKKFLGFVVDPNQVNVAVTRAQEGLCLIG 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 pF1KSD DHLLLRCCPLWRSLLDFCEAQQTLVPAGQVRVCRRPTMPS :::::::::::::::::::::::::::::::::::::::: CCDS13 DHLLLRCCPLWRSLLDFCEAQQTLVPAGQVRVCRRPTMPS 2050 2060 2070 2080 >>CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649 aa) initn: 14050 init1: 14050 opt: 14050 Z-score: 14889.6 bits: 2769.0 E(32554): 0 Smith-Waterman score: 14050; 99.7% identity (99.9% similar) in 2075 aa overlap (6-2080:575-2649) 10 20 30 pF1KSD MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVM . :::::::::::::::::::::::::::: CCDS33 PFGTGKTYTLAMASLEVIRRPETKVLICTHTNSAADIYIREYFHSHVSGGHPEATPLRVM 550 560 570 580 590 600 40 50 60 70 80 90 pF1KSD YTDRPLSQTDPVTLQYCCLTDDRQAFRPPTRAELARHRVVVTTTSQARELRVPVGFFSHI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YTDRPLSQTDPVTLQYCCLTDDRQAFRPPTRAELARHRVVVTTTSQARELRVPVGFFSHI 610 620 630 640 650 660 100 110 120 130 140 150 pF1KSD LIDEAAQMLECEALTPLAYASHGTRLVLAGDHMQVTPRLFSVARARAAEHTLLHRLFLCY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LIDEAAQMLECEALTPLAYASHGTRLVLAGDHMQVTPRLFSVARARAAEHTLLHRLFLCY 670 680 690 700 710 720 160 170 180 190 200 210 pF1KSD QQETHEVARQSRLVFHENYRCTDAIVSFISRHFYVAKGNPIHARGKVPPHPRHYPLMFCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QQETHEVARQSRLVFHENYRCTDAIVSFISRHFYVAKGNPIHARGKVPPHPRHYPLMFCH 730 740 750 760 770 780 220 230 240 250 260 270 pF1KSD VAGNPDRDMSMASWLNLAEIAQVVEKVQEAYNTWPSCWGGREQRCICVVSHGAQVSALRQ :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VAGSPDRDMSMASWLNLAEIAQVVEKVQEAYNTWPSCWGGREQRCICVVSHGAQVSALRQ 790 800 810 820 830 840 280 290 300 310 320 330 pF1KSD ELRRRDLGQVSVGSFEILPGRQFRVVVLSTVHTCQSLLSPGALAPEFFTDARVLNTVLTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ELRRRDLGQVSVGSFEILPGRQFRVVVLSTVHTCQSLLSPGALAPEFFTDARVLNTVLTR 850 860 870 880 890 900 340 350 360 370 380 390 pF1KSD AQSQLVVVGDAVALCSFGACGKLWESFIRECVERHSVCPEGLSMEQVEQGVAQRRRWPPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 AQSQLVVVGDAVALCSFGACGKLWESFIRECVERHSVCPEGLSMEQVEQGVAQRRRWPPR 910 920 930 940 950 960 400 410 420 430 440 450 pF1KSD GTQAGAAGNWEAAPEPVGDLAEEQAAVVTAMVKAEPGDEALSPASRDITATTAQTEAAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GTQAGAAGNWEAAPEPVGDLAEEQAAVVTAMVKAEPGDEALSPASRDITATTAQTEAAAA 970 980 990 1000 1010 1020 460 470 480 490 500 510 pF1KSD PAGDAVKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNADDAILRELLDESQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PAGDAVKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNADDAILRELLDESQK 1030 1040 1050 1060 1070 1080 520 530 540 550 560 570 pF1KSD VMVTVGEDGLLDTVARPESLQQARLYENLPPAALRKLLRAEPERYRHCSFVPETFERASA ::::::::::::::::::::::::::::::::::::::.::::::::::::::::::::: CCDS33 VMVTVGEDGLLDTVARPESLQQARLYENLPPAALRKLLHAEPERYRHCSFVPETFERASA 1090 1100 1110 1120 1130 1140 580 590 600 610 620 630 pF1KSD IPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 IPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAF 1150 1160 1170 1180 1190 1200 640 650 660 670 680 690 pF1KSD VCRMDTWDPRIMVPINGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VCRMDTWDPRIMVPINGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRL 1210 1220 1230 1240 1250 1260 700 710 720 730 740 750 pF1KSD FWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYH 1270 1280 1290 1300 1310 1320 760 770 780 790 800 810 pF1KSD TELGRVAGRREDCRAFLTFTVDPQGACNLDDALSVRDLGPRCEVAVHITDVASFVPRDGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TELGRVAGRREDCRAFLTFTVDPQGACNLDDALSVRDLGPRCEVAVHITDVASFVPRDGV 1330 1340 1350 1360 1370 1380 820 830 840 850 860 870 pF1KSD LDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLR 1390 1400 1410 1420 1430 1440 880 890 900 910 920 930 pF1KSD FAPSVVQSDRQLSYEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FAPSVVQSDRQLSYEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSD 1450 1460 1470 1480 1490 1500 940 950 960 970 980 990 pF1KSD CFYEQPDEDGTLGFRAAHIMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CFYEQPDEDGTLGFRAAHIMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLK 1510 1520 1530 1540 1550 1560 1000 1010 1020 1030 1040 1050 pF1KSD ALCEKHGDRVPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ALCEKHGDRVPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTT 1570 1580 1590 1600 1610 1620 1060 1070 1080 1090 1100 1110 pF1KSD DDMHPFLAPAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DDMHPFLAPAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQ 1630 1640 1650 1660 1670 1680 1120 1130 1140 1150 1160 1170 pF1KSD RQILLALGHGGSAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RQILLALGHGGSAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFV 1690 1700 1710 1720 1730 1740 1180 1190 1200 1210 1220 1230 pF1KSD VDVEAGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VDVEAGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQG 1750 1760 1770 1780 1790 1800 1240 1250 1260 1270 1280 1290 pF1KSD SSPPLPLPGTVPDPHTLAVETALWKQLLELVELQRWPEAAALIQEKGEASQRRELVQVQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SSPPLPLPGTVPDPHTLAVETALWKQLLELVELQRWPEAAALIQEKGEASQRRELVQVQR 1810 1820 1830 1840 1850 1860 1300 1310 1320 1330 1340 1350 pF1KSD SHCGHFLEVARELGSGDTLQVQLGTSLQHGFLVPSPQLWTVAPGFSLCLEHVERPGDCFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SHCGHFLEVARELGSGDTLQVQLGTSLQHGFLVPSPQLWTVAPGFSLCLEHVERPGDCFS 1870 1880 1890 1900 1910 1920 1360 1370 1380 1390 1400 1410 pF1KSD GRVYRAPRDRYRDVDEYACVWEPFCALESATGAVAENDSVTLQHLSVSWEASRTPQGQLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GRVYRAPRDRYRDVDEYACVWEPFCALESATGAVAENDSVTLQHLSVSWEASRTPQGQLQ 1930 1940 1950 1960 1970 1980 1420 1430 1440 1450 1460 1470 pF1KSD GAFRLEAAFLEENCADINFSCCYLCIRLEGLLAPTASPRPGPSSLGPGLNVDPGTYTWVA ::::::::::::::::::::::::::::::: :::::::::::::::::::::::::::: CCDS33 GAFRLEAAFLEENCADINFSCCYLCIRLEGLPAPTASPRPGPSSLGPGLNVDPGTYTWVA 1990 2000 2010 2020 2030 2040 1480 1490 1500 1510 1520 1530 pF1KSD HGQTEDWDQERRADRQEAPRRVHLFVHHMGMEKVPEEVLRPGTLFTVELLPKQLPDLRKE ::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HGQTQDWDQERRADRQEAPRRVHLFVHHMGMEKVPEEVLRPGTLFTVELLPKQLPDLRKE 2050 2060 2070 2080 2090 2100 1540 1550 1560 1570 1580 1590 pF1KSD EAVRGLEEASPLVTSIALGRPVPQPLCRVIPSRFLERQTYNIPGGRHKLNPSQNVAVREA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EAVRGLEEASPLVTSIALGRPVPQPLCRVIPSRFLERQTYNIPGGRHKLNPSQNVAVREA 2110 2120 2130 2140 2150 2160 1600 1610 1620 1630 1640 1650 pF1KSD LEKPFTVIQGPPGTGKTIVGLHIVFWFHKSNQEQVQPGGPPRGEKRLGGPCILYCGPSNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LEKPFTVIQGPPGTGKTIVGLHIVFWFHKSNQEQVQPGGPPRGEKRLGGPCILYCGPSNK 2170 2180 2190 2200 2210 2220 1660 1670 1680 1690 1700 1710 pF1KSD SVDVLAGLLLRRMELKPLRVYSEQAEASEFPVPRVGSRKLLRKSPREGRPNQSLRSITLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SVDVLAGLLLRRMELKPLRVYSEQAEASEFPVPRVGSRKLLRKSPREGRPNQSLRSITLH 2230 2240 2250 2260 2270 2280 1720 1730 1740 1750 1760 1770 pF1KSD HRIRQAPNPYSSEIKAFDTRLQRGELFSREDLVWYKKVLWEARKFELDRHEVILCTCSCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HRIRQAPNPYSSEIKAFDTRLQRGELFSREDLVWYKKVLWEARKFELDRHEVILCTCSCA 2290 2300 2310 2320 2330 2340 1780 1790 1800 1810 1820 1830 pF1KSD ASASLKILDVRQILVDEAGMATEPETLIPLVQFPQAEKVVLLGDHKQLRPVVKNERLQNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ASASLKILDVRQILVDEAGMATEPETLIPLVQFPQAEKVVLLGDHKQLRPVVKNERLQNL 2350 2360 2370 2380 2390 2400 1840 1850 1860 1870 1880 1890 pF1KSD GLDRSLFERYHEDAHMLDTQYRMHEGICAFPSVAFYKSKLKTWQGLRRPPSVLGHAGKES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GLDRSLFERYHEDAHMLDTQYRMHEGICAFPSVAFYKSKLKTWQGLRRPPSVLGHAGKES 2410 2420 2430 2440 2450 2460 1900 1910 1920 1930 1940 1950 pF1KSD CPVIFGHVQGHERSLLVSTDEGNENSKANLEEVAEVVRITKQLTLGRTVEPQDIAVLTPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CPVIFGHVQGHERSLLVSTDEGNENSKANLEEVAEVVRITKQLTLGRTVEPQDIAVLTPY 2470 2480 2490 2500 2510 2520 1960 1970 1980 1990 2000 2010 pF1KSD NAQASEISKALRREGIAGVAVSSITKSQGSEWRYVLVSTVRTCAKSDLDQRPTKSWLKKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NAQASEISKALRREGIAGVAVSSITKSQGSEWRYVLVSTVRTCAKSDLDQRPTKSWLKKF 2530 2540 2550 2560 2570 2580 2020 2030 2040 2050 2060 2070 pF1KSD LGFVVDPNQVNVAVTRAQEGLCLIGDHLLLRCCPLWRSLLDFCEAQQTLVPAGQVRVCRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LGFVVDPNQVNVAVTRAQEGLCLIGDHLLLRCCPLWRSLLDFCEAQQTLVPAGQVRVCRR 2590 2600 2610 2620 2630 2640 2080 pF1KSD PTMPS ::::: CCDS33 PTMPS >>CCDS42374.1 HELZ gene_id:9931|Hs108|chr17 (1942 aa) initn: 906 init1: 229 opt: 770 Z-score: 804.2 bits: 162.3 E(32554): 1.8e-38 Smith-Waterman score: 931; 41.0% identity (66.3% similar) in 398 aa overlap (6-383:699-1086) 10 20 30 pF1KSD MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVM : ::::.::..:.: .: .:.:.: ::::. CCDS42 PYGTGKTFTLAQAVKHILQQQETRILICTHSNSAADLYIKDYLHPYVEAGNPQARPLRVY 670 680 690 700 710 720 40 50 60 70 80 90 pF1KSD YTDRPLSQTDPVTLQYCCLTDDRQAFRPPTRAELARHRVVVTT--TSQAR-ELRVPVGFF . .: .. . ::. ::: ... ...:. : . .. .:::::.: ::: .: . ::: CCDS42 FRNRWVKTVHPVVHQYCLISSAHSTFQMPQKEDILKHRVVVVTLNTSQYLCQLDLEPGFF 730 740 750 760 770 780 100 110 120 130 140 150 pF1KSD SHILIDEAAQMLECEALTPLAYASHGTRLVLAGDHMQVTPRLFS-VARARAAEHTLLHRL .:::.::::: .:::.. ::: :...::.::::::::..: ..: :: : . .:: :: CCDS42 THILLDEAAQAMECETIMPLALATQNTRIVLAGDHMQLSPFVYSEFARERNLHVSLLDRL 790 800 810 820 830 840 160 170 180 190 200 210 pF1KSD FLCYQQETHEVARQSRLVFHENYRCTDAIVSFISRHFYVAKGNPIHARGKVPPHPRHYPL . : : :... :::: .::... :. :: .: . : :: : : ::: CCDS42 YEHYPAEF-----PCRILLCENYRSHEAIINYTSELFYEGK---LMASGKQPAHKDFYPL 850 860 870 880 890 900 220 230 240 250 260 270 pF1KSD MFCHVAGNPDRDMSMASWLNLAEIAQVVEKVQEAYNTWPSCWGGREQRCICVVSHGA-QV : . :. .. . ... : ::. .:::.:.: :: :: .. : ::. : :: CCDS42 TFFTARGEDVQEKNSTAFYNNAEVFEVVERVEELRRKWPVAWGKLDDGSIGVVTPYADQV 910 920 930 940 950 960 280 290 300 310 320 pF1KSD SALRQELRRRDLGQVSVGSFEILPGRQFRVVVLSTV---HTCQSLLSPGALAPE------ .: :::.. :..:.: . :.::::. :::: :::. .: . CCDS42 FRIRAELRKKRLSDVNVERVLNVQGKQFRVLFLSTVRTRHTCKHKQTPIKKKEQLLEDST 970 980 990 1000 1010 1020 330 340 350 360 370 pF1KSD ------FFTDARVLNTVLTRAQSQLVVVGDAVALCSFGACGKLWESFIRECVERHSVCPE :... ..:::..::::: ..:::: .::::.: : :.:: :: : : :. . CCDS42 EDLDYGFLSNYKLLNTAITRAQSLVAVVGDPIALCSIGRCRKFWERFIALCHENSSL--H 1030 1040 1050 1060 1070 380 390 400 410 420 430 pF1KSD GLSMEQVEQGVAQRRRWPPRGTQAGAAGNWEAAPEPVGDLAEEQAAVVTAMVKAEPGDEA :...::.. CCDS42 GITFEQIKAQLEALELKKTYVLNPLAPEFIPRALRLQHSGSTNKQQQSPPKGKSLHHTQN 1080 1090 1100 1110 1120 1130 >>CCDS82192.1 HELZ gene_id:9931|Hs108|chr17 (1943 aa) initn: 906 init1: 229 opt: 770 Z-score: 804.2 bits: 162.3 E(32554): 1.8e-38 Smith-Waterman score: 931; 41.0% identity (66.3% similar) in 398 aa overlap (6-383:700-1087) 10 20 30 pF1KSD MSSSPSRSAADIYIREYFHSHVSGGHPEATPLRVM : ::::.::..:.: .: .:.:.: ::::. CCDS82 YGTGKTFTLAQAVKHILQQQETSRILICTHSNSAADLYIKDYLHPYVEAGNPQARPLRVY 670 680 690 700 710 720 40 50 60 70 80 90 pF1KSD YTDRPLSQTDPVTLQYCCLTDDRQAFRPPTRAELARHRVVVTT--TSQAR-ELRVPVGFF . .: .. . ::. ::: ... ...:. : . .. .:::::.: ::: .: . ::: CCDS82 FRNRWVKTVHPVVHQYCLISSAHSTFQMPQKEDILKHRVVVVTLNTSQYLCQLDLEPGFF 730 740 750 760 770 780 100 110 120 130 140 150 pF1KSD SHILIDEAAQMLECEALTPLAYASHGTRLVLAGDHMQVTPRLFS-VARARAAEHTLLHRL .:::.::::: .:::.. ::: :...::.::::::::..: ..: :: : . .:: :: CCDS82 THILLDEAAQAMECETIMPLALATQNTRIVLAGDHMQLSPFVYSEFARERNLHVSLLDRL 790 800 810 820 830 840 160 170 180 190 200 210 pF1KSD FLCYQQETHEVARQSRLVFHENYRCTDAIVSFISRHFYVAKGNPIHARGKVPPHPRHYPL . : : :... :::: .::... :. :: .: . : :: : : ::: CCDS82 YEHYPAEF-----PCRILLCENYRSHEAIINYTSELFYEGK---LMASGKQPAHKDFYPL 850 860 870 880 890 900 220 230 240 250 260 270 pF1KSD MFCHVAGNPDRDMSMASWLNLAEIAQVVEKVQEAYNTWPSCWGGREQRCICVVSHGA-QV : . :. .. . ... : ::. .:::.:.: :: :: .. : ::. : :: CCDS82 TFFTARGEDVQEKNSTAFYNNAEVFEVVERVEELRRKWPVAWGKLDDGSIGVVTPYADQV 910 920 930 940 950 960 280 290 300 310 320 pF1KSD SALRQELRRRDLGQVSVGSFEILPGRQFRVVVLSTV---HTCQSLLSPGALAPE------ .: :::.. :..:.: . :.::::. :::: :::. .: . CCDS82 FRIRAELRKKRLSDVNVERVLNVQGKQFRVLFLSTVRTRHTCKHKQTPIKKKEQLLEDST 970 980 990 1000 1010 1020 330 340 350 360 370 pF1KSD ------FFTDARVLNTVLTRAQSQLVVVGDAVALCSFGACGKLWESFIRECVERHSVCPE :... ..:::..::::: ..:::: .::::.: : :.:: :: : : :. . CCDS82 EDLDYGFLSNYKLLNTAITRAQSLVAVVGDPIALCSIGRCRKFWERFIALCHENSSL--H 1030 1040 1050 1060 1070 380 390 400 410 420 430 pF1KSD GLSMEQVEQGVAQRRRWPPRGTQAGAAGNWEAAPEPVGDLAEEQAAVVTAMVKAEPGDEA :...::.. CCDS82 GITFEQIKAQLEALELKKTYVLNPLAPEFIPRALRLQHSGSTNKQQQSPPKGKSLHHTQN 1080 1090 1100 1110 1120 1130 >>CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 (971 aa) initn: 284 init1: 185 opt: 433 Z-score: 451.3 bits: 96.0 E(32554): 8.2e-19 Smith-Waterman score: 496; 24.6% identity (52.9% similar) in 731 aa overlap (491-1165:108-781) 470 480 490 500 510 pF1KSD VKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNAD----DAIL---RELLDES .::: .:.: :.:: :: .:: CCDS10 VMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWP---DLKAAHELCDSILQSRRERENES 80 90 100 110 120 130 520 530 540 550 560 570 pF1KSD QKVMVTVGEDGLLDTVARPESLQQARLYENLPPAA-LRKLLRAEPERYRHCSFVPETFER :. . :.. :: : : .. . .. .: .. .: . .:: .. CCDS10 QE---SHGKE-------YPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFV--RLQG 140 150 160 170 180 580 590 600 610 620 630 pF1KSD ASAIPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHE ::. : .:. : ..: . .. :: :.:.:: :... .::.... . . CCDS10 ASSKDSDLVSD--ILIHGMKARNRSIHGDVVVVELL-----PKNEWKGRTVALCENDCDD 190 200 210 220 230 640 650 660 670 pF1KSD LAFVCRMDTWDPRIMVPINGSVTKIFVAELKD-----PSQVPIYSLRKG----------- . . .: .: .: :. :. . .: ::. . : :. CCDS10 -----KASGESPSEPMP-TGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDY 240 250 260 270 280 680 690 700 710 720 730 pF1KSD RLQRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYS :. .. . ::. .. :.: :.. :: : .:: . . : . . .: : CCDS10 RIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENS 290 300 310 320 330 340 740 750 760 770 780 790 pF1KSD LRVPPSDQATITKVLQKYHTELGRVAG----RREDCR-AFLTFTVDPQGACNLDDALSVR . : : ..: . .. . .:. .:.: : . :.:..::.: ..::.:::: CCDS10 ISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVR 350 360 370 380 390 400 800 810 820 830 840 850 pF1KSD DLGP-RCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLL :. :..:::.::. :: .. .:.::: .....: :. :::. : :. ::: CCDS10 TLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRR-YDMLPSVLSADLCSLL 410 420 430 440 450 460 860 870 880 890 900 pF1KSD PGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHPGAGRELP--- : :: :.:.. ..::: ..:.. .. ....: .: :: :.:.. . .. ..: CCDS10 GGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFK 470 480 490 500 510 520 910 920 930 940 950 pF1KSD -----ARLDSVDACVVAACYFSRLLRRHRLRSD-C-FYEQPDEDGTLGF---RAAHIMVK .: ... : : .. . :. : . : : : . . . . : .. CCDS10 DLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIP 530 540 550 560 570 580 960 970 980 990 1000 1010 pF1KSD EYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHG . .. .. ::: .. . .. :. :. :. .:: ..: : CCDS10 KQPLEVHETVAECMILA--NHWVAKKIWESFPH----QALLRQH----P----------- 590 600 610 620 1020 1030 1040 1050 1060 1070 pF1KSD GGGSPPDTRLHL-LASLWKQVQFAARTQDYEQMVD-LVTTDDMH-PFLAPAGRDL-RKAL :: .. : : : :.. . ..: : ...: : :.. :.. .:. CCDS10 ----PPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAM 630 640 650 660 670 680 1080 1090 1100 1110 1120 pF1KSD ERSAF---GRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHG----- . . : :: ... ::.: .: :: ::::::: :.:..: .. :... CCDS10 SNALYFSTGSCA---EEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEI 690 700 710 720 730 740 1130 1140 1150 1160 1170 1180 pF1KSD -GSAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRC :. .: .:.. ::. .. .. :: :... : . .: CCDS10 KGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSI 750 760 770 780 790 800 1190 1200 1210 1220 1230 1240 pF1KSD FRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPG CCDS10 RTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESV 810 820 830 840 850 860 >>CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054 aa) initn: 284 init1: 185 opt: 433 Z-score: 450.7 bits: 96.0 E(32554): 8.7e-19 Smith-Waterman score: 496; 24.6% identity (52.9% similar) in 731 aa overlap (491-1165:191-864) 470 480 490 500 510 pF1KSD VKEDVVPGACAAGAAAAAGVESTEAEDAEADFWPWDGELNAD----DAIL---RELLDES .::: .:.: :.:: :: .:: CCDS45 VMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWP---DLKAAHELCDSILQSRRERENES 170 180 190 200 210 520 530 540 550 560 570 pF1KSD QKVMVTVGEDGLLDTVARPESLQQARLYENLPPAA-LRKLLRAEPERYRHCSFVPETFER :. . :.. :: : : .. . .. .: .. .: . .:: .. CCDS45 QE---SHGKE-------YPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFV--RLQG 220 230 240 250 260 580 590 600 610 620 630 pF1KSD ASAIPLDDASSGPIQVRGRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHE ::. : .:. : ..: . .. :: :.:.:: :... .::.... . . CCDS45 ASSKDSDLVSD--ILIHGMKARNRSIHGDVVVVELL-----PKNEWKGRTVALCENDCDD 270 280 290 300 310 640 650 660 670 pF1KSD LAFVCRMDTWDPRIMVPINGSVTKIFVAELKD-----PSQVPIYSLRKG----------- . . .: .: .: :. :. . .: ::. . : :. CCDS45 -----KASGESPSEPMP-TGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDY 320 330 340 350 360 370 680 690 700 710 720 730 pF1KSD RLQRVGLERLTAEARHSRLFWVQIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYS :. .. . ::. .. :.: :.. :: : .:: . . : . . .: : CCDS45 RIPKIRISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENS 380 390 400 410 420 430 740 750 760 770 780 790 pF1KSD LRVPPSDQATITKVLQKYHTELGRVAG----RREDCR-AFLTFTVDPQGACNLDDALSVR . : : ..: . .. . .:. .:.: : . :.:..::.: ..::.:::: CCDS45 ISVIPFSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHLVFSIDPKGCEDVDDTLSVR 440 450 460 470 480 490 800 810 820 830 840 850 pF1KSD DLGP-RCEVAVHITDVASFVPRDGVLDVEARRQGAAFYAPGREPVPMLPASLCQDVLSLL :. :..:::.::. :: .. .:.::: .....: :. :::. : :. ::: CCDS45 TLNNGNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRR-YDMLPSVLSADLCSLL 500 510 520 530 540 550 860 870 880 890 900 pF1KSD PGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLSYEEAEEVIRQHPGAGRELP--- : :: :.:.. ..::: ..:.. .. ....: .: :: :.:.. . .. ..: CCDS45 GGVDRYAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFK 560 570 580 590 600 610 910 920 930 940 950 pF1KSD -----ARLDSVDACVVAACYFSRLLRRHRLRSD-C-FYEQPDEDGTLGF---RAAHIMVK .: ... : : .. . :. : . : : : . . . . : .. CCDS45 DLDEKSRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIP 620 630 640 650 660 670 960 970 980 990 1000 1010 pF1KSD EYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDRVPLSLHLGHHLHG . .. .. ::: .. . .. :. :. :. .:: ..: : CCDS45 KQPLEVHETVAECMILA--NHWVAKKIWESFPH----QALLRQH----P----------- 680 690 700 710 1020 1030 1040 1050 1060 1070 pF1KSD GGGSPPDTRLHL-LASLWKQVQFAARTQDYEQMVD-LVTTDDMH-PFLAPAGRDL-RKAL :: .. : : : :.. . ..: : ...: : :.. :.. .:. CCDS45 ----PPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPIVNRLLRSMATQAM 720 730 740 750 760 1080 1090 1100 1110 1120 pF1KSD ERSAF---GRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLALGHG----- . . : :: ... ::.: .: :: ::::::: :.:..: .. :... CCDS45 SNALYFSTGSCA---EEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMAAISKDKKMEI 770 780 790 800 810 820 1130 1140 1150 1160 1170 1180 pF1KSD -GSAYSARDIDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVEAGSRC :. .: .:.. ::. .. .. :: :... : . .: CCDS45 KGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEERCISDGVIYSI 830 840 850 860 870 880 1190 1200 1210 1220 1230 1240 pF1KSD FRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPPLPLPG CCDS45 RTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKITSTTTDGESV 890 900 910 920 930 940 >>CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 (796 aa) initn: 290 init1: 123 opt: 323 Z-score: 335.9 bits: 74.4 E(32554): 2.2e-12 Smith-Waterman score: 424; 24.0% identity (53.2% similar) in 558 aa overlap (620-1167:181-681) 590 600 610 620 630 640 pF1KSD GRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVP :::.:..::. : : CCDS81 EGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRN------------WRPYC--- 160 170 180 190 650 660 670 680 690 700 pF1KSD INGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYY : ..: ...:. :. ... :. :. .: : . ..: . : : : .. : CCDS81 --GMLSK---SDIKE-SRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRY 200 210 220 230 240 710 720 730 740 750 760 pF1KSD PLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCR : : . : ... : ..: ::... : .::... . . . . ::: : CCDS81 PNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLR 250 260 270 280 290 300 770 780 790 800 810 820 pF1KSD AFLTFTVDPQGACNLDDALSVRDL-GPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFY . .::: : ..:::: :.: . ::.:::.::. :. ..:: :. :.:.. : CCDS81 HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVY 310 320 330 340 350 360 830 840 850 860 870 880 pF1KSD APGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLS .. . :.: : ... :: ::::.: . :.. . ::. .:. ::..: .:. CCDS81 LCEKR-IDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKT-KFTKSVINSKASLT 370 380 390 400 410 420 890 900 910 920 930 940 pF1KSD YEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLG : ::. : .:. . :.. . . . ....:...:... . . : CCDS81 YAEAQLRI---DSANMN-----DDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHM 430 440 450 460 470 950 960 970 980 990 1000 pF1KSD FRAAH----IMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDR .: ...:: . . : .: ::.. .. . . : . :. ... CCDS81 DSETHDPIDLQTKE-LRETNSMVEEFMLLANISVA---------------KKIHEEFSEH 480 490 500 510 520 1010 1020 1030 1040 1050 1060 pF1KSD VPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDD--MHPFL . : : .:: . ..:.. .. .. .:. ..... . . :.: CCDS81 ALLRKH---------PAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYL 530 540 550 560 570 1070 1080 1090 1100 1110 1120 pF1KSD APAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLAL : : .: :. : ... ::.: :: ::::::: ::...: . .:. CCDS81 NTLLRILATRCMMQAVYFCS-GMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAI 580 590 600 610 620 630 1130 1140 1150 1160 1170 pF1KSD GHGGSAYSARD---IDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVE : . : . .:. ....: .:: :: . ..: . .:.. CCDS81 GADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFV 640 650 660 670 680 690 1180 1190 1200 1210 1220 1230 pF1KSD AGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPP CCDS81 RKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDS 700 710 720 730 740 750 >>CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 (928 aa) initn: 290 init1: 123 opt: 323 Z-score: 334.9 bits: 74.4 E(32554): 2.5e-12 Smith-Waterman score: 424; 24.0% identity (53.2% similar) in 558 aa overlap (620-1167:313-813) 590 600 610 620 630 640 pF1KSD GRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVP :::.:..::. : : CCDS45 EGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRN------------WRPYC--- 290 300 310 320 650 660 670 680 690 700 pF1KSD INGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYY : ..: ...:. :. ... :. :. .: : . ..: . : : : .. : CCDS45 --GMLSK---SDIKE-SRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRY 330 340 350 360 370 380 710 720 730 740 750 760 pF1KSD PLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCR : : . : ... : ..: ::... : .::... . . . . ::: : CCDS45 PNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLR 390 400 410 420 430 440 770 780 790 800 810 820 pF1KSD AFLTFTVDPQGACNLDDALSVRDL-GPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFY . .::: : ..:::: :.: . ::.:::.::. :. ..:: :. :.:.. : CCDS45 HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVY 450 460 470 480 490 500 830 840 850 860 870 880 pF1KSD APGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLS .. . :.: : ... :: ::::.: . :.. . ::. .:. ::..: .:. CCDS45 LCEKR-IDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKT-KFTKSVINSKASLT 510 520 530 540 550 890 900 910 920 930 940 pF1KSD YEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLG : ::. : .:. . :.. . . . ....:...:... . . : CCDS45 YAEAQLRI---DSANMN-----DDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHM 560 570 580 590 600 610 950 960 970 980 990 1000 pF1KSD FRAAH----IMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDR .: ...:: . . : .: ::.. .. . . : . :. ... CCDS45 DSETHDPIDLQTKE-LRETNSMVEEFMLLANISVA---------------KKIHEEFSEH 620 630 640 650 1010 1020 1030 1040 1050 1060 pF1KSD VPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDD--MHPFL . : : .:: . ..:.. .. .. .:. ..... . . :.: CCDS45 ALLRKH---------PAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYL 660 670 680 690 700 1070 1080 1090 1100 1110 1120 pF1KSD APAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLAL : : .: :. : ... ::.: :: ::::::: ::...: . .:. CCDS45 NTLLRILATRCMMQAVYFCS-GMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAI 710 720 730 740 750 760 1130 1140 1150 1160 1170 pF1KSD GHGGSAYSARD---IDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVE : . : . .:. ....: .:: :: . ..: . .:.. CCDS45 GADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFV 770 780 790 800 810 820 1180 1190 1200 1210 1220 1230 pF1KSD AGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPP CCDS45 RKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDS 830 840 850 860 870 880 >>CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 (958 aa) initn: 290 init1: 123 opt: 323 Z-score: 334.7 bits: 74.4 E(32554): 2.5e-12 Smith-Waterman score: 424; 24.0% identity (53.2% similar) in 558 aa overlap (620-1167:343-843) 590 600 610 620 630 640 pF1KSD GRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVP :::.:..::. : : CCDS94 EGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRN------------WRPYC--- 320 330 340 350 650 660 670 680 690 700 pF1KSD INGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYY : ..: ...:. :. ... :. :. .: : . ..: . : : : .. : CCDS94 --GMLSK---SDIKE-SRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRY 360 370 380 390 400 410 710 720 730 740 750 760 pF1KSD PLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCR : : . : ... : ..: ::... : .::... . . . . ::: : CCDS94 PNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLR 420 430 440 450 460 470 770 780 790 800 810 820 pF1KSD AFLTFTVDPQGACNLDDALSVRDL-GPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFY . .::: : ..:::: :.: . ::.:::.::. :. ..:: :. :.:.. : CCDS94 HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVY 480 490 500 510 520 530 830 840 850 860 870 880 pF1KSD APGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLS .. . :.: : ... :: ::::.: . :.. . ::. .:. ::..: .:. CCDS94 LCEKR-IDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKT-KFTKSVINSKASLT 540 550 560 570 580 890 900 910 920 930 940 pF1KSD YEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLG : ::. : .:. . :.. . . . ....:...:... . . : CCDS94 YAEAQLRI---DSANMN-----DDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHM 590 600 610 620 630 640 950 960 970 980 990 1000 pF1KSD FRAAH----IMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDR .: ...:: . . : .: ::.. .. . . : . :. ... CCDS94 DSETHDPIDLQTKE-LRETNSMVEEFMLLANISVA---------------KKIHEEFSEH 650 660 670 680 1010 1020 1030 1040 1050 1060 pF1KSD VPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLVTTDD--MHPFL . : : .:: . ..:.. .. .. .:. ..... . . :.: CCDS94 ALLRKH---------PAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYL 690 700 710 720 730 1070 1080 1090 1100 1110 1120 pF1KSD APAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLAL : : .: :. : ... ::.: :: ::::::: ::...: . .:. CCDS94 NTLLRILATRCMMQAVYFCS-GMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAI 740 750 760 770 780 790 1130 1140 1150 1160 1170 pF1KSD GHGGSAYSARD---IDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVE : . : . .:. ....: .:: :: . ..: . .:.. CCDS94 GADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFV 800 810 820 830 840 850 1180 1190 1200 1210 1220 1230 pF1KSD AGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPP CCDS94 RKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDS 860 870 880 890 900 910 >>CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 (603 aa) initn: 124 init1: 124 opt: 302 Z-score: 315.4 bits: 70.2 E(32554): 3e-11 Smith-Waterman score: 302; 25.9% identity (53.8% similar) in 424 aa overlap (499-909:106-511) 470 480 490 500 510 520 pF1KSD ACAAGAAAAAGVESTEAEDAEADFWPWDGELNADDAILRELLDESQKVMVTVGEDGLLDT ::.: .... : .: ::. ..: .: CCDS58 NPKKFHEAFIPSPDGDRDIFIDGVVARNRALNGDLVVVKLLPEEHWKVVKPESNDK--ET 80 90 100 110 120 130 530 540 550 560 570 580 pF1KSD VARPES-LQQARLYENLPPAALRKLLRAEPERYRHCSFVPETFERASAIP----LDDASS : :: . . ..:: .:.. :. . .: : . .: .: ... CCDS58 EAAYESDIPEELCGHHLPQQSLKSY-NDSPDVIVEAQFDGSDSEDGHGITQNVLVDGVKK 140 150 160 170 180 190 590 600 610 620 630 pF1KSD GPIQV--RGRLDCGMAFAGDEVLVQLLSGDKAPEGRLR--GRVLGVLKRKRHELAFVCRM . : .:: : . ::. . : :. ..:. .:..:. : CCDS58 LSVCVSEKGREDGDAPVTKDETTCISQDTRALSEKSLQRSAKVVYILEKKHS------RA 200 210 220 230 240 640 650 660 670 680 690 pF1KSD DTWDPRIMVPINGSVTKIFVAELKDPSQVP-IYSLRKGRLQRVGLERLTAEARHSRLFWV : .... :. . . .. . .:: :: : : . : : . :: CCDS58 ATGFLKLLADKNSELFRKYALFSPSDHRVPRIYVPLKDCPQDF-VARPKDYA--NTLFIC 250 260 270 280 290 300 700 710 720 730 740 750 pF1KSD QIVLWRQGFYYPLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTEL .:: :.. . :: . . : .:. : . . ::.. .. .. . : . CCDS58 RIVDWKEDCNFALGQLAKSLGQAGEIEPETEGILTEYGVDFSDFSSEVLECLPQGLPWTI 310 320 330 340 350 360 760 770 780 790 800 810 pF1KSD G-RVAGRREDCRAFLTFTVDPQGACNLDDALSVRDLGP-RCEVAVHITDVASFVPRDGVL . ..:.: : ::.::. : .:::::: . :. .:.:::.::. :::. . : CCDS58 PPEEFSKRRDLRKDCIFTIDPSTARDLDDALSCKPLADGNFKVGVHIADVSYFVPEGSDL 370 380 390 400 410 420 820 830 840 850 860 870 pF1KSD D-VEARRQGAAFYAPGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLR : : :.: ... . .. ::::: ::... :: : :.:..:.. :. :.. . CCDS58 DKVAAERATSVYLV--QKVVPMLPRLLCEELCSLNPMSDKLTFSVIWTLTPE-GKILDEW 430 440 450 460 470 480 880 890 900 910 920 930 pF1KSD FAPSVVQSDRQLSYEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSD :. ....: .::::.:. .: . : ...::. CCDS58 FGRTIIRSCTKLSYEHAQSMI-ESP--TEKIPAKELPPISPEHSSEEVHQQNADKDGAAH 490 500 510 520 530 940 950 960 970 980 990 pF1KSD CFYEQPDEDGTLGFRAAHIMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLK CCDS58 LQASHSPSAEDAEAQPSTEERLPETRGICDRDPDTRLFFLQQQSRVLEAKPQNTIRVEEQ 540 550 560 570 580 590 2080 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 19:10:15 2016 done: Thu Nov 3 19:10:16 2016 Total Scan time: 5.870 Total Display time: 0.590 Function used was FASTA [36.3.4 Apr, 2011]