FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0760, 1224 aa 1>>>pF1KSDA0760 1224 - 1224 aa - 1224 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.3591+/-0.00126; mu= 13.8267+/- 0.074 mean_var=230.9917+/-49.383, 0's: 0 Z-trim(108.9): 882 B-trim: 136 in 1/50 Lambda= 0.084387 statistics sampled from 9507 (10497) to 9507 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.657), E-opt: 0.2 (0.322), width: 16 Scan time: 3.980 The best scores are: opt bits E(32554) CCDS61930.1 ZNF423 gene_id:23090|Hs108|chr16 (1224) 8620 1064.4 0 CCDS32445.1 ZNF423 gene_id:23090|Hs108|chr16 (1284) 8620 1064.4 0 CCDS81979.1 ZNF423 gene_id:23090|Hs108|chr16 (1167) 8206 1013.9 0 CCDS32806.1 ZNF521 gene_id:25925|Hs108|chr18 (1311) 3663 460.9 9.3e-129 CCDS77167.1 ZNF521 gene_id:25925|Hs108|chr18 (1091) 3532 444.9 5.2e-124 CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252) 589 86.6 4.1e-16 CCDS42447.1 ZNF236 gene_id:7776|Hs108|chr18 (1845) 537 80.5 4.2e-14 CCDS77201.1 ZNF236 gene_id:7776|Hs108|chr18 (1847) 537 80.5 4.2e-14 CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058) 497 75.4 8.7e-13 CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090) 497 75.4 8.9e-13 CCDS46170.1 ZNF845 gene_id:91664|Hs108|chr19 ( 970) 471 72.1 7.4e-12 CCDS42183.1 ZFP90 gene_id:146198|Hs108|chr16 ( 636) 456 70.1 2e-11 >>CCDS61930.1 ZNF423 gene_id:23090|Hs108|chr16 (1224 aa) initn: 8620 init1: 8620 opt: 8620 Z-score: 5686.9 bits: 1064.4 E(32554): 0 Smith-Waterman score: 8620; 100.0% identity (100.0% similar) in 1224 aa overlap (1-1224:1-1224) 10 20 30 40 50 60 pF1KSD MEDESIYTCDHCQQDFESLADLTDHRAHRCPGDGDDDPQLSWVASSPSSKDVASPTQMIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MEDESIYTCDHCQQDFESLADLTDHRAHRCPGDGDDDPQLSWVASSPSSKDVASPTQMIG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD DGCDLGLGEEEGGTGLPYPCQFCDKSFIRLSYLKRHEQIHSDKLPFKCTYCSRLFKHKRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 DGCDLGLGEEEGGTGLPYPCQFCDKSFIRLSYLKRHEQIHSDKLPFKCTYCSRLFKHKRS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD RDRHIKLHTGDKKYHCHECEAAFSRSDHLKIHLKTHSSSKPFKCTVCKRGFSSTSSLQSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 RDRHIKLHTGDKKYHCHECEAAFSRSDHLKIHLKTHSSSKPFKCTVCKRGFSSTSSLQSH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD MQAHKKNKEHLAKSEKEAKKDDFMCDYCEDTFSQTEELEKHVLTRHPQLSEKADLQCIHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MQAHKKNKEHLAKSEKEAKKDDFMCDYCEDTFSQTEELEKHVLTRHPQLSEKADLQCIHC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD PEVFVDENTLLAHIHQAHANQKHKCPMCPEQFSSVEGVYCHLDSHRQPDSSNHSVSPDPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PEVFVDENTLLAHIHQAHANQKHKCPMCPEQFSSVEGVYCHLDSHRQPDSSNHSVSPDPV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD LGSVASMSSATPDSSASVERGSTPDSTLKPLRGQKKMRDDGQGWTKVVYSCPYCSKRDFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LGSVASMSSATPDSSASVERGSTPDSTLKPLRGQKKMRDDGQGWTKVVYSCPYCSKRDFN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SLAVLEIHLKTIHADKPQQSHTCQICLDSMPTLYNLNEHVRKLHKNHAYPVMQFGNISAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 SLAVLEIHLKTIHADKPQQSHTCQICLDSMPTLYNLNEHVRKLHKNHAYPVMQFGNISAF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD HCNYCPEMFADINSLQEHIRVSHCGPNANPSDGNNAFFCNQCSMGFLTESSLTEHIQQAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 HCNYCPEMFADINSLQEHIRVSHCGPNANPSDGNNAFFCNQCSMGFLTESSLTEHIQQAH 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD CSVGSAKLESPVVQPTQSFMEVYSCPYCTNSPIFGSILKLTKHIKENHKNIPLAHSKKSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 CSVGSAKLESPVVQPTQSFMEVYSCPYCTNSPIFGSILKLTKHIKENHKNIPLAHSKKSK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD AEQSPVSSDVEVSSPKRQRLSASANSISNGEYPCNQCDLKFSNFESFQTHLKLHLELLLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 AEQSPVSSDVEVSSPKRQRLSASANSISNGEYPCNQCDLKFSNFESFQTHLKLHLELLLR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD KQACPQCKEDFDSQESLLQHLTVHYMTTSTHYVCESCDKQFSSVDDLQKHLLDMHTFVLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KQACPQCKEDFDSQESLLQHLTVHYMTTSTHYVCESCDKQFSSVDDLQKHLLDMHTFVLY 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD HCTLCQEVFDSKVSIQVHLAVKHSNEKKMYRCTACNWDFRKEADLQVHVKHSHLGNPAKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 HCTLCQEVFDSKVSIQVHLAVKHSNEKKMYRCTACNWDFRKEADLQVHVKHSHLGNPAKA 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD HKCIFCGETFSTEVELQCHITTHSKKYNCKFCSKAFHAIILLEKHLREKHCVFDAATENG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 HKCIFCGETFSTEVELQCHITTHSKKYNCKFCSKAFHAIILLEKHLREKHCVFDAATENG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD TANGVPPMATKKAEPADLQGMLLKNPEAPNSHEASEDDVDASEPMYGCDICGAAYTMEVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 TANGVPPMATKKAEPADLQGMLLKNPEAPNSHEASEDDVDASEPMYGCDICGAAYTMEVL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD LQNHRLRDHNIRPGEDDGSRKKAEFIKGSHKCNVCSRTFFSENGLREHLQTHRGPAKHYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LQNHRLRDHNIRPGEDDGSRKKAEFIKGSHKCNVCSRTFFSENGLREHLQTHRGPAKHYM 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD CPICGERFPSLLTLTEHKVTHSKSLDTGTCRICKMPLQSEEEFIEHCQMHPDLRNSLTGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 CPICGERFPSLLTLTEHKVTHSKSLDTGTCRICKMPLQSEEEFIEHCQMHPDLRNSLTGF 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD RCVVCMQTVTSTLELKIHGTFHMQKLAGSSAASSPNGQGLQKLYKCALCLKEFRSKQDLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 RCVVCMQTVTSTLELKIHGTFHMQKLAGSSAASSPNGQGLQKLYKCALCLKEFRSKQDLV 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD KLDVNGLPYGLCAGCMARSANGQVGGLAPPEPADRPCAGLRCPECSVKFESAEDLESHMQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KLDVNGLPYGLCAGCMARSANGQVGGLAPPEPADRPCAGLRCPECSVKFESAEDLESHMQ 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD VDHRDLTPETSGPRKGTQTSPVPRKKTYQCIKCQMTFENEREIQIHVANHMIEEGINHEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 VDHRDLTPETSGPRKGTQTSPVPRKKTYQCIKCQMTFENEREIQIHVANHMIEEGINHEC 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD KLCNQMFDSPAKLLCHLIEHSFEGMGGTFKCPVCFTVFVQANKLQQHIFAVHGQEDKIYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KLCNQMFDSPAKLLCHLIEHSFEGMGGTFKCPVCFTVFVQANKLQQHIFAVHGQEDKIYD 1150 1160 1170 1180 1190 1200 1210 1220 pF1KSD CSQCPQKFFFQTELQNHTMSQHAQ :::::::::::::::::::::::: CCDS61 CSQCPQKFFFQTELQNHTMSQHAQ 1210 1220 >>CCDS32445.1 ZNF423 gene_id:23090|Hs108|chr16 (1284 aa) initn: 8620 init1: 8620 opt: 8620 Z-score: 5686.7 bits: 1064.4 E(32554): 0 Smith-Waterman score: 8620; 100.0% identity (100.0% similar) in 1224 aa overlap (1-1224:61-1284) 10 20 30 pF1KSD MEDESIYTCDHCQQDFESLADLTDHRAHRC :::::::::::::::::::::::::::::: CCDS32 EPECDQKTSRALEDRNSVTSQEERNEDDEDMEDESIYTCDHCQQDFESLADLTDHRAHRC 40 50 60 70 80 90 40 50 60 70 80 90 pF1KSD PGDGDDDPQLSWVASSPSSKDVASPTQMIGDGCDLGLGEEEGGTGLPYPCQFCDKSFIRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PGDGDDDPQLSWVASSPSSKDVASPTQMIGDGCDLGLGEEEGGTGLPYPCQFCDKSFIRL 100 110 120 130 140 150 100 110 120 130 140 150 pF1KSD SYLKRHEQIHSDKLPFKCTYCSRLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRSDHLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SYLKRHEQIHSDKLPFKCTYCSRLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRSDHLK 160 170 180 190 200 210 160 170 180 190 200 210 pF1KSD IHLKTHSSSKPFKCTVCKRGFSSTSSLQSHMQAHKKNKEHLAKSEKEAKKDDFMCDYCED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IHLKTHSSSKPFKCTVCKRGFSSTSSLQSHMQAHKKNKEHLAKSEKEAKKDDFMCDYCED 220 230 240 250 260 270 220 230 240 250 260 270 pF1KSD TFSQTEELEKHVLTRHPQLSEKADLQCIHCPEVFVDENTLLAHIHQAHANQKHKCPMCPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 TFSQTEELEKHVLTRHPQLSEKADLQCIHCPEVFVDENTLLAHIHQAHANQKHKCPMCPE 280 290 300 310 320 330 280 290 300 310 320 330 pF1KSD QFSSVEGVYCHLDSHRQPDSSNHSVSPDPVLGSVASMSSATPDSSASVERGSTPDSTLKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 QFSSVEGVYCHLDSHRQPDSSNHSVSPDPVLGSVASMSSATPDSSASVERGSTPDSTLKP 340 350 360 370 380 390 340 350 360 370 380 390 pF1KSD LRGQKKMRDDGQGWTKVVYSCPYCSKRDFNSLAVLEIHLKTIHADKPQQSHTCQICLDSM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LRGQKKMRDDGQGWTKVVYSCPYCSKRDFNSLAVLEIHLKTIHADKPQQSHTCQICLDSM 400 410 420 430 440 450 400 410 420 430 440 450 pF1KSD PTLYNLNEHVRKLHKNHAYPVMQFGNISAFHCNYCPEMFADINSLQEHIRVSHCGPNANP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PTLYNLNEHVRKLHKNHAYPVMQFGNISAFHCNYCPEMFADINSLQEHIRVSHCGPNANP 460 470 480 490 500 510 460 470 480 490 500 510 pF1KSD SDGNNAFFCNQCSMGFLTESSLTEHIQQAHCSVGSAKLESPVVQPTQSFMEVYSCPYCTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SDGNNAFFCNQCSMGFLTESSLTEHIQQAHCSVGSAKLESPVVQPTQSFMEVYSCPYCTN 520 530 540 550 560 570 520 530 540 550 560 570 pF1KSD SPIFGSILKLTKHIKENHKNIPLAHSKKSKAEQSPVSSDVEVSSPKRQRLSASANSISNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SPIFGSILKLTKHIKENHKNIPLAHSKKSKAEQSPVSSDVEVSSPKRQRLSASANSISNG 580 590 600 610 620 630 580 590 600 610 620 630 pF1KSD EYPCNQCDLKFSNFESFQTHLKLHLELLLRKQACPQCKEDFDSQESLLQHLTVHYMTTST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EYPCNQCDLKFSNFESFQTHLKLHLELLLRKQACPQCKEDFDSQESLLQHLTVHYMTTST 640 650 660 670 680 690 640 650 660 670 680 690 pF1KSD HYVCESCDKQFSSVDDLQKHLLDMHTFVLYHCTLCQEVFDSKVSIQVHLAVKHSNEKKMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 HYVCESCDKQFSSVDDLQKHLLDMHTFVLYHCTLCQEVFDSKVSIQVHLAVKHSNEKKMY 700 710 720 730 740 750 700 710 720 730 740 750 pF1KSD RCTACNWDFRKEADLQVHVKHSHLGNPAKAHKCIFCGETFSTEVELQCHITTHSKKYNCK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RCTACNWDFRKEADLQVHVKHSHLGNPAKAHKCIFCGETFSTEVELQCHITTHSKKYNCK 760 770 780 790 800 810 760 770 780 790 800 810 pF1KSD FCSKAFHAIILLEKHLREKHCVFDAATENGTANGVPPMATKKAEPADLQGMLLKNPEAPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 FCSKAFHAIILLEKHLREKHCVFDAATENGTANGVPPMATKKAEPADLQGMLLKNPEAPN 820 830 840 850 860 870 820 830 840 850 860 870 pF1KSD SHEASEDDVDASEPMYGCDICGAAYTMEVLLQNHRLRDHNIRPGEDDGSRKKAEFIKGSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SHEASEDDVDASEPMYGCDICGAAYTMEVLLQNHRLRDHNIRPGEDDGSRKKAEFIKGSH 880 890 900 910 920 930 880 890 900 910 920 930 pF1KSD KCNVCSRTFFSENGLREHLQTHRGPAKHYMCPICGERFPSLLTLTEHKVTHSKSLDTGTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KCNVCSRTFFSENGLREHLQTHRGPAKHYMCPICGERFPSLLTLTEHKVTHSKSLDTGTC 940 950 960 970 980 990 940 950 960 970 980 990 pF1KSD RICKMPLQSEEEFIEHCQMHPDLRNSLTGFRCVVCMQTVTSTLELKIHGTFHMQKLAGSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RICKMPLQSEEEFIEHCQMHPDLRNSLTGFRCVVCMQTVTSTLELKIHGTFHMQKLAGSS 1000 1010 1020 1030 1040 1050 1000 1010 1020 1030 1040 1050 pF1KSD AASSPNGQGLQKLYKCALCLKEFRSKQDLVKLDVNGLPYGLCAGCMARSANGQVGGLAPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 AASSPNGQGLQKLYKCALCLKEFRSKQDLVKLDVNGLPYGLCAGCMARSANGQVGGLAPP 1060 1070 1080 1090 1100 1110 1060 1070 1080 1090 1100 1110 pF1KSD EPADRPCAGLRCPECSVKFESAEDLESHMQVDHRDLTPETSGPRKGTQTSPVPRKKTYQC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EPADRPCAGLRCPECSVKFESAEDLESHMQVDHRDLTPETSGPRKGTQTSPVPRKKTYQC 1120 1130 1140 1150 1160 1170 1120 1130 1140 1150 1160 1170 pF1KSD IKCQMTFENEREIQIHVANHMIEEGINHECKLCNQMFDSPAKLLCHLIEHSFEGMGGTFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IKCQMTFENEREIQIHVANHMIEEGINHECKLCNQMFDSPAKLLCHLIEHSFEGMGGTFK 1180 1190 1200 1210 1220 1230 1180 1190 1200 1210 1220 pF1KSD CPVCFTVFVQANKLQQHIFAVHGQEDKIYDCSQCPQKFFFQTELQNHTMSQHAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CPVCFTVFVQANKLQQHIFAVHGQEDKIYDCSQCPQKFFFQTELQNHTMSQHAQ 1240 1250 1260 1270 1280 >>CCDS81979.1 ZNF423 gene_id:23090|Hs108|chr16 (1167 aa) initn: 8206 init1: 8206 opt: 8206 Z-score: 5414.8 bits: 1013.9 E(32554): 0 Smith-Waterman score: 8206; 100.0% identity (100.0% similar) in 1167 aa overlap (58-1224:1-1167) 30 40 50 60 70 80 pF1KSD HRCPGDGDDDPQLSWVASSPSSKDVASPTQMIGDGCDLGLGEEEGGTGLPYPCQFCDKSF :::::::::::::::::::::::::::::: CCDS81 MIGDGCDLGLGEEEGGTGLPYPCQFCDKSF 10 20 30 90 100 110 120 130 140 pF1KSD IRLSYLKRHEQIHSDKLPFKCTYCSRLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 IRLSYLKRHEQIHSDKLPFKCTYCSRLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRSD 40 50 60 70 80 90 150 160 170 180 190 200 pF1KSD HLKIHLKTHSSSKPFKCTVCKRGFSSTSSLQSHMQAHKKNKEHLAKSEKEAKKDDFMCDY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 HLKIHLKTHSSSKPFKCTVCKRGFSSTSSLQSHMQAHKKNKEHLAKSEKEAKKDDFMCDY 100 110 120 130 140 150 210 220 230 240 250 260 pF1KSD CEDTFSQTEELEKHVLTRHPQLSEKADLQCIHCPEVFVDENTLLAHIHQAHANQKHKCPM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 CEDTFSQTEELEKHVLTRHPQLSEKADLQCIHCPEVFVDENTLLAHIHQAHANQKHKCPM 160 170 180 190 200 210 270 280 290 300 310 320 pF1KSD CPEQFSSVEGVYCHLDSHRQPDSSNHSVSPDPVLGSVASMSSATPDSSASVERGSTPDST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 CPEQFSSVEGVYCHLDSHRQPDSSNHSVSPDPVLGSVASMSSATPDSSASVERGSTPDST 220 230 240 250 260 270 330 340 350 360 370 380 pF1KSD LKPLRGQKKMRDDGQGWTKVVYSCPYCSKRDFNSLAVLEIHLKTIHADKPQQSHTCQICL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LKPLRGQKKMRDDGQGWTKVVYSCPYCSKRDFNSLAVLEIHLKTIHADKPQQSHTCQICL 280 290 300 310 320 330 390 400 410 420 430 440 pF1KSD DSMPTLYNLNEHVRKLHKNHAYPVMQFGNISAFHCNYCPEMFADINSLQEHIRVSHCGPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 DSMPTLYNLNEHVRKLHKNHAYPVMQFGNISAFHCNYCPEMFADINSLQEHIRVSHCGPN 340 350 360 370 380 390 450 460 470 480 490 500 pF1KSD ANPSDGNNAFFCNQCSMGFLTESSLTEHIQQAHCSVGSAKLESPVVQPTQSFMEVYSCPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 ANPSDGNNAFFCNQCSMGFLTESSLTEHIQQAHCSVGSAKLESPVVQPTQSFMEVYSCPY 400 410 420 430 440 450 510 520 530 540 550 560 pF1KSD CTNSPIFGSILKLTKHIKENHKNIPLAHSKKSKAEQSPVSSDVEVSSPKRQRLSASANSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 CTNSPIFGSILKLTKHIKENHKNIPLAHSKKSKAEQSPVSSDVEVSSPKRQRLSASANSI 460 470 480 490 500 510 570 580 590 600 610 620 pF1KSD SNGEYPCNQCDLKFSNFESFQTHLKLHLELLLRKQACPQCKEDFDSQESLLQHLTVHYMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 SNGEYPCNQCDLKFSNFESFQTHLKLHLELLLRKQACPQCKEDFDSQESLLQHLTVHYMT 520 530 540 550 560 570 630 640 650 660 670 680 pF1KSD TSTHYVCESCDKQFSSVDDLQKHLLDMHTFVLYHCTLCQEVFDSKVSIQVHLAVKHSNEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 TSTHYVCESCDKQFSSVDDLQKHLLDMHTFVLYHCTLCQEVFDSKVSIQVHLAVKHSNEK 580 590 600 610 620 630 690 700 710 720 730 740 pF1KSD KMYRCTACNWDFRKEADLQVHVKHSHLGNPAKAHKCIFCGETFSTEVELQCHITTHSKKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 KMYRCTACNWDFRKEADLQVHVKHSHLGNPAKAHKCIFCGETFSTEVELQCHITTHSKKY 640 650 660 670 680 690 750 760 770 780 790 800 pF1KSD NCKFCSKAFHAIILLEKHLREKHCVFDAATENGTANGVPPMATKKAEPADLQGMLLKNPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 NCKFCSKAFHAIILLEKHLREKHCVFDAATENGTANGVPPMATKKAEPADLQGMLLKNPE 700 710 720 730 740 750 810 820 830 840 850 860 pF1KSD APNSHEASEDDVDASEPMYGCDICGAAYTMEVLLQNHRLRDHNIRPGEDDGSRKKAEFIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 APNSHEASEDDVDASEPMYGCDICGAAYTMEVLLQNHRLRDHNIRPGEDDGSRKKAEFIK 760 770 780 790 800 810 870 880 890 900 910 920 pF1KSD GSHKCNVCSRTFFSENGLREHLQTHRGPAKHYMCPICGERFPSLLTLTEHKVTHSKSLDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 GSHKCNVCSRTFFSENGLREHLQTHRGPAKHYMCPICGERFPSLLTLTEHKVTHSKSLDT 820 830 840 850 860 870 930 940 950 960 970 980 pF1KSD GTCRICKMPLQSEEEFIEHCQMHPDLRNSLTGFRCVVCMQTVTSTLELKIHGTFHMQKLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 GTCRICKMPLQSEEEFIEHCQMHPDLRNSLTGFRCVVCMQTVTSTLELKIHGTFHMQKLA 880 890 900 910 920 930 990 1000 1010 1020 1030 1040 pF1KSD GSSAASSPNGQGLQKLYKCALCLKEFRSKQDLVKLDVNGLPYGLCAGCMARSANGQVGGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 GSSAASSPNGQGLQKLYKCALCLKEFRSKQDLVKLDVNGLPYGLCAGCMARSANGQVGGL 940 950 960 970 980 990 1050 1060 1070 1080 1090 1100 pF1KSD APPEPADRPCAGLRCPECSVKFESAEDLESHMQVDHRDLTPETSGPRKGTQTSPVPRKKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 APPEPADRPCAGLRCPECSVKFESAEDLESHMQVDHRDLTPETSGPRKGTQTSPVPRKKT 1000 1010 1020 1030 1040 1050 1110 1120 1130 1140 1150 1160 pF1KSD YQCIKCQMTFENEREIQIHVANHMIEEGINHECKLCNQMFDSPAKLLCHLIEHSFEGMGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 YQCIKCQMTFENEREIQIHVANHMIEEGINHECKLCNQMFDSPAKLLCHLIEHSFEGMGG 1060 1070 1080 1090 1100 1110 1170 1180 1190 1200 1210 1220 pF1KSD TFKCPVCFTVFVQANKLQQHIFAVHGQEDKIYDCSQCPQKFFFQTELQNHTMSQHAQ ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 TFKCPVCFTVFVQANKLQQHIFAVHGQEDKIYDCSQCPQKFFFQTELQNHTMSQHAQ 1120 1130 1140 1150 1160 >>CCDS32806.1 ZNF521 gene_id:25925|Hs108|chr18 (1311 aa) initn: 3722 init1: 1245 opt: 3663 Z-score: 2425.1 bits: 460.9 E(32554): 9.3e-129 Smith-Waterman score: 5658; 63.9% identity (82.5% similar) in 1280 aa overlap (1-1223:41-1310) 10 20 30 pF1KSD MEDESIYTCDHCQQDFESLADLTDHRAHRC .:::....:: : : ::::.:.:.:. ..: CCDS32 SLKDPNCKLEDKTEDGEALDCKKRPEDGEELEDEAVHSCDSCLQVFESLSDITEHKINQC 20 30 40 50 60 70 40 50 60 70 80 pF1KSD P-GDG---DDDPQLSWVASSPSSKDVASPTQMIGDGCDLGLGEEEGGTGLPYPCQFCDKS :: .::: :: :::::::: .::.. :.:::.: ::::: :::::::::::: CCDS32 QLTDGVDVEDDPTCSWPASSPSSKDQTSPSH--GEGCDFG--EEEGGPGLPYPCQFCDKS 80 90 100 110 120 90 100 110 120 130 140 pF1KSD FIRLSYLKRHEQIHSDKLPFKCTYCSRLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRS : ::::::.::: ::::::::::::::::::::::::::::::::::::: ::.:::::: CCDS32 FSRLSYLKHHEQSHSDKLPFKCTYCSRLFKHKRSRDRHIKLHTGDKKYHCSECDAAFSRS 130 140 150 160 170 180 150 160 170 180 190 200 pF1KSD DHLKIHLKTHSSSKPFKCTVCKRGFSSTSSLQSHMQAHKKNKEHL---AKSEKEAKKDDF ::::::::::.:.::.::..:.::: :.:::..:::.:..::. .. : :: CCDS32 DHLKIHLKTHTSNKPYKCAICRRGFLSSSSLHGHMQVHERNKDGSQSGSRMEDWKMKDTQ 190 200 210 220 230 240 210 220 230 240 250 260 pF1KSD MCDYCEDTFSQTEELEKHVLTRHPQLS---EKADLQCIHCPEVFVDENTLLAHIHQAHAN :. ::. :. :.:.::. ::. : ..: :::..: :.::.:..:. :..:.:.. CCDS32 KCSQCEEGFDFPEDLQKHIAECHPECSPNEDRAALQCVYCHELFVEETSLMNHMEQVHSG 250 260 270 280 290 300 270 280 290 300 310 pF1KSD QK-HKCPMCPEQFSSVEGVYCHLDSHRQPDSSNHSVSPDPVLGSVASMSSATPDSSASVE .: ..: .: :.: .:: .: :.:::.::.: ::: ::. : . .:.::.::::. ::. CCDS32 EKKNSCSICSESFHTVEELYSHMDSHQQPESCNHSNSPSLVTVGYTSVSSTTPDSNLSVD 310 320 330 340 350 360 320 330 340 350 360 pF1KSD RGSTPDSTLKPL---RGQKK-------MRDDGQGWTKVVYSCPYCSKRDFNSLAVLEIHL .:: . :. ::.:. : .. .::.::: ::.:. :.:::::.::: CCDS32 -SSTMVEAAPPIPKSRGRKRAAQQTPDMTGPSSKQAKVTYSCIYCNKQLFSSLAVLQIHL 370 380 390 400 410 420 370 380 390 400 410 420 pF1KSD KTIHADKPQQSHTCQICLDSMPTLYNLNEHVRKLHKNHAYPVMQFGNISA--FHCNYCPE ::.: :::.:.: :: ::. .:.:::::::....:. . : . . . : ..::.: : CCDS32 KTMHLDKPEQAHICQYCLEVLPSLYNLNEHLKQVHEAQD-PGLIVSAMPAIVYQCNFCSE 430 440 450 460 470 480 430 440 450 460 470 480 pF1KSD MFADINSLQEHIRVSHCGPNANPSDGNNAFFCNQCSMGFLTESSLTEHIQQAHCSVGSAK . :.:.:::::: :: : .: .::::: .: :::::.::: :::.:.::...... CCDS32 VVNDLNTLQEHIRCSHGFANPAAKD-SNAFFCPHCYMGFLTDSSLEEHIRQVHCDLSGSR 490 500 510 520 530 540 490 500 510 520 530 540 pF1KSD LESPVV-QPTQSFMEVYSCPYCTNSPIFGSILKLTKHIKENHKNIPLA----HSKKSKAE . :::. : . .::::: ::::::::.:.:::.::::::::::::: :. :.. CCDS32 FGSPVLGTPKEPVVEVYSCSYCTNSPIFNSVLKLNKHIKENHKNIPLALNYIHNGKKSRA 550 560 570 580 590 600 550 560 570 580 590 600 pF1KSD QSPVSS-DVEVSSPKRQRLSASANSISNGEYPCNQCDLKFSNFESFQTHLKLHLELLLRK ::.: .: .: : .. ..: . .::: :::: :.....::::::: ::. .: : CCDS32 LSPLSPVAIEQTSLKMMQAVGGAPARPTGEYICNQCGAKYTSLDSFQTHLKTHLDTVLPK 610 620 630 640 650 660 610 620 630 640 650 660 pF1KSD QACPQCKEDFDSQESLLQHLTVHYMTTSTHYVCESCDKQFSSVDDLQKHLLDMHTFVLYH .::::...: .:::::.:.:.:.: :::.:.::::::::.::::::::::::::::... CCDS32 LTCPQCNKEFPNQESLLKHVTIHFMITSTYYICESCDKQFTSVDDLQKHLLDMHTFVFFR 670 680 690 700 710 720 670 680 690 700 710 720 pF1KSD CTLCQEVFDSKVSIQVHLAVKHSNEKKMYRCTACNWDFRKEADLQVHVKHSHLGNPAKAH :::::::::::::::.:::::::::::.::::.::::::.:.:::.::::.:: : .:.: CCDS32 CTLCQEVFDSKVSIQLHLAVKHSNEKKVYRCTSCNWDFRNETDLQLHVKHNHLENQGKVH 730 740 750 760 770 780 730 740 750 760 770 780 pF1KSD KCIFCGETFSTEVELQCHITTHSKKYNCKFCSKAFHAIILLEKHLREKHCVFDAATENGT :::::::.:.::::::::::::::::::::::::::::::::::::::::::.. : : CCDS32 KCIFCGESFGTEVELQCHITTHSKKYNCKFCSKAFHAIILLEKHLREKHCVFETKTPNCG 790 800 810 820 830 840 790 800 810 820 830 840 pF1KSD ANGVPPMATKKAEPADLQGMLLKNPEAPNSHEASEDDVDASEPMYGCDICGAAYTMEVLL .::. .. : : ..:: .: .. :. :::..::.:::.:::::::::::::::::.:: CCDS32 TNGASEQVQK--EEVELQTLLTNSQESHNSHDGSEEDVDTSEPMYGCDICGAAYTMETLL 850 860 870 880 890 900 850 860 870 880 890 900 pF1KSD QNHRLRDHNIRPGEDDGSRKKAEFIKGSHKCNVCSRTFFSENGLREHLQTHRGPAKHYMC :::.::::::::::. .::::.:::..::::::::::::::::::.::: ::.::::: CCDS32 QNHQLRDHNIRPGESAIVKKKAELIKGNYKCNVCSRTFFSENGLREHMQTHLGPVKHYMC 910 920 930 940 950 960 910 920 930 940 950 960 pF1KSD PICGERFPSLLTLTEHKVTHSKSLDTGTCRICKMPLQSEEEFIEHCQMHPDLRNSLTGFR :::::::::::::::::::::::::::.::::::::::::::.::::::::::::::::: CCDS32 PICGERFPSLLTLTEHKVTHSKSLDTGNCRICKMPLQSEEEFLEHCQMHPDLRNSLTGFR 970 980 990 1000 1010 1020 970 980 990 1000 1010 1020 pF1KSD CVVCMQTVTSTLELKIHGTFHMQKLA-GSSAASSPNGQGLQKLYKCALCLKEFRSKQDLV :::::::::::::::::::::::: . ::.. .. :: .::::::: :::::::::::: CCDS32 CVVCMQTVTSTLELKIHGTFHMQKTGNGSAVQTTGRGQHVQKLYKCASCLKEFRSKQDLV 1030 1040 1050 1060 1070 1080 1030 1040 1050 1060 pF1KSD KLDVNGLPYGLCAGCMARSANGQVGGLAPPEPADRP----------------CAGL--RC :::.:::::::::::. : ... : .:: ..:: .:: :: CCDS32 KLDINGLPYGLCAGCVNLSKSASPGINVPP-GTNRPGLGQNENLSAIEGKGKVGGLKTRC 1090 1100 1110 1120 1130 1140 1070 1080 1090 1100 1110 pF1KSD PECSVKFESAEDLESHMQVDHRDLTPETSGPR-KGTQTSPVPR--------KKTYQCIKC :.::::: .:..:.:. ::.:.:.... . : :.::.:: ::::::::: CCDS32 SSCNVKFESESELQNHIQTIHRELVPDSNSTQLKTPQVSPMPRISPSQSDEKKTYQCIKC 1150 1160 1170 1180 1190 1200 1120 1130 1140 1150 1160 1170 pF1KSD QMTFENEREIQIHVANHMIEEGINHECKLCNQMFDSPAKLLCHLIEHSFEGMGGTFKCPV ::.: :: .::.:::::::.::.:::::::.: ::::::: ::::::::::::::::::: CCDS32 QMVFYNEWDIQVHVANHMIDEGLNHECKLCSQTFDSPAKLQCHLIEHSFEGMGGTFKCPV 1210 1220 1230 1240 1250 1260 1180 1190 1200 1210 1220 pF1KSD CFTVFVQANKLQQHIFAVHGQEDKIYDCSQCPQKFFFQTELQNHTMSQHAQ ::::::::::::::::..::::::::::.:::::::::::::::::.::. CCDS32 CFTVFVQANKLQQHIFSAHGQEDKIYDCTQCPQKFFFQTELQNHTMTQHSS 1270 1280 1290 1300 1310 >>CCDS77167.1 ZNF521 gene_id:25925|Hs108|chr18 (1091 aa) initn: 2922 init1: 1245 opt: 3532 Z-score: 2339.8 bits: 444.9 E(32554): 5.2e-124 Smith-Waterman score: 4694; 62.4% identity (81.5% similar) in 1096 aa overlap (181-1223:1-1090) 160 170 180 190 200 pF1KSD IHLKTHSSSKPFKCTVCKRGFSSTSSLQSHMQAHKKNKEHL---AKSEKEAKKDDFMCDY ::.:..::. .. : :: :. CCDS77 MQVHERNKDGSQSGSRMEDWKMKDTQKCSQ 10 20 30 210 220 230 240 250 260 pF1KSD CEDTFSQTEELEKHVLTRHPQLS---EKADLQCIHCPEVFVDENTLLAHIHQAHANQK-H ::. :. :.:.::. ::. : ..: :::..: :.::.:..:. :..:.:...: . CCDS77 CEEGFDFPEDLQKHIAECHPECSPNEDRAALQCVYCHELFVEETSLMNHMEQVHSGEKKN 40 50 60 70 80 90 270 280 290 300 310 320 pF1KSD KCPMCPEQFSSVEGVYCHLDSHRQPDSSNHSVSPDPVLGSVASMSSATPDSSASVERGST .: .: :.: .:: .: :.:::.::.: ::: ::. : . .:.::.::::. ::. .:: CCDS77 SCSICSESFHTVEELYSHMDSHQQPESCNHSNSPSLVTVGYTSVSSTTPDSNLSVD-SST 100 110 120 130 140 330 340 350 360 370 pF1KSD PDSTLKPL---RGQKK-------MRDDGQGWTKVVYSCPYCSKRDFNSLAVLEIHLKTIH . :. ::.:. : .. .::.::: ::.:. :.:::::.:::::.: CCDS77 MVEAAPPIPKSRGRKRAAQQTPDMTGPSSKQAKVTYSCIYCNKQLFSSLAVLQIHLKTMH 150 160 170 180 190 200 380 390 400 410 420 430 pF1KSD ADKPQQSHTCQICLDSMPTLYNLNEHVRKLHKNHAYPVMQFGNISA--FHCNYCPEMFAD :::.:.: :: ::. .:.:::::::....:. . : . . . : ..::.: :. : CCDS77 LDKPEQAHICQYCLEVLPSLYNLNEHLKQVHEAQD-PGLIVSAMPAIVYQCNFCSEVVND 210 220 230 240 250 260 440 450 460 470 480 490 pF1KSD INSLQEHIRVSHCGPNANPSDGNNAFFCNQCSMGFLTESSLTEHIQQAHCSVGSAKLESP .:.:::::: :: : .: .::::: .: :::::.::: :::.:.::....... :: CCDS77 LNTLQEHIRCSHGFANPAAKD-SNAFFCPHCYMGFLTDSSLEEHIRQVHCDLSGSRFGSP 270 280 290 300 310 320 500 510 520 530 540 pF1KSD VV-QPTQSFMEVYSCPYCTNSPIFGSILKLTKHIKENHKNIPLA----HSKKSKAEQSPV :. : . .::::: ::::::::.:.:::.::::::::::::: :. :.. ::. CCDS77 VLGTPKEPVVEVYSCSYCTNSPIFNSVLKLNKHIKENHKNIPLALNYIHNGKKSRALSPL 330 340 350 360 370 380 550 560 570 580 590 600 pF1KSD SS-DVEVSSPKRQRLSASANSISNGEYPCNQCDLKFSNFESFQTHLKLHLELLLRKQACP : .: .: : .. ..: . .::: :::: :.....::::::: ::. .: : .:: CCDS77 SPVAIEQTSLKMMQAVGGAPARPTGEYICNQCGAKYTSLDSFQTHLKTHLDTVLPKLTCP 390 400 410 420 430 440 610 620 630 640 650 660 pF1KSD QCKEDFDSQESLLQHLTVHYMTTSTHYVCESCDKQFSSVDDLQKHLLDMHTFVLYHCTLC ::...: .:::::.:.:.:.: :::.:.::::::::.::::::::::::::::...:::: CCDS77 QCNKEFPNQESLLKHVTIHFMITSTYYICESCDKQFTSVDDLQKHLLDMHTFVFFRCTLC 450 460 470 480 490 500 670 680 690 700 710 720 pF1KSD QEVFDSKVSIQVHLAVKHSNEKKMYRCTACNWDFRKEADLQVHVKHSHLGNPAKAHKCIF :::::::::::.:::::::::::.::::.::::::.:.:::.::::.:: : .:.::::: CCDS77 QEVFDSKVSIQLHLAVKHSNEKKVYRCTSCNWDFRNETDLQLHVKHNHLENQGKVHKCIF 510 520 530 540 550 560 730 740 750 760 770 780 pF1KSD CGETFSTEVELQCHITTHSKKYNCKFCSKAFHAIILLEKHLREKHCVFDAATENGTANGV :::.:.::::::::::::::::::::::::::::::::::::::::::.. : : .::. CCDS77 CGESFGTEVELQCHITTHSKKYNCKFCSKAFHAIILLEKHLREKHCVFETKTPNCGTNGA 570 580 590 600 610 620 790 800 810 820 830 840 pF1KSD PPMATKKAEPADLQGMLLKNPEAPNSHEASEDDVDASEPMYGCDICGAAYTMEVLLQNHR .. : : ..:: .: .. :. :::..::.:::.:::::::::::::::::.:::::. CCDS77 SEQVQK--EEVELQTLLTNSQESHNSHDGSEEDVDTSEPMYGCDICGAAYTMETLLQNHQ 630 640 650 660 670 680 850 860 870 880 890 900 pF1KSD LRDHNIRPGEDDGSRKKAEFIKGSHKCNVCSRTFFSENGLREHLQTHRGPAKHYMCPICG ::::::::::. .::::.:::..::::::::::::::::::.::: ::.::::::::: CCDS77 LRDHNIRPGESAIVKKKAELIKGNYKCNVCSRTFFSENGLREHMQTHLGPVKHYMCPICG 690 700 710 720 730 740 910 920 930 940 950 960 pF1KSD ERFPSLLTLTEHKVTHSKSLDTGTCRICKMPLQSEEEFIEHCQMHPDLRNSLTGFRCVVC :::::::::::::::::::::::.::::::::::::::.::::::::::::::::::::: CCDS77 ERFPSLLTLTEHKVTHSKSLDTGNCRICKMPLQSEEEFLEHCQMHPDLRNSLTGFRCVVC 750 760 770 780 790 800 970 980 990 1000 1010 1020 pF1KSD MQTVTSTLELKIHGTFHMQKLA-GSSAASSPNGQGLQKLYKCALCLKEFRSKQDLVKLDV :::::::::::::::::::: . ::.. .. :: .::::::: :::::::::::::::. CCDS77 MQTVTSTLELKIHGTFHMQKTGNGSAVQTTGRGQHVQKLYKCASCLKEFRSKQDLVKLDI 810 820 830 840 850 860 1030 1040 1050 1060 pF1KSD NGLPYGLCAGCMARSANGQVGGLAPPEPADRPCAG------------------LRCPECS :::::::::::. : ... : .:: ..:: : :: :. CCDS77 NGLPYGLCAGCVNLSKSASPGINVPP-GTNRPGLGQNENLSAIEGKGKVGGLKTRCSSCN 870 880 890 900 910 920 1070 1080 1090 1100 1110 pF1KSD VKFESAEDLESHMQVDHRDLTPETSGPR-KGTQTSPVPR--------KKTYQCIKCQMTF ::::: .:..:.:. ::.:.:.... . : :.::.:: :::::::::::.: CCDS77 VKFESESELQNHIQTIHRELVPDSNSTQLKTPQVSPMPRISPSQSDEKKTYQCIKCQMVF 930 940 950 960 970 980 1120 1130 1140 1150 1160 1170 pF1KSD ENEREIQIHVANHMIEEGINHECKLCNQMFDSPAKLLCHLIEHSFEGMGGTFKCPVCFTV :: .::.:::::::.::.:::::::.: ::::::: ::::::::::::::::::::::: CCDS77 YNEWDIQVHVANHMIDEGLNHECKLCSQTFDSPAKLQCHLIEHSFEGMGGTFKCPVCFTV 990 1000 1010 1020 1030 1040 1180 1190 1200 1210 1220 pF1KSD FVQANKLQQHIFAVHGQEDKIYDCSQCPQKFFFQTELQNHTMSQHAQ ::::::::::::..::::::::::.:::::::::::::::::.::. CCDS77 FVQANKLQQHIFSAHGQEDKIYDCTQCPQKFFFQTELQNHTMTQHSS 1050 1060 1070 1080 1090 >>CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252 aa) initn: 2153 init1: 341 opt: 589 Z-score: 402.7 bits: 86.6 E(32554): 4.1e-16 Smith-Waterman score: 915; 25.5% identity (48.9% similar) in 1055 aa overlap (83-1117:353-1252) 60 70 80 90 100 110 pF1KSD ASPTQMIGDGCDLGLGEEEGGTGLPYPCQFCDKSFIRLSYLKRHEQIHSDKLPFKCTYCS : :.: . : :..:: ::. . :.:: :. CCDS59 EDCGKTFNHFSALRKHKIIHTGKKPYKREECGKAFSQSSTLRKHEIIHTGEKPYKCEECG 330 340 350 360 370 380 120 130 140 150 160 170 pF1KSD RLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRSDHLKIHLKTHSSSKPFKCTVCKRGFS . :: . . : .:::.: :.:.:: :::. . :: : :...::.:: : ..:. CCDS59 KAFKWSSKLTVHKVVHTGEKPYKCEECGKAFSQFSTLKKHKIIHTGKKPYKCEECGKAFN 390 400 410 420 430 440 180 190 200 210 220 230 pF1KSD STSSLQSHMQAHKKNKEHLAKSEKEAKKDDFMCDYCEDTFSQTEELEKHVLTRHPQLSEK :.:.:..: : .:: : :. : .: :. .: .: . . .:: CCDS59 SSSTLMKHKIIHT--------GEKPYK-----CEECGKAFRQSSHLTRH---KAIHTGEK 450 460 470 480 240 250 260 270 280 pF1KSD ADLQCIHCPEVFVDENTLLAHIHQAHANQK-HKCPMCPEQFSSVEGVYCHLDSH--RQPD .: .: ..: . : : . :...: .:: : . ::. . : : ..: CCDS59 P-YKCEECGKAFNHFSDLRRH-KIIHTGKKPYKCEECGKAFSQSSTLRNHQIIHTGEKPY 490 500 510 520 530 540 290 300 310 320 330 340 pF1KSD SSNHSVSPDPVLGSVASMSSATPDSSASVERGSTP---DSTLKPLRGQKKMRDDGQGWTK . .. :.. . :: .. .. : : . : .. . .: :. CCDS59 KCEEC-------GKAFKWSSKLTVHKV-IHTGEKPCKCEECGKAFKHFSALRKHKVIHTR 550 560 570 580 590 350 360 370 380 390 400 pF1KSD V-VYSCPYCSKRDFNSLAVLEIHLKTIHADKPQQSHTCQICLDSMPTLYNLNEHVRKLHK .:.: :.: ::. ..: : : ::. : . . :. : .. .:..: . .: CCDS59 EKLYKCEECGKA-FNNSSILAKH-KIIHTGK--KPYKCEECGKAFRQSSHLTRH-KAIHT 600 610 620 630 640 650 410 420 430 440 450 460 pF1KSD NHAYPVMQFGNISAFHCNYCPEMFADINSLQEHIRVSHCGPNANPSDGNNAFFCNQCSMG .. : ..:. : . :. ...:..: .. : :.. . :..:. . CCDS59 GEK-P---------YKCEECGKAFSHFSALRRH-KIIHT--------GKKPYKCEECGKA 660 670 680 690 470 480 490 500 510 520 pF1KSD FLTESSLTEHIQQAHCSVGSAKLESPVVQPTQSFMEVYSCPYCTNSPIFGSILKLTKHIK : :.: .: . : . :.: :.: : :. .: .... CCDS59 FSHFSALRRH-KIIHTG------EKP-----------YKCEEC------GKAFKWSSKLT 700 710 720 530 540 550 560 570 580 pF1KSD ENHKNIPLAHSKKSKAEQSPVSSDVEVSSPKRQRLSASANSISNGEYPCNQCDLKFSNFE :: : :. : : :. : . :. ..... . ... : :..: :..: CCDS59 V-HKVIHTAE-KPCKCEECGKSFK-HFSALRKHKVIHTREKL----YKCEECVKAFNSFS 730 740 750 760 770 780 590 600 610 620 630 640 pF1KSD SFQTHLKLHLELLLRKQACPQCKEDFDSQESLLQHLTVHYMTTSTHYVCESCDKQFSSVD ... : .: . : .: . : . .: : ..: : :: : : :. . CCDS59 ALMKHKVIHTGE--KPYKCEECGKAFKWSSKLTVHKVIH--TGEKPCKCEECGKAFKHFS 790 800 810 820 830 650 660 670 680 690 700 pF1KSD DLQKHLLDMHTFVL-YHCTLCQEVFDSKVSIQVHLAVKHSNEKKMYRCTACNWDFRKEAD :.:: . .:: :.: : ..:... :.. : . ::.:: :.: :. :. . CCDS59 ALRKHKV-IHTGKKPYKCEECGKAFSQSSSLRKH-EIIHSGEKP-YKCEECGKAFKWLSK 840 850 860 870 880 890 710 720 730 740 750 760 pF1KSD LQVHVKHSHLGNPAKAHKCIFCGETFSTEVELQCHITTHS--KKYNCKFCSKAFHAIILL : :: : : .. : :: ::..:. :. : :. : :.:. :.:::. : CCDS59 LTVH-KVIHTAE--KPCKCEECGKAFKHFSALRKHKIIHTGKKPYKCEECGKAFNDSSTL 900 910 920 930 940 950 770 780 790 800 810 820 pF1KSD EKHLREKHCVFDAATENGTANGVPPMATKKAEPADLQGMLLKNPEAPNSHEASEDDVDAS :: . : .: :. : :: : .:. .:: . . . .. CCDS59 MKH-KIIH------------TGKKPY--KCAE----CGKAFKQ----SSHLTRHKAIHTG 960 970 980 830 840 850 860 870 880 pF1KSD EPMYGCDICGAAYTMEVLLQNHRLRDHNIRPGEDDGSRKKAEFIKGSHKCNVCSRTFFSE : : :. :: .. :..:.: : .:.: .::. : ..: . CCDS59 EKPYKCEECGKDFNNSSTLKKHKLI-H---------TREKL------YKCEECVKAFNNF 990 1000 1010 1020 1030 890 900 910 920 930 940 pF1KSD NGLREHLQTHRGPAKHYMCPICGERFPSLLTLTEHKVTHSKSLDTGTCRICKMPLQSEEE ..: .: : : : : : ::. : :::::: :. :. : .. CCDS59 SALMKHKIIHTGE-KPYKCEECGKAFKWSSKLTEHKVIHTGE-KPCKCEECDKAFKHFSA 1040 1050 1060 1070 1080 1090 950 960 970 980 990 1000 pF1KSD FIEHCQMHPDLRNSLTGFRCVVCMQTVTSTLELKIHGTFHMQKLAGSSAASSPNGQGLQK . .: .: . ..: : .. ... : : .: .: .: CCDS59 LRKHKVIHTGKK----PYQCDECGKAFNNSSTLTKHKIIH----TG------------EK 1100 1110 1120 1130 1010 1020 1030 1040 1050 pF1KSD LYKCALCLKEFRSKQDLVKLDVNGL---PYGLCAGCMARSANGQVGGLAPPEPADRPCAG ::: : : : ... :.: . :: : : .: .: . :. . CCDS59 PYKCEECGKAFSQSSILTKHKIIHSVEKPYK-CEEC--GKAFNQSSHLTRHKTIHTGEKP 1140 1150 1160 1170 1180 1060 1070 1080 1090 1100 1110 pF1KSD LRCPECSVKFESAEDLESHMQVDHRDL------TPET-SGPRKGTQTSPVPRKKTYQCIK .: ::. : . : : . :. .:. :.:. . . .: :.: . CCDS59 YKCEECGKAFIQCSYLIRHKTIHTREKPTNVKKVPKLLSNPHTLLDKTIHTGEKPYKCEE 1190 1200 1210 1220 1230 1240 1120 1130 1140 1150 1160 1170 pF1KSD CQMTFENEREIQIHVANHMIEEGINHECKLCNQMFDSPAKLLCHLIEHSFEGMGGTFKCP : .: CCDS59 CAKAF 1250 >>CCDS42447.1 ZNF236 gene_id:7776|Hs108|chr18 (1845 aa) initn: 1513 init1: 331 opt: 537 Z-score: 366.6 bits: 80.5 E(32554): 4.2e-14 Smith-Waterman score: 544; 22.9% identity (52.2% similar) in 668 aa overlap (80-713:1169-1801) 50 60 70 80 90 100 pF1KSD KDVASPTQMIGDGCDLGLGEEEGGTGLPYPCQFCDKSFIRLSYLKRHEQIHSDKLPFKCT : .: ::: . : : :: .::. . :.:: CCDS42 LVQSAAEKDRISELRDKQAELQDEPKHANCCTYCPKSFKKPSDLVRHVRIHTGEKPYKCD 1140 1150 1160 1170 1180 1190 110 120 130 140 150 160 pF1KSD YCSRLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRSDHLKIHLKTHSSSKPFKCTVCKR :.. : : . : :.: :::.: . :: : ::: . ::.:.. :...::::: :. CCDS42 ECGKSFTVKSTLDCHVKTHTGQKLFSCHVCSNAFSTKGSLKVHMRLHTGAKPFKCPHCEL 1200 1210 1220 1230 1240 1250 170 180 190 200 210 220 pF1KSD GFSSTSSLQSHMQAHKKNKEHLAKSEKEAKKDDFMCDYCEDTFSQTEELEKHVLTRHPQL : ... ..::: : : . :.. .... . . :.:. . . . : CCDS42 RFRTSGRRKTHMQFHYKPDPKKARKPMTRSSSEGLQPVNLLNSSSTDP--NVFIMNNSVL 1260 1270 1280 1290 1300 1310 230 240 250 260 270 280 pF1KSD SEKADLQCIHCPEVFVDENTLLAHIHQAHANQKHKCPMCPEQFSSVEGVYCHLDSHRQPD . . : : . : . : . : : . :. . .....::. .: CCDS42 TGQFD-QNLLQPGL-VGQAILPASVS---AGGDLTVSLTDGSLATLEGIQLQL------- 1320 1330 1340 1350 1360 290 300 310 320 330 340 pF1KSD SSNHSVSPDPVLGSV--ASMSSATPDSSASVERGSTPDSTL--KPLRGQKKMRDDGQGWT . . :.:. .... ::... : . . :. . . ...: . : :. . .... CCDS42 -AANLVGPNVQISGIDAASINNITLQIDPSILQQTLQQGNLLAQQLTGEPGLAPQNSSLQ 1370 1380 1390 1400 1410 1420 350 360 370 380 390 400 pF1KSD KVVYSCPYCSKRDFNSLAVLEIHLKTIHADKPQQSHTCQICLDSMPTLYNLNEHVRKLHK . : :... : ... . . : .. .: . . .. : . CCDS42 TSDSTVP-------ASVVIQPISGLSLQPTVTSANLTIGPLSEQDSVLTTNSSGTQDLTQ 1430 1440 1450 1460 1470 410 420 430 440 450 460 pF1KSD NHAYPVMQF-GNISAFHCNYCPEMFADINSLQEHIRVSHCGPNANPSDGNNAFFCNQCSM :: : .: . . . .::.. . .. ::.:. :.:. . : CCDS42 -----VMTSQGLVSPSGGPHEITLTINNSSLSQ-VLAQAAGPTATSSSGSPQEITLTISE 1480 1490 1500 1510 1520 1530 470 480 490 500 510 520 pF1KSD GFLTESSLTEHIQQAHCSVGSAKL--ESPVVQPTQSFMEVYSCPYCTNSPIFGSILKLTK : .:: .. .... .: : : : . . :.. . :.. .: CCDS42 LNTTSGSLPSTTPMSPSAISTQNLVMSSSGVGGDASVTLTLAD---TQGMLSGGLDTVTL 1540 1550 1560 1570 1580 530 540 550 560 570 pF1KSD HIKENHKNIPLAHSKKSKAEQ----SP----VSSDVEVSSPKRQRLSASANSISN----G .: . ...: . : . : :: :: . .: .... .. ..:. : CCDS42 NITSQGQQFPALLTDPSLSGQGGAGSPQVILVSHTPQSASAACEEIAYQVAGVSGNLAPG 1590 1600 1610 1620 1630 1640 580 590 600 610 620 pF1KSD EYP--------CNQCDLKFSNFESFQTHLKLHLELLLRKQACPQCKEDFDSQESLLQHLT . : : .:: ::. .. : : ... : ..:: :.. : : .:. CCDS42 NQPEKEGRAHQCLECDRAFSSAAVLMHHSK-EVHGRERIHGCPVCRKAFKRATHLKEHMQ 1650 1660 1670 1680 1690 1700 630 640 650 660 670 pF1KSD VHYMTTSTH------YVCESCDKQFSSVDDLQKHLLDMHTFVL-YHCTLCQEVFDSKVSI .: : . :..:.: :.. ..:..: .:: .:::::...:..: .. CCDS42 THQAGPSLSSQKPRVFKCDTCEKAFAKPSQLERHS-RIHTGERPFHCTLCEKAFNQKSAL 1710 1720 1730 1740 1750 1760 680 690 700 710 720 730 pF1KSD QVHLAVKHSNEKKMYRCTACNWDFRKEADLQVHVKHSHLGNPAKAHKCIFCGETFSTEVE :::. ::..:. :.:. : : .......:.:..: CCDS42 QVHMK-KHTGERP-YKCAYCVMGFTQKSNMKLHMKRAHSYAGALQESAGHPEQDGEELSR 1770 1780 1790 1800 1810 1820 740 750 760 770 780 790 pF1KSD LQCHITTHSKKYNCKFCSKAFHAIILLEKHLREKHCVFDAATENGTANGVPPMATKKAEP CCDS42 TLHLEEVVQEAAGEWQALTHVF 1830 1840 >>CCDS77201.1 ZNF236 gene_id:7776|Hs108|chr18 (1847 aa) initn: 1513 init1: 331 opt: 537 Z-score: 366.6 bits: 80.5 E(32554): 4.2e-14 Smith-Waterman score: 544; 22.9% identity (52.2% similar) in 668 aa overlap (80-713:1171-1803) 50 60 70 80 90 100 pF1KSD KDVASPTQMIGDGCDLGLGEEEGGTGLPYPCQFCDKSFIRLSYLKRHEQIHSDKLPFKCT : .: ::: . : : :: .::. . :.:: CCDS77 LVQSAAEKDRISELRDKQAELQDEPKHANCCTYCPKSFKKPSDLVRHVRIHTGEKPYKCD 1150 1160 1170 1180 1190 1200 110 120 130 140 150 160 pF1KSD YCSRLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRSDHLKIHLKTHSSSKPFKCTVCKR :.. : : . : :.: :::.: . :: : ::: . ::.:.. :...::::: :. CCDS77 ECGKSFTVKSTLDCHVKTHTGQKLFSCHVCSNAFSTKGSLKVHMRLHTGAKPFKCPHCEL 1210 1220 1230 1240 1250 1260 170 180 190 200 210 220 pF1KSD GFSSTSSLQSHMQAHKKNKEHLAKSEKEAKKDDFMCDYCEDTFSQTEELEKHVLTRHPQL : ... ..::: : : . :.. .... . . :.:. . . . : CCDS77 RFRTSGRRKTHMQFHYKPDPKKARKPMTRSSSEGLQPVNLLNSSSTDP--NVFIMNNSVL 1270 1280 1290 1300 1310 230 240 250 260 270 280 pF1KSD SEKADLQCIHCPEVFVDENTLLAHIHQAHANQKHKCPMCPEQFSSVEGVYCHLDSHRQPD . . : : . : . : . : : . :. . .....::. .: CCDS77 TGQFD-QNLLQPGL-VGQAILPASVS---AGGDLTVSLTDGSLATLEGIQLQL------- 1320 1330 1340 1350 1360 290 300 310 320 330 340 pF1KSD SSNHSVSPDPVLGSV--ASMSSATPDSSASVERGSTPDSTL--KPLRGQKKMRDDGQGWT . . :.:. .... ::... : . . :. . . ...: . : :. . .... CCDS77 -AANLVGPNVQISGIDAASINNITLQIDPSILQQTLQQGNLLAQQLTGEPGLAPQNSSLQ 1370 1380 1390 1400 1410 1420 350 360 370 380 390 400 pF1KSD KVVYSCPYCSKRDFNSLAVLEIHLKTIHADKPQQSHTCQICLDSMPTLYNLNEHVRKLHK . : :... : ... . . : .. .: . . .. : . CCDS77 TSDSTVP-------ASVVIQPISGLSLQPTVTSANLTIGPLSEQDSVLTTNSSGTQDLTQ 1430 1440 1450 1460 1470 410 420 430 440 450 460 pF1KSD NHAYPVMQF-GNISAFHCNYCPEMFADINSLQEHIRVSHCGPNANPSDGNNAFFCNQCSM :: : .: . . . .::.. . .. ::.:. :.:. . : CCDS77 -----VMTSQGLVSPSGGPHEITLTINNSSLSQ-VLAQAAGPTATSSSGSPQEITLTISE 1480 1490 1500 1510 1520 1530 470 480 490 500 510 520 pF1KSD GFLTESSLTEHIQQAHCSVGSAKL--ESPVVQPTQSFMEVYSCPYCTNSPIFGSILKLTK : .:: .. .... .: : : : . . :.. . :.. .: CCDS77 LNTTSGSLPSTTPMSPSAISTQNLVMSSSGVGGDASVTLTLAD---TQGMLSGGLDTVTL 1540 1550 1560 1570 1580 530 540 550 560 570 pF1KSD HIKENHKNIPLAHSKKSKAEQ----SP----VSSDVEVSSPKRQRLSASANSISN----G .: . ...: . : . : :: :: . .: .... .. ..:. : CCDS77 NITSQGQQFPALLTDPSLSGQGGAGSPQVILVSHTPQSASAACEEIAYQVAGVSGNLAPG 1590 1600 1610 1620 1630 1640 580 590 600 610 620 pF1KSD EYP--------CNQCDLKFSNFESFQTHLKLHLELLLRKQACPQCKEDFDSQESLLQHLT . : : .:: ::. .. : : ... : ..:: :.. : : .:. CCDS77 NQPEKEGRAHQCLECDRAFSSAAVLMHHSK-EVHGRERIHGCPVCRKAFKRATHLKEHMQ 1650 1660 1670 1680 1690 1700 630 640 650 660 670 pF1KSD VHYMTTSTH------YVCESCDKQFSSVDDLQKHLLDMHTFVL-YHCTLCQEVFDSKVSI .: : . :..:.: :.. ..:..: .:: .:::::...:..: .. CCDS77 THQAGPSLSSQKPRVFKCDTCEKAFAKPSQLERHS-RIHTGERPFHCTLCEKAFNQKSAL 1710 1720 1730 1740 1750 1760 680 690 700 710 720 730 pF1KSD QVHLAVKHSNEKKMYRCTACNWDFRKEADLQVHVKHSHLGNPAKAHKCIFCGETFSTEVE :::. ::..:. :.:. : : .......:.:..: CCDS77 QVHMK-KHTGERP-YKCAYCVMGFTQKSNMKLHMKRAHSYAGALQESAGHPEQDGEELSR 1770 1780 1790 1800 1810 1820 740 750 760 770 780 790 pF1KSD LQCHITTHSKKYNCKFCSKAFHAIILLEKHLREKHCVFDAATENGTANGVPPMATKKAEP CCDS77 TLHLEEVVQEAAGEWQALTHVF 1830 1840 >>CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058 aa) initn: 2384 init1: 332 opt: 497 Z-score: 343.0 bits: 75.4 E(32554): 8.7e-13 Smith-Waterman score: 852; 25.7% identity (48.4% similar) in 855 aa overlap (77-921:332-1055) 50 60 70 80 90 100 pF1KSD PSSKDVASPTQMIGDGCDLGLGEEEGGTGLPYPCQFCDKSFIRLSYLKRHEQIHSDKLPF :: :. : ::: : : ::..::. . :. CCDS74 EKPYDCKECGKSFASGSALIRHQRIHTGEKPYDCKECGKSFTFHSALIRHQRIHTGEKPY 310 320 330 340 350 360 110 120 130 140 150 160 pF1KSD KCTYCSRLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRSDHLKIHLKTHSSSKPFKCTV : :.. : . . : .:::.: : :.:: .:. .. : : . :.. ::. : CCDS74 DCKECGKSFTFRSGLIGHQAIHTGEKPYDCKECGKSFTAGSTLIQHQRIHTGEKPYDCKE 370 380 390 400 410 420 170 180 190 200 210 220 pF1KSD CKRGFSSTSSLQSHMQAHKKNKEHLAKSEKEAKKDDFMCDYCEDTFSQTEELEKHVLTRH : ..:.: :.: .:.. : .: . : : .:. ..: .. CCDS74 CGKSFASGSALLQHQRIHTGEKP-------------YCCKECGKSFTFRSTRNRH---QR 430 440 450 460 230 240 250 260 270 280 pF1KSD PQLSEKADLQCIHCPEVFVDENTLLAHIHQAHANQK-HKCPMCPEQFSSVEGVYCHLDSH . .:: .: .: . :.. ..:: : .. :...: ..: : ..:. :. : : CCDS74 IHTGEKP-YNCKECGKSFASGSALLQH-QRIHTGEKPYHCKECGKSFTFRSGLIGHQAVH 470 480 490 500 510 520 290 300 310 320 330 pF1KSD --RQP----DSSNHSVSPDPVLGSVASMSSATPDSSASVERGSTPDSTLKPLRGQKKMRD ..: . .. .: . .. .. : .. : ::: :. :. CCDS74 TGEKPYDCKECGKSFTSRSALIQHQRIHTGEKPYHCKECGKSFTVGSTL--LQHQQIHTG 530 540 550 560 570 580 340 350 360 370 380 390 pF1KSD DGQGWTKVVYSCPYCSKRDFNSLAVLEIHLKTIHADKPQQSHTCQICLDSMPTLYNLNEH . :.: :.: : : : . ..:: : :: : .. .. .:..: CCDS74 EKP------YDCKECGKA-FRLRLRLTQHQQIHTGEKPYQ---CQECGKAFVSVSGLTQH 590 600 610 620 630 400 410 420 430 440 450 pF1KSD VRKLHKNHAYPVMQFGNISAFHCNYCPEMFADINSLQEHIRVSHCGPNANPSDGNNAFFC :. :. :. . ..: : . : . . :..: :. : : . : . : CCDS74 ----HRIHT------GE-KPYECPDCGKAFRQRTYLNQHRRI-HTGEK--P------YEC 640 650 660 670 460 470 480 490 500 510 pF1KSD NQCSMGFLTESSLTEHIQQAHCSVGSAKLESPVVQPTQSFMEVYSCPYCTNSPIFGSILK ..:. .: :.: .: :: : . :.: :. : .: : : CCDS74 KECGKSFTFCSGLIQH-QQNHTD------EKP-----------YDGKECGKSFTSHSTLI 680 690 700 710 520 530 540 550 560 570 pF1KSD LTKHIKENHKNIPLAHSKKSKAEQSPVSSDVEVSSPKRQRLSASANSISNGEYPCNQCDL ..:. ..: . :: . .: . . .. . .. : :..: CCDS74 QHQQIHTGEKPYDCKECGKSFTSHSTLIQHQQIHTGEKL-------------YDCKECGK 720 730 740 750 760 580 590 600 610 620 630 pF1KSD KFSNFESFQTHLKLHLELLLRKQACPQCKEDFDSQESLLQHLTVHYMTTSTHYVCESCDK .:.. .. : :: . : .: ..: . .:.:: :: : .: :. : : CCDS74 SFTSHSTLIQHQPLHTGE--KPYHCKECGKSFTLRSALIQHRPVH--TGEKRYSCKECGK 770 780 790 800 810 640 650 660 670 680 690 pF1KSD QFSSVDDLQKHLLDMHTFVL-YHCTLCQEVFDSKVSIQVHLAVKHSNEKKMYRCTACNWD .:.: . : .: .:: ::: : . : . .: : . :..:: : : :. CCDS74 SFTSRSTLIEHQ-RIHTGEKPYHCKECGKSFAFRSAIIQHRRI-HTGEKP-YDCKECGKA 820 830 840 850 860 870 700 710 720 730 740 750 pF1KSD FRKEADLQVHVKHSHLGNPAKAHKCIFCGETFSTEVELQCHITTHS--KKYNCKFCSKAF ::... : : .. : :. : ..: ::..: : : . :. : :.:: :.:.: CCDS74 FRRRSKLTQH-QRIHTGE--KPYRCHECGKAFVRFSGLTKHHSIHTGEKPYECKTCGKSF 880 890 900 910 920 930 760 770 780 790 800 810 pF1KSD HAIILLEKHLREKHCVFDAATENGTANGVPPMATKKAEPADLQGMLLKNPEAPNSHEASE . : : : : .: :. :. . : : . .. : CCDS74 RQRTHLTLHQR-IH------------TGDRPYECKECGKSFTCGSELIRHQRTHTGE--- 940 950 960 970 820 830 840 850 860 870 pF1KSD DDVDASEPMYGCDICGAAYTMEVLLQNHRLRDHNIRPGEDDGSRKKAEFIKGSHKCNVCS .: : : :: :. :..:. : :. :: ...: :. CCDS74 ------KP-YDCKECGKAFRCPSQLSQHK-RIHT---GEK------------TYQCPECG 980 990 1000 1010 880 890 900 910 920 930 pF1KSD RTFFSENGLREHLQTHRGPAKHYMCPICGERFPSLLTLTEHKVTHSKSLDTGTCRICKMP ..:: .:: .: ..: : : : : ::. : .: ::.:. : CCDS74 KAFFYASGLSRHQSVHTGE-KPYECKTCGKAFKQLTQLTRHQRIHDLT 1020 1030 1040 1050 940 950 960 970 980 990 pF1KSD LQSEEEFIEHCQMHPDLRNSLTGFRCVVCMQTVTSTLELKIHGTFHMQKLAGSSAASSPN >>CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090 aa) initn: 2384 init1: 332 opt: 497 Z-score: 342.9 bits: 75.4 E(32554): 8.9e-13 Smith-Waterman score: 852; 25.7% identity (48.4% similar) in 855 aa overlap (77-921:364-1087) 50 60 70 80 90 100 pF1KSD PSSKDVASPTQMIGDGCDLGLGEEEGGTGLPYPCQFCDKSFIRLSYLKRHEQIHSDKLPF :: :. : ::: : : ::..::. . :. CCDS59 EKPYDCKECGKSFASGSALIRHQRIHTGEKPYDCKECGKSFTFHSALIRHQRIHTGEKPY 340 350 360 370 380 390 110 120 130 140 150 160 pF1KSD KCTYCSRLFKHKRSRDRHIKLHTGDKKYHCHECEAAFSRSDHLKIHLKTHSSSKPFKCTV : :.. : . . : .:::.: : :.:: .:. .. : : . :.. ::. : CCDS59 DCKECGKSFTFRSGLIGHQAIHTGEKPYDCKECGKSFTAGSTLIQHQRIHTGEKPYDCKE 400 410 420 430 440 450 170 180 190 200 210 220 pF1KSD CKRGFSSTSSLQSHMQAHKKNKEHLAKSEKEAKKDDFMCDYCEDTFSQTEELEKHVLTRH : ..:.: :.: .:.. : .: . : : .:. ..: .. CCDS59 CGKSFASGSALLQHQRIHTGEKP-------------YCCKECGKSFTFRSTRNRH---QR 460 470 480 490 230 240 250 260 270 280 pF1KSD PQLSEKADLQCIHCPEVFVDENTLLAHIHQAHANQK-HKCPMCPEQFSSVEGVYCHLDSH . .:: .: .: . :.. ..:: : .. :...: ..: : ..:. :. : : CCDS59 IHTGEKP-YNCKECGKSFASGSALLQH-QRIHTGEKPYHCKECGKSFTFRSGLIGHQAVH 500 510 520 530 540 550 290 300 310 320 330 pF1KSD --RQP----DSSNHSVSPDPVLGSVASMSSATPDSSASVERGSTPDSTLKPLRGQKKMRD ..: . .. .: . .. .. : .. : ::: :. :. CCDS59 TGEKPYDCKECGKSFTSRSALIQHQRIHTGEKPYHCKECGKSFTVGSTL--LQHQQIHTG 560 570 580 590 600 610 340 350 360 370 380 390 pF1KSD DGQGWTKVVYSCPYCSKRDFNSLAVLEIHLKTIHADKPQQSHTCQICLDSMPTLYNLNEH . :.: :.: : : : . ..:: : :: : .. .. .:..: CCDS59 EKP------YDCKECGKA-FRLRLRLTQHQQIHTGEKPYQ---CQECGKAFVSVSGLTQH 620 630 640 650 660 400 410 420 430 440 450 pF1KSD VRKLHKNHAYPVMQFGNISAFHCNYCPEMFADINSLQEHIRVSHCGPNANPSDGNNAFFC :. :. :. . ..: : . : . . :..: :. : : . : . : CCDS59 ----HRIHT------GE-KPYECPDCGKAFRQRTYLNQHRRI-HTGEK--P------YEC 670 680 690 700 460 470 480 490 500 510 pF1KSD NQCSMGFLTESSLTEHIQQAHCSVGSAKLESPVVQPTQSFMEVYSCPYCTNSPIFGSILK ..:. .: :.: .: :: : . :.: :. : .: : : CCDS59 KECGKSFTFCSGLIQH-QQNHTD------EKP-----------YDGKECGKSFTSHSTLI 710 720 730 740 520 530 540 550 560 570 pF1KSD LTKHIKENHKNIPLAHSKKSKAEQSPVSSDVEVSSPKRQRLSASANSISNGEYPCNQCDL ..:. ..: . :: . .: . . .. . .. : :..: CCDS59 QHQQIHTGEKPYDCKECGKSFTSHSTLIQHQQIHTGEKL-------------YDCKECGK 750 760 770 780 790 580 590 600 610 620 630 pF1KSD KFSNFESFQTHLKLHLELLLRKQACPQCKEDFDSQESLLQHLTVHYMTTSTHYVCESCDK .:.. .. : :: . : .: ..: . .:.:: :: : .: :. : : CCDS59 SFTSHSTLIQHQPLHTGE--KPYHCKECGKSFTLRSALIQHRPVH--TGEKRYSCKECGK 800 810 820 830 840 640 650 660 670 680 690 pF1KSD QFSSVDDLQKHLLDMHTFVL-YHCTLCQEVFDSKVSIQVHLAVKHSNEKKMYRCTACNWD .:.: . : .: .:: ::: : . : . .: : . :..:: : : :. CCDS59 SFTSRSTLIEHQ-RIHTGEKPYHCKECGKSFAFRSAIIQHRRI-HTGEKP-YDCKECGKA 850 860 870 880 890 900 700 710 720 730 740 750 pF1KSD FRKEADLQVHVKHSHLGNPAKAHKCIFCGETFSTEVELQCHITTHS--KKYNCKFCSKAF ::... : : .. : :. : ..: ::..: : : . :. : :.:: :.:.: CCDS59 FRRRSKLTQH-QRIHTGE--KPYRCHECGKAFVRFSGLTKHHSIHTGEKPYECKTCGKSF 910 920 930 940 950 960 760 770 780 790 800 810 pF1KSD HAIILLEKHLREKHCVFDAATENGTANGVPPMATKKAEPADLQGMLLKNPEAPNSHEASE . : : : : .: :. :. . : : . .. : CCDS59 RQRTHLTLHQR-IH------------TGDRPYECKECGKSFTCGSELIRHQRTHTGE--- 970 980 990 1000 820 830 840 850 860 870 pF1KSD DDVDASEPMYGCDICGAAYTMEVLLQNHRLRDHNIRPGEDDGSRKKAEFIKGSHKCNVCS .: : : :: :. :..:. : :. :: ...: :. CCDS59 ------KP-YDCKECGKAFRCPSQLSQHK-RIHT---GEK------------TYQCPECG 1010 1020 1030 1040 880 890 900 910 920 930 pF1KSD RTFFSENGLREHLQTHRGPAKHYMCPICGERFPSLLTLTEHKVTHSKSLDTGTCRICKMP ..:: .:: .: ..: : : : : ::. : .: ::.:. : CCDS59 KAFFYASGLSRHQSVHTGE-KPYECKTCGKAFKQLTQLTRHQRIHDLT 1050 1060 1070 1080 1090 940 950 960 970 980 990 pF1KSD LQSEEEFIEHCQMHPDLRNSLTGFRCVVCMQTVTSTLELKIHGTFHMQKLAGSSAASSPN 1224 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 02:58:49 2016 done: Thu Nov 3 02:58:50 2016 Total Scan time: 3.980 Total Display time: 0.340 Function used was FASTA [36.3.4 Apr, 2011]