FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1852, 792 aa 1>>>pF1KSDA1852 792 - 792 aa - 792 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9288+/-0.00208; mu= 14.3110+/- 0.122 mean_var=280.9348+/-53.224, 0's: 0 Z-trim(103.5): 996 B-trim: 9 in 1/50 Lambda= 0.076519 statistics sampled from 6349 (7423) to 6349 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.54), E-opt: 0.2 (0.228), width: 16 Scan time: 3.770 The best scores are: opt bits E(32554) CCDS12968.1 ZNF606 gene_id:80095|Hs108|chr19 ( 792) 5674 641.9 1.2e-183 CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17 ( 865) 2234 262.2 2.6e-69 CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 ( 778) 2138 251.5 3.8e-66 CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19 ( 715) 2115 249.0 2.1e-65 CCDS60514.1 ZNF33A gene_id:7581|Hs108|chr10 ( 817) 2101 247.5 6.6e-65 CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 ( 839) 2098 247.2 8.4e-65 CCDS31182.1 ZNF33A gene_id:7581|Hs108|chr10 ( 810) 2090 246.3 1.5e-64 CCDS44372.1 ZNF33A gene_id:7581|Hs108|chr10 ( 811) 2087 245.9 1.9e-64 CCDS73088.1 ZNF33A gene_id:7581|Hs108|chr10 ( 829) 2087 246.0 1.9e-64 CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 ( 840) 2086 245.9 2.1e-64 CCDS33122.1 ZNF470 gene_id:388566|Hs108|chr19 ( 717) 2081 245.2 2.8e-64 CCDS12503.1 ZNF569 gene_id:148266|Hs108|chr19 ( 686) 2038 240.4 7.5e-63 CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058) 1996 236.1 2.3e-61 CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090) 1996 236.1 2.4e-61 CCDS82341.1 ZNF569 gene_id:148266|Hs108|chr19 ( 527) 1981 234.0 5.1e-61 CCDS59367.1 ZNF43 gene_id:7594|Hs108|chr19 ( 803) 1980 234.1 6.9e-61 CCDS12413.2 ZNF43 gene_id:7594|Hs108|chr19 ( 809) 1980 234.1 6.9e-61 CCDS74321.1 ZNF43 gene_id:7594|Hs108|chr19 ( 818) 1980 234.1 6.9e-61 CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 ( 738) 1967 232.6 1.8e-60 CCDS45012.1 ZNF268 gene_id:10795|Hs108|chr12 ( 947) 1944 230.3 1.2e-59 CCDS4624.1 ZNF184 gene_id:7738|Hs108|chr6 ( 751) 1937 229.3 1.8e-59 CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159) 1932 229.1 3.3e-59 CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191) 1932 229.1 3.3e-59 CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 ( 688) 1926 228.1 3.9e-59 CCDS82388.1 ZNF841 gene_id:284371|Hs108|chr19 ( 808) 1925 228.1 4.6e-59 CCDS46161.1 ZNF841 gene_id:284371|Hs108|chr19 ( 924) 1925 228.2 5e-59 CCDS14279.1 ZNF41 gene_id:7592|Hs108|chrX ( 779) 1917 227.2 8.4e-59 CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19 ( 936) 1910 226.5 1.6e-58 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1907 225.9 1.6e-58 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1907 225.9 1.6e-58 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1907 225.9 1.7e-58 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1907 226.0 1.7e-58 CCDS46212.1 ZNF814 gene_id:730051|Hs108|chr19 ( 855) 1901 225.5 3e-58 CCDS82413.1 ZNF544 gene_id:27300|Hs108|chr19 ( 687) 1892 224.3 5.3e-58 CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19 (1252) 1896 225.2 5.4e-58 CCDS33090.1 ZNF616 gene_id:90317|Hs108|chr19 ( 781) 1892 224.4 5.7e-58 CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 ( 682) 1887 223.8 7.7e-58 CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280) 1886 224.1 1.2e-57 CCDS46170.1 ZNF845 gene_id:91664|Hs108|chr19 ( 970) 1876 222.8 2.2e-57 CCDS12637.1 ZNF112 gene_id:7771|Hs108|chr19 ( 907) 1875 222.6 2.3e-57 CCDS54276.1 ZNF112 gene_id:7771|Hs108|chr19 ( 913) 1875 222.6 2.3e-57 CCDS46991.1 ZNF721 gene_id:170960|Hs108|chr4 ( 923) 1872 222.3 2.9e-57 CCDS12499.1 ZNF585A gene_id:199704|Hs108|chr19 ( 714) 1862 221.0 5.4e-57 CCDS74353.1 ZNF585A gene_id:199704|Hs108|chr19 ( 769) 1862 221.1 5.6e-57 CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 1859 220.7 6.6e-57 CCDS12500.1 ZNF585B gene_id:92285|Hs108|chr19 ( 769) 1856 220.4 8.9e-57 CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 ( 803) 1854 220.2 1.1e-56 CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9 (1059) 1852 220.2 1.4e-56 CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1848 219.5 1.6e-56 CCDS77297.1 ZNF546 gene_id:339327|Hs108|chr19 ( 810) 1846 219.3 2e-56 >>CCDS12968.1 ZNF606 gene_id:80095|Hs108|chr19 (792 aa) initn: 5674 init1: 5674 opt: 5674 Z-score: 3410.6 bits: 641.9 E(32554): 1.2e-183 Smith-Waterman score: 5674; 100.0% identity (100.0% similar) in 792 aa overlap (1-792:1-792) 10 20 30 40 50 60 pF1KSD MAAINPWASWGALTDQSWGMTAVDPWASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MAAINPWASWGALTDQSWGMTAVDPWASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD PVTFKDVAVDFTQEEWGQLDLVQRTLYRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PVTFKDVAVDFTQEEWGQLDLVQRTLYRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD WSVEQACPQRTCPEWVRNLESKALIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 WSVEQACPQRTCPEWVRNLESKALIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD DQLEMYHMNQSTAMRQMVFMQKQVLSQRSSEFCGLGAEFSQNLNFVPSQRVSQIEHFYKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DQLEMYHMNQSTAMRQMVFMQKQVLSQRSSEFCGLGAEFSQNLNFVPSQRVSQIEHFYKP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD DTHAQSWRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGDNLFKCTDAVKSFNH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DTHAQSWRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGDNLFKCTDAVKSFNH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD IIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 IIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD EHQKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 EHQKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD THTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 THTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD EKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 EKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPF 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD KCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD CGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKS 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD FSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNES 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD SSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALL 730 740 750 760 770 780 790 pF1KSD QHQRNHSEEKLN :::::::::::: CCDS12 QHQRNHSEEKLN 790 >>CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17 (865 aa) initn: 3501 init1: 1806 opt: 2234 Z-score: 1357.9 bits: 262.2 E(32554): 2.6e-69 Smith-Waterman score: 2234; 44.7% identity (70.5% similar) in 739 aa overlap (58-790:50-778) 30 40 50 60 70 80 pF1KSD SWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLY :.: :::::::.::: ::: .: .::.:. CCDS11 AAVFFSVGRLSPEVTQPDEDLHLQAEETQLVKESVTFKDVAIDFTLEEWRLMDPTQRNLH 20 30 40 50 60 70 90 100 110 120 130 140 pF1KSD RDVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPEWVRNLESKALIPA .:::::.: .:.:.: ..::..:: ::.:. :: . . . :. . .: . CCDS11 KDVMLENYRNLVSLGLAVSKPDMISHLENGKGPWVTVREISRIPYPDMEPKPATKKATRT 80 90 100 110 120 130 150 160 170 180 190 200 pF1KSD QSIFEEEQSHGMKLERYIWDDPWFSRLEVLGC-KDQLEMYHMNQSTAMRQMVF-MQKQVL ..: :. ..... ::. . : ::.: : .:.. . :: . . : .. ..: CCDS11 KAISEDLSQEAI-LEKLTENGLWDSRMEGLWKWNDRILRLQNNQENHLSQRIIPLKKTPT 140 150 160 170 180 190 210 220 230 240 250 260 pF1KSD SQRSSEFCGLGAEFSQNLNFVPSQRVSQIEHFYKPDTHAQSWRCDSAIM---YADKVTCE :::. .: .. ..: .. : . .:. ... . .. . :. :. CCDS11 SQRGFRFESI---------LIPEPGIATEELHSRCQTQEENFTENLNLITDTHLGKIICK 200 210 220 230 240 270 280 290 300 310 320 pF1KSD NNDYDKTVYQSIQPIYPARIQTGDNLFKCTDAVKSFNHIIHFGDHKGIHTGEKLYEYKEC . .:.. :. . . .. .. .::. :.:.. . .:. :: :: :: .:: CCDS11 EMKGSKAIRQTSELTLGKKSNNKEKPYKCSTCEKAFHYRSLLIQHQRTHTKEKPYECNEC 250 260 270 280 290 300 330 340 350 360 370 380 pF1KSD HQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSS-FMEHQKIGTVEKAYKYNEWEKVF . :.: ...: ..:.::. :. .: . : :: .: ::.: : :: :. : : : CCDS11 GKTFSQPSYLSQHKKIHTGEKPYKCNECGKAFIASSSLMVHQRIHTKEKPYQCNVCGKSF 310 320 330 340 350 360 390 400 410 420 430 440 pF1KSD GYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKTHTGEKPYECDKCGKVFRNRS . . :.:: :.:::: .::: .: .: : .:..::.:::::.:: :::.:::.: CCDS11 SQCARLNQHQRIQTGEKPYKCSECGKAFSDKSKLARHQETHNGEKPYKCDDCGKAFRNKS 370 380 390 400 410 420 450 460 470 480 490 500 pF1KSD ALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGEKPYVCNECGKSFNWNSHLIG :. :..::: :::.::.:::.:. .. . ::.::::::::. ::::::.. :: :: CCDS11 YLSVHQKTHTEEKPYQCNECGKSFKNTTIFNVHQRIHTGEKPFRCNECGKAYRSNSSLIV 430 440 450 460 470 480 510 520 530 540 550 560 pF1KSD HQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFKCDECEKAFRDYSALSKHERT : ::::::::.::.::::.:. ... :.:.::::::.::.:: ::: .:: :. :.: CCDS11 HIRTHTGEKPYECNECGKAFNRIANFTEHQRIHTGEKPYKCNECGKAFINYSCLTVHHRM 490 500 510 520 530 540 570 580 590 600 610 620 pF1KSD HSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQECGKAFRERSALTKHEIIHSGI :.: ::::::::::.: :: :: ::: :: :::: :.:::..:: .: :: :. ::.: CCDS11 HTGEKPYKCTECGKAFMRSSSLIIHQRIHTEEKPYLCNECGESFRIKSHLTVHQRIHTGE 550 560 570 580 590 600 630 640 650 660 670 680 pF1KSD KPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSFSQSCHLVAHRRIHTGEKPYK :::.:. : .. ..:..: .::. ::: :::.: ::::: . .:..:.: :::::::: CCDS11 KPYKCTDCERAFTKMVNLKEHQKIHTGVKPYKCYDCGKSFRTKSYLIVHQRTHTGEKPYK 610 620 630 640 650 660 690 700 710 720 730 740 pF1KSD CNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESSSLIVHLRNHTGEKPYKCNHC ::.::..:. .:.: .:.: :::::::.::::::.:. .:.. .: :.::::::.::: : CCDS11 CNECEKAFTNTSQLTVHQRRHTGEKPYKCNECGKVFTSNSGFNTHQRTHTGEKPFKCNDC 670 680 690 700 710 720 750 760 770 780 790 pF1KSD EKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQHQRNHSEEKLN ::: . . ::..::::: . :. ::::: : : : :.:. :: CCDS11 GKAFSQMVHVTEHQKIHSGEKPYKCDVCGKAFRRGSYLTVHWRTHTGEKPYTCKECGKGC 730 740 750 760 770 780 CCDS11 ITLSQLTLHQRIHTGERPYKCEECGKAFRTNSDFTVHLRMHTGEKPYKCNECGKAFRSSS 790 800 810 820 830 840 >>CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 (778 aa) initn: 1820 init1: 1820 opt: 2138 Z-score: 1301.0 bits: 251.5 E(32554): 3.8e-66 Smith-Waterman score: 2138; 43.3% identity (69.3% similar) in 753 aa overlap (57-790:7-747) 30 40 50 60 70 80 pF1KSD ASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTL . : :.::::.: :::::: .:: ::.: CCDS71 MNKVDQKFQGSVSFKDVTVGFTQEEWQHLDPSQRAL 10 20 30 90 100 110 120 130 pF1KSD YRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPE-WV------RNL :::::::.:..:.::: ::::: :::::::: .:. :... :: :. :. CCDS71 YRDVMLENYSNLVSVGYCAHKPEVIFRLEQGEEPWRLEEEFPSQSFPEVWTADHLKERSQ 40 50 60 70 80 90 140 150 160 170 180 190 pF1KSD ESKA------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEMYHMNQSTA :... .. . .. .::.. . . . : : ... : : . :. .: CCDS71 ENQSKHLWEVVFINNEMLTKEQGNVIGIP-FNMDVSSFPSRKMF-C--QYDSRGMSFNT- 100 110 120 130 140 150 200 210 220 230 240 250 pF1KSD MRQMVFMQKQVLSQRSSEFCGLGAEFSQNLNFVPSQRVSQIEHFYKPDTHAQSWRCDSAI . ..:. . . :...:.:: . : . ::. .. .. .. . .. : : .. CCDS71 VSELVISKINYLGKKSDEFNACGKLL---LNIKHDETHTREKNEVLKNRNTLSHRENT-- 160 170 180 190 200 260 270 280 290 300 pF1KSD MYADKVTCENNDYDKTVYQSI---QPIYPARIQTGDNLFKC--TDAVKSFNHIIHFGDHK . .:. ..... .. : . .. .: . . . .: .. ..: . :. CCDS71 LQHEKIQTLDHNFEYSICQETLLEKAVFNTRKRENAEENNCDYNEFGRTFCDSSSLLFHQ 210 220 230 240 250 260 310 320 330 340 350 360 pF1KSD GIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFMEH-QKIGT . .. ::...:.... . ....: . : ..:. : : : . . . :: CCDS71 IPPSKDSHYEFSDCEKFLCVKSTLSKHDGVPV--KHYDCGESGNNFRRKLCLSQLQKGDK 270 280 290 300 310 320 370 380 390 400 410 420 pF1KSD VEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKTHTGEKP :: .. :: :.: : ::.: ..:.:: .. :.:: .: .: : .:...:::::: CCDS71 GEKHFECNECGKAFWEKSHLTRHQRVHTGEKHFQCNQCGKTFWEKSNLTKHQRSHTGEKP 330 340 350 360 370 380 430 440 450 460 470 480 pF1KSD YECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGEKPYVCN .::..:::.: ..:::: :.::::: :::.:: :::.: .: : :.: :::.::: : CCDS71 FECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFYQKSDLTKHQRTHTGQKPYECY 390 400 410 420 430 440 490 500 510 520 530 540 pF1KSD ECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFKCDECEK :::::: :::: ::::::::::::: :::::: .::: :.: : :.::..:. : : CCDS71 ECGKSFCMNSHLTVHQRTHTGEKPFECLECGKSFCQKSHLTQHQRTHIGDKPYECNACGK 450 460 470 480 490 500 550 560 570 580 590 600 pF1KSD AFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQECGKAFRE .: :.:..:. :.: :::.: ::::.: .: : ::::::::::. : :::: : . CCDS71 TFYHKSVLTRHQIIHTGLKPYECYECGKTFCLKSDLTIHQRTHTGEKPFACPECGKFFSH 510 520 530 540 550 560 610 620 630 640 650 660 pF1KSD RSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSFSQSCHL .:.:..: :.: :::::..::: . ..:..:.::::::::::::.:::.: :. .: CCDS71 KSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKPYECNECGKTFCQKSQL 570 580 590 600 610 620 670 680 690 700 710 720 pF1KSD VAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESSSLIVHL . :.::: :::::.::.: ..: .: ::.:.:::: ::::.::::::.: .:.::.: CCDS71 TQHQRIHIGEKPYECNECGKAFCHKSALIVHQRTHTQEKPYKCNECGKSFCVKSGLILHE 630 640 650 660 670 680 730 740 750 760 770 780 pF1KSD RNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQHQRNHS :.:::::::.::.: :.: ..::: .:.: :.::: :.:::: : .: : .:::.:. CCDS71 RKHTGEKPYECNECGKSFSHKSSLTVHHRAHTGEKSCQCNECGKIFYRKSDLAKHQRSHT 690 700 710 720 730 740 790 pF1KSD EEKLN :: CCDS71 GEKPYECNTCRKTFSQKSNLIVHQRTHIGEKPYE 750 760 770 >>CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19 (715 aa) initn: 1657 init1: 1657 opt: 2115 Z-score: 1287.7 bits: 249.0 E(32554): 2.1e-65 Smith-Waterman score: 2115; 46.4% identity (70.7% similar) in 716 aa overlap (59-762:11-714) 30 40 50 60 70 80 pF1KSD WALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLYR : : :.:::. :::::: ::::.:::::: CCDS12 MEARSMLVPPQASVCFEDVAMAFTQEEWEQLDLAQRTLYR 10 20 30 40 90 100 110 120 130 140 pF1KSD DVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPEWVRNLESKALIPAQ .: :::. :..:.: ..: .::: ::: :. .:: :. .: .:: . : . CCDS12 EVTLETWEHIVSLGLFLSKSDVISQLEQEEDLCRAEQEAPR----DWKATLEENRLNSEK 50 60 70 80 90 150 160 170 180 190 200 pF1KSD SIFEEEQSHGMKLERYIWDDPWFSRLEVLG-CKDQLEMYHMNQSTAMRQMVFMQKQVLSQ . .:: :: ... : ..: : ::: .:: .. . .: ...: ::. ......: CCDS12 DRAREELSHHVEVYRSGPEEP--PSL-VLGKVQDQSNQLREHQENSLRFMVLTSERLFAQ 100 110 120 130 140 150 210 220 230 240 250 pF1KSD RSSEFC----GLGAEFSQNLNFVPSQRVSQIEHFYKPDTHAQSWRCDSAIMY-----ADK : : : : : . ..:...:. .. : ::..... . .::.. :: CCDS12 R--EHCELELGGGYSLPSTLSLLPTTLPTST-GFPKPNSQVKELKQNSAFINHEKNGADG 160 170 180 190 200 210 260 270 280 290 300 310 pF1KSD VTCENNDYDKTVYQSIQPIYPARIQTGD-NLFKCTDAVKSFNHIIHFGDHKGIHTGEKLY ::... .. ::: . ..:: : .. . :.:. . : . .: CCDS12 KHCESHQCARAFCQSIYLSKLGNVETGKKNPYEYIVSGDSLNYGSSLCFHGRTFSVKKSD 220 230 240 250 260 270 320 330 340 350 360 370 pF1KSD EYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFS-SFMEHQKIGTVEKAYKYNE . :. ..:..: :.::. .: :..::. : .. : ... .. : : .. .: CCDS12 DCKDYGNLFSHSVSLNEQKPVHFGKSQYECDECRETCSESLCLVQTERSGPGETPFRCEE 280 290 300 310 320 330 380 390 400 410 420 430 pF1KSD WEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKTHTGEKPYECDKCGKV .: . : ... . :.::: :.:: :: : . :..:::::::.:: .::: CCDS12 RCAAFPMASSFSDCNIIQTTEKPSVCNQCGKSF--SCCKLIHQRTHTGEKPFECTQCGKS 340 350 360 370 380 440 450 460 470 480 490 pF1KSD FRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGEKPYVCNECGKSFNWN : . :. :.::::: :::::. :::.:. :.::.:.::::::::: : :: ::: :: CCDS12 FSQSYDLVIHQRTHTGEKPYECDLCGKSFTQRSKLITHQRIHTGEKPYQCIECRKSFRWN 390 400 410 420 430 440 500 510 520 530 540 550 pF1KSD SHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFKCDECEKAFRDYSALS :.:: ::: ::::::.:::.:::::: : .:..: : ::::::::: .: :.: . : CCDS12 SNLIVHQRIHTGEKPYECTHCGKSFSQSYELVTHKRTHTGEKPFKCTQCGKSFSQKYDLV 450 460 470 480 490 500 560 570 580 590 600 610 pF1KSD KHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQECGKAFRERSALTKHEI :.:::.: :::.:. :::::: ::.::.::: :::::::.: ::::.:: : :. :. CCDS12 VHQRTHTGEKPYECNLCGKSFSQSSKLITHQRIHTGEKPYQCIECGKSFRWNSNLVIHQR 510 520 530 540 550 560 620 630 640 650 660 670 pF1KSD IHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSFSQSCHLVAHRRIHTG ::.: :::.:..:::: :: .:: :.::::::::::::.:::.:..: .:. : .:::: CCDS12 IHTGEKPYDCTHCGKSFSQSYQLVAHKRTHTGEKPYECNECGKAFNRSTQLIRHLQIHTG 570 580 590 600 610 620 680 690 700 710 720 730 pF1KSD EKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESSSLIVHLRNHTGEKPY :::::::::...: ::.:. :.::::::::..:..:::::. ::.:. : : :.::::: CCDS12 EKPYKCNQCNKAFARSSYLVMHQRTHTGEKPFECSQCGKAFSGSSNLLSHHRIHSGEKPY 630 640 650 660 670 680 740 750 760 770 780 790 pF1KSD KCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQHQRNHSEEKLN .:. : :.: ..:.:..:.: :.::: CCDS12 ECSDCGKSFRQQSQLVVHRRTHTGEKP 690 700 710 >>CCDS60514.1 ZNF33A gene_id:7581|Hs108|chr10 (817 aa) initn: 1785 init1: 1785 opt: 2101 Z-score: 1278.8 bits: 247.5 E(32554): 6.6e-65 Smith-Waterman score: 2114; 44.0% identity (68.4% similar) in 769 aa overlap (48-790:6-753) 20 30 40 50 60 70 pF1KSD WGMTAVDPWASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWG ::..:. . :: :.::::.: :::::: CCDS60 MANATRRGSGVEQ-KSQESVSFKDVTVGFTQEEWQ 10 20 30 80 90 100 110 120 130 pF1KSD QLDLVQRTLYRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPEWV- .:: ::.::::::::.:..:.::: . ::::: :.::::::. :. :... : :. CCDS60 HLDPSQRALYRDVMLENYSNLVSVGYCVHKPEVIFRLQQGEEPWKQEEEFPSQSFPVWTA 40 50 60 70 80 90 140 150 160 170 180 pF1KSD -----RNLESKA------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEM :. :... .. . .. .::. . . . . . :: : :. : CCDS60 DHLKERSQENQSKHLWEVVFINNEMLTKEQGDVIGIPFNVDVSSFPSRKMFCQC-DSCGM 100 110 120 130 140 150 190 200 210 220 230 pF1KSD YHMNQSTAMRQMVFMQKQVLSQRSSEF--CG---LGAEF----SQNLNFVPSQRVSQIEH . ... ..:. . . :...:.:: :: :. . .:. : : ..: . . : CCDS60 ----SFNTVSELVISKINYLGKKSDEFNACGKLLLNIKHDETHTQEKNEVLKNR-NTLSH 160 170 180 190 200 240 250 260 270 280 290 pF1KSD FYKPDTHAQSWRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGD-NLFK---CT . : . . . :. :... .:.:... : :. .. : : : : CCDS60 HEETLQHEKIQTLEHNFEYS---ICQETLLEKAVFNT-QKRENAEENNCDYNEFGRTLCD 210 220 230 240 250 260 300 310 320 330 340 350 pF1KSD DAVKSFNHIIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYEN .. :..: :.. ::...:.... . .... :. :. ..:. : : CCDS60 SSSLLFHQISPSRDNH--------YEFSDCEKFLCVKSTLSK-PH-GVSMKHYDCGESGN 270 280 290 300 310 360 370 380 390 400 410 pF1KSD IFYFSSFMEH-QKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIW : . . : :: :: .. :: :.: : ::.: ..:..::.. ::: .: CCDS60 NFRRKLCLSHLQKGDKGEKHFECNECGKAFWEKSHLTRHQRVHTGQKPFQCNECEKAFWD 320 330 340 350 360 370 420 430 440 450 460 470 pF1KSD SSYLIQHKKTHTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHL .: : .:...::::::.::..:::.: ..:::: :.::::: :::.:: :::.: .: : CCDS60 KSNLTKHQRSHTGEKPFECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFCQKSDL 380 390 400 410 420 430 480 490 500 510 520 530 pF1KSD IVHKRIHTGEKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHM :.: ::: ::: : :::::: .::: ::::::::::::: ::::::: .:.: :. CCDS60 TKHQRTHTGLKPYECYECGKSFRVTSHLKVHQRTHTGEKPFECLECGKSFSEKSNLTQHQ 440 450 460 470 480 490 540 550 560 570 580 590 pF1KSD RMHTGEKPFKCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHT :.: :.: ..:. : :.: : :..:. :.: :::.: ::::.: .: : .:::::: CCDS60 RIHIGDKSYECNACGKTFYHKSLLTRHQIIHTGWKPYECYECGKTFCLKSDLTVHQRTHT 500 510 520 530 540 550 600 610 620 630 640 650 pF1KSD GEKPYNCQECGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKP :.::. : :::: : ..:.:..: :.: :::::..::: . ..:..:.:::::::: CCDS60 GQKPFACPECGKFFSHKSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKP 560 570 580 590 600 610 660 670 680 690 700 710 pF1KSD YECNKCGKSFSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCN ::::.:::.: :. .:. :.::: ::::::::.: ..: .: ::.:.:::: ::::.:: CCDS60 YECNECGKAFYQKSQLTQHQRIHIGEKPYKCNECGKAFCHKSALIVHQRTHTQEKPYKCN 620 630 640 650 660 670 720 730 740 750 760 770 pF1KSD ECGKAFNESSSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGK ::::.: .:.:: : :.:::::::.::.: : : ..::: .:.: :.::: :.:::: CCDS60 ECGKSFCVKSGLIFHERKHTGEKPYECNECGKFFRHKSSLTVHHRAHTGEKSCQCNECGK 680 690 700 710 720 730 780 790 pF1KSD AFSGHSALLQHQRNHSEEKLN : .: : ::::.:. :: CCDS60 IFYRKSELAQHQRSHTGEKPYECNTCRKTFSQKSNLIVHQRRHIGENLMNEMDIRNFQPQ 740 750 760 770 780 790 >>CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 (839 aa) initn: 3358 init1: 1831 opt: 2098 Z-score: 1276.9 bits: 247.2 E(32554): 8.4e-65 Smith-Waterman score: 2109; 43.8% identity (66.9% similar) in 767 aa overlap (56-790:2-763) 30 40 50 60 70 80 pF1KSD WASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRT : .: :::.:::..:.:::: :: .::: CCDS33 MALTQGQVTFRDVAIEFSQEEWTCLDPAQRT 10 20 30 90 100 110 120 130 140 pF1KSD LYRDVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCP---EWVRNLESK ::::::::.: .: :.: . .::.::::.::...:. : ::. : CCDS33 LYRDVMLENYRNLASLGISCFDLSIISMLEQGKEPFTLESQVQIAGNPDGWEWI-----K 40 50 60 70 80 150 160 170 180 pF1KSD ALIPAQS---IFEEEQSHGMKLERYIWDDPWFSRLE---VLGCK--------DQLEMYHM :.: : : .... .: . ... . : : . ::. ::. CCDS33 AVITALSSEFVMKDLLHKGKSNTGEVFQTVMLERQESQDIEGCSFREVQKNTHGLEYQCR 90 100 110 120 130 140 190 200 210 220 230 pF1KSD NQSTAMRQMVFMQKQVLS-------QRSSEFCGLGAEFSQNL-NFVPSQRVSQIE-HFYK . .. ... :. :. .:... . ... .: . .: .. : : ..:. CCDS33 DAEGNYKGVLLTQEGNLTHGRDEHDKRDARNKLIKNQLGLSLQSHLPELQLFQYEGKIYE 150 160 170 180 190 200 240 250 260 270 280 290 pF1KSD PDTHAQSWRCDSAI-----MYADKVTCENNDYDKTVYQSIQPIYPARIQTGDNLFKCTDA . .:. .:.. : . : .. : : .:. . .. . .: . CCDS33 CNQVEKSFNNNSSVSPPQQMPYNVKTHISKKYLKDFISSLLLTQGQKANNWGSPYKSNGC 210 220 230 240 250 260 300 310 320 330 340 350 pF1KSD VKSFNHIIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIF : . :...:. :: :: :. :: . : ... : .:.::..:. .: ..: CCDS33 GMVFPQNSHLASHQRSHTKEKPYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKVF 270 280 290 300 310 320 360 370 380 390 400 410 pF1KSD YFSSFM-EHQKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSS .: . .:::: : :: :: :: ::: .: :..: . .:.:::: :::: .: : CCDS33 SRNSQLSQHQKIHTGEKPYKCNECGKVFTQNSHLVRHRGIHTGEKPYKCNECGKAFRARS 330 340 350 360 370 380 420 430 440 450 460 470 pF1KSD YLIQHKKTHTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIV : :. ::.:::::.:..::::: . : ::.: : ::: :::.::.:::::. : : . CCDS33 SLAIHQATHSGEKPYKCNECGKVFTQNSHLTNHWRIHTGEKPYKCNECGKAFGVRSSLAI 390 400 410 420 430 440 480 490 500 510 520 530 pF1KSD HKRIHTGEKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRM : :::::::: :.:::: : :::: :: ::::::..:.::::.: :.: .:. . CCDS33 HLVIHTGEKPYKCHECGKVFRRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTTHQVI 450 460 470 480 490 500 540 550 560 570 580 590 pF1KSD HTGEKPFKCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGE ::::::.::.:: :.: . : :..:.: :.:.::: :.::::.:: : : .:: :::: CCDS33 HTGEKPYKCNECGKVFTQNSHLANHQRIHTGVKPYMCNECGKAFSVYSSLTTHQVIHTGE 510 520 530 540 550 560 600 610 620 630 640 650 pF1KSD KPYNCQECGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYE :::.:.::::.: . : :..:. ::.: :::.::.::: . ..: :::: :::::::. CCDS33 KPYKCNECGKVFTQNSHLARHRGIHTGEKPYKCNECGKVFRHNSYLSRHQRIHTGEKPYK 570 580 590 600 610 620 660 670 680 690 700 710 pF1KSD CNKCGKSFSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNEC :. ::.::. .:..:. :::::::::::.: . :. .::: :::.::: :::.:::: CCDS33 YNEYGKAFSEHSNLTTHQVIHTGEKPYKCNECGKVFTQNSHLARHRRVHTGGKPYQCNEC 630 640 650 660 670 680 720 730 740 750 760 770 pF1KSD GKAFNESSSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAF ::::...:.: : : :::::::.::.: ::: ::: :: .:.:.: . :.::::.: CCDS33 GKAFSQTSKLARHQRVHTGEKPYECNQCGKAFSVRSSLTTHQAIHTGKKPYKCNECGKVF 690 700 710 720 730 740 780 790 pF1KSD SGHSALLQHQRNHSEEKLN . .: : .:. :. :: CCDS33 TQNSHLARHRGIHTGEKPYKCNECGKAFSQTSKLARHQRIHTGEKPYECGKPFSICSSLT 750 760 770 780 790 800 >>CCDS31182.1 ZNF33A gene_id:7581|Hs108|chr10 (810 aa) initn: 1785 init1: 1785 opt: 2090 Z-score: 1272.2 bits: 246.3 E(32554): 1.5e-64 Smith-Waterman score: 2103; 44.2% identity (68.5% similar) in 758 aa overlap (59-790:9-746) 30 40 50 60 70 80 pF1KSD WALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLYR :: :.::::.: :::::: .:: ::.::: CCDS31 MNKVEQKSQESVSFKDVTVGFTQEEWQHLDPSQRALYR 10 20 30 90 100 110 120 130 140 pF1KSD DVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPEWV------RNLESK :::::.:..:.::: . ::::: :.::::::. :. :... : :. :. :.. CCDS31 DVMLENYSNLVSVGYCVHKPEVIFRLQQGEEPWKQEEEFPSQSFPVWTADHLKERSQENQ 40 50 60 70 80 90 150 160 170 180 190 pF1KSD A------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEMYHMNQSTAMRQ . .. . .. .::. . . . . . :: : :. : . ... . CCDS31 SKHLWEVVFINNEMLTKEQGDVIGIPFNVDVSSFPSRKMFCQC-DSCGM----SFNTVSE 100 110 120 130 140 150 200 210 220 230 240 pF1KSD MVFMQKQVLSQRSSEF--CG---LGAEF----SQNLNFVPSQRVSQIEHFYKPDTHAQSW .:. . . :...:.:: :: :. . .:. : : ..: . . : . : . CCDS31 LVISKINYLGKKSDEFNACGKLLLNIKHDETHTQEKNEVLKNR-NTLSHHEETLQHEKIQ 160 170 180 190 200 210 250 260 270 280 290 300 pF1KSD RCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGD-NLFK---CTDAVKSFNHIIH . . :. :... .:.:... : :. .. : : : : .. :..: CCDS31 TLEHNFEYS---ICQETLLEKAVFNT-QKRENAEENNCDYNEFGRTLCDSSSLLFHQISP 220 230 240 250 260 310 320 330 340 350 360 pF1KSD FGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFMEH- :.. ::...:.... . .... :. :. ..:. : : : . . : CCDS31 SRDNH--------YEFSDCEKFLCVKSTLSK-PH-GVSMKHYDCGESGNNFRRKLCLSHL 270 280 290 300 310 370 380 390 400 410 420 pF1KSD QKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKTH :: :: .. :: :.: : ::.: ..:..::.. ::: .: .: : .:...: CCDS31 QKGDKGEKHFECNECGKAFWEKSHLTRHQRVHTGQKPFQCNECEKAFWDKSNLTKHQRSH 320 330 340 350 360 370 430 440 450 460 470 480 pF1KSD TGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGEK :::::.::..:::.: ..:::: :.::::: :::.:: :::.: .: : :.: ::: : CCDS31 TGEKPFECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFCQKSDLTKHQRTHTGLK 380 390 400 410 420 430 490 500 510 520 530 540 pF1KSD PYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFKC :: : :::::: .::: ::::::::::::: ::::::: .:.: :.:.: :.: ..: CCDS31 PYECYECGKSFRVTSHLKVHQRTHTGEKPFECLECGKSFSEKSNLTQHQRIHIGDKSYEC 440 450 460 470 480 490 550 560 570 580 590 600 pF1KSD DECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQECG . : :.: : :..:. :.: :::.: ::::.: .: : .:::::::.::. : ::: CCDS31 NACGKTFYHKSLLTRHQIIHTGWKPYECYECGKTFCLKSDLTVHQRTHTGQKPFACPECG 500 510 520 530 540 550 610 620 630 640 650 660 pF1KSD KAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSFS : : ..:.:..: :.: :::::..::: . ..:..:.::::::::::::.:::.: CCDS31 KFFSHKSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKPYECNECGKAFY 560 570 580 590 600 610 670 680 690 700 710 720 pF1KSD QSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESSS :. .:. :.::: ::::::::.: ..: .: ::.:.:::: ::::.::::::.: .:. CCDS31 QKSQLTQHQRIHIGEKPYKCNECGKAFCHKSALIVHQRTHTQEKPYKCNECGKSFCVKSG 620 630 640 650 660 670 730 740 750 760 770 780 pF1KSD LIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQH :: : :.:::::::.::.: : : ..::: .:.: :.::: :.:::: : .: : :: CCDS31 LIFHERKHTGEKPYECNECGKFFRHKSSLTVHHRAHTGEKSCQCNECGKIFYRKSELAQH 680 690 700 710 720 730 790 pF1KSD QRNHSEEKLN ::.:. :: CCDS31 QRSHTGEKPYECNTCRKTFSQKSNLIVHQRRHIGENLMNEMDIRNFQPQVSLHNASEYSH 740 750 760 770 780 790 >>CCDS44372.1 ZNF33A gene_id:7581|Hs108|chr10 (811 aa) initn: 1785 init1: 1785 opt: 2087 Z-score: 1270.4 bits: 245.9 E(32554): 1.9e-64 Smith-Waterman score: 2100; 44.3% identity (68.5% similar) in 759 aa overlap (59-790:9-747) 30 40 50 60 70 80 pF1KSD WALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLYR :: :.::::.: :::::: .:: ::.::: CCDS44 MNKVEQKSQESVSFKDVTVGFTQEEWQHLDPSQRALYR 10 20 30 90 100 110 120 130 140 pF1KSD DVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPE-WV------RNLES :::::.:..:.::: . ::::: :.::::::. :. :... :: :. :. :. CCDS44 DVMLENYSNLVSVGYCVHKPEVIFRLQQGEEPWKQEEEFPSQSFPEVWTADHLKERSQEN 40 50 60 70 80 90 150 160 170 180 190 pF1KSD KA------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEMYHMNQSTAMR .. .. . .. .::. . . . . . :: : :. : . ... CCDS44 QSKHLWEVVFINNEMLTKEQGDVIGIPFNVDVSSFPSRKMFCQC-DSCGM----SFNTVS 100 110 120 130 140 150 200 210 220 230 240 pF1KSD QMVFMQKQVLSQRSSEF--CG---LGAEF----SQNLNFVPSQRVSQIEHFYKPDTHAQS ..:. . . :...:.:: :: :. . .:. : : ..: . . : . : . CCDS44 ELVISKINYLGKKSDEFNACGKLLLNIKHDETHTQEKNEVLKNR-NTLSHHEETLQHEKI 160 170 180 190 200 210 250 260 270 280 290 300 pF1KSD WRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGD-NLFK---CTDAVKSFNHII . . :. :... .:.:... : :. .. : : : : .. :..: CCDS44 QTLEHNFEYS---ICQETLLEKAVFNT-QKRENAEENNCDYNEFGRTLCDSSSLLFHQIS 220 230 240 250 260 310 320 330 340 350 360 pF1KSD HFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFMEH :.. ::...:.... . .... :. :. ..:. : : : . . : CCDS44 PSRDNH--------YEFSDCEKFLCVKSTLSK-PH-GVSMKHYDCGESGNNFRRKLCLSH 270 280 290 300 310 370 380 390 400 410 420 pF1KSD -QKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKT :: :: .. :: :.: : ::.: ..:..::.. ::: .: .: : .:... CCDS44 LQKGDKGEKHFECNECGKAFWEKSHLTRHQRVHTGQKPFQCNECEKAFWDKSNLTKHQRS 320 330 340 350 360 370 430 440 450 460 470 480 pF1KSD HTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGE ::::::.::..:::.: ..:::: :.::::: :::.:: :::.: .: : :.: ::: CCDS44 HTGEKPFECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFCQKSDLTKHQRTHTGL 380 390 400 410 420 430 490 500 510 520 530 540 pF1KSD KPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFK ::: : :::::: .::: ::::::::::::: ::::::: .:.: :.:.: :.: .. CCDS44 KPYECYECGKSFRVTSHLKVHQRTHTGEKPFECLECGKSFSEKSNLTQHQRIHIGDKSYE 440 450 460 470 480 490 550 560 570 580 590 600 pF1KSD CDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQEC :. : :.: : :..:. :.: :::.: ::::.: .: : .:::::::.::. : :: CCDS44 CNACGKTFYHKSLLTRHQIIHTGWKPYECYECGKTFCLKSDLTVHQRTHTGQKPFACPEC 500 510 520 530 540 550 610 620 630 640 650 660 pF1KSD GKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSF :: : ..:.:..: :.: :::::..::: . ..:..:.::::::::::::.:::.: CCDS44 GKFFSHKSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKPYECNECGKAF 560 570 580 590 600 610 670 680 690 700 710 720 pF1KSD SQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESS :. .:. :.::: ::::::::.: ..: .: ::.:.:::: ::::.::::::.: .: CCDS44 YQKSQLTQHQRIHIGEKPYKCNECGKAFCHKSALIVHQRTHTQEKPYKCNECGKSFCVKS 620 630 640 650 660 670 730 740 750 760 770 780 pF1KSD SLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQ .:: : :.:::::::.::.: : : ..::: .:.: :.::: :.:::: : .: : : CCDS44 GLIFHERKHTGEKPYECNECGKFFRHKSSLTVHHRAHTGEKSCQCNECGKIFYRKSELAQ 680 690 700 710 720 730 790 pF1KSD HQRNHSEEKLN :::.:. :: CCDS44 HQRSHTGEKPYECNTCRKTFSQKSNLIVHQRRHIGENLMNEMDIRNFQPQVSLHNASEYS 740 750 760 770 780 790 >>CCDS73088.1 ZNF33A gene_id:7581|Hs108|chr10 (829 aa) initn: 1785 init1: 1785 opt: 2087 Z-score: 1270.4 bits: 246.0 E(32554): 1.9e-64 Smith-Waterman score: 2100; 44.3% identity (68.5% similar) in 759 aa overlap (59-790:27-765) 30 40 50 60 70 80 pF1KSD WALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRTLYR :: :.::::.: :::::: .:: ::.::: CCDS73 MCPRGYPEQSNWMSSPLYSTEVEQKSQESVSFKDVTVGFTQEEWQHLDPSQRALYR 10 20 30 40 50 90 100 110 120 130 140 pF1KSD DVMLETYGHLLSVGNQIAKPEVISLLEQGEEPWSVEQACPQRTCPE-WV------RNLES :::::.:..:.::: . ::::: :.::::::. :. :... :: :. :. :. CCDS73 DVMLENYSNLVSVGYCVHKPEVIFRLQQGEEPWKQEEEFPSQSFPEVWTADHLKERSQEN 60 70 80 90 100 110 150 160 170 180 190 pF1KSD KA------LIPAQSIFEEEQSHGMKLERYIWDDPWFSRLEVLGCKDQLEMYHMNQSTAMR .. .. . .. .::. . . . . . :: : :. : . ... CCDS73 QSKHLWEVVFINNEMLTKEQGDVIGIPFNVDVSSFPSRKMFCQC-DSCGM----SFNTVS 120 130 140 150 160 170 200 210 220 230 240 pF1KSD QMVFMQKQVLSQRSSEF--CG---LGAEF----SQNLNFVPSQRVSQIEHFYKPDTHAQS ..:. . . :...:.:: :: :. . .:. : : ..: . . : . : . CCDS73 ELVISKINYLGKKSDEFNACGKLLLNIKHDETHTQEKNEVLKNR-NTLSHHEETLQHEKI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KSD WRCDSAIMYADKVTCENNDYDKTVYQSIQPIYPARIQTGD-NLFK---CTDAVKSFNHII . . :. :... .:.:... : :. .. : : : : .. :..: CCDS73 QTLEHNFEYS---ICQETLLEKAVFNT-QKRENAEENNCDYNEFGRTLCDSSSLLFHQIS 240 250 260 270 280 310 320 330 340 350 360 pF1KSD HFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENIFYFSSFMEH :.. ::...:.... . .... :. :. ..:. : : : . . : CCDS73 PSRDNH--------YEFSDCEKFLCVKSTLSK-PH-GVSMKHYDCGESGNNFRRKLCLSH 290 300 310 320 330 370 380 390 400 410 420 pF1KSD -QKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWSSYLIQHKKT :: :: .. :: :.: : ::.: ..:..::.. ::: .: .: : .:... CCDS73 LQKGDKGEKHFECNECGKAFWEKSHLTRHQRVHTGQKPFQCNECEKAFWDKSNLTKHQRS 340 350 360 370 380 390 430 440 450 460 470 480 pF1KSD HTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLIVHKRIHTGE ::::::.::..:::.: ..:::: :.::::: :::.:: :::.: .: : :.: ::: CCDS73 HTGEKPFECNECGKAFSHKSALTLHQRTHTGEKPYQCNACGKTFCQKSDLTKHQRTHTGL 400 410 420 430 440 450 490 500 510 520 530 540 pF1KSD KPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMRMHTGEKPFK ::: : :::::: .::: ::::::::::::: ::::::: .:.: :.:.: :.: .. CCDS73 KPYECYECGKSFRVTSHLKVHQRTHTGEKPFECLECGKSFSEKSNLTQHQRIHIGDKSYE 460 470 480 490 500 510 550 560 570 580 590 600 pF1KSD CDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTGEKPYNCQEC :. : :.: : :..:. :.: :::.: ::::.: .: : .:::::::.::. : :: CCDS73 CNACGKTFYHKSLLTRHQIIHTGWKPYECYECGKTFCLKSDLTVHQRTHTGQKPFACPEC 520 530 540 550 560 570 610 620 630 640 650 660 pF1KSD GKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPYECNKCGKSF :: : ..:.:..: :.: :::::..::: . ..:..:.::::::::::::.:::.: CCDS73 GKFFSHKSTLSQHYRTHTGEKPYECHECGKIFYNKSYLTKHNRTHTGEKPYECNECGKAF 580 590 600 610 620 630 670 680 690 700 710 720 pF1KSD SQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNECGKAFNESS :. .:. :.::: ::::::::.: ..: .: ::.:.:::: ::::.::::::.: .: CCDS73 YQKSQLTQHQRIHIGEKPYKCNECGKAFCHKSALIVHQRTHTQEKPYKCNECGKSFCVKS 640 650 660 670 680 690 730 740 750 760 770 780 pF1KSD SLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKAFSGHSALLQ .:: : :.:::::::.::.: : : ..::: .:.: :.::: :.:::: : .: : : CCDS73 GLIFHERKHTGEKPYECNECGKFFRHKSSLTVHHRAHTGEKSCQCNECGKIFYRKSELAQ 700 710 720 730 740 750 790 pF1KSD HQRNHSEEKLN :::.:. :: CCDS73 HQRSHTGEKPYECNTCRKTFSQKSNLIVHQRRHIGENLMNEMDIRNFQPQVSLHNASEYS 760 770 780 790 800 810 >>CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 (840 aa) initn: 3358 init1: 1831 opt: 2086 Z-score: 1269.7 bits: 245.9 E(32554): 2.1e-64 Smith-Waterman score: 2097; 43.8% identity (66.8% similar) in 768 aa overlap (56-790:2-764) 30 40 50 60 70 80 pF1KSD WASWALCPQYPAWHVEGSLEEGRRATGLPAAQVQEPVTFKDVAVDFTQEEWGQLDLVQRT : .: :::.:::..:.:::: :: .::: CCDS54 MALTQGQVTFRDVAIEFSQEEWTCLDPAQRT 10 20 30 90 100 110 120 130 140 pF1KSD LYRDVMLETYGHLLSV-GNQIAKPEVISLLEQGEEPWSVEQACPQRTCP---EWVRNLES ::::::::.: .: :. : . .::.::::.::...:. : ::. CCDS54 LYRDVMLENYRNLASLAGISCFDLSIISMLEQGKEPFTLESQVQIAGNPDGWEWI----- 40 50 60 70 80 150 160 170 180 pF1KSD KALIPAQS---IFEEEQSHGMKLERYIWDDPWFSRLE---VLGCK--------DQLEMYH ::.: : : .... .: . ... . : : . ::. ::. CCDS54 KAVITALSSEFVMKDLLHKGKSNTGEVFQTVMLERQESQDIEGCSFREVQKNTHGLEYQC 90 100 110 120 130 140 190 200 210 220 230 pF1KSD MNQSTAMRQMVFMQKQVLS-------QRSSEFCGLGAEFSQNL-NFVPSQRVSQIE-HFY . .. ... :. :. .:... . ... .: . .: .. : : ..: CCDS54 RDAEGNYKGVLLTQEGNLTHGRDEHDKRDARNKLIKNQLGLSLQSHLPELQLFQYEGKIY 150 160 170 180 190 200 240 250 260 270 280 290 pF1KSD KPDTHAQSWRCDSAI-----MYADKVTCENNDYDKTVYQSIQPIYPARIQTGDNLFKCTD . . .:. .:.. : . : .. : : .:. . .. . .: . CCDS54 ECNQVEKSFNNNSSVSPPQQMPYNVKTHISKKYLKDFISSLLLTQGQKANNWGSPYKSNG 210 220 230 240 250 260 300 310 320 330 340 350 pF1KSD AVKSFNHIIHFGDHKGIHTGEKLYEYKECHQIFNQSPSFNEHPRLHVGENQYNYKEYENI : . :...:. :: :: :. :: . : ... : .:.::..:. .: .. CCDS54 CGMVFPQNSHLASHQRSHTKEKPYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKV 270 280 290 300 310 320 360 370 380 390 400 410 pF1KSD FYFSSFM-EHQKIGTVEKAYKYNEWEKVFGYDSFLTQHTSTYTAEKPYDYNECGTSFIWS : .: . .:::: : :: :: :: ::: .: :..: . .:.:::: :::: .: CCDS54 FSRNSQLSQHQKIHTGEKPYKCNECGKVFTQNSHLVRHRGIHTGEKPYKCNECGKAFRAR 330 340 350 360 370 380 420 430 440 450 460 470 pF1KSD SYLIQHKKTHTGEKPYECDKCGKVFRNRSALTKHERTHTGIKPYECNKCGKAFSWNSHLI : : :. ::.:::::.:..::::: . : ::.: : ::: :::.::.:::::. : : CCDS54 SSLAIHQATHSGEKPYKCNECGKVFTQNSHLTNHWRIHTGEKPYKCNECGKAFGVRSSLA 390 400 410 420 430 440 480 490 500 510 520 530 pF1KSD VHKRIHTGEKPYVCNECGKSFNWNSHLIGHQRTHTGEKPFECTECGKSFSWSSHLIAHMR .: :::::::: :.:::: : :::: :: ::::::..:.::::.: :.: .:. CCDS54 IHLVIHTGEKPYKCHECGKVFRRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTTHQV 450 460 470 480 490 500 540 550 560 570 580 590 pF1KSD MHTGEKPFKCDECEKAFRDYSALSKHERTHSGAKPYKCTECGKSFSWSSHLIAHQRTHTG .::::::.::.:: :.: . : :..:.: :.:.::: :.::::.:: : : .:: ::: CCDS54 IHTGEKPYKCNECGKVFTQNSHLANHQRIHTGVKPYMCNECGKAFSVYSSLTTHQVIHTG 510 520 530 540 550 560 600 610 620 630 640 650 pF1KSD EKPYNCQECGKAFRERSALTKHEIIHSGIKPYECNKCGKSCSQMAHLVRHQRTHTGEKPY ::::.:.::::.: . : :..:. ::.: :::.::.::: . ..: :::: ::::::: CCDS54 EKPYKCNECGKVFTQNSHLARHRGIHTGEKPYKCNECGKVFRHNSYLSRHQRIHTGEKPY 570 580 590 600 610 620 660 670 680 690 700 710 pF1KSD ECNKCGKSFSQSCHLVAHRRIHTGEKPYKCNQCERSFNCSSHLIAHRRTHTGEKPYRCNE . :. ::.::. .:..:. :::::::::::.: . :. .::: :::.::: :::.::: CCDS54 KYNEYGKAFSEHSNLTTHQVIHTGEKPYKCNECGKVFTQNSHLARHRRVHTGGKPYQCNE 630 640 650 660 670 680 720 730 740 750 760 770 pF1KSD CGKAFNESSSLIVHLRNHTGEKPYKCNHCEKAFCKNSSLIIHQRMHSGEKRFICSECGKA :::::...:.: : : :::::::.::.: ::: ::: :: .:.:.: . :.::::. CCDS54 CGKAFSQTSKLARHQRVHTGEKPYECNQCGKAFSVRSSLTTHQAIHTGKKPYKCNECGKV 690 700 710 720 730 740 780 790 pF1KSD FSGHSALLQHQRNHSEEKLN :. .: : .:. :. :: CCDS54 FTQNSHLARHRGIHTGEKPYKCNECGKAFSQTSKLARHQRIHTGEKPYECGKPFSICSSL 750 760 770 780 790 800 792 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 07:30:01 2016 done: Thu Nov 3 07:30:02 2016 Total Scan time: 3.770 Total Display time: 0.330 Function used was FASTA [36.3.4 Apr, 2011]