Result of FASTA (ccds) for pF1KSDA0326
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KSDA0326, 869 aa
  1>>>pF1KSDA0326 869 - 869 aa - 869 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.0270+/-0.000979; mu= 11.3760+/- 0.059
 mean_var=241.8692+/-48.598, 0's: 0 Z-trim(113.5): 957  B-trim: 38 in 2/50
 Lambda= 0.082468
 statistics sampled from 13129 (14149) to 13129 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.736), E-opt: 0.2 (0.435), width:  16
 Scan time:  4.230

The best scores are:                                      opt bits E(32554)
CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16       ( 869) 6210 752.6 6.9e-217
CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19      (1058) 2129 267.1 1.1e-70
CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19      (1090) 2129 267.2 1.2e-70
CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19        (1280) 2043 257.0 1.6e-67
CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19   (1252) 1977 249.1 3.6e-65
CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19      ( 936) 1932 243.6 1.2e-63
CCDS46991.1 ZNF721 gene_id:170960|Hs108|chr4       ( 923) 1902 240.1 1.4e-62
CCDS82388.1 ZNF841 gene_id:284371|Hs108|chr19      ( 808) 1896 239.3 2.1e-62
CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19      ( 688) 1890 238.5 3.1e-62
CCDS46161.1 ZNF841 gene_id:284371|Hs108|chr19      ( 924) 1853 234.2   8e-61
CCDS4624.1 ZNF184 gene_id:7738|Hs108|chr6          ( 751) 1845 233.2 1.4e-60
CCDS45012.1 ZNF268 gene_id:10795|Hs108|chr12       ( 947) 1840 232.7 2.4e-60
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19        ( 616) 1831 231.4 3.8e-60
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19        ( 658) 1831 231.5 3.9e-60
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19        ( 670) 1831 231.5   4e-60
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19        ( 682) 1831 231.5   4e-60
CCDS2717.1 ZNF197 gene_id:10168|Hs108|chr3         (1029) 1834 232.0 4.1e-60
CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12         ( 738) 1823 230.6 8.2e-60
CCDS46170.1 ZNF845 gene_id:91664|Hs108|chr19       ( 970) 1822 230.6 1.1e-59
CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17       ( 865) 1811 229.2 2.5e-59
CCDS82409.1 ZNF418 gene_id:147686|Hs108|chr19      ( 591) 1806 228.4 2.9e-59
CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15       ( 614) 1806 228.4   3e-59
CCDS42642.1 ZNF418 gene_id:147686|Hs108|chr19      ( 676) 1806 228.5 3.2e-59
CCDS46169.1 ZNF665 gene_id:79788|Hs108|chr19       ( 678) 1806 228.5 3.2e-59
CCDS82410.1 ZNF418 gene_id:147686|Hs108|chr19      ( 697) 1806 228.5 3.2e-59
CCDS75846.1 ZNF658 gene_id:26149|Hs108|chr9        (1059) 1796 227.5 9.7e-59
CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8           ( 682) 1788 226.4 1.4e-58
CCDS82391.1 ZNF160 gene_id:90338|Hs108|chr19       ( 782) 1786 226.2 1.8e-58
CCDS12859.1 ZNF160 gene_id:90338|Hs108|chr19       ( 818) 1786 226.2 1.9e-58
CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19       ( 839) 1786 226.2 1.9e-58
CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19       ( 840) 1786 226.2 1.9e-58
CCDS14279.1 ZNF41 gene_id:7592|Hs108|chrX          ( 779) 1781 225.6 2.7e-58
CCDS59367.1 ZNF43 gene_id:7594|Hs108|chr19         ( 803) 1777 225.1 3.9e-58
CCDS12413.2 ZNF43 gene_id:7594|Hs108|chr19         ( 809) 1777 225.1 3.9e-58
CCDS74321.1 ZNF43 gene_id:7594|Hs108|chr19         ( 818) 1777 225.1 3.9e-58
CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19         (1159) 1779 225.5 4.2e-58
CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19         (1191) 1779 225.6 4.2e-58
CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19        ( 803) 1769 224.2 7.5e-58
CCDS2715.1 ZKSCAN7 gene_id:55888|Hs108|chr3        ( 754) 1767 223.9 8.4e-58
CCDS42537.1 ZNF429 gene_id:353088|Hs108|chr19      ( 674) 1747 221.5 4.1e-57
CCDS73089.1 ZNF33A gene_id:7581|Hs108|chr10        ( 699) 1742 220.9 6.3e-57
CCDS31182.1 ZNF33A gene_id:7581|Hs108|chr10        ( 810) 1742 221.0   7e-57
CCDS44372.1 ZNF33A gene_id:7581|Hs108|chr10        ( 811) 1742 221.0   7e-57
CCDS60514.1 ZNF33A gene_id:7581|Hs108|chr10        ( 817) 1742 221.0   7e-57
CCDS73088.1 ZNF33A gene_id:7581|Hs108|chr10        ( 829) 1742 221.0 7.1e-57
CCDS76895.1 ZNF23 gene_id:7571|Hs108|chr16         ( 585) 1735 220.0   1e-56
CCDS11179.2 ZNF287 gene_id:57336|Hs108|chr17       ( 761) 1737 220.3   1e-56
CCDS10900.1 ZNF23 gene_id:7571|Hs108|chr16         ( 643) 1735 220.0 1.1e-56
CCDS56092.1 ZNF568 gene_id:374900|Hs108|chr19      ( 580) 1734 219.9 1.1e-56
CCDS42558.1 ZNF568 gene_id:374900|Hs108|chr19      ( 644) 1734 219.9 1.2e-56


>>CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16            (869 aa)
 initn: 6210 init1: 6210 opt: 6210  Z-score: 4007.3  bits: 752.6 E(32554): 6.9e-217
Smith-Waterman score: 6210; 100.0% identity (100.0% similar) in 869 aa overlap (1-869:1-869)

               10        20        30        40        50        60
pF1KSD MEPETALWGPDLQGPEQSPNDAHRGAESENEEESPRQESSGEEIIMGDPAQSPESKDSTE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 MEPETALWGPDLQGPEQSPNDAHRGAESENEEESPRQESSGEEIIMGDPAQSPESKDSTE
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KSD MSLERSSQDPSVPQNPPTPLGHSNPLDHQIPLDPPAPEVVPTPSDWTKACEASWQWGALT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 MSLERSSQDPSVPQNPPTPLGHSNPLDHQIPLDPPAPEVVPTPSDWTKACEASWQWGALT
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KSD TWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGERPNTC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 TWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGERPNTC
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KSD SECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKCTECE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 SECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKCTECE
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KSD KAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECGKRFG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECGKRFG
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KSD QNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFGHSST
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFGHSST
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KSD LIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSNLINH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSNLINH
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KSD QRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQHRRTH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQHRRTH
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KSD TGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIHERGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 TGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIHERGK
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KSD TPARRAQGDSLLGLGDPSLLTPPPGAKPHKCLVCGKGFNDEGIFMQHQRIHIGENPYKNA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 TPARRAQGDSLLGLGDPSLLTPPPGAKPHKCLVCGKGFNDEGIFMQHQRIHIGENPYKNA
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KSD DGLIAHAAPKPPQLRSPRLPFRGNSYPGAAEGRAEAPGQPLKPPEGQEGFSQRRGLLSSK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 DGLIAHAAPKPPQLRSPRLPFRGNSYPGAAEGRAEAPGQPLKPPEGQEGFSQRRGLLSSK
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KSD TYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDYRIGLGEGAGPSPFLSGKPFKCPECK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 TYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDYRIGLGEGAGPSPFLSGKPFKCPECK
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KSD QSFGLSSELLLHQKVHAGGKSSQKSPELGKSSSVLLEHLRSPLGARPYRCSDCRASFLDR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QSFGLSSELLLHQKVHAGGKSSQKSPELGKSSSVLLEHLRSPLGARPYRCSDCRASFLDR
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KSD VALTRHQETHTQEKPPNPEDPPPEAVTLSTDQEGEGETPTPTESSSHGEGQNPKTLVEEK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 VALTRHQETHTQEKPPNPEDPPPEAVTLSTDQEGEGETPTPTESSSHGEGQNPKTLVEEK
              790       800       810       820       830       840

              850       860         
pF1KSD PYLCPECGAGFTEVAALLLHRSCHPGVSL
       :::::::::::::::::::::::::::::
CCDS45 PYLCPECGAGFTEVAALLLHRSCHPGVSL
              850       860         

>>CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19           (1058 aa)
 initn: 1757 init1: 1757 opt: 2129  Z-score: 1382.2  bits: 267.1 E(32554): 1.1e-70
Smith-Waterman score: 2156; 44.1% identity (66.1% similar) in 757 aa overlap (147-864:274-1027)

        120       130       140       150       160       170      
pF1KSD GALTTWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGER
                                     :::: :..:::::.  : :.:::.:::::.
CCDS74 TGDKPYECKECGKSFTSGSTLNQHQQIHTGEKPYHCKQCGKSFTVGSTLIRHQQIHTGEK
           250       260       270       280       290       300   

        180       190       200       210       220       230      
pF1KSD PNTCSECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKC
       :  :.::::::...: :..::: ::::::: : .::: :.. : :..::: ::::::: :
CCDS74 PYDCKECGKSFASGSALIRHQRIHTGEKPYDCKECGKSFTFHSALIRHQRIHTGEKPYDC
           310       320       330       340       350       360   

        240       250       260       270       280       290      
pF1KSD TECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECG
        :: :.::  ..:: ::  ::::::: : :: ..:  .: :::::  ::::::: : :::
CCDS74 KECGKSFTFRSGLIGHQAIHTGEKPYDCKECGKSFTAGSTLIQHQRIHTGEKPYDCKECG
           370       380       390       400       410       420   

        300       310       320       330       340       350      
pF1KSD KRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFG
       : :...  ::.::.::.::::: : ::::::   :  ..::: :::::::.: ::::::.
CCDS74 KSFASGSALLQHQRIHTGEKPYCCKECGKSFTFRSTRNRHQRIHTGEKPYNCKECGKSFA
           430       440       450       460       470       480   

        360       370       380       390       400       410      
pF1KSD HSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSN
        .:.:..::: :  : :..:  :::.::. . :. :: .::::.:: : ::::::.  : 
CCDS74 SGSALLQHQRIHTGEKPYHCKECGKSFTFRSGLIGHQAVHTGEKPYDCKECGKSFTSRSA
           490       500       510       520       530       540   

        420       430       440       450       460       470      
pF1KSD LINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQH
       ::.::::: ::.:: : .::::: ..:::..::.:::::::: :..:::.:    .: ::
CCDS74 LIQHQRIHTGEKPYHCKECGKSFTVGSTLLQHQQIHTGEKPYDCKECGKAFRLRLRLTQH
           550       560       570       580       590       600   

        480       490       500       510       520       530      
pF1KSD RRTHTGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIH
       .. :::::::.: ::::.: . :.:  : : :  :. . : :::::: .   :.::: ::
CCDS74 QQIHTGEKPYQCQECGKAFVSVSGLTQHHRIHTGEKPYECPDCGKAFRQRTYLNQHRRIH
           610       620       630       640       650       660   

        540        550        560       570       580       590    
pF1KSD ERGKTPAR-RAQGDSL-LGLGDPSLLTPPPGAKPHKCLVCGKGFNDEGIFMQHQRIHIGE
         :. : . .  : :. .  :  .        ::.    :::.:.... ..:::.:: ::
CCDS74 T-GEKPYECKECGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGE
            670       680       690       700       710       720  

          600           610       620           630           640  
pF1KSD NPYKNAD---GLIAHAA-PKPPQLRSPRLPFR----GNSYPGAAEGRAEAP---GQ-PLK
       .::   .   .. .:..  .  :... .  .     :.:. . .    . :   :. : .
CCDS74 KPYDCKECGKSFTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGEKPYH
            730       740       750       760       770       780  

            650              660       670       680       690     
pF1KSD PPEGQEGFSQRRGLLSS-------KTYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDY
         :  ..:. : .:..        : : :..::.:: .::.:..::  : .:::.   . 
CCDS74 CKECGKSFTLRSALIQHRPVHTGEKRYSCKECGKSFTSRSTLIEHQRIHTGEKPYHCKEC
            790       800       810       820       830       840  

         700          710        720       730       740       750 
pF1KSD RIGLGEGAG---PSPFLSG-KPFKCPECKQSFGLSSELLLHQKVHAGGKSSQKSPELGKS
         ...  ..      . .: ::. : :: ..:   :.:  ::..:.: :   .  : ::.
CCDS74 GKSFAFRSAIIQHRRIHTGEKPYDCKECGKAFRRRSKLTQHQRIHTGEKP-YRCHECGKA
            850       860       870       880       890        900 

                760       770       780       790       800        
pF1KSD S---SVLLEHLRSPLGARPYRCSDCRASFLDRVALTRHQETHTQEKPPNPEDPPPEAVTL
           : : .:     : .::.:. :  :: .:. :: ::. :: ..: . ..   .. : 
CCDS74 FVRFSGLTKHHSIHTGEKPYECKTCGKSFRQRTHLTLHQRIHTGDRPYECKECG-KSFTC
             910       920       930       940       950        960

      810            820             830       840       850       
pF1KSD STD-----QEGEGETPTPTESSSHGE------GQNPKTLVEEKPYLCPECGAGFTEVAAL
       ...     .   :: :   .  ...       .:. .  . :: : ::::: .:  ...:
CCDS74 GSELIRHQRTHTGEKPYDCKECGKAFRCPSQLSQHKRIHTGEKTYQCPECGKAFFYASGL
              970       980       990      1000      1010      1020

       860                                   
pF1KSD LLHRSCHPGVSL                          
         :.: :                               
CCDS74 SRHQSVHTGEKPYECKTCGKAFKQLTQLTRHQRIHDLT
             1030      1040      1050        

>--
 initn: 884 init1: 498 opt: 569  Z-score: 379.1  bits: 81.5 E(32554): 8.5e-15
Smith-Waterman score: 589; 41.2% identity (62.6% similar) in 238 aa overlap (219-454:41-273)

      190       200       210       220       230       240        
pF1KSD QSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKCTECEKAFTQSTN
                                     :.::. .     .   .:   :   . :..
CCDS74 DLSIDFSQEEWECLDAAQKDLYRDVMMENYSSLVSLDSEFRCKTKDSCLPKEIYEVTSSQ
               20        30        40        50        60        70

      250         260       270       280       290       300      
pF1KSD LIKHQRSHT--GEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECGKRFGQNHNLL
        .. .. :.  : .     ::.  : . .:. :..     ::     :    :  . .: 
CCDS74 WVRMEKCHSLVGSSVRDDWECKGQF-QHQDINQERYL---EKAIMTYETTPTFCLQTSLT
               80        90        100          110       120      

        310       320       330       340       350       360      
pF1KSD KHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFGHSSTLIKHQR
        :..:: ::: :. :::  .:  .:::::.:.:::::: :.: ::::.: : : :.::::
CCDS74 LHHRIHPGEKLYKSTEC-MAFKYGSELTQQQETHTGEKLYKCKECGKAFHHFSYLVKHQR
        130       140        150       160       170       180     

        370       380       390       400       410       420      
pF1KSD THLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSNLINHQRIHRG
        :  : :  :   ::.:  .. :..::. .: :::..: :  :.:  :..::.: ::: :
CCDS74 IHTGEKPCACKEYGKAFISGSHLIQHQKMYTDERPHECQESVKAFRPSAHLIQHWRIHTG
         190       200       210       220       230       240     

        430       440       450       460       470       480      
pF1KSD ERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQHRRTHTGEKPY
       ..:: : .:::::  .::: .::.::::                                
CCDS74 DKPYECKECGKSFTSGSTLNQHQQIHTGEKPYHCKQCGKSFTVGSTLIRHQQIHTGEKPY
         250       260       270       280       290       300     

>>CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19           (1090 aa)
 initn: 1757 init1: 1757 opt: 2129  Z-score: 1382.0  bits: 267.2 E(32554): 1.2e-70
Smith-Waterman score: 2156; 44.1% identity (66.1% similar) in 757 aa overlap (147-864:306-1059)

        120       130       140       150       160       170      
pF1KSD GALTTWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGER
                                     :::: :..:::::.  : :.:::.:::::.
CCDS59 TGDKPYECKECGKSFTSGSTLNQHQQIHTGEKPYHCKQCGKSFTVGSTLIRHQQIHTGEK
         280       290       300       310       320       330     

        180       190       200       210       220       230      
pF1KSD PNTCSECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKC
       :  :.::::::...: :..::: ::::::: : .::: :.. : :..::: ::::::: :
CCDS59 PYDCKECGKSFASGSALIRHQRIHTGEKPYDCKECGKSFTFHSALIRHQRIHTGEKPYDC
         340       350       360       370       380       390     

        240       250       260       270       280       290      
pF1KSD TECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECG
        :: :.::  ..:: ::  ::::::: : :: ..:  .: :::::  ::::::: : :::
CCDS59 KECGKSFTFRSGLIGHQAIHTGEKPYDCKECGKSFTAGSTLIQHQRIHTGEKPYDCKECG
         400       410       420       430       440       450     

        300       310       320       330       340       350      
pF1KSD KRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFG
       : :...  ::.::.::.::::: : ::::::   :  ..::: :::::::.: ::::::.
CCDS59 KSFASGSALLQHQRIHTGEKPYCCKECGKSFTFRSTRNRHQRIHTGEKPYNCKECGKSFA
         460       470       480       490       500       510     

        360       370       380       390       400       410      
pF1KSD HSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSN
        .:.:..::: :  : :..:  :::.::. . :. :: .::::.:: : ::::::.  : 
CCDS59 SGSALLQHQRIHTGEKPYHCKECGKSFTFRSGLIGHQAVHTGEKPYDCKECGKSFTSRSA
         520       530       540       550       560       570     

        420       430       440       450       460       470      
pF1KSD LINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQH
       ::.::::: ::.:: : .::::: ..:::..::.:::::::: :..:::.:    .: ::
CCDS59 LIQHQRIHTGEKPYHCKECGKSFTVGSTLLQHQQIHTGEKPYDCKECGKAFRLRLRLTQH
         580       590       600       610       620       630     

        480       490       500       510       520       530      
pF1KSD RRTHTGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIH
       .. :::::::.: ::::.: . :.:  : : :  :. . : :::::: .   :.::: ::
CCDS59 QQIHTGEKPYQCQECGKAFVSVSGLTQHHRIHTGEKPYECPDCGKAFRQRTYLNQHRRIH
         640       650       660       670       680       690     

        540        550        560       570       580       590    
pF1KSD ERGKTPAR-RAQGDSL-LGLGDPSLLTPPPGAKPHKCLVCGKGFNDEGIFMQHQRIHIGE
         :. : . .  : :. .  :  .        ::.    :::.:.... ..:::.:: ::
CCDS59 T-GEKPYECKECGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGE
          700       710       720       730       740       750    

          600           610       620           630           640  
pF1KSD NPYKNAD---GLIAHAA-PKPPQLRSPRLPFR----GNSYPGAAEGRAEAP---GQ-PLK
       .::   .   .. .:..  .  :... .  .     :.:. . .    . :   :. : .
CCDS59 KPYDCKECGKSFTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGEKPYH
          760       770       780       790       800       810    

            650              660       670       680       690     
pF1KSD PPEGQEGFSQRRGLLSS-------KTYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDY
         :  ..:. : .:..        : : :..::.:: .::.:..::  : .:::.   . 
CCDS59 CKECGKSFTLRSALIQHRPVHTGEKRYSCKECGKSFTSRSTLIEHQRIHTGEKPYHCKEC
          820       830       840       850       860       870    

         700          710        720       730       740       750 
pF1KSD RIGLGEGAG---PSPFLSG-KPFKCPECKQSFGLSSELLLHQKVHAGGKSSQKSPELGKS
         ...  ..      . .: ::. : :: ..:   :.:  ::..:.: :   .  : ::.
CCDS59 GKSFAFRSAIIQHRRIHTGEKPYDCKECGKAFRRRSKLTQHQRIHTGEKP-YRCHECGKA
          880       890       900       910       920        930   

                760       770       780       790       800        
pF1KSD S---SVLLEHLRSPLGARPYRCSDCRASFLDRVALTRHQETHTQEKPPNPEDPPPEAVTL
           : : .:     : .::.:. :  :: .:. :: ::. :: ..: . ..   .. : 
CCDS59 FVRFSGLTKHHSIHTGEKPYECKTCGKSFRQRTHLTLHQRIHTGDRPYECKECG-KSFTC
           940       950       960       970       980        990  

      810            820             830       840       850       
pF1KSD STD-----QEGEGETPTPTESSSHGE------GQNPKTLVEEKPYLCPECGAGFTEVAAL
       ...     .   :: :   .  ...       .:. .  . :: : ::::: .:  ...:
CCDS59 GSELIRHQRTHTGEKPYDCKECGKAFRCPSQLSQHKRIHTGEKTYQCPECGKAFFYASGL
           1000      1010      1020      1030      1040      1050  

       860                                   
pF1KSD LLHRSCHPGVSL                          
         :.: :                               
CCDS59 SRHQSVHTGEKPYECKTCGKAFKQLTQLTRHQRIHDLT
           1060      1070      1080      1090

>--
 initn: 884 init1: 498 opt: 569  Z-score: 379.0  bits: 81.6 E(32554): 8.7e-15
Smith-Waterman score: 587; 43.0% identity (63.8% similar) in 221 aa overlap (236-454:90-305)

         210       220       230       240       250         260   
pF1KSD YKCPDCGKCFSWSSNLVQHQRTHTGEKPYKCTECEKAFTQSTNLIKHQRSHT--GEKPYK
                                     :   :   . :.. .. .. :.  : .   
CCDS59 EQGKEPWMVSRDVLGGWCRDSEFRCKTKDSCLPKEIYEVTSSQWVRMEKCHSLVGSSVRD
      60        70        80        90       100       110         

           270       280       290       300       310       320   
pF1KSD CGECRRAFYRSSDLIQHQATHTGEKPYKCPECGKRFGQNHNLLKHQKIHAGEKPYRCTEC
         ::.  : . .:. :..     ::     :    :  . .:  :..:: ::: :. :::
CCDS59 DWECKGQF-QHQDINQERYL---EKAIMTYETTPTFCLQTSLTLHHRIHPGEKLYKSTEC
     120        130          140       150       160       170     

           330       340       350       360       370       380   
pF1KSD GKSFIQSSELTQHQRTHTGEKPYECLECGKSFGHSSTLIKHQRTHLREDPFKCPVCGKTF
         .:  .:::::.:.:::::: :.: ::::.: : : :.:::: :  : :  :   ::.:
CCDS59 -MAFKYGSELTQQQETHTGEKLYKCKECGKAFHHFSYLVKHQRIHTGEKPCACKEYGKAF
          180       190       200       210       220       230    

           390       400       410       420       430       440   
pF1KSD TLSATLLRHQRTHTGERPYKCPECGKSFSVSSNLINHQRIHRGERPYICADCGKSFIMSS
         .. :..::. .: :::..: :  :.:  :..::.: ::: :..:: : .:::::  .:
CCDS59 ISGSHLIQHQKMYTDERPHECQESVKAFRPSAHLIQHWRIHTGDKPYECKECGKSFTSGS
          240       250       260       270       280       290    

           450       460       470       480       490       500   
pF1KSD TLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQHRRTHTGEKPYKCPECGKSFSQSSNLIT
       :: .::.::::                                                 
CCDS59 TLNQHQQIHTGEKPYHCKQCGKSFTVGSTLIRHQQIHTGEKPYDCKECGKSFASGSALIR
          300       310       320       330       340       350    

>>CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19             (1280 aa)
 initn: 1663 init1: 1663 opt: 2043  Z-score: 1325.9  bits: 257.0 E(32554): 1.6e-67
Smith-Waterman score: 2071; 43.9% identity (62.7% similar) in 747 aa overlap (144-869:492-1196)

           120       130       140       150       160       170   
pF1KSD WQWGALTTWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHT
                                     :: :::: :.::::.:.  :.:..:.::::
CCDS54 FSMFSILTKHKVIHNGEKPYKCEECDKATHAG-EKPYKCEECGKAFNWSSNLMEHKRIHT
             470       480       490        500       510       520

           180       190       200       210       220       230   
pF1KSD GERPNTCSECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKP
       ::.:  : ::::::.  : :..:.  ::::::::: .::: ..:::.:  :.. :: :::
CCDS54 GEKPYKCEECGKSFSTFSILTKHKVIHTGEKPYKCEECGKAYKWSSTLSYHKKIHTVEKP
              530       540       550       560       570       580

           240       250       260       270       280       290   
pF1KSD YKCTECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCP
       ::: :: :::.::. ::::.: ::::::::: :: ..: . : :  :.: :.::::::: 
CCDS54 YKCEECGKAFNQSAILIKHKRIHTGEKPYKCEECGKTFSKVSTLTTHKAIHAGEKPYKCK
              590       600       610       620       630       640

           300       310       320       330       340       350   
pF1KSD ECGKRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGK
       :::: : .  .:  :. ::::::::.: ::::.: . : ::.:.  :::::::.: ::::
CCDS54 ECGKTFIKVSTLTTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIHTGEKPYKCEECGK
              650       660       670       680       690       700

           360       370       380       390       400       410   
pF1KSD SFGHSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSV
       .:. ::.:..:.: :  : :.::  :::.:.  ..: .:.  ::::.:::: ::::... 
CCDS54 AFNWSSNLMEHKRIHTGEKPYKCEECGKSFSTFSVLTKHKVIHTGEKPYKCEECGKAYKW
              710       720       730       740       750       760

           420       430       440       450       460       470   
pF1KSD SSNLINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHL
       ::.:  :..::  :.:: : .:::.:  :. ::.:.:::: :::::: .:::.: . : :
CCDS54 SSTLSYHKKIHTVEKPYKCEECGKAFNRSAILIKHKRIHTDEKPYKCEECGKTFSKVSTL
              770       780       790       800       810       820

           480       490       500       510       520       530   
pF1KSD IQHRRTHTGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHR
         :.  :.::::::: ::::.::. : :  :   :  :. . : .::::.     :  :.
CCDS54 TTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIHTGEKPYKCEECGKAYKWPSTLSYHK
              830       840       850       860       870       880

           540       550       560           570       580         
pF1KSD VIHERGKTPARRAQGDSLLGLGDPSLLTPPP----GAKPHKCLVCGKGFNDEGIFMQHQR
        ::  :. : .  .  .  :..  :.::       : ::.::  :::.:.  ..: .:..
CCDS54 KIHT-GEKPYKCEECGK--GFSMFSILTKHEVIHTGEKPYKCEECGKAFSWLSVFSKHKK
               890         900       910       920       930       

     590       600       610       620       630       640         
pF1KSD IHIGENPYKNADGLIAHAAPKPPQLRSPRLPFRGNSYPGAAEGRAEAPGQPLKPPEGQEG
        : ::. ::       .:  :  .  :        ::    . . ..  .: :  :  .:
CCDS54 THAGEKFYK------CEACGKAYKSSSTL------SY----HKKIHTEEKPYKYEECGKG
       940             950       960                 970       980 

     650       660              670       680       690       700  
pF1KSD FSQRRGLLSSKT-------YICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDYRIGLGEG
       ::    : . :.       : : .::..:   : :..:.  : .: :.   .   ..   
CCDS54 FSTFSILTKHKVIHTGEKPYKCEECGKAFNWSSNLMEHKKIHTGETPYKCEECDKAF---
             990      1000      1010      1020      1030           

                  710        720       730       740       750     
pF1KSD AGPSPFL------SG-KPFKCPECKQSFGLSSELLLHQKVHAGGKSSQKSPELGKS---S
       . :: .       .: ::.:: :: ..:.  :.:  :. .::: .   :  : ::.   :
CCDS54 SWPSSLTEHKATHAGEKPYKCEECGKAFSWPSRLTEHKATHAG-EEPYKCEECGKAFNWS
     1040      1050      1060      1070      1080       1090       

            760       770       780       790       800       810  
pF1KSD SVLLEHLRSPLGARPYRCSDCRASFLDRVALTRHQETHTQEKPPNPEDPPPEAVTLSTDQ
       : :.:: :   : .::.: .:  ::     ::.:.  :: :::             . ..
CCDS54 SNLMEHKRIHTGEKPYKCEECGKSFSTFSILTKHKVIHTGEKP------------YKCEE
      1100      1110      1120      1130      1140                 

            820       830       840       850       860            
pF1KSD EGEGETPTPTESSSHGEGQNPKTLVEEKPYLCPECGAGFTEVAALLLHRSCHPGVSL   
        :..   . : :       . :  . :::: : ::: ::.  . :  :.  : : .:   
CCDS54 CGKAYKWSSTLS------YHKKIHTVEKPYKCEECGKGFVMFSILAKHKVIHTGEKLYKC
        1150            1160      1170      1180      1190         

CCDS54 EECGKAYKWPSTLRYHKKIHTGEKPYKCEECGKAFSTFSILTKHKVIHTGEKPYKCEECG
    1200      1210      1220      1230      1240      1250         

>--
 initn: 2566 init1: 1316 opt: 1318  Z-score: 859.7  bits: 170.7 E(32554): 1.4e-41
Smith-Waterman score: 1318; 53.0% identity (72.9% similar) in 336 aa overlap (159-494:154-489)

      130       140       150       160       170       180        
pF1KSD PANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGERPNTCSECGKSFT
                                     : . :.  ::.  :::..   :.:  .:: 
CCDS54 KVHKEGYNKLNQSLTTTQSKVFQRGKYANVFHKCSNSNRHKIRHTGKKHLQCKEYVRSFC
           130       140       150       160       170       180   

      190       200       210       220       230       240        
pF1KSD QSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKCTECEKAFTQSTN
       . ::: ::.: .: :. ::: . :: :.:::.:. .. .:::::::.: :: :::.. . 
CCDS54 MLSHLSQHKRIYTRENSYKCEEGGKAFNWSSTLTYYKSAHTGEKPYRCKECGKAFSKFSI
           190       200       210       220       230       240   

      250       260       270       280       290       300        
pF1KSD LIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECGKRFGQNHNLLKH
       : ::.  ::::: ::: :: .:: .:. : .:.  :::::: :: :::: :..  .:  :
CCDS54 LTKHKVIHTGEKSYKCEECGKAFNQSAILTKHKIIHTGEKPNKCEECGKAFSKVSTLTTH
           250       260       270       280       290       300   

      310       320       330       340       350       360        
pF1KSD QKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFGHSSTLIKHQRTH
       . ::::::::.: ::::.: . : :  :.  :.:::::.: ::::.:.. : : ::.  :
CCDS54 KAIHAGEKPYKCKECGKAFSKVSTLITHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIH
           310       320       330       340       350       360   

      370       380       390       400       410       420        
pF1KSD LREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSNLINHQRIHRGER
         : :.::  :::..   .::  :.. ::::.:::: ::::.::. : : .:. :: ::.
CCDS54 TGEKPYKCEECGKAYKWPSTLSYHKKIHTGEKPYKCEECGKGFSMFSILTKHEVIHTGEK
           370       380       390       400       410       420   

      430       440       450       460       470       480        
pF1KSD PYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQHRRTHTGEKPYKC
       :: : .:::.:  ::.:..:..::::: :::: .:::.:   : : .:.  :.:::::::
CCDS54 PYKCEECGKAFNWSSNLMEHKKIHTGETPYKCEECGKGFSMFSILTKHKVIHNGEKPYKC
           430       440       450       460       470       480   

      490       500       510       520       530       540        
pF1KSD PECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIHERGKTPARRAQG
        :: :.                                                      
CCDS54 EECDKATHAGEKPYKCEECGKAFNWSSNLMEHKRIHTGEKPYKCEECGKSFSTFSILTKH
           490       500       510       520       530       540   

>>CCDS59368.1 ZNF729 gene_id:100287226|Hs108|chr19        (1252 aa)
 initn: 3241 init1: 1634 opt: 1977  Z-score: 1283.6  bits: 249.1 E(32554): 3.6e-65
Smith-Waterman score: 1977; 43.0% identity (63.7% similar) in 742 aa overlap (147-866:373-1100)

        120       130       140       150       160       170      
pF1KSD GALTTWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGER
                                     :::: :.::::.:.  :::  :. .::::.
CCDS59 TGKKPYKREECGKAFSQSSTLRKHEIIHTGEKPYKCEECGKAFKWSSKLTVHKVVHTGEK
            350       360       370       380       390       400  

        180       190       200       210       220       230      
pF1KSD PNTCSECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKC
       :  : ::::.:.: : : .:.  :::.::::: .::: :. ::.:..:.  :::::::::
CCDS59 PYKCEECGKAFSQFSTLKKHKIIHTGKKPYKCEECGKAFNSSSTLMKHKIIHTGEKPYKC
            410       420       430       440       450       460  

        240       250       260       270       280       290      
pF1KSD TECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECG
        :: ::: ::..: .:.  ::::::::: :: .:: . ::: .:.  :::.::::: :::
CCDS59 EECGKAFRQSSHLTRHKAIHTGEKPYKCEECGKAFNHFSDLRRHKIIHTGKKPYKCEECG
            470       480       490       500       510       520  

        300       310       320       330       340       350      
pF1KSD KRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFG
       : :.:. .: .:: ::.:::::.: ::::.:  ::.:: :.  :::::: .: ::::.: 
CCDS59 KAFSQSSTLRNHQIIHTGEKPYKCEECGKAFKWSSKLTVHKVIHTGEKPCKCEECGKAFK
            530       540       550       560       570       580  

        360       370       380       390       400       410      
pF1KSD HSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSN
       : :.: ::.  : ::  .::  :::.:. :. : .:.  :::..:::: ::::.:  ::.
CCDS59 HFSALRKHKVIHTREKLYKCEECGKAFNNSSILAKHKIIHTGKKPYKCEECGKAFRQSSH
            590       600       610       620       630       640  

        420       430       440       450       460       470      
pF1KSD LINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQH
       :  :. :: ::.:: : .:::.:   :.: ::. ::::.::::: .:::.: . : : .:
CCDS59 LTRHKAIHTGEKPYKCEECGKAFSHFSALRRHKIIHTGKKPYKCEECGKAFSHFSALRRH
            650       660       670       680       690       700  

        480       490       500       510       520       530      
pF1KSD RRTHTGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIH
       .  ::::::::: ::::.:. ::.: .:   :  :.   : .:::.: .   :..:.:::
CCDS59 KIIHTGEKPYKCEECGKAFKWSSKLTVHKVIHTAEKPCKCEECGKSFKHFSALRKHKVIH
            710       720       730       740       750       760  

        540          550       560       570       580       590   
pF1KSD ERGKTPARRA---QGDSLLGLGDPSLLTPPPGAKPHKCLVCGKGFNDEGIFMQHQRIHIG
        : :    .      .:. .:   ...    : ::.::  :::.:.  . .  :. :: :
CCDS59 TREKLYKCEECVKAFNSFSALMKHKVIHT--GEKPYKCEECGKAFKWSSKLTVHKVIHTG
            770       780       790         800       810       820

           600       610       620        630       640       650  
pF1KSD ENPYKNADGLIAHAAPKPPQLRSPRLPFRGNS-YPGAAEGRAEAPGQPLKPPEGQEGFSQ
       :.: :  .   ..:  .   ::. ..   :.. :     :.: . .. :.  :  ..   
CCDS59 EKPCKCEE--CGKAFKHFSALRKHKVIHTGKKPYKCEECGKAFSQSSSLRKHEIIHS---
                830       840       850       860       870        

            660       670       680       690       700            
pF1KSD RRGLLSSKTYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDYRIGLGEGAG---PSPFL
            . : : : .::..:   : :  :.. :  :::    .   .. . ..    . . 
CCDS59 -----GEKPYKCEECGKAFKWLSKLTVHKVIHTAEKPCKCEECGKAFKHFSALRKHKIIH
              880       890       900       910       920       930

     710        720       730       740       750          760     
pF1KSD SGK-PFKCPECKQSFGLSSELLLHQKVHAGGKSSQKSPELGKS---SSVLLEHLRSPLGA
       .:: :.:: :: ..:. :: :. :. .:.: :.  :  : ::.   :: : .:     : 
CCDS59 TGKKPYKCEECGKAFNDSSTLMKHKIIHTG-KKPYKCAECGKAFKQSSHLTRHKAIHTGE
              940       950       960        970       980         

         770       780       790       800       810           820 
pF1KSD RPYRCSDCRASFLDRVALTRHQETHTQEKPPNPEDPPPEAVTLSTDQEGE----GETPTP
       .::.: .:  .: .  .: .:.  ::.::  . :.      ..:. .. .    :: :  
CCDS59 KPYKCEECGKDFNNSSTLKKHKLIHTREKLYKCEECVKAFNNFSALMKHKIIHTGEKPYK
     990      1000      1010      1020      1030      1040         

             830              840       850       860              
pF1KSD TESSSHGEGQNPKTLVE-------EKPYLCPECGAGFTEVAALLLHRSCHPGVSL     
        :  ...   . : :.:       :::  : ::  .: . .::  :.  : :        
CCDS59 CEECGKAFKWSSK-LTEHKVIHTGEKPCKCEECDKAFKHFSALRKHKVIHTGKKPYQCDE
    1050      1060       1070      1080      1090      1100        

CCDS59 CGKAFNNSSTLTKHKIIHTGEKPYKCEECGKAFSQSSILTKHKIIHSVEKPYKCEECGKA
     1110      1120      1130      1140      1150      1160        

>--
 initn: 1366 init1: 720 opt: 720  Z-score: 475.3  bits: 99.6 E(32554): 3.7e-20
Smith-Waterman score: 753; 43.0% identity (70.1% similar) in 251 aa overlap (232-482:124-372)

             210       220       230       240       250       260 
pF1KSD GEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKCTECEKAFTQSTNLIKHQRSHTGEKP
                                     :  : ..  :   .. : ... :. : .: 
CCDS59 LWPDQSTKDSFQEVILRTYARCGHKNLRLRKDCKSANEGKMHKEGYNKLNQCRTATQRKI
           100       110       120       130       140       150   

             270       280       290       300       310       320 
pF1KSD YKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECGKRFGQNHNLLKHQKIHAGEKPYRCT
       ..:..  ..:.. :.  .... :: .: .:: .:.: : .   :..:..::  .. :.: 
CCDS59 FQCNKHMKVFHKYSN--RNKVRHTKKKTFKCIKCSKSFFMLSCLIRHKRIHIRQNIYKCE
           160         170       180       190       200       210 

             330       340       350       360       370       380 
pF1KSD ECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFGHSSTLIKHQRTHLREDPFKCPVCGK
       : ::.: . : ::.:.  :: .:::.  .::..:  :::. ::.: :  : ::.:  :::
CCDS59 ERGKAFKSFSTLTKHKIIHTEDKPYKYKKCGNAFKFSSTFTKHKRIHTGETPFRCEECGK
             220       230       240       250       260       270 

             390       400       410       420       430       440 
pF1KSD TFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSNLINHQRIHRGERPYICADCGKSFIM
       .:. :..:  :.: ::::. ::: ::::.:. :::.  :. :: .:.:: : ::::.:  
CCDS59 AFNQSSNLTDHKRIHTGEKTYKCEECGKAFKGSSNFNAHKVIHTAEKPYKCEDCGKTFNH
             280       290       300       310       320       330 

             450       460       470       480       490       500 
pF1KSD SSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQHRRTHTGEKPYKCPECGKSFSQSSNL
        :.: .:. ::::.::::  .:::.: .:: : .:.  :::                   
CCDS59 FSALRKHKIIHTGKKPYKREECGKAFSQSSTLRKHEIIHTGEKPYKCEECGKAFKWSSKL
             340       350       360       370       380       390 

             510       520       530       540       550       560 
pF1KSD ITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIHERGKTPARRAQGDSLLGLGDPSLLT
                                                                   
CCDS59 TVHKVVHTGEKPYKCEECGKAFSQFSTLKKHKIIHTGKKPYKCEECGKAFNSSSTLMKHK
             400       410       420       430       440       450 

>--
 initn: 1011 init1: 525 opt: 614  Z-score: 407.2  bits: 87.0 E(32554): 2.3e-16
Smith-Waterman score: 614; 55.6% identity (72.5% similar) in 153 aa overlap (259-411:1101-1252)

      230       240       250       260       270       280        
pF1KSD TGEKPYKCTECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEK
                                     .:::.: :: .::  :: : .:.  :::::
CCDS59 TGEKPCKCEECDKAFKHFSALRKHKVIHTGKKPYQCDECGKAFNNSSTLTKHKIIHTGEK
             1080      1090      1100      1110      1120      1130

      290       300       310       320       330       340        
pF1KSD PYKCPECGKRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYEC
       :::: :::: :.:.  : ::. ::. ::::.: ::::.: :::.::.:.  :::::::.:
CCDS59 PYKCEECGKAFSQSSILTKHKIIHSVEKPYKCEECGKAFNQSSHLTRHKTIHTGEKPYKC
             1140      1150      1160      1170      1180      1190

      350       360       370       380       390       400        
pF1KSD LECGKSFGHSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECG
        ::::.: . : ::.:.  : :: : .     : ..   :::  .  ::::.:::: ::.
CCDS59 EECGKAFIQCSYLIRHKTIHTREKPTNVKKVPKLLSNPHTLL-DKTIHTGEKPYKCEECA
             1200      1210      1220      1230       1240         

      410       420       430       440       450       460        
pF1KSD KSFSVSSNLINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFI
       :.:                                                         
CCDS59 KAF                                                         
    1250                                                           

>>CCDS46162.1 ZNF836 gene_id:162962|Hs108|chr19           (936 aa)
 initn: 1670 init1: 1670 opt: 1932  Z-score: 1256.1  bits: 243.6 E(32554): 1.2e-63
Smith-Waterman score: 2009; 45.7% identity (64.6% similar) in 659 aa overlap (142-793:294-915)

             120       130       140       150       160       170 
pF1KSD ASWQWGALTTWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRI
                                     :   .:::: ::::::::::  .:  ::::
CCDS46 HQIVHTRGKPYQCGVCGKIFRQNSDLVNHRRSHTGEKPYKCNECGKSFSQSYNLAIHQRI
           270       280       290       300       310       320   

             180       190       200       210       220       230 
pF1KSD HTGERPNTCSECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGE
       ::::.:  :.::::.: :.: :. ::  :::::::.:  ::: :  .::::.::: ::::
CCDS46 HTGEKPYKCNECGKTFKQGSCLTTHQIIHTGEKPYQCDICGKVFRQNSNLVNHQRIHTGE
           330       340       350       360       370       380   

             240       250       260       270       280       290 
pF1KSD KPYKCTECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYK
       :::::. : :.:.::.::  ::  :.:.::::: :: ..: :::.:  ::  ::::::: 
CCDS46 KPYKCNICGKSFSQSSNLATHQTVHSGNKPYKCDECGKTFKRSSSLTTHQIIHTGEKPYT
           390       400       410       420       430       440   

             300       310       320       330       340       350 
pF1KSD CPECGKRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLEC
       :  : : :.:  .: .::. :.:::::.:.:::: : :.:.:. :.: :::::::.: .:
CCDS46 CDVCDKVFSQRSQLARHQRSHTGEKPYKCNECGKVFSQTSHLVGHRRIHTGEKPYKCDKC
           450       460       470       480       490       500   

             360       370       380       390       400       410 
pF1KSD GKSFGHSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSF
       ::.: ..: : .:.  : ::  ..:  :::.:. .. :.:: : ::::.::::  ::: :
CCDS46 GKAFKQGSLLTRHKIIHTREKRYQCGECGKVFSENSCLVRHLRIHTGEQPYKCNVCGKVF
           510       520       530       540       550       560   

             420       430       440       450       460       470 
pF1KSD SVSSNLINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSS
       . :.::  :.::: ::.:. : .::  :   : : :: :::::.:::::. ::: :  :.
CCDS46 NYSGNLSIHKRIHTGEKPFQCNECGTVFRNYSCLARHLRIHTGQKPYKCNVCGKVFNDSG
           570       580       590       600       610       620   

             480       490       500       510       520       530 
pF1KSD HLIQHRRTHTGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQ
       .: .:.: ::::::..: :::: ::  : :  : . :  :. . :.:::::. .   : .
CCDS46 NLSNHKRIHTGEKPFQCNECGKVFSYYSCLARHRKIHTGEKPYKCNDCGKAYTQRSSLTK
           630       640       650       660       670       680   

             540        550        560       570       580         
pF1KSD HRVIHERGKTPARRAQ-GDSLLGLGD-PSLLTPPPGAKPHKCLVCGKGFNDEGIFMQHQR
       : .::  :. :    . : ...  .        : : :::::  ::. :.    .  :::
CCDS46 HLIIHT-GEKPYNCNEFGGAFIQSSKLARYHRNPTGEKPHKCSHCGRTFSHITGLTYHQR
            690       700       710       720       730       740  

     590       600        610       620       630       640        
pF1KSD IHIGENPYKNAD-GLIAHAAPKPPQLRSPRLPFRGNSYPGAAEGRAEAPGQPLKPPEGQE
        : :: :::  . : . ... .  . :  :.      . :    . .  :. ..    : 
CCDS46 RHTGEMPYKCIECGQVFNSTSNLARHR--RI------HTGEKPYKCNECGKVFR---HQS
            750       760         770             780          790 

      650        660       670       680       690       700       
pF1KSD GFSQRRGLLSS-KTYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDYRIGLGEGAGPSP
        ....:.. .. : :.:..::..:  ::.:..::  : ..                    
CCDS46 TLARHRSIHTGEKPYVCNECGKAFRVRSILVNHQKMHTGD--------------------
             800       810       820       830                     

       710       720       730       740       750          760    
pF1KSD FLSGKPFKCPECKQSFGLSSELLLHQKVHAGGKSSQKSPELGKSS---SVLLEHLRSPLG
           ::.:: :: ..:   :.:. ::. :.: :   :  : ::.    : : .:     :
CCDS46 ----KPYKCNECGKAFIERSKLVYHQRNHTGEKP-YKCIECGKAFGRFSCLNKHQMIHSG
                 840       850       860        870       880      

          770       780       790       800       810       820    
pF1KSD ARPYRCSDCRASFLDRVALTRHQETHTQEKPPNPEDPPPEAVTLSTDQEGEGETPTPTES
        .::.:..:  ::..: .::.::  :: :                               
CCDS46 EKPYKCNECGKSFISRSGLTKHQTKHTAESLKTKFNVEKPLDVLLTSGFK          
        890       900       910       920       930                

>>CCDS46991.1 ZNF721 gene_id:170960|Hs108|chr4            (923 aa)
 initn: 3191 init1: 1642 opt: 1902  Z-score: 1236.9  bits: 240.1 E(32554): 1.4e-62
Smith-Waterman score: 2007; 42.0% identity (62.1% similar) in 738 aa overlap (147-866:218-917)

        120       130       140       150       160       170      
pF1KSD GALTTWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGER
                                     .::: :.::::.: . :.: .:..:::::.
CCDS46 NREKAYTGEDRDRAFGWSTNLNEYKKIHTGDKPYKCKECGKAFMHSSHLNKHEKIHTGEK
       190       200       210       220       230       240       

        180       190       200       210       220       230      
pF1KSD PNTCSECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKC
       :  :.:::: ...:: ...:.: ::::::.:: .::: :. :..:..:.: ::::::: :
CCDS46 PYKCKECGKVISSSSSFAKHKRIHTGEKPFKCLECGKAFNISTTLTKHRRIHTGEKPYTC
       250       260       270       280       290       300       

        240       250       260       270       280       290      
pF1KSD TECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECG
         : ::: ::.::  :.: ::::::: :::: ..: .:..:  :.  ::::::::: .::
CCDS46 EVCGKAFRQSANLYVHRRIHTGEKPYTCGECGKTFRQSANLYVHRRIHTGEKPYKCEDCG
       310       320       330       340       350       360       

        300       310       320       330       340       350      
pF1KSD KRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFG
       : ::.   : .:.:::.:::::.: ::::.: .:..:: :.: :: :::: : . :..::
CCDS46 KAFGRYTALNQHKKIHTGEKPYKCEECGKAFNSSTNLTAHKRIHTREKPYTCEDRGRAFG
       370       380       390       400       410       420       

        360       370       380       390       400       410      
pF1KSD HSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSN
        :..: .... :  . :.::  :::.:  :  : .:.. :::..:::: .::: .. ::.
CCDS46 LSTNLNEYKKIHTGDKPYKCKECGKAFIHSLHLNKHEKIHTGKKPYKCKQCGKVITSSSS
       430       440       450       460       470       480       

        420       430       440       450       460       470      
pF1KSD LINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQH
       . .:.::: ::.:. : .:::.:  :.:: .:.::::::::: :  :::.: .:. :  :
CCDS46 FAKHKRIHTGEKPFECLECGKAFTSSTTLTKHRRIHTGEKPYTCEVCGKAFRQSAILYVH
       490       500       510       520       530       540       

        480       490       500       510       520       530      
pF1KSD RRTHTGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIH
       :: ::::::: : ::::.: ::.:: .: : :  :. . : .::::: .  .:.::. ::
CCDS46 RRIHTGEKPYTCEECGKTFRQSANLYVHRRIHTGEKPYKCEECGKAFGRYTDLNQHKKIH
       550       560       570       580       590       600       

        540       550       560        570       580       590     
pF1KSD ERGKTPARRAQGDSLLGLGDPSLLTPP-PGAKPHKCLVCGKGFNDEGIFMQHQRIHIGEN
          :    .  : ...   : .       : ::.::  :::.:     . :: .:  ::.
CCDS46 TGEKLYKCEECGKDFVWYTDLNQQKKIYTGEKPYKCEECGKAFAPSTDLNQHTKILTGEQ
       610       620       630       640       650       660       

         600       610       620       630       640       650     
pF1KSD PYKNADGLIAHAAPKPPQLRSPRLPFRGNSYPGAAEGRAEAPGQPLKPPEGQEGFSQRRG
        ::  .                          : : : . : .:  :   :.        
CCDS46 SYKCEEC-------------------------GKAFGWSIALNQHKKIHTGE--------
       670                                680       690            

         660       670       680       690       700           710 
pF1KSD LLSSKTYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDYRIGLGEGAGPSPF----LSG
           : : : .::..:     :  :. .:  :::.   :   ..: ... . .     . 
CCDS46 ----KPYKCEECGKAFSRSRNLTTHRRVHTREKPYKCEDRGRSFGWSTNLNEYKKIHTGD
              700       710       720       730       740       750

             720       730       740       750          760        
pF1KSD KPFKCPECKQSFGLSSELLLHQKVHAGGKSSQKSPELGK---SSSVLLEHLRSPLGARPY
       : .:: :: . :  ::.:  :.:.:.: :.  :  : ::   ::: . .: :   : .:.
CCDS46 KLYKCKECGKVFKQSSHLNRHEKIHTG-KKPYKCKECGKVITSSSSFAKHKRIHTGEKPF
              760       770        780       790       800         

      770       780       790       800           810       820    
pF1KSD RCSDCRASFLDRVALTRHQETHTQEKPPNPEDPPPE----AVTLSTDQEGEGETPTP---
       .: .:  .: . ..::.:.. :: ::: . :.        :.     .   :: :     
CCDS46 KCLECGKAFTSSTTLTKHRRIHTGEKPYTCEECGKAFRQSAILYVHRRIHTGEKPYTCGE
     810       820       830       840       850       860         

                830       840       850       860            
pF1KSD ---TESSSHGEGQNPKTLVEEKPYLCPECGAGFTEVAALLLHRSCHPGVSL   
          :  .: .   . :  . :::: : .::  : . : :  :.. : :      
CCDS46 CGKTFRQSANLYAHKKIHTGEKPYTCGDCGKTFRQSANLYAHKKIHTGDKTIQV
     870       880       890       900       910       920   

>>CCDS82388.1 ZNF841 gene_id:284371|Hs108|chr19           (808 aa)
 initn: 4746 init1: 1609 opt: 1896  Z-score: 1233.8  bits: 239.3 E(32554): 2.1e-62
Smith-Waterman score: 1953; 45.5% identity (63.1% similar) in 661 aa overlap (147-793:170-786)

        120       130       140       150       160       170      
pF1KSD GALTTWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGER
                                     :::: ::: ::.: . : :  :: .::  .
CCDS82 IREKPYIGNECGKAFRVSSSLINHQMIHTTEKPYRCNESGKAFHRGSLLTVHQIVHTRGK
     140       150       160       170       180       190         

        180       190       200       210       220       230      
pF1KSD PNTCSECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKC
       :  :. ::. : :.: ::.:.:.:::.::: : .::: :: ::.:. ::: :::::::::
CCDS82 PYQCDVCGRIFRQNSDLVNHRRSHTGDKPYICNECGKSFSKSSHLAVHQRIHTGEKPYKC
     200       210       220       230       240       250         

        240       250       260       270       280       290      
pF1KSD TECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECG
       ..: : :.::..:  ::  :::.:::::.:: ..: :.:.:  :.  :.:.::: :  ::
CCDS82 NRCGKCFSQSSSLATHQTVHTGDKPYKCNECGKTFKRNSSLTAHHIIHAGKKPYTCDVCG
     260       270       280       290       300       310         

        300       310       320       330       340       350      
pF1KSD KRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFG
       : : :: .:..:: ::.:: ::.:.:::: :.: :.:. :.: :::::::.: :::: :.
CCDS82 KVFYQNSQLVRHQIIHTGETPYKCNECGKVFFQRSRLAGHRRIHTGEKPYKCNECGKVFS
     320       330       340       350       360       370         

        360       370       380       390       400       410      
pF1KSD HSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSN
       . : :  :::.:  : :.::  :::.:. .. :  ::: ::::.::::  ::: :. .. 
CCDS82 QHSHLAVHQRVHTGEKPYKCNECGKAFNWGSLLTVHQRIHTGEKPYKCNVCGKVFNYGGY
     380       390       400       410       420       430         

        420       430       440       450       460       470      
pF1KSD LINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQH
       :  :.: : ::.:  :  ::  : . : : ::::.:::::::::. ::: :: :..:  :
CCDS82 LSVHMRCHTGEKPLHCNKCGMVFTYYSCLARHQRMHTGEKPYKCNVCGKVFIDSGNLSIH
     440       450       460       470       480       490         

        480       490       500       510       520       530      
pF1KSD RRTHTGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIH
       ::.::::::..: :::: ::  : :  : . :  :. . :.:::::. .   : .: :::
CCDS82 RRSHTGEKPFQCNECGKVFSYYSCLARHRKIHTGEKPYKCNDCGKAYTQRSSLTKHLVIH
     500       510       520       530       540       550         

        540        550        560       570       580       590    
pF1KSD ERGKTPARRAQ-GDSLLGLGD-PSLLTPPPGAKPHKCLVCGKGFNDEGIFMQHQRIHIGE
         :..: .  . :....  .        : : :::::  ::. :. .  .. ::: : ::
CCDS82 T-GENPYHCNEFGEAFIQSSKLARYHRNPTGEKPHKCSECGRTFSHKTSLVYHQRRHTGE
     560        570       580       590       600       610        

          600        610       620       630        640       650  
pF1KSD NPYKNAD-GLIAHAAPKPPQLRSPRLPFRGNSYPGAAEGRAEAPGQ-PLKPPEGQEGFSQ
        :::  . : .                :  ::    :. :    :. : :  :  . :  
CCDS82 MPYKCIECGKV----------------F--NSTTTLARHRRIHTGEKPYKCNECGKVFRY
      620                       630         640       650       660

                   660       670       680       690       700     
pF1KSD RRGL-------LSSKTYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDYRIGLGEGAGP
       : ::        . : : :..::..:  ::.::.::. : .::                 
CCDS82 RSGLARHWSIHTGEKPYKCNECGKAFRVRSILLNHQMMHTGEK-----------------
              670       680       690       700                    

         710       720       730       740       750          760  
pF1KSD SPFLSGKPFKCPECKQSFGLSSELLLHQKVHAGGKSSQKSPELGKS---SSVLLEHLRSP
              :.:: :: ..:   :.:. ::. :.: :   :  : ::.    : : .: :  
CCDS82 -------PYKCNECGKAFIERSNLVYHQRNHTGEKP-YKCMECGKAFGRRSCLTKHQRIH
                  710       720       730        740       750     

            770       780       790       800       810       820  
pF1KSD LGARPYRCSDCRASFLDRVALTRHQETHTQEKPPNPEDPPPEAVTLSTDQEGEGETPTPT
        . .::.:..:  :...: .::.::  :. :                             
CCDS82 SSEKPYKCNECGKSYISRSGLTKHQIKHAGENLTTKLNVERPLDVVLTSGIPK       
         760       770       780       790       800               

            830       840       850       860         
pF1KSD ESSSHGEGQNPKTLVEEKPYLCPECGAGFTEVAALLLHRSCHPGVSL

>>CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19           (688 aa)
 initn: 1786 init1: 1786 opt: 1890  Z-score: 1230.7  bits: 238.5 E(32554): 3.1e-62
Smith-Waterman score: 1902; 49.5% identity (69.0% similar) in 564 aa overlap (147-703:164-684)

        120       130       140       150       160       170      
pF1KSD GALTTWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGER
                                     :::: :..:::.::. :.:  :::.::::.
CCDS12 STEKPYKCKECGKAFRRASHLTQHQSIHTGEKPYECKQCGKAFSRDSQLSLHQRLHTGEK
           140       150       160       170       180       190   

        180       190       200       210       220       230      
pF1KSD PNTCSECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKC
       : .:.::::.:::::.:. :.: ::::::::: .::: :  ::.:..::..:::::::.:
CCDS12 PYACKECGKAFTQSSQLILHHRIHTGEKPYKCEECGKAFIRSSQLTRHQKVHTGEKPYEC
           200       210       220       230       240       250   

        240       250       260       270       280       290      
pF1KSD TECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECG
        :: :::::...:  ::: ::::: :.: :::..: . :.:: :.  :::::::.: :::
CCDS12 KECGKAFTQNSQLTLHQRLHTGEKLYECKECRKVFTQLSQLILHKRIHTGEKPYECKECG
           260       270       280       290       300       310   

        300       310       320       330       340       350      
pF1KSD KRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFG
       : :  . .: .::::: :::::.: :::..::..: : :::: :::::::.: ::::.: 
CCDS12 KAFICGSQLSQHQKIHNGEKPYECKECGRAFIRGSLLMQHQRIHTGEKPYKCEECGKAFI
           320       330       340       350       360       370   

        360       370       380       390       400       410      
pF1KSD HSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSN
       ..: : .::: :  : :..:  ::: :. .. : .::: ::::.::.: ::::.:. .: 
CCDS12 RGSQLTQHQRIHTNEKPYECKECGKMFSHGSQLTQHQRIHTGEKPYQCKECGKAFNRGSL
           380       390       400       410       420       430   

        420       430       440       450       460       470      
pF1KSD LINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQH
       :  ::::: ::.:: : .:::.:  .: : .:.:::::::::.:..:::::::.:.: ::
CCDS12 LTRHQRIHTGEKPYECKECGKTFSRGSELTQHERIHTGEKPYECKECGKSFIRGSQLTQH
           440       450       460       470       480       490   

        480       490       500       510       520       530      
pF1KSD RRTHTGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIH
       .: :::::::.: ::  .:.:::.:  : : :  :. .::..::::: ..  : ::. ::
CCDS12 QRIHTGEKPYECKECRMAFTQSSHLSQHQRLHTGEKPYVCNECGKAFARGLLLIQHQRIH
           500       510       520       530       540       550   

        540       550       560       570       580       590      
pF1KSD ERGKTPARRAQGDSLLGLGDPSLLTPPPGAKPHKCLVCGKGFNDEGIFMQHQRIHIGENP
                                   : ::..:  :::.:   . . :::::: ::.:
CCDS12 ---------------------------TGEKPYQCKECGKAFIRGSQLTQHQRIHTGEKP
                                      560       570       580      

        600       610       620       630       640       650      
pF1KSD YKNADGLIAHAAPKPPQLRSPRLPFRGNSYPGAAEGRAEAPGQPLKPPEGQEGFSQRRGL
       :.  .   ..:  .  ::              . . : ..  .: .  : ...:.:   :
CCDS12 YECKE--CGKAFSHGSQL--------------TLHQRIHTGEKPYECRECRKAFTQSSHL
        590         600                     610       620       630

               660       670       680       690       700         
pF1KSD -------LSSKTYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDYRIGLGEGAGPSPFL
               . : : :..::..:   : : :::  : .:: : . .  : ...:.      
CCDS12 SRHQRIHTGEKPYQCKECGKAFTRGSQLTQHQRIHISEKSFEYKECGIDFSHGSQVYM  
              640       650       660       670       680          

     710       720       730       740       750       760         
pF1KSD SGKPFKCPECKQSFGLSSELLLHQKVHAGGKSSQKSPELGKSSSVLLEHLRSPLGARPYR

>>CCDS46161.1 ZNF841 gene_id:284371|Hs108|chr19           (924 aa)
 initn: 4746 init1: 1609 opt: 1853  Z-score: 1205.4  bits: 234.2 E(32554): 8e-61
Smith-Waterman score: 1953; 45.5% identity (63.1% similar) in 661 aa overlap (147-793:286-902)

        120       130       140       150       160       170      
pF1KSD GALTTWNSPPVVPANEPSLRELVQGRPAGAEKPYICNECGKSFSQWSKLLRHQRIHTGER
                                     :::: ::: ::.: . : :  :: .::  .
CCDS46 IREKPYIGNECGKAFRVSSSLINHQMIHTTEKPYRCNESGKAFHRGSLLTVHQIVHTRGK
         260       270       280       290       300       310     

        180       190       200       210       220       230      
pF1KSD PNTCSECGKSFTQSSHLVQHQRTHTGEKPYKCPDCGKCFSWSSNLVQHQRTHTGEKPYKC
       :  :. ::. : :.: ::.:.:.:::.::: : .::: :: ::.:. ::: :::::::::
CCDS46 PYQCDVCGRIFRQNSDLVNHRRSHTGDKPYICNECGKSFSKSSHLAVHQRIHTGEKPYKC
         320       330       340       350       360       370     

        240       250       260       270       280       290      
pF1KSD TECEKAFTQSTNLIKHQRSHTGEKPYKCGECRRAFYRSSDLIQHQATHTGEKPYKCPECG
       ..: : :.::..:  ::  :::.:::::.:: ..: :.:.:  :.  :.:.::: :  ::
CCDS46 NRCGKCFSQSSSLATHQTVHTGDKPYKCNECGKTFKRNSSLTAHHIIHAGKKPYTCDVCG
         380       390       400       410       420       430     

        300       310       320       330       340       350      
pF1KSD KRFGQNHNLLKHQKIHAGEKPYRCTECGKSFIQSSELTQHQRTHTGEKPYECLECGKSFG
       : : :: .:..:: ::.:: ::.:.:::: :.: :.:. :.: :::::::.: :::: :.
CCDS46 KVFYQNSQLVRHQIIHTGETPYKCNECGKVFFQRSRLAGHRRIHTGEKPYKCNECGKVFS
         440       450       460       470       480       490     

        360       370       380       390       400       410      
pF1KSD HSSTLIKHQRTHLREDPFKCPVCGKTFTLSATLLRHQRTHTGERPYKCPECGKSFSVSSN
       . : :  :::.:  : :.::  :::.:. .. :  ::: ::::.::::  ::: :. .. 
CCDS46 QHSHLAVHQRVHTGEKPYKCNECGKAFNWGSLLTVHQRIHTGEKPYKCNVCGKVFNYGGY
         500       510       520       530       540       550     

        420       430       440       450       460       470      
pF1KSD LINHQRIHRGERPYICADCGKSFIMSSTLIRHQRIHTGEKPYKCSDCGKSFIRSSHLIQH
       :  :.: : ::.:  :  ::  : . : : ::::.:::::::::. ::: :: :..:  :
CCDS46 LSVHMRCHTGEKPLHCNKCGMVFTYYSCLARHQRMHTGEKPYKCNVCGKVFIDSGNLSIH
         560       570       580       590       600       610     

        480       490       500       510       520       530      
pF1KSD RRTHTGEKPYKCPECGKSFSQSSNLITHVRTHMDENLFVCSDCGKAFLEAHELEQHRVIH
       ::.::::::..: :::: ::  : :  : . :  :. . :.:::::. .   : .: :::
CCDS46 RRSHTGEKPFQCNECGKVFSYYSCLARHRKIHTGEKPYKCNDCGKAYTQRSSLTKHLVIH
         620       630       640       650       660       670     

        540        550        560       570       580       590    
pF1KSD ERGKTPARRAQ-GDSLLGLGD-PSLLTPPPGAKPHKCLVCGKGFNDEGIFMQHQRIHIGE
         :..: .  . :....  .        : : :::::  ::. :. .  .. ::: : ::
CCDS46 T-GENPYHCNEFGEAFIQSSKLARYHRNPTGEKPHKCSECGRTFSHKTSLVYHQRRHTGE
          680       690       700       710       720       730    

          600        610       620       630        640       650  
pF1KSD NPYKNAD-GLIAHAAPKPPQLRSPRLPFRGNSYPGAAEGRAEAPGQ-PLKPPEGQEGFSQ
        :::  . : .                :  ::    :. :    :. : :  :  . :  
CCDS46 MPYKCIECGKV----------------F--NSTTTLARHRRIHTGEKPYKCNECGKVFRY
          740                         750       760       770      

                   660       670       680       690       700     
pF1KSD RRGL-------LSSKTYICSHCGESFLDRSVLLQHQLTHGNEKPFLFPDYRIGLGEGAGP
       : ::        . : : :..::..:  ::.::.::. : .::                 
CCDS46 RSGLARHWSIHTGEKPYKCNECGKAFRVRSILLNHQMMHTGEK-----------------
        780       790       800       810                          

         710       720       730       740       750          760  
pF1KSD SPFLSGKPFKCPECKQSFGLSSELLLHQKVHAGGKSSQKSPELGKS---SSVLLEHLRSP
              :.:: :: ..:   :.:. ::. :.: :   :  : ::.    : : .: :  
CCDS46 -------PYKCNECGKAFIERSNLVYHQRNHTGEKP-YKCMECGKAFGRRSCLTKHQRIH
            820       830       840        850       860       870 

            770       780       790       800       810       820  
pF1KSD LGARPYRCSDCRASFLDRVALTRHQETHTQEKPPNPEDPPPEAVTLSTDQEGEGETPTPT
        . .::.:..:  :...: .::.::  :. :                             
CCDS46 SSEKPYKCNECGKSYISRSGLTKHQIKHAGENLTTKLNVERPLDVVLTSGIPK       
             880       890       900       910       920           

            830       840       850       860         
pF1KSD ESSSHGEGQNPKTLVEEKPYLCPECGAGFTEVAALLLHRSCHPGVSL




869 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 01:17:19 2016 done: Thu Nov  3 01:17:20 2016
 Total Scan time:  4.230 Total Display time:  0.250

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com