FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7824, 604 aa 1>>>pF1KB7824 604 - 604 aa - 604 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.2518+/-0.00175; mu= 11.6854+/- 0.105 mean_var=278.9313+/-55.502, 0's: 0 Z-trim(107.6): 952 B-trim: 66 in 2/48 Lambda= 0.076794 statistics sampled from 8600 (9665) to 8600 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.63), E-opt: 0.2 (0.297), width: 16 Scan time: 3.680 The best scores are: opt bits E(32554) CCDS6709.2 ZNF169 gene_id:169841|Hs108|chr9 ( 603) 4252 485.7 7.3e-137 CCDS82337.1 HKR1 gene_id:284459|Hs108|chr19 ( 641) 1903 225.5 1.7e-58 CCDS43307.1 PRDM9 gene_id:56979|Hs108|chr5 ( 894) 1841 218.8 2.3e-56 CCDS13174.1 ZNF337 gene_id:26152|Hs108|chr20 ( 751) 1838 218.4 2.7e-56 CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 ( 738) 1797 213.8 6.2e-55 CCDS74693.1 ZNF343 gene_id:79175|Hs108|chr20 ( 640) 1698 202.8 1.1e-51 CCDS63235.1 ZNF133 gene_id:7692|Hs108|chr20 ( 591) 1691 202.0 1.9e-51 CCDS74704.1 ZNF133 gene_id:7692|Hs108|chr20 ( 635) 1691 202.0 1.9e-51 CCDS13134.1 ZNF133 gene_id:7692|Hs108|chr20 ( 653) 1691 202.0 2e-51 CCDS63234.1 ZNF133 gene_id:7692|Hs108|chr20 ( 654) 1691 202.0 2e-51 CCDS63233.1 ZNF133 gene_id:7692|Hs108|chr20 ( 657) 1691 202.0 2e-51 CCDS74703.1 ZNF133 gene_id:7692|Hs108|chr20 ( 667) 1691 202.0 2e-51 CCDS47539.1 ZNF12 gene_id:7559|Hs108|chr7 ( 659) 1632 195.5 1.8e-49 CCDS4624.1 ZNF184 gene_id:7738|Hs108|chr6 ( 751) 1630 195.3 2.3e-49 CCDS74692.1 ZNF343 gene_id:79175|Hs108|chr20 ( 509) 1575 189.0 1.3e-47 CCDS11179.2 ZNF287 gene_id:57336|Hs108|chr17 ( 761) 1577 189.5 1.4e-47 CCDS13028.1 ZNF343 gene_id:79175|Hs108|chr20 ( 599) 1575 189.1 1.4e-47 CCDS12846.1 ZNF615 gene_id:284370|Hs108|chr19 ( 731) 1576 189.3 1.4e-47 CCDS82387.1 ZNF615 gene_id:284370|Hs108|chr19 ( 736) 1576 189.4 1.4e-47 CCDS59418.1 ZNF615 gene_id:284370|Hs108|chr19 ( 742) 1576 189.4 1.5e-47 CCDS12495.1 ZNF567 gene_id:163081|Hs108|chr19 ( 616) 1569 188.5 2.2e-47 CCDS74349.1 ZNF567 gene_id:163081|Hs108|chr19 ( 647) 1569 188.5 2.3e-47 CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 ( 778) 1556 187.2 6.9e-47 CCDS75075.1 ZNF595 gene_id:152687|Hs108|chr4 ( 648) 1551 186.5 9.2e-47 CCDS12848.1 ZNF432 gene_id:9668|Hs108|chr19 ( 652) 1551 186.5 9.2e-47 CCDS32991.1 ZNF599 gene_id:148103|Hs108|chr19 ( 588) 1546 185.9 1.3e-46 CCDS33046.1 ZNF224 gene_id:7767|Hs108|chr19 ( 707) 1537 185.0 2.8e-46 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1535 184.7 3e-46 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1535 184.7 3.2e-46 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1535 184.8 3.2e-46 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1535 184.8 3.2e-46 CCDS42537.1 ZNF429 gene_id:353088|Hs108|chr19 ( 674) 1525 183.6 6.9e-46 CCDS12955.1 ZNF530 gene_id:348327|Hs108|chr19 ( 599) 1512 182.1 1.8e-45 CCDS82339.1 HKR1 gene_id:284459|Hs108|chr19 ( 598) 1510 181.9 2e-45 CCDS82338.1 HKR1 gene_id:284459|Hs108|chr19 ( 640) 1510 182.0 2.1e-45 CCDS12502.1 HKR1 gene_id:284459|Hs108|chr19 ( 659) 1510 182.0 2.2e-45 CCDS4439.1 ZNF354B gene_id:117608|Hs108|chr5 ( 612) 1503 181.1 3.5e-45 CCDS14279.1 ZNF41 gene_id:7592|Hs108|chrX ( 779) 1497 180.6 6.4e-45 CCDS33006.1 ZNF607 gene_id:84775|Hs108|chr19 ( 696) 1495 180.3 7e-45 CCDS42642.1 ZNF418 gene_id:147686|Hs108|chr19 ( 676) 1491 179.9 9.4e-45 CCDS82410.1 ZNF418 gene_id:147686|Hs108|chr19 ( 697) 1491 179.9 9.6e-45 CCDS35067.1 ZNF484 gene_id:83744|Hs108|chr9 ( 816) 1491 180.0 1e-44 CCDS35066.1 ZNF484 gene_id:83744|Hs108|chr9 ( 852) 1491 180.0 1.1e-44 CCDS59136.1 ZNF484 gene_id:83744|Hs108|chr9 ( 854) 1491 180.0 1.1e-44 CCDS73089.1 ZNF33A gene_id:7581|Hs108|chr10 ( 699) 1484 179.1 1.6e-44 CCDS31182.1 ZNF33A gene_id:7581|Hs108|chr10 ( 810) 1484 179.2 1.8e-44 CCDS44372.1 ZNF33A gene_id:7581|Hs108|chr10 ( 811) 1484 179.2 1.8e-44 CCDS60514.1 ZNF33A gene_id:7581|Hs108|chr10 ( 817) 1484 179.2 1.8e-44 CCDS73088.1 ZNF33A gene_id:7581|Hs108|chr10 ( 829) 1484 179.2 1.8e-44 CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16 ( 869) 1483 179.2 2e-44 >>CCDS6709.2 ZNF169 gene_id:169841|Hs108|chr9 (603 aa) initn: 3705 init1: 3705 opt: 4252 Z-score: 2570.6 bits: 485.7 E(32554): 7.3e-137 Smith-Waterman score: 4252; 99.8% identity (99.8% similar) in 604 aa overlap (1-604:1-603) 10 20 30 40 50 60 pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQI ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS67 KLIEQLEQGDEPWREENEHLLDLCP-EPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQI 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 FPSSSAGGDFQLEAPRCSSEKGESGETEGPDSSLRKRPSRISRTFFSPHQGDPVEWVEGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 FPSSSAGGDFQLEAPRCSSEKGESGETEGPDSSLRKRPSRISRTFFSPHQGDPVEWVEGN 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB7 REGGTDLRLAQRMSLGGSDTMLKGADTSESGAVIRGNYRLGLSKKSSLFSHQKHHVCPEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 REGGTDLRLAQRMSLGGSDTMLKGADTSESGAVIRGNYRLGLSKKSSLFSHQKHHVCPEC 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB7 GRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKASLSIHQRKHSGEKPYVCRECGRHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 GRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKASLSIHQRKHSGEKPYVCRECGRHF 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB7 RYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 RYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKA 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB7 SLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 SLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIR 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB7 HQRTHTGEKPYLCPQCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 HQRTHTGEKPYLCPQCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRT 420 430 440 450 460 470 490 500 510 520 530 540 pF1KB7 HTGEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 HTGEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGE 480 490 500 510 520 530 550 560 570 580 590 600 pF1KB7 KPCICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 KPCICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLP 540 550 560 570 580 590 pF1KB7 QEVF :::: CCDS67 QEVF 600 >>CCDS82337.1 HKR1 gene_id:284459|Hs108|chr19 (641 aa) initn: 1386 init1: 1386 opt: 1903 Z-score: 1163.8 bits: 225.5 E(32554): 1.7e-58 Smith-Waterman score: 2094; 50.9% identity (69.4% similar) in 633 aa overlap (1-582:1-628) 10 20 30 40 50 60 pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP :. ::: ..:::..::::::: :::.::.::: :::::.::::::.:.::::: : ::: CCDS82 MATGLLRAKKEAFVAFRDVAVYFTQEEWRLLSPAQRTLHREVMLETYNHLVSLEIPSSKP 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQ--PSFPHLVAFSSSQLLRQYALSGHPT ::: :::.:. ::::: . ::::::: . :.: :: : . :::.: : :.. .: . CCDS82 KLIAQLERGEAPWREERKCPLDLCPAESKPEIQLSPSCP--LIFSSQQALSQHVWLSHLS 70 80 90 100 110 120 130 140 150 160 pF1KB7 QIFPSSSAGGDFQL-----------EAPRCSSEKGESGETEGPDSSL---RKRPSRISRT :.: : ::. ..: . : : : :.: . :: :: : : . :.. CCDS82 QLFSSLWAGNPLHLGKHYPEDQKQQQDPFCFSGKAEWIQ-EGEDSRLLFGRVSKNGTSKA 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB7 FFSP-HQGDPVEWVEGNREGGTDLRLAQRMSLGGSDTMLKGADTSESGAVIRGNYRLGLS . :: .. .:.. : : .: .: .: .:.: ..: : . .. :. CCDS82 LSSPPEEQQPAQSKEDNTVVDIGSSPERRADLEETDKVLHGLEVSGFGEIKYEEFGPGFI 180 190 200 210 220 230 230 240 pF1KB7 KKSSLFSHQK-----------------------------H-----HVCPECGRGFCQRSD :.:.:.: :: : .:: :::::: .:. CCDS82 KESNLLSLQKTQTGETPYMYTEWGDSFGSMSVLIKNPRTHSGGKPYVCRECGRGFTWKSN 240 250 260 270 280 290 250 260 270 280 290 300 pF1KB7 LIKHQRTHTGEKPYLCPECGRRFSQKASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNH :: :::::.:::::.: .::: :. :..: ::: ::: :::::.:::. : :.: .: CCDS82 LITHQRTHSGEKPYVCKDCGRGFTWKSNLFTHQRTHSGLKPYVCKECGQSFSLKSNLITH 300 310 320 330 340 350 310 320 330 340 350 360 pF1KB7 KRIHSGERPFVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSH .: :.::.:.::.::::::::. :. :.::: :::..: :: .:: ::. :..: .: CCDS82 QRAHTGEKPYVCRECGRGFRQHSHLVRHKRTHSGEKPYICRECEQGFSQKSHLIRHLRTH 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB7 TGERPFLCLECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEK :::.:..: :::: : .: : .:: :::: ::::: :::. : : .: .:::.::::: CCDS82 TGEKPYVCTECGRHFSWKSNLKTHQRTHSGVKPYVCLECGQCFSLKSNLNKHQRSHTGEK 420 430 440 450 460 470 430 440 450 460 470 480 pF1KB7 PYLCPQCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLC :..: .:::::..: :: :::::.::::..: .:::::..: ::: :::::.::::..: CCDS82 PFVCTECGRGFTRKSTLSTHQRTHSGEKPFVCAECGRGFNDKSTLISHQRTHSGEKPFMC 480 490 500 510 520 530 490 500 510 520 530 540 pF1KB7 PKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECG .::: : : : ::.:.:: .: : ::::. : ::. ::.:.: :: .: ::: CCDS82 RECGRRFRQKPNLFRHKRAHSGA--FVCRECGQGFCAKLTLIKHQRAHAGGKPHVCRECG 540 550 560 570 580 590 550 560 570 580 590 600 pF1KB7 RGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF .::. .: ::::::::::::::.::.::::::. CCDS82 QGFSRQSHLIRHQRTHSGEKPYICRKCGRGFSRKSNLIRHQRTHSG 600 610 620 630 640 >>CCDS43307.1 PRDM9 gene_id:56979|Hs108|chr5 (894 aa) initn: 1754 init1: 1754 opt: 1841 Z-score: 1125.3 bits: 218.8 E(32554): 2.3e-56 Smith-Waterman score: 1855; 51.9% identity (70.3% similar) in 528 aa overlap (87-597:382-886) 60 70 80 90 100 110 pF1KB7 FSKPKLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYALSGH ::. :..: .::::...: :.. .: CCDS43 ELLVWYGDEYGQELGIKWGSKWKKELMAGREPKPEIHPCPSCCLAFSSQKFLSQHVERNH 360 370 380 390 400 410 120 130 140 150 pF1KB7 PTQIFPSSSAGGDFQLEAPRCSSEKGESGETEGPDSS---------------LRKRP--S .: ::. :: .: : : : ..... . : : : :: CCDS43 SSQNFPGPSARKLLQPENP-CPGDQNQEQQYPDPHSRNDKTKGQEIKERSKLLNKRTWQR 420 430 440 450 460 470 160 170 180 190 200 210 pF1KB7 RISRTFFSPHQGDPVEWVEGNREGGTDLRLAQRMSLGGSDTMLKGADTSESGAVIRGNYR .:::.: :: .:. :.: . : .:... :.. .. :. :. . : : CCDS43 EISRAFSSPPKGQMGSCRVGKRIMEEESRTGQKVNPGNTGKLFVGVGISRIAKVKYG--- 480 490 500 510 520 220 230 240 250 260 270 pF1KB7 LGLSKKSSLFSHQKHHVCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKASLS :::.:: .::.: ::::::::: :.: :::: :: :. : CCDS43 -------------------ECGQGFSVKSDVITHQRTHTGEKLYVCRECGRGFSWKSHLL 530 540 550 560 280 290 300 310 320 330 pF1KB7 IHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLHQR :::: :.:::::::::::: : . : : .:.: :.::.:.::.:::::: .. .:: ::: CCDS43 IHQRIHTGEKPYVCRECGRGFSWQSVLLTHQRTHTGEKPYVCRECGRGFSRQSVLLTHQR 570 580 590 600 610 620 340 350 360 370 380 390 pF1KB7 THLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTHSG : :::.:: :::::: ... :: :: ::::.:..: ::::.: ::.::.:: ::.: CCDS43 RHTGEKPYVCRECGRGFSRQSVLLTHQRRHTGEKPYVCRECGRGFSWQSVLLTHQRTHTG 630 640 650 660 670 680 400 410 420 430 440 450 pF1KB7 EKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGRGFSQKVTLIGHQRTHTGEKPY :::::: :::..: . .:. :::::::::::.: .::::::.: :. ::::::::::: CCDS43 EKPYVCRECGRGFSWQSVLLTHQRTHTGEKPYVCRECGRGFSNKSHLLRHQRTHTGEKPY 690 700 710 720 730 740 460 470 480 490 500 510 pF1KB7 LCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRV .: .::::: .: :.::::::::::::.: .:::.: :: : :::::. :. :: : CCDS43 VCRECGRGFRDKSHLLRHQRTHTGEKPYVCRECGRGFRDKSNLLSHQRTHTGEKPYVCRE 750 760 770 780 790 800 520 530 540 550 560 570 pF1KB7 CGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRG ::.:...::::. ::::.:::: .: :::::: :: :.::::::.::::::::::::: CCDS43 CGRGFSNKSHLLRHQRTHTGEKPYVCRECGRGFRNKSHLLRHQRTHTGEKPYVCRECGRG 810 820 830 840 850 860 580 590 600 pF1KB7 FSQKSHLHRHRRTKSGHQLLPQEVF ::..: : :.::..:.. CCDS43 FSDRSSLCYHQRTHTGEKPYVCREDE 870 880 890 >>CCDS13174.1 ZNF337 gene_id:26152|Hs108|chr20 (751 aa) initn: 4518 init1: 1538 opt: 1838 Z-score: 1124.2 bits: 218.4 E(32554): 2.7e-56 Smith-Waterman score: 1853; 46.4% identity (69.4% similar) in 605 aa overlap (9-597:7-598) 10 20 30 40 50 60 pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP :..:..:: ::.: ::::::.::: :::.::::: :::::::::::: ::: CCDS13 MGPQGARRQAFLAFGDVTVDFTQKEWRLLSPAQRALYREVTLENYSHLVSLGILHSKP 10 20 30 40 50 70 80 90 100 110 pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPA-EPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQ .::..::::. :: :: .. : . . ..:. :. ..:: :.. : CCDS13 ELIRRLEQGEVPWGEERRRRPGPCAGIYAEHVLRPKNLGLAHQRQQQL--QFS-----DQ 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 IFPSSSAGGDFQLEAPRCSSEKGESGETEGPDSSLRKRPSRISRTFFSPHQGDPVEW--- : :..: :. : . .. . :. : :.: : . . .. .:.: CCDS13 SFQSDTAEGQ---EKEKSTKPMAFSSPPLRHAVSSRRRNSVVEIESSQGQRENPTEIDKV 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 ---VEGNREGGTDLRLAQRMSLGGSDTML---KGADTSESGAVIRGNYRLGLSKKSSLFS .:..: :. .. :.: . . :. : : . .. . : .. :. .:.:. CCDS13 LKGIENSRWGA--FKCAERGQDFSRKMMVIIHKKAHSRQKLFTCRECHQ-GFRDESALLL 170 180 190 200 210 220 240 250 260 270 280 pF1KB7 HQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKASLSIHQRK ::. : :: ::::: ...:..:::::.::::.:: ::: ...:. :..:.: CCDS13 HQNTHTGEKSYVCSVCGRGFSLKANLLRHQRTHSGEKPFLCKVCGRGYTSKSYLTVHERT 230 240 250 260 270 280 290 300 310 320 330 340 pF1KB7 HSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLHQRTHLEE :.::::: :.::::.: :: ..: . ::::.::::.:::::. .: ...:.: : : CCDS13 HTGEKPYECQECGRRFNDKSSYNKHLKAHSGEKPFVCKECGRGYTNKSYFVVHKRIHSGE 290 300 310 320 330 340 350 360 370 380 390 400 pF1KB7 KPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTHSGEKPYV ::. : :::::: .:. :. :: .:.::.:: : .: .:: .. :: :: :::::::.: CCDS13 KPYRCQECGRGFSNKSHLITHQRTHSGEKPFACRQCKQSFSVKGSLLRHQRTHSGEKPFV 350 360 370 380 390 400 410 420 430 440 450 460 pF1KB7 CAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGRGFSQKVTLIGHQRTHTGEKPYLCPDC : .: .:: :: ::. :::::.::::..: .::.:: :: ::. :: ::. :::..: :: CCDS13 CKDCERSFSQKSTLVYHQRTHSGEKPFVCRECGQGFIQKSTLVKHQITHSEEKPFVCKDC 410 420 430 440 450 460 470 480 490 500 510 520 pF1KB7 GRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGL :::: :: :. :::::. :::: : .::: : :: ..: :.: :. . : ::.:. CCDS13 GRGFIQKSTFTLHQRTHSEEKPYGCRECGRRFRDKSSYNKHLRAHLGEKRFFCRDCGRGF 470 480 490 500 510 520 530 540 550 560 570 580 pF1KB7 GQKSHLISDQRTHSGEKPCICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKS : .: ::::::::: .: .: ..:..:. :.::: :::::.:. :..::::: :: CCDS13 TLKPNLTIHQRTHSGEKPFMCKQCEKSFSLKANLLRHQWTHSGERPFNCKDCGRGFILKS 530 540 550 560 570 580 590 600 pF1KB7 HLHRHRRTKSGHQLLPQEVF : :..:.::.. CCDS13 TLLFHQKTHSGEKPFICSECGQGFIWKSNLVKHQLAHSGKQPFVCKECGRGFNWKGNLLT 590 600 610 620 630 640 >-- initn: 622 init1: 344 opt: 574 Z-score: 367.4 bits: 78.4 E(32554): 3.8e-14 Smith-Waterman score: 574; 48.3% identity (72.8% similar) in 151 aa overlap (346-495:599-749) 320 330 340 350 360 370 pF1KB7 ERPFVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPF ::.: :::.:: :..:..:: .:.:..:: CCDS13 ERPFNCKDCGRGFILKSTLLFHQKTHSGEKPFICSECGQGFIWKSNLVKHQLAHSGKQPF 570 580 590 600 610 620 380 390 400 410 420 430 pF1KB7 LCLECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQ-RTHTGEKPYLCP .: ::::.: .. ::.:: :::::::.:: ::..: : .: ::. : :. :::..: CCDS13 VCKECGRGFNWKGNLLTHQRTHSGEKPFVCNVCGQGFSWKRSLTRHHWRIHSKEKPFVCQ 630 640 650 660 670 680 440 450 460 470 480 490 pF1KB7 QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGR .: ::...: : :.: ::::.:: : .::: :..: .: . : :: . . :. CCDS13 ECKRGYTSKSDLTVHERIHTGERPYECQECGRKFSNKSYYSKHLKRHLREKRFCTGSVGE 690 700 710 720 730 740 500 510 520 530 540 550 pF1KB7 AFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGF : CCDS13 ASS 750 >>CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 (738 aa) initn: 8614 init1: 1572 opt: 1797 Z-score: 1099.8 bits: 213.8 E(32554): 6.2e-55 Smith-Waterman score: 1819; 45.8% identity (67.5% similar) in 627 aa overlap (6-602:1-600) 10 20 30 40 50 60 pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP .: .:.. .: :..: ::::::.::. .:..::..::::::: ::::: :: CCDS31 MTMLQESF-SFDDLSVDFTQKEWQLLDPSQKNLYKDVMLENYSSLVSLGYEVMKP 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQI .: .::::.::: ..: :. : ... ...: . :: . CCDS31 DVIFKLEQGEEPWVGDGE-----IPSSDSPEVWKVDGNMMWHQDNQDKLKIIKRGHECDA 60 70 80 90 100 130 140 150 160 170 pF1KB7 FPSSSAGGDFQLEAPRCSSEKGESGETEGP-DSSLRKRPSRISRTFFSPHQGDPVEWVEG : : .:.:. .:..: :: :. . :. .. : .:: : CCDS31 F-----GKNFNLNMNFVPLRKSNS---EGDLDGLILKH----HLDLLIP-KGD-----YG 110 120 130 140 150 180 190 200 210 220 pF1KB7 NREGGTDLRLAQRMSLGG----SDTMLKGADTSE-------SGAVIRGNYRLG------- . :. :. . . . : . .:: :: : .. : .: ::: CCDS31 KAESD-DFNVFDNFFLHSKPEDTDTWLKYYDCDKYKESYKKSQIIIYHRNRLGEKLYECS 160 170 180 190 200 210 230 240 250 260 270 pF1KB7 -----LSKKSSLFSHQKHHV------CPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGR .::: ::..::..:. : .::. : :.:..: :.::::::::: : .::. CCDS31 ECRKRFSKKPSLIKHQSRHIRDIAFGCGNCGKTFPQKSQFITHHRTHTGEKPYNCSQCGK 220 230 240 250 260 270 280 290 300 310 320 330 pF1KB7 RFSQKASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQ ::::..:. ::: :.::::: : :::. : : : .: : :.::.:. :.::::.: . CCDS31 AFSQKSQLTSHQRTHTGEKPYECGECGKAFSRKSHLISHWRTHTGEKPYGCNECGRAFSE 280 290 300 310 320 330 340 350 360 370 380 390 pF1KB7 KIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLL : :. ::: : :::: : :::..: .:..:. :. .::: .:: : .: ..: ..: : CCDS31 KSNLINHQRIHTGEKPFECRECGKAFSRKSQLVTHHRTHTGTKPFGCSDCRKAFFEKSEL 340 350 360 370 380 390 400 410 420 430 440 450 pF1KB7 LSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGRGFSQKVTLIGHQ . ::. :.::::: :.:: ..::.. .:: ::::::::::. : :::..:::: ::.:: CCDS31 IRHQTIHTGEKPYECSECRKAFRERSSLINHQRTHTGEKPHGCIQCGKAFSQKSHLISHQ 400 410 420 430 440 450 460 470 480 490 500 510 pF1KB7 RTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGFKSLLTRHQRTHS :::::::..: ::..:..: :.:::::::::::: : .::.::. : :: ::: :. CCDS31 MTHTGEKPFICSKCGKAFSRKSQLVRHQRTHTGEKPYECSECGKAFSEKLSLTNHQRIHT 460 470 480 490 500 510 520 530 540 550 560 570 pF1KB7 EEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGFKSALIRHQRTHSGEKP :. :: ::... ::::::: ::::.:::: :.:::..:: ::.: :::::.:::: CCDS31 GEKPYVCSECGKAFCQKSHLISHQRTHTGEKPYECSECGKAFGEKSSLATHQRTHTGEKP 520 530 540 550 560 570 580 590 600 pF1KB7 YVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF : ::.: ..:::::.:. :.: ..:.. : : CCDS31 YECRDCEKAFSQKSQLNTHQRIHTGEK--PYECSLCRKAFFEKSELIRHLRTHTGEKPYE 580 590 600 610 620 CCDS31 CNECRKAFREKSSLINHQRIHTGEKPFECSECGKAFSRKSHLIPHQRTHTGEKPYGCSEC 630 640 650 660 670 680 >-- initn: 2032 init1: 546 opt: 546 Z-score: 350.7 bits: 75.2 E(32554): 3.2e-13 Smith-Waterman score: 589; 55.5% identity (78.1% similar) in 137 aa overlap (349-485:601-737) 320 330 340 350 360 370 pF1KB7 FVCQECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCL : : ..: .:. :..: .::::.:. : CCDS31 YECRDCEKAFSQKSQLNTHQRIHTGEKPYECSLCRKAFFEKSELIRHLRTHTGEKPYECN 580 590 600 610 620 630 380 390 400 410 420 430 pF1KB7 ECGRSFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGR :: ..::..: :..:: :.::::. :.:::..: .: :: ::::::::::: : .: . CCDS31 ECRKAFREKSSLINHQRIHTGEKPFECSECGKAFSRKSHLIPHQRTHTGEKPYGCSECRK 640 650 660 670 680 690 440 450 460 470 480 490 pF1KB7 GFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGF .:::: :..::: ::::::: : .::..:.:: :: :::::: .: CCDS31 AFSQKSQLVNHQRIHTGEKPYRCIECGKAFSQKSQLINHQRTHTVKKS 700 710 720 730 500 510 520 530 540 550 pF1KB7 KSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGFKSAL >>CCDS74693.1 ZNF343 gene_id:79175|Hs108|chr20 (640 aa) initn: 1574 init1: 1574 opt: 1698 Z-score: 1041.1 bits: 202.8 E(32554): 1.1e-51 Smith-Waterman score: 1771; 47.7% identity (68.3% similar) in 600 aa overlap (14-592:62-639) 10 20 30 40 pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVM ..::::.: ::. ::: :: ::.::.::: CCDS74 LTQNHKAKGLPSNDTDCPQKKEGKAQIVVPVTFRDVTVIFTEAEWKRLSPEQRNLYKEVM 40 50 60 70 80 90 50 60 70 80 90 pF1KB7 LENYSHLVSL-GIAFSKPKL-----IEQLEQGDEPWREENEHLLDLC---PAEPRTEFQP :::: .:.:: :... :.: : .. : .. . :::. :. CCDS74 LENYRNLLSLDGVSLLLPRLECNRAISAHHNLCLPGSSNSPATASRVVGITAEPKPEIYT 100 110 120 130 140 150 100 110 120 130 140 pF1KB7 SFPHLVAFSSSQLLRQYALS---G--HPTQIFPSSSAGGDFQLEAPR-----CSSEKGES :.::: .:.: :..:. : ... :..:. : .. .. . : :..:. CCDS74 CSSCLLAFSCQQFLSQHVLQIFLGLCAENHFHPGNSSPGHWKQQGQQYSHVSCWFENAEG 160 170 180 190 200 210 150 160 170 180 190 200 pF1KB7 GETEGPDS--SLRKRPSRISRTFFSPHQGDPVEWVEGNREGGTDLRLAQRMSLGGSDTML : : .. : : . . ::.: :: : . . .:: :. ::: . : : CCDS74 QERGGGSKPWSARTEERETSRAFPSPLQRQSASPRKGNMVVETEPSSAQRPNPVQLDKGL 220 230 240 250 260 270 210 220 230 240 250 260 pF1KB7 KGADTSESGAVIRGNYRLGLSKKSSLFSHQKHHVCPECGRGFCQRSDLIKHQRTHTGEKP : .: . ::. : : .. : .:..: . :: :.:: CCDS74 KELETLRFGAI---NCR----------EYEPDH---------NLESNFITNPRTLLGKKP 280 290 300 270 280 290 300 310 320 pF1KB7 YLCPECGRRFSQKASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQ :.: .::: :.....: :.: :: :::::: :::: : :.:. :.: :: :.:..:. CCDS74 YICSDCGRSFKDRSTLIRHHRIHSMEKPYVCSECGRGFSQKSNLSRHQRTHSEEKPYLCR 310 320 330 340 350 360 330 340 350 360 370 380 pF1KB7 ECGRGFRQKIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGR :::..::.: : :: :: ::::.:: :::::: .:.:...:: .:.::.:..:::::: CCDS74 ECGQSFRSKSILNRHQWTHSEEKPYVCSECGRGFSEKSSFIRHQRTHSGEKPYVCLECGR 370 380 390 400 410 420 390 400 410 420 430 440 pF1KB7 SFRQQSLLLSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLCPQCGRGFSQ :: ..: : .:: ::::::::: :::..: :. ::.::::: ::::.: .::::: . CCDS74 SFCDKSTLRKHQRIHSGEKPYVCRECGRGFSQNSDLIKHQRTHLDEKPYVCRECGRGFCD 430 440 450 460 470 480 450 460 470 480 490 500 pF1KB7 KVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLCPKCGRAFGFKSLL : ::: :.:::.:::::.: .:::::..: :. :::::.::: :.: .: :.:. :: : CCDS74 KSTLIIHERTHSGEKPYVCGECGRGFSRKSLLLVHQRTHSGEKHYVCRECRRGFSQKSNL 490 500 510 520 530 540 510 520 530 540 550 560 pF1KB7 TRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECGRGFGFKSALIRHQ :::::::.:. :. : ::.:. .:: :: .:::::::: .:.::::::. :: :. :: CCDS74 IRHQRTHSNEKPYICRECGRGFCDKSTLIVHERTHSGEKPYVCSECGRGFSRKSLLLVHQ 550 560 570 580 590 600 570 580 590 600 pF1KB7 RTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF ::::::: :::::::::::.::.: ::.:: CCDS74 RTHSGEKHYVCRECGRGFSHKSNLIRHQRTH 610 620 630 640 >>CCDS63235.1 ZNF133 gene_id:7692|Hs108|chr20 (591 aa) initn: 1659 init1: 1659 opt: 1691 Z-score: 1037.3 bits: 202.0 E(32554): 1.9e-51 Smith-Waterman score: 1788; 47.9% identity (68.0% similar) in 568 aa overlap (83-600:9-572) 60 70 80 90 100 110 pF1KB7 LGIAFSKPKLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYA : ::. ..: : .:::... :.. CCDS63 MCNGRKTVLADPEPELYLDPFCPP--GFSSQKFPMQHV 10 20 30 120 130 140 150 pF1KB7 LSGHPTQIFPSSSAGGDFQLEAP--------------RCSSEKGESGETEGPDSSLRKRP : .:: :: : :..: : : :...:. : :: . . CCDS63 LCNHPPWIFTCLCAEGNIQPGDPGPGDQEKQQQASEGRPWSDQAEGPEGEGAMPLFGRTK 40 50 60 70 80 90 160 170 180 190 200 210 pF1KB7 SRISRTFFSPHQGDPVEWVEGNREGGTDLRL--AQRMSLGGSDTMLKGADTSESGAVIRG .: .: : : .:: .: : :..:. :: . .: .:: .. :.: : CCDS63 KRTLGAFSRPPQRQPVSSRNGLR--GVELEASPAQSGNPEETDKLLKRIEVLGFGTVNCG 100 110 120 130 140 150 220 230 240 250 260 270 pF1KB7 NYRLGLSKKSSLFSHQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGR . :..:: ..:.:::. : :: : .:: ...: .::..:.:::: .: :::: CCDS63 ECGLSFSKMTNLLSHQRIHSGEKPYVCGVCEKGFSLKKSLARHQKAHSGEKPIVCRECGR 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB7 RFSQKASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQ :..:..: ::.: :::::::.: :::: : :.: :.: ::::.:.::.:::.:: : CCDS63 GFNRKSTLIIHERTHSGEKPYMCSECGRGFSQKSNLIIHQRTHSGEKPYVCRECGKGFSQ 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB7 KIALLLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLL : :.. ::::::::: .:: .:: :: ....:..:: .:.::.:. : :::: :::.. : CCDS63 KSAVVRHQRTHLEEKTIVCSDCGLGFSDRSNLISHQRTHSGEKPYACKECGRCFRQRTTL 280 290 300 310 320 330 400 410 420 430 pF1KB7 LSHQVTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLC----------------- ..:: ::: ::::::. ::::: :. ::: :.:::::::::.: CCDS63 VNHQRTHSKEKPYVCGVCGHSFSQNSTLISHRRTHTGEKPYVCGVCGRGFSLKSHLNRHQ 340 350 360 370 380 390 440 450 460 470 480 pF1KB7 -------P----QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHT : .:::::::. .:: :::::.::::..: .:::::.:: .:. :::::. CCDS63 NIHSGEKPIVCKDCGRGFSQQSNLIRHQRTHSGEKPMVCGECGRGFSQKSNLVAHQRTHS 400 410 420 430 440 450 490 500 510 520 530 540 pF1KB7 GEKPYLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKP ::.::.: .:::.:. .. : ::.: ::.:. :. : :: :.:.:: ::. .:.:: ::: CCDS63 GERPYVCRECGRGFSHQAGLIRHKRKHSREKPYMCRQCGLGFGNKSALITHKRAHSEEKP 460 470 480 490 500 510 550 560 570 580 590 600 pF1KB7 CICDECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQE :.: :::.:: :: : :: ::.:::::::. :::::: :::: :::.: : :. :: CCDS63 CVCRECGQGFLQKSHLTLHQMTHTGEKPYVCKTCGRGFSLKSHLSRHRKTTSVHHRLPVQ 520 530 540 550 560 570 pF1KB7 VF CCDS63 PDPEPCAGQPSDSLYSL 580 590 >>CCDS74704.1 ZNF133 gene_id:7692|Hs108|chr20 (635 aa) initn: 1659 init1: 1659 opt: 1691 Z-score: 1036.9 bits: 202.0 E(32554): 1.9e-51 Smith-Waterman score: 1786; 48.0% identity (68.3% similar) in 564 aa overlap (87-600:57-616) 60 70 80 90 100 110 pF1KB7 FSKPKLIEQLEQGDEPWREENEHLLDLCPAEPRTEFQPSFPHLVAFSSSQLLRQYALSGH ::. ..: : .:::... :..: .: CCDS74 IRGSVVLAPRWRSSPAGGWSDPLFFGGADPEPELYLDPFCPP--GFSSQKFPMQHVLCNH 30 40 50 60 70 80 120 130 140 150 160 pF1KB7 PTQIFPSSSAGGDFQLEAP--------------RCSSEKGESGETEGPDSSLRKRPSRIS : :: : :..: : : :...:. : :: . . .: CCDS74 PPWIFTCLCAEGNIQPGDPGPGDQEKQQQASEGRPWSDQAEGPEGEGAMPLFGRTKKRTL 90 100 110 120 130 140 170 180 190 200 210 220 pF1KB7 RTFFSPHQGDPVEWVEGNREGGTDLRL--AQRMSLGGSDTMLKGADTSESGAVIRGNYRL .: : : .:: .: : :..:. :: . .: .:: .. :.: :. : CCDS74 GAFSRPPQRQPVSSRNGLR--GVELEASPAQSGNPEETDKLLKRIEVLGFGTVNCGECGL 150 160 170 180 190 200 230 240 250 260 270 pF1KB7 GLSKKSSLFSHQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQ ..:: ..:.:::. : :: : .:: ...: .::..:.:::: .: :::: :.. CCDS74 SFSKMTNLLSHQRIHSGEKPYVCGVCEKGFSLKKSLARHQKAHSGEKPIVCRECGRGFNR 210 220 230 240 250 260 280 290 300 310 320 330 pF1KB7 KASLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIAL :..: ::.: :::::::.: :::: : :.: :.: ::::.:.::.:::.:: :: :. CCDS74 KSTLIIHERTHSGEKPYMCSECGRGFSQKSNLIIHQRTHSGEKPYVCRECGKGFSQKSAV 270 280 290 300 310 320 340 350 360 370 380 390 pF1KB7 LLHQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQ . ::::::::: .:: .:: :: ....:..:: .:.::.:. : :::: :::.. :..:: CCDS74 VRHQRTHLEEKTIVCSDCGLGFSDRSNLISHQRTHSGEKPYACKECGRCFRQRTTLVNHQ 330 340 350 360 370 380 400 410 420 430 pF1KB7 VTHSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLC--------------------- ::: ::::::. ::::: :. ::: :.:::::::::.: CCDS74 RTHSKEKPYVCGVCGHSFSQNSTLISHRRTHTGEKPYVCGVCGRGFSLKSHLNRHQNIHS 390 400 410 420 430 440 440 450 460 470 480 pF1KB7 ---P----QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKP : .:::::::. .:: :::::.::::..: .:::::.:: .:. :::::.::.: CCDS74 GEKPIVCKDCGRGFSQQSNLIRHQRTHSGEKPMVCGECGRGFSQKSNLVAHQRTHSGERP 450 460 470 480 490 500 490 500 510 520 530 540 pF1KB7 YLCPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICD :.: .:::.:. .. : ::.: ::.:. :. : :: :.:.:: ::. .:.:: ::::.: CCDS74 YVCRECGRGFSHQAGLIRHKRKHSREKPYMCRQCGLGFGNKSALITHKRAHSEEKPCVCR 510 520 530 540 550 560 550 560 570 580 590 600 pF1KB7 ECGRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF :::.:: :: : :: ::.:::::::. :::::: :::: :::.: : :. :: CCDS74 ECGQGFLQKSHLTLHQMTHTGEKPYVCKTCGRGFSLKSHLSRHRKTTSVHHRLPVQPDPE 570 580 590 600 610 620 CCDS74 PCAGQPSDSLYSL 630 >>CCDS13134.1 ZNF133 gene_id:7692|Hs108|chr20 (653 aa) initn: 1659 init1: 1659 opt: 1691 Z-score: 1036.8 bits: 202.0 E(32554): 2e-51 Smith-Waterman score: 2115; 50.9% identity (69.8% similar) in 636 aa overlap (16-600:3-634) 10 20 30 40 50 60 pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP :::::: ::: ::.::: :::::::::::::::.::::::.:::: CCDS13 MAFRDVAVDFTQDEWRLLSPAQRTLYREVMLENYSNLVSLGISFSKP 10 20 30 40 70 80 90 100 110 pF1KB7 KLIEQLEQGDEPWREENEHLLDLCP-AEPRTEFQPSFPHLVAFSSSQLLRQYALSGHPTQ .:: ::::: : ::::.. :: ::. ..: : .:::... :..: .:: CCDS13 ELITQLEQGKETWREEKKCSPATCPDPEPELYLDPFCPP--GFSSQKFPMQHVLCNHPPW 50 60 70 80 90 100 120 130 140 150 160 pF1KB7 IFPSSSAGGDFQLEAP--------------RCSSEKGESGETEGPDSSLRKRPSRISRTF :: : :..: : : :...:. : :: . . .: .: CCDS13 IFTCLCAEGNIQPGDPGPGDQEKQQQASEGRPWSDQAEGPEGEGAMPLFGRTKKRTLGAF 110 120 130 140 150 160 170 180 190 200 210 220 pF1KB7 FSPHQGDPVEWVEGNREGGTDLRL--AQRMSLGGSDTMLKGADTSESGAVIRGNYRLGLS : : .:: .: : :..:. :: . .: .:: .. :.: :. :..: CCDS13 SRPPQRQPVSSRNGLR--GVELEASPAQSGNPEETDKLLKRIEVLGFGTVNCGECGLSFS 170 180 190 200 210 220 230 240 250 260 270 pF1KB7 KKSSLFSHQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKAS : ..:.:::. : :: : .:: ...: .::..:.:::: .: :::: :..:.. CCDS13 KMTNLLSHQRIHSGEKPYVCGVCEKGFSLKKSLARHQKAHSGEKPIVCRECGRGFNRKST 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB7 LSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLLH : ::.: :::::::.: :::: : :.: :.: ::::.:.::.:::.:: :: :.. : CCDS13 LIIHERTHSGEKPYMCSECGRGFSQKSNLIIHQRTHSGEKPYVCRECGKGFSQKSAVVRH 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB7 QRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVTH :::::::: .:: .:: :: ....:..:: .:.::.:. : :::: :::.. :..:: :: CCDS13 QRTHLEEKTIVCSDCGLGFSDRSNLISHQRTHSGEKPYACKECGRCFRQRTTLVNHQRTH 350 360 370 380 390 400 400 410 420 430 pF1KB7 SGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLC------------------------ : ::::::. ::::: :. ::: :.:::::::::.: CCDS13 SKEKPYVCGVCGHSFSQNSTLISHRRTHTGEKPYVCGVCGRGFSLKSHLNRHQNIHSGEK 410 420 430 440 450 460 440 450 460 470 480 pF1KB7 P----QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYLC : .:::::::. .:: :::::.::::..: .:::::.:: .:. :::::.::.::.: CCDS13 PIVCKDCGRGFSQQSNLIRHQRTHSGEKPMVCGECGRGFSQKSNLVAHQRTHSGERPYVC 470 480 490 500 510 520 490 500 510 520 530 540 pF1KB7 PKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDECG .:::.:. .. : ::.: ::.:. :. : :: :.:.:: ::. .:.:: ::::.: ::: CCDS13 RECGRGFSHQAGLIRHKRKHSREKPYMCRQCGLGFGNKSALITHKRAHSEEKPCVCRECG 530 540 550 560 570 580 550 560 570 580 590 600 pF1KB7 RGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF .:: :: : :: ::.:::::::. :::::: :::: :::.: : :. :: CCDS13 QGFLQKSHLTLHQMTHTGEKPYVCKTCGRGFSLKSHLSRHRKTTSVHHRLPVQPDPEPCA 590 600 610 620 630 640 CCDS13 GQPSDSLYSL 650 >>CCDS63234.1 ZNF133 gene_id:7692|Hs108|chr20 (654 aa) initn: 1659 init1: 1659 opt: 1691 Z-score: 1036.8 bits: 202.0 E(32554): 2e-51 Smith-Waterman score: 2115; 50.9% identity (70.0% similar) in 636 aa overlap (17-600:4-635) 10 20 30 40 50 60 pF1KB7 MSPGLLTTRKEALMAFRDVAVAFTQKEWKLLSSAQRTLYREVMLENYSHLVSLGIAFSKP ::::: ::: ::.::: :::::::::::::::.::::::.:::: CCDS63 MAFRDVAVDFTQDEWRLLSPAQRTLYREVMLENYSNLVSLGISFSKP 10 20 30 40 70 80 90 100 110 pF1KB7 KLIEQLEQGDEPWREENEHLLDLCPAEPRTEF--QPSFPHLVAFSSSQLLRQYALSGHPT .:: ::::: : ::::.. :::.:. :. .: : .:::... :..: .:: CCDS63 ELITQLEQGKETWREEKKCSPATCPADPEPELYLDPFCPP--GFSSQKFPMQHVLCNHPP 50 60 70 80 90 100 120 130 140 150 160 pF1KB7 QIFPSSSAGGDFQLEAP--------------RCSSEKGESGETEGPDSSLRKRPSRISRT :: : :..: : : :...:. : :: . . .: . CCDS63 WIFTCLCAEGNIQPGDPGPGDQEKQQQASEGRPWSDQAEGPEGEGAMPLFGRTKKRTLGA 110 120 130 140 150 160 170 180 190 200 210 220 pF1KB7 FFSPHQGDPVEWVEGNREGGTDLRL--AQRMSLGGSDTMLKGADTSESGAVIRGNYRLGL : : : .:: .: : :..:. :: . .: .:: .. :.: :. :.. CCDS63 FSRPPQRQPVSSRNGLR--GVELEASPAQSGNPEETDKLLKRIEVLGFGTVNCGECGLSF 170 180 190 200 210 220 230 240 250 260 270 pF1KB7 SKKSSLFSHQKHH------VCPECGRGFCQRSDLIKHQRTHTGEKPYLCPECGRRFSQKA :: ..:.:::. : :: : .:: ...: .::..:.:::: .: :::: :..:. CCDS63 SKMTNLLSHQRIHSGEKPYVCGVCEKGFSLKKSLARHQKAHSGEKPIVCRECGRGFNRKS 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB7 SLSIHQRKHSGEKPYVCRECGRHFRYTSSLTNHKRIHSGERPFVCQECGRGFRQKIALLL .: ::.: :::::::.: :::: : :.: :.: ::::.:.::.:::.:: :: :.. CCDS63 TLIIHERTHSGEKPYMCSECGRGFSQKSNLIIHQRTHSGEKPYVCRECGKGFSQKSAVVR 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB7 HQRTHLEEKPFVCPECGRGFCQKASLLQHQSSHTGERPFLCLECGRSFRQQSLLLSHQVT ::::::::: .:: .:: :: ....:..:: .:.::.:. : :::: :::.. :..:: : CCDS63 HQRTHLEEKTIVCSDCGLGFSDRSNLISHQRTHSGEKPYACKECGRCFRQRTTLVNHQRT 350 360 370 380 390 400 400 410 420 430 pF1KB7 HSGEKPYVCAECGHSFRQKVTLIRHQRTHTGEKPYLC----------------------- :: ::::::. ::::: :. ::: :.:::::::::.: CCDS63 HSKEKPYVCGVCGHSFSQNSTLISHRRTHTGEKPYVCGVCGRGFSLKSHLNRHQNIHSGE 410 420 430 440 450 460 440 450 460 470 480 pF1KB7 -P----QCGRGFSQKVTLIGHQRTHTGEKPYLCPDCGRGFGQKVTLIRHQRTHTGEKPYL : .:::::::. .:: :::::.::::..: .:::::.:: .:. :::::.::.::. CCDS63 KPIVCKDCGRGFSQQSNLIRHQRTHSGEKPMVCGECGRGFSQKSNLVAHQRTHSGERPYV 470 480 490 500 510 520 490 500 510 520 530 540 pF1KB7 CPKCGRAFGFKSLLTRHQRTHSEEELYVDRVCGQGLGQKSHLISDQRTHSGEKPCICDEC : .:::.:. .. : ::.: ::.:. :. : :: :.:.:: ::. .:.:: ::::.: :: CCDS63 CRECGRGFSHQAGLIRHKRKHSREKPYMCRQCGLGFGNKSALITHKRAHSEEKPCVCREC 530 540 550 560 570 580 550 560 570 580 590 600 pF1KB7 GRGFGFKSALIRHQRTHSGEKPYVCRECGRGFSQKSHLHRHRRTKSGHQLLPQEVF :.:: :: : :: ::.:::::::. :::::: :::: :::.: : :. :: CCDS63 GQGFLQKSHLTLHQMTHTGEKPYVCKTCGRGFSLKSHLSRHRKTTSVHHRLPVQPDPEPC 590 600 610 620 630 640 CCDS63 AGQPSDSLYSL 650 604 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 09:51:29 2016 done: Sat Nov 5 09:51:30 2016 Total Scan time: 3.680 Total Display time: 0.200 Function used was FASTA [36.3.4 Apr, 2011]