FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8402, 782 aa 1>>>pF1KB8402 782 - 782 aa - 782 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1721+/-0.00147; mu= 19.8400+/- 0.089 mean_var=285.3877+/-51.198, 0's: 0 Z-trim(111.0): 928 B-trim: 0 in 0/50 Lambda= 0.075920 statistics sampled from 11013 (12050) to 11013 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.698), E-opt: 0.2 (0.37), width: 16 Scan time: 3.670 The best scores are: opt bits E(32554) CCDS47738.1 ZNF786 gene_id:136051|Hs108|chr7 ( 782) 5744 643.9 2.8e-184 CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090) 1582 188.3 5.6e-47 CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280) 1495 178.9 4.4e-44 CCDS82409.1 ZNF418 gene_id:147686|Hs108|chr19 ( 591) 1473 175.9 1.6e-43 CCDS42642.1 ZNF418 gene_id:147686|Hs108|chr19 ( 676) 1473 176.0 1.8e-43 CCDS82410.1 ZNF418 gene_id:147686|Hs108|chr19 ( 697) 1473 176.1 1.8e-43 CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 ( 688) 1472 175.9 1.9e-43 CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058) 1464 175.4 4.3e-43 CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 ( 839) 1461 174.9 4.8e-43 CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 ( 840) 1457 174.5 6.5e-43 CCDS31940.1 ZNF84 gene_id:7637|Hs108|chr12 ( 738) 1454 174.0 7.7e-43 CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 ( 803) 1446 173.2 1.5e-42 CCDS33046.1 ZNF224 gene_id:7767|Hs108|chr19 ( 707) 1444 172.9 1.6e-42 CCDS46169.1 ZNF665 gene_id:79788|Hs108|chr19 ( 678) 1440 172.4 2.1e-42 CCDS13174.1 ZNF337 gene_id:26152|Hs108|chr20 ( 751) 1433 171.7 3.8e-42 CCDS12846.1 ZNF615 gene_id:284370|Hs108|chr19 ( 731) 1426 170.9 6.4e-42 CCDS82387.1 ZNF615 gene_id:284370|Hs108|chr19 ( 736) 1426 171.0 6.5e-42 CCDS59418.1 ZNF615 gene_id:284370|Hs108|chr19 ( 742) 1426 171.0 6.5e-42 CCDS12977.1 ZNF497 gene_id:162968|Hs108|chr19 ( 498) 1420 170.0 8.5e-42 CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15 ( 614) 1417 169.8 1.2e-41 CCDS4624.1 ZNF184 gene_id:7738|Hs108|chr6 ( 751) 1416 169.9 1.4e-41 CCDS42636.1 ZNF17 gene_id:7565|Hs108|chr19 ( 662) 1413 169.4 1.6e-41 CCDS82405.1 ZNF17 gene_id:7565|Hs108|chr19 ( 664) 1413 169.5 1.7e-41 CCDS33048.1 ZNF235 gene_id:9310|Hs108|chr19 ( 738) 1412 169.4 1.9e-41 CCDS14279.1 ZNF41 gene_id:7592|Hs108|chrX ( 779) 1412 169.5 1.9e-41 CCDS46212.1 ZNF814 gene_id:730051|Hs108|chr19 ( 855) 1412 169.5 2e-41 CCDS45012.1 ZNF268 gene_id:10795|Hs108|chr12 ( 947) 1409 169.3 2.6e-41 CCDS7198.1 ZNF33B gene_id:7582|Hs108|chr10 ( 778) 1401 168.3 4.4e-41 CCDS77297.1 ZNF546 gene_id:339327|Hs108|chr19 ( 810) 1394 167.5 7.7e-41 CCDS12548.1 ZNF546 gene_id:339327|Hs108|chr19 ( 836) 1394 167.5 7.8e-41 CCDS12497.1 ZNF345 gene_id:25850|Hs108|chr19 ( 488) 1388 166.5 9.5e-41 CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17 ( 865) 1388 166.9 1.2e-40 CCDS43307.1 PRDM9 gene_id:56979|Hs108|chr5 ( 894) 1388 166.9 1.3e-40 CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1382 166.1 1.8e-40 CCDS12955.1 ZNF530 gene_id:348327|Hs108|chr19 ( 599) 1379 165.6 2.1e-40 CCDS12505.1 ZNF571 gene_id:51276|Hs108|chr19 ( 609) 1378 165.6 2.3e-40 CCDS56092.1 ZNF568 gene_id:374900|Hs108|chr19 ( 580) 1374 165.1 3e-40 CCDS54258.1 ZNF540 gene_id:163255|Hs108|chr19 ( 628) 1374 165.1 3.1e-40 CCDS42558.1 ZNF568 gene_id:374900|Hs108|chr19 ( 644) 1374 165.2 3.1e-40 CCDS12506.1 ZNF540 gene_id:163255|Hs108|chr19 ( 660) 1374 165.2 3.2e-40 CCDS12848.1 ZNF432 gene_id:9668|Hs108|chr19 ( 652) 1369 164.6 4.6e-40 CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 ( 748) 1369 164.7 4.9e-40 CCDS12636.1 ZNF227 gene_id:7770|Hs108|chr19 ( 799) 1369 164.8 5.1e-40 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1361 163.7 8.3e-40 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1361 163.7 8.5e-40 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1361 163.8 8.6e-40 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1361 163.8 8.7e-40 CCDS13134.1 ZNF133 gene_id:7692|Hs108|chr20 ( 653) 1360 163.6 9.2e-40 CCDS74703.1 ZNF133 gene_id:7692|Hs108|chr20 ( 667) 1360 163.7 9.3e-40 CCDS63235.1 ZNF133 gene_id:7692|Hs108|chr20 ( 591) 1357 163.2 1.1e-39 >>CCDS47738.1 ZNF786 gene_id:136051|Hs108|chr7 (782 aa) initn: 5744 init1: 5744 opt: 5744 Z-score: 3421.8 bits: 643.9 E(32554): 2.8e-184 Smith-Waterman score: 5744; 99.9% identity (99.9% similar) in 782 aa overlap (1-782:1-782) 10 20 30 40 50 60 pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 IEHGGEPFRKWRESQKSGNIICSSVDMHFDPGFEEQLFWGSQQAMNSGKTKSHFQLDPES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 IEHGGEPFRKWRESQKSGNIICSSVDMHFDPGFEEQLFWGSQQAMNSGKTKSHFQLDPES 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 QCSFGSFVSFRPDQGITLGSPQRHDARAPPPLACGPSESTLKEGIPGPRNLDLPGLWDVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QCSFGSFVSFRPDQGITLGSPQRHDARAPPPLACGPSESTLKEGIPGPRNLDLPGLWDVP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 AWESTQHPWPVCGESCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AWESTQHPWPVCGESCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 RCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 CGKRSLPVDSTQARRCQHSREGPASWREGRGASSSVHSGQKPGSRLPQEGNSHQEGDTEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 CGKRSLPVDSTQARRCQHSREGPASWREGRGASSSVHSGQKPGSRLPQEGNSHQEGDTEA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 LQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 GERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 FQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 FQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 KCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 SFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSCECGKGFVKH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSCECGKGFVKH 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 SKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHML ::::::::::::::::::::::::::::::::::::::::::::::::::::: :::::: CCDS47 SKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFRERGHML 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB8 RHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEAD 730 740 750 760 770 780 pF1KB8 WS :: CCDS47 WS >>CCDS59379.1 ZNF850 gene_id:342892|Hs108|chr19 (1090 aa) initn: 8886 init1: 1047 opt: 1582 Z-score: 956.9 bits: 188.3 E(32554): 5.6e-47 Smith-Waterman score: 1736; 35.5% identity (61.7% similar) in 772 aa overlap (11-759:9-756) 10 20 30 40 50 60 pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW :.:..: ::..::. :.: ::.::. :: :: .:::: ..:::..:: CCDS59 MNMEGLVMFQDLSIDFSQEEWECLDAAQKDLYRDVMMENYSSLVSLGLSIPKPDVISL 10 20 30 40 50 70 80 90 100 110 pF1KB8 IEHGGEPFRKWRESQ----KSGNIICSSVDMHFDPGFEEQLF--WGSQQAMNS--GKT-- .:.: ::. :. ..... :.. : . . : : .. .: :.. CCDS59 LEQGKEPWMVSRDVLGGWCRDSEFRCKTKDSCLPKEIYEVTSSQWVRMEKCHSLVGSSVR 60 70 80 90 100 110 120 130 140 150 160 pF1KB8 -----KSHFQLDPESQCSF--GSFVSFRPDQGITLGSPQRHDARAPPPLACGPSESTLKE :..:: . .: . ...... . : . : : : . : CCDS59 DDWECKGQFQHQDINQERYLEKAIMTYETTPTFCLQTSLTLHHRIHP----GEKLYKSTE 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB8 GIPGPRNLDLPGLWDVPAWESTQHPWPVCGESCWENNHLVMHQRGHSKDRT---RRAWEK . . .: .. . :. . ::.. . ..:: ::: :. .. .. . CCDS59 CMAFKYGSELTQQQETHTGEKL-YKCKECGKAFHHFSYLVKHQRIHTGEKPCACKEYGKA 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB8 FNKRAETQMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHE : . .. . . .: .: :.:: . :..: ::: :.. . : CCDS59 FISGSHLIQHQKMYTDERPHECQESVKAFRPSAHLIQHWRIHTGDKPYECKECGKSFTSG 240 250 260 270 280 290 290 300 310 320 330 pF1KB8 LTHPSHRLPQQGEKPAQCTPCGKRSLPVDSTQARRCQ-HSREGPASWRE-GRGASSSVHS : .:. . :::: .: ::: :. : :: :. : :. : : . .: :.. .: CCDS59 STLNQHQQIHTGEKPYHCKQCGK-SFTVGSTLIRHQQIHTGEKPYDCKECGKSFAS---- 300 310 320 330 340 340 350 360 370 380 390 pF1KB8 GQKPGSRLPQEGNSHQEGDTEALQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQ :: : . ::. : .: : .:.:::. . . : : ::::::.. CCDS59 ----GSALIR----HQR------IHTGEKPYDCKECGKSFTFHSALIRHQRIHTGEKPYD 350 360 370 380 390 400 410 420 430 440 450 pF1KB8 CAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKC : .: : : .: : :: : ::.:..:..:::.:. : .: :.:.::::. : .: CCDS59 CKECGKSFTFRSGLIGHQAIHTGEKPYDCKECGKSFTAGSTLIQHQRIHTGEKPYDCKEC 400 410 420 430 440 450 460 470 480 490 500 510 pF1KB8 GRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGF :..: . . ::.:::.:: :::. : ::: :: ..: :. : ::.:..:.:::..: CCDS59 GKSFASGSALLQHQRIHTGEKPYCCKECGKSFTFRSTRNRHQRIHTGEKPYNCKECGKSF 460 470 480 490 500 510 520 530 540 550 560 570 pF1KB8 THQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQS . : .: :.:.::.:..: .: : : ... : .:: .:. :.:..: ::::.:: .: CCDS59 ASGSALLQHQRIHTGEKPYHCKECGKSFTFRSGLIGHQAVHTGEKPYDCKECGKSFTSRS 520 530 540 550 560 570 580 590 600 610 620 630 pF1KB8 KLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKA : .: :.:.::.:..: ::..:: . . ::.::..::::.:..: :: : .:.. . CCDS59 ALIQHQRIHTGEKPYHCKECGKSFTVGSTLLQHQQIHTGEKPYDCKECGKAFRLRLRLTQ 580 590 600 610 620 630 640 650 660 670 680 690 pF1KB8 HQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGL :: .:.:: :..: ::::.::. : : .: : ::::::..:: : :.:: .. : .:. . CCDS59 HQQIHTGEKPYQCQECGKAFVSVSGLTQHHRIHTGEKPYECPDCGKAFRQRTYLNQHRRI 640 650 660 670 680 690 700 710 720 730 740 750 pF1KB8 HTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKS ::::.:..: :: :.: . ...::. : :.:. .:::.: .: : .: ..:: CCDS59 HTGEKPYECKECGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGE 700 710 720 730 740 750 760 770 780 pF1KB8 CPAPNELDIKKRLSQLFAMIEADWS : CCDS59 KPYDCKECGKSFTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGEKPYH 760 770 780 790 800 810 >-- initn: 1998 init1: 1036 opt: 1086 Z-score: 663.3 bits: 134.0 E(32554): 1.3e-30 Smith-Waterman score: 1247; 45.5% identity (75.6% similar) in 332 aa overlap (425-754:757-1087) 400 410 420 430 440 450 pF1KB8 KPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFR ..:..:::.:... : .: ..:.::: . CCDS59 KPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDCKECGKSFTSHSTLIQHQQIHTGEKLYD 730 740 750 760 770 780 460 470 480 490 500 510 pF1KB8 CAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSEC : .::..: ... :..:: ::: :::..: ::: :: :.: : :: : ::. .::.:: CCDS59 CKECGKSFTSHSTLIQHQPLHTGEKPYHCKECGKSFTLRSALIQHRPVHTGEKRYSCKEC 790 800 810 820 830 840 520 530 540 550 560 570 pF1KB8 GRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGF :..:: . : :: :.:.::.:..: .: : : ... . :.. :. :.:..: ::::.: CCDS59 GKSFTSRSTLIEHQRIHTGEKPYHCKECGKSFAFRSAIIQHRRIHTGEKPYDCKECGKAF 850 860 870 880 890 900 580 590 600 610 620 630 pF1KB8 TRQSKLTEHLRVHSGERPFQCPECNRSF-RLKGQLLSHQRLHTGERPFQCPECDKRYRVK :.::::.: :.:.::.:..: ::...: :..: : .:. .::::.:..: : : .: . CCDS59 RRRSKLTQHQRIHTGEKPYRCHECGKAFVRFSG-LTKHHSIHTGEKPYECKTCGKSFRQR 910 920 930 940 950 960 640 650 660 670 680 690 pF1KB8 ADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLL . . :: .:.:. :. : ::::.:. :.::.: ::::::::..: .: :.:: .:: CCDS59 THLTLHQRIHTGDRPYECKECGKSFTCGSELIRHQRTHTGEKPYDCKECGKAFRCPSQLS 970 980 990 1000 1010 1020 700 710 720 730 740 750 pF1KB8 SHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIR .:. .::::. ..:::: : :. . . ::: .: :.:. : :::.: ..:..: : CCDS59 QHKRIHTGEKTYQCPECGKAFFYASGLSRHQSVHTGEKPYECKTCGKAFKQLTQLTRHQR 1030 1040 1050 1060 1070 1080 760 770 780 pF1KB8 VHTKSCPAPNELDIKKRLSQLFAMIEADWS .: CCDS59 IHDLT 1090 >>CCDS54240.1 ZNF208 gene_id:7757|Hs108|chr19 (1280 aa) initn: 1001 init1: 1001 opt: 1495 Z-score: 904.8 bits: 178.9 E(32554): 4.4e-44 Smith-Waterman score: 1502; 34.5% identity (62.6% similar) in 588 aa overlap (192-763:318-892) 170 180 190 200 210 pF1KB8 KEGIPGPRNLDLPGLWDVPAWESTQHPWPVCGESCWENNHLVMHQRGHSKDRTRR----- ::.. . . :. :. :. .. . CCDS54 EECGKAFSKVSTLTTHKAIHAGEKPYKCKECGKAFSKVSTLITHKAIHAGEKPYKCKECG 290 300 310 320 330 340 220 230 240 250 260 270 pF1KB8 -AWEKFNKRAETQMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEM :. ::. .. .. .. .. ..: :::... : : :::. :.. . CCDS54 KAFSKFSILTKHKVIHTG---EKPYKCEECGKAYKWPSTLSYHKKIHTGEKPYKCEECGK 350 360 370 380 390 400 280 290 300 310 320 330 pF1KB8 CFRHELTHPSHRLPQQGEKPAQCTPCGKRSLPVDSTQARRCQHSREGPASWRE-GRGAS- : .:.. . :::: .: ::: .. . .. :. : : . .: :.: : CCDS54 GFSMFSILTKHEVIHTGEKPYKCEECGKAFNWSSNLMEHKKIHTGETPYKCEECGKGFSM 410 420 430 440 450 460 340 350 360 370 380 pF1KB8 -------SSVHSGQKPGSRLPQEGNSHQEGDTEALQHGAEGPCSCSECGERSPMSARLAS . .:.:.:: .. . . :..: : .: :::. :. : CCDS54 FSILTKHKVIHNGEKP----------YKCEECDKATHAGEKPYKCEECGKAFNWSSNLME 470 480 490 500 510 390 400 410 420 430 440 pF1KB8 PCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRV : ::::::..: .: : : .: :. : ::.:..:..:::.. . :. : .. CCDS54 HKRIHTGEKPYKCEECGKSFSTFSILTKHKVIHTGEKPYKCEECGKAYKWSSTLSYHKKI 520 530 540 550 560 570 450 460 470 480 490 500 pF1KB8 HSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGE :. :::..: .::. : : . :..:.:.:: :::..: ::: .: : : .:. :.:: CCDS54 HTVEKPYKCEECGKAFNQSAILIKHKRIHTGEKPYKCEECGKTFSKVSTLTTHKAIHAGE 580 590 600 610 620 630 510 520 530 540 550 560 pF1KB8 RPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFS .:..:.:::. : . : : .:.::.:..: .: : : .:: :. :. :.:.. CCDS54 KPYKCKECGKTFIKVSTLTTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIHTGEKPYK 640 650 660 670 680 690 570 580 590 600 610 620 pF1KB8 CGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPEC : ::::.:. .:.: :: :.:.::.:..: ::..:: . : .:. .::::.:..: :: CCDS54 CEECGKAFNWSSNLMEHKRIHTGEKPYKCEECGKSFSTFSVLTKHKVIHTGEKPYKCEEC 700 710 720 730 740 750 630 640 650 660 670 680 pF1KB8 DKRYRVKADMKAHQLLHSGEMPFSCE-CGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSF : :. .. .. :. .:. : :..:: :::.: . . ::.: : :: :::..: .: :.: CCDS54 GKAYKWSSTLSYHKKIHTVEKPYKCEECGKAFNRSAILIKHKRIHTDEKPYKCEECGKTF 760 770 780 790 800 810 690 700 710 720 730 740 pF1KB8 RLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKS . : .:...:.::.:..: :: : : . . . .:. :: :.:. : .:::.. . : CCDS54 SKVSTLTTHKAIHAGEKPYKCKECGKAFSKFSILTKHKVIHTGEKPYKCEECGKAYKWPS 820 830 840 850 860 870 750 760 770 780 pF1KB8 KLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS :. : ..:: : : CCDS54 TLSYHKKIHTGEKPYKCEECGKGFSMFSILTKHEVIHTGEKPYKCEECGKAFSWLSVFSK 880 890 900 910 920 930 >-- initn: 926 init1: 926 opt: 968 Z-score: 592.9 bits: 121.2 E(32554): 1.1e-26 Smith-Waterman score: 1227; 39.8% identity (69.0% similar) in 384 aa overlap (373-755:893-1276) 350 360 370 380 390 400 pF1KB8 GSRLPQEGNSHQEGDTEALQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQCAHC :::. : . :.. ::::::..: .: CCDS54 CEECGKAYKWPSTLSYHKKIHTGEKPYKCEECGKGFSMFSILTKHEVIHTGEKPYKCEEC 870 880 890 900 910 920 410 420 430 440 450 460 pF1KB8 TKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNF : : ... :...:.::. ..:. :::.. .. :. : ..:. :::.. .::..: CCDS54 GKAFSWLSVFSKHKKTHAGEKFYKCEACGKAYKSSSTLSYHKKIHTEEKPYKYEECGKGF 930 940 950 960 970 980 470 480 490 500 510 520 pF1KB8 RQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQC . : .:. .:: :::..: ::: .: : : :. : :: :..: :: ..:. CCDS54 STFSILTKHKVIHTGEKPYKCEECGKAFNWSSNLMEHKKIHTGETPYKCEECDKAFSWPS 990 1000 1010 1020 1030 1040 530 540 550 560 570 580 pF1KB8 KLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTE .: :: .:.::.:..: .: : : . : :. ::. :.:..: ::::.:. .:.: : CCDS54 SLTEHKATHAGEKPYKCEECGKAFSWPSRLTEHKATHAGEEPYKCEECGKAFNWSSNLME 1050 1060 1070 1080 1090 1100 590 600 610 620 630 640 pF1KB8 HLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLL : :.:.::.:..: ::..:: . : .:. .::::.:..: :: : :. .. .. :. . CCDS54 HKRIHTGEKPYKCEECGKSFSTFSILTKHKVIHTGEKPYKCEECGKAYKWSSTLSYHKKI 1110 1120 1130 1140 1150 1160 650 660 670 680 690 700 pF1KB8 HSGEMPFSCE-CGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGE :. : :..:: :::::: : : .: ::::: ..: .: :... . : :. .:::: CCDS54 HTVEKPYKCEECGKGFVMFSILAKHKVIHTGEKLYKCEECGKAYKWPSTLRYHKKIHTGE 1170 1180 1190 1200 1210 1220 710 720 730 740 750 760 pF1KB8 RPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAP .:..: :: : : . . .:. :: :.:. : .:::.: . : ...: ..:: CCDS54 KPYKCEECGKAFSTFSILTKHKVIHTGEKPYKCEECGKAFSWLSVFSKHKKIHTGEKL 1230 1240 1250 1260 1270 1280 770 780 pF1KB8 NELDIKKRLSQLFAMIEADWS >>CCDS82409.1 ZNF418 gene_id:147686|Hs108|chr19 (591 aa) initn: 6253 init1: 1064 opt: 1473 Z-score: 894.6 bits: 175.9 E(32554): 1.6e-43 Smith-Waterman score: 1494; 39.5% identity (65.3% similar) in 554 aa overlap (258-778:11-551) 230 240 250 260 270 280 pF1KB8 QMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHR ::: : : .. . ..: :.: CCDS82 MCGAILGDILHLADHQGTHHKQKLHRCEAWGNKLYDSSNR 10 20 30 40 290 300 310 320 330 pF1KB8 LPQQ----GEKPAQCTPCGKRSLPVDSTQARRCQ-H-SREGPASWREGRG--ASSSV--- :.: :::: :: .. ..::. : :.:. . :. ::.. CCDS82 -PHQNQYLGEKPY-------RSSVEEALFVKRCKFHVSEESSIFIQSGKDFLPSSGLLLQ 50 60 70 80 90 340 350 360 370 pF1KB8 ---HSGQKPGSRLPQEGNSHQEGDT-----EALQHGAEG---------P----CSCSECG :.:.: .:. :. . : ::: : ..:.. : : : ::: CCDS82 EATHTGEKSNSK-PECESPFQWGDTHYSCGECMKHSSTKHVFVQQQRLPSREECYCWECG 100 110 120 130 140 150 380 390 400 410 420 430 pF1KB8 ERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFA . ... :.:::..:..:..: : : . : ::..: :.::. : .:::.:. CCDS82 KSFSKYDSVSNHQRVHTGKRPYECGECGKSFSHKGSLVQHQRVHTGKRPYECGECGKSFS 160 170 180 190 200 210 440 450 460 470 480 490 pF1KB8 KQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESM .. .:..: :::.::.:..:..::..: : : :..:::.:: :.:..: ::: : .. CCDS82 HKGSLVQHQRVHTGERPYECGECGKSFSQNGTLIKHQRVHTGERPYECEECGKCFTQKGN 220 230 240 250 260 270 500 510 520 530 540 550 pF1KB8 LRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAH : :. : .:::. : :::. :... : :: :::. :::..: .: : : :: :. : CCDS82 LIQHQRGHTSERPYECEECGKCFSQKGTLTEHHRVHTRERPYECGECGKSFSRKGHLRNH 280 290 300 310 320 330 560 570 580 590 600 610 pF1KB8 QHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQRLH :. :. :::. ::::::.:.:...: .: : :.::::..: :: . :: :..:. :::.: CCDS82 QRGHTGERPYECGECGKSFSRKGNLIQHQRSHTGERPYECRECRKLFRGKSHLIEHQRVH 340 350 360 370 380 390 620 630 640 650 660 670 pF1KB8 TGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEK :::::..: :: : .. .. ...:: .:.:: :: : ::::.: . .:..: :.::::. CCDS82 TGERPYECNECGKSFQDSSGFRVHQRVHTGEKPFECSECGKSFPQSCSLLRHRRVHTGER 400 410 420 430 440 450 680 690 700 710 720 730 pF1KB8 PFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFAC :..: .: :::. ...:: :: ::.:::..: :: : : . .:.:.:.: :::. : CCDS82 PYECGECGKSFHQSSSLLRHQKTHTAERPYECRECGKFF---SSLLEHRRVHTGERPYEC 460 470 480 490 500 740 750 760 770 780 pF1KB8 GDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS .::: : .: .: :.::.. : . : ... :.. : CCDS82 RECGKTFTRRSAHFKHQRLHTRGKPYECS-ECGKSFAETFSLTEHRRVHTGERPYECSEC 510 520 530 540 550 560 CCDS82 GKSFHRSSSLLRHQRVHTERSPYK 570 580 590 >>CCDS42642.1 ZNF418 gene_id:147686|Hs108|chr19 (676 aa) initn: 6253 init1: 1064 opt: 1473 Z-score: 894.1 bits: 176.0 E(32554): 1.8e-43 Smith-Waterman score: 1506; 38.2% identity (64.2% similar) in 587 aa overlap (225-778:67-636) 200 210 220 230 240 250 pF1KB8 SCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHFRCGVCGKSFRRKLC .... : .. .. : .:: . : CCDS42 NWVLISSLGCWCGSEDEEAPSKKSISIQRVSQVSTPGAGVSPKKAHSCEMCGAILGDIL- 40 50 60 70 80 90 260 270 280 290 300 310 pF1KB8 LLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQ----GEKPAQCTPCGKRSLPVDS ::: : : .. . ..: :.: :.: :::: :: .. CCDS42 ---HLADHQGTHHKQKLHRCEAWGNKLYDSSNR-PHQNQYLGEKPY-------RSSVEEA 100 110 120 130 140 320 330 340 350 pF1KB8 TQARRCQ-H-SREGPASWREGRG--ASSSV------HSGQKPGSRLPQEGNSHQEGDT-- ..::. : :.:. . :. ::.. :.:.: .:. :. . : ::: CCDS42 LFVKRCKFHVSEESSIFIQSGKDFLPSSGLLLQEATHTGEKSNSK-PECESPFQWGDTHY 150 160 170 180 190 200 360 370 380 390 400 pF1KB8 ---EALQHGAEG---------P----CSCSECGERSPMSARLASPCRAHTGEKPFQCAHC : ..:.. : : : :::. ... :.:::..:..:..: CCDS42 SCGECMKHSSTKHVFVQQQRLPSREECYCWECGKSFSKYDSVSNHQRVHTGKRPYECGEC 210 220 230 240 250 260 410 420 430 440 450 460 pF1KB8 TKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNF : : . : ::..: :.::. : .:::.:... .:..: :::.::.:..:..::..: CCDS42 GKSFSHKGSLVQHQRVHTGKRPYECGECGKSFSHKGSLVQHQRVHTGERPYECGECGKSF 270 280 290 300 310 320 470 480 490 500 510 520 pF1KB8 RQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQC : : :..:::.:: :.:..: ::: : .. : :. : .:::. : :::. :... CCDS42 SQNGTLIKHQRVHTGERPYECEECGKCFTQKGNLIQHQRGHTSERPYECEECGKCFSQKG 330 340 350 360 370 380 530 540 550 560 570 580 pF1KB8 KLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTE : :: :::. :::..: .: : : :: :. ::. :. :::. ::::::.:.:...: . CCDS42 TLTEHHRVHTRERPYECGECGKSFSRKGHLRNHQRGHTGERPYECGECGKSFSRKGNLIQ 390 400 410 420 430 440 590 600 610 620 630 640 pF1KB8 HLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLL : : :.::::..: :: . :: :..:. :::.::::::..: :: : .. .. ...:: . CCDS42 HQRSHTGERPYECRECRKLFRGKSHLIEHQRVHTGERPYECNECGKSFQDSSGFRVHQRV 450 460 470 480 490 500 650 660 670 680 690 700 pF1KB8 HSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGE :.:: :: : ::::.: . .:..: :.::::.:..: .: :::. ...:: :: ::.: CCDS42 HTGEKPFECSECGKSFPQSCSLLRHRRVHTGERPYECGECGKSFHQSSSLLRHQKTHTAE 510 520 530 540 550 560 710 720 730 740 750 760 pF1KB8 RPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAP ::..: :: : : . .:.:.:.: :::. : .::: : .: .: :.::.. : CCDS42 RPYECRECGKFF---SSLLEHRRVHTGERPYECRECGKTFTRRSAHFKHQRLHTRGKPYE 570 580 590 600 610 620 770 780 pF1KB8 NELDIKKRLSQLFAMIEADWS . : ... :.. : CCDS42 CS-ECGKSFAETFSLTEHRRVHTGERPYECSECGKSFHRSSSLLRHQRVHTERSPYK 630 640 650 660 670 >>CCDS82410.1 ZNF418 gene_id:147686|Hs108|chr19 (697 aa) initn: 6253 init1: 1064 opt: 1473 Z-score: 894.0 bits: 176.1 E(32554): 1.8e-43 Smith-Waterman score: 1506; 38.2% identity (64.2% similar) in 587 aa overlap (225-778:88-657) 200 210 220 230 240 250 pF1KB8 SCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHFRCGVCGKSFRRKLC .... : .. .. : .:: . : CCDS82 NWVLISSLGCWCGSEDEEAPSKKSISIQRVSQVSTPGAGVSPKKAHSCEMCGAILGDIL- 60 70 80 90 100 110 260 270 280 290 300 310 pF1KB8 LLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQ----GEKPAQCTPCGKRSLPVDS ::: : : .. . ..: :.: :.: :::: :: .. CCDS82 ---HLADHQGTHHKQKLHRCEAWGNKLYDSSNR-PHQNQYLGEKPY-------RSSVEEA 120 130 140 150 160 320 330 340 350 pF1KB8 TQARRCQ-H-SREGPASWREGRG--ASSSV------HSGQKPGSRLPQEGNSHQEGDT-- ..::. : :.:. . :. ::.. :.:.: .:. :. . : ::: CCDS82 LFVKRCKFHVSEESSIFIQSGKDFLPSSGLLLQEATHTGEKSNSK-PECESPFQWGDTHY 170 180 190 200 210 220 360 370 380 390 400 pF1KB8 ---EALQHGAEG---------P----CSCSECGERSPMSARLASPCRAHTGEKPFQCAHC : ..:.. : : : :::. ... :.:::..:..:..: CCDS82 SCGECMKHSSTKHVFVQQQRLPSREECYCWECGKSFSKYDSVSNHQRVHTGKRPYECGEC 230 240 250 260 270 280 410 420 430 440 450 460 pF1KB8 TKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNF : : . : ::..: :.::. : .:::.:... .:..: :::.::.:..:..::..: CCDS82 GKSFSHKGSLVQHQRVHTGKRPYECGECGKSFSHKGSLVQHQRVHTGERPYECGECGKSF 290 300 310 320 330 340 470 480 490 500 510 520 pF1KB8 RQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQC : : :..:::.:: :.:..: ::: : .. : :. : .:::. : :::. :... CCDS82 SQNGTLIKHQRVHTGERPYECEECGKCFTQKGNLIQHQRGHTSERPYECEECGKCFSQKG 350 360 370 380 390 400 530 540 550 560 570 580 pF1KB8 KLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTE : :: :::. :::..: .: : : :: :. ::. :. :::. ::::::.:.:...: . CCDS82 TLTEHHRVHTRERPYECGECGKSFSRKGHLRNHQRGHTGERPYECGECGKSFSRKGNLIQ 410 420 430 440 450 460 590 600 610 620 630 640 pF1KB8 HLRVHSGERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLL : : :.::::..: :: . :: :..:. :::.::::::..: :: : .. .. ...:: . CCDS82 HQRSHTGERPYECRECRKLFRGKSHLIEHQRVHTGERPYECNECGKSFQDSSGFRVHQRV 470 480 490 500 510 520 650 660 670 680 690 700 pF1KB8 HSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGE :.:: :: : ::::.: . .:..: :.::::.:..: .: :::. ...:: :: ::.: CCDS82 HTGEKPFECSECGKSFPQSCSLLRHRRVHTGERPYECGECGKSFHQSSSLLRHQKTHTAE 530 540 550 560 570 580 710 720 730 740 750 760 pF1KB8 RPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAP ::..: :: : : . .:.:.:.: :::. : .::: : .: .: :.::.. : CCDS82 RPYECRECGKFF---SSLLEHRRVHTGERPYECRECGKTFTRRSAHFKHQRLHTRGKPYE 590 600 610 620 630 640 770 780 pF1KB8 NELDIKKRLSQLFAMIEADWS . : ... :.. : CCDS82 CS-ECGKSFAETFSLTEHRRVHTGERPYECSECGKSFHRSSSLLRHQRVHTERSPYK 650 660 670 680 690 >>CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 (688 aa) initn: 5961 init1: 1041 opt: 1472 Z-score: 893.5 bits: 175.9 E(32554): 1.9e-43 Smith-Waterman score: 1563; 39.3% identity (65.7% similar) in 539 aa overlap (221-755:120-638) 200 210 220 230 240 250 pF1KB8 VCGESCWENNHLVMHQRGHSKDRTRRAWEKFNKRAETQMPWSSPRVQRHFRCGVCGKSFR ::... .. ... ..: :::.:: CCDS12 LEAKGKMEKQQENQKEYFRQGMIIYDKMSIFNQHTYLSQHSRCHSTEKPYKCKECGKAFR 90 100 110 120 130 140 260 270 280 290 300 310 pF1KB8 RKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTPCGKRSLPVDS : : .: . :::. :.. . : .. :. . :::: : ::: ..: CCDS12 RASHLTQHQSIHTGEKPYECKQCGKAFSRDSQLSLHQRLHTGEKPYACKECGKAF--TQS 150 160 170 180 190 200 320 330 340 350 360 pF1KB8 TQARRCQHSREGPASWREGRGASSSVHSGQKPGSRLPQEGNSHQEGDTEALQ---HGAEG .: : : .:.:.:: . . :.. ... . . : .: CCDS12 SQL--ILHHR---------------IHTGEKP-YKCEECGKAFIRSSQLTRHQKVHTGEK 210 220 230 240 370 380 390 400 410 420 pF1KB8 PCSCSECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSC : :.:::. ....:. : ::::: ..: .: : : : .:.. : ::.:. : CCDS12 PYECKECGKAFTQNSQLTLHQRLHTGEKLYECKECRKVFTQLSQLILHKRIHTGEKPYEC 250 260 270 280 290 300 430 440 450 460 470 480 pF1KB8 RKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECG ..:::.: .:..: ..:.::::..: .::: : . . :..:::.:: :::..: ::: CCDS12 KECGKAFICGSQLSQHQKIHNGEKPYECKECGRAFIRGSLLMQHQRIHTGEKPYKCEECG 310 320 330 340 350 360 490 500 510 520 530 540 pF1KB8 LSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFR .: :.: :. : .:.:. :.:::. :.: .: .: :.:.::.:.:: .: : : CCDS12 KAFIRGSQLTQHQRIHTNEKPYECKECGKMFSHGSQLTQHQRIHTGEKPYQCKECGKAFN 370 380 390 400 410 420 550 560 570 580 590 600 pF1KB8 LKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQ ..: ::. :. :.:. : :::: :.: :.::.: :.:.::.:..: ::..:: .: CCDS12 RGSLLTRHQRIHTGEKPYECKECGKTFSRGSELTQHERIHTGEKPYECKECGKSFIRGSQ 430 440 450 460 470 480 610 620 630 640 650 660 pF1KB8 LLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEH : .:::.::::.:..: :: . .. .. :: ::.:: :. : ::::.:.. ::.: CCDS12 LTQHQRIHTGEKPYECKECRMAFTQSSHLSQHQRLHTGEKPYVCNECGKAFARGLLLIQH 490 500 510 520 530 540 670 680 690 700 710 720 pF1KB8 IRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIH : ::::::.:: .: :.: .:: .:: .::::.:..: :: : : . ... ::::: CCDS12 QRIHTGEKPYQCKECGKAFIRGSQLTQHQRIHTGEKPYECKECGKAFSHGSQLTLHQRIH 550 560 570 580 590 600 730 740 750 760 770 780 pF1KB8 RPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS :.:. : .: :.: .:.:..: :.:: CCDS12 TGEKPYECRECRKAFTQSSHLSRHQRIHTGEKPYQCKECGKAFTRGSQLTQHQRIHISEK 610 620 630 640 650 660 >>CCDS74350.1 ZNF850 gene_id:342892|Hs108|chr19 (1058 aa) initn: 8886 init1: 1047 opt: 1464 Z-score: 887.2 bits: 175.4 E(32554): 4.3e-43 Smith-Waterman score: 1667; 35.2% identity (60.6% similar) in 761 aa overlap (11-759:9-724) 10 20 30 40 50 60 pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW :.:..: ::..::. :.: ::.::. :: :: .:::::. . : CCDS74 MNMEGLVMFQDLSIDFSQEEWECLDAAQKDLYRDVMMENYSSLVSLDSEFRCKTKDSC 10 20 30 40 50 70 80 90 100 110 pF1KB8 IEHGGEPFR----KWRESQKSGNIICSSVDMHFDPGFEEQLFWGSQQAMNSGKTKSHFQL . . : .. .: . .: ... ::: : : . :..:: CCDS74 LPK--EIYEVTSSQWVRMEKCHSLVGSSVR---DD-------W---------ECKGQFQH 60 70 80 90 120 130 140 150 160 170 pF1KB8 DPESQCSF--GSFVSFRPDQGITLGSPQRHDARAPPPLACGPSESTLKEGIPGPRNLDLP . .: . ...... . : . : : : . : . . .: CCDS74 QDINQERYLEKAIMTYETTPTFCLQTSLTLHHRIHP----GEKLYKSTECMAFKYGSELT 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB8 GLWDVPAWESTQHPWPVCGESCWENNHLVMHQRGHSKDRT---RRAWEKFNKRAETQMPW .. . :. . ::.. . ..:: ::: :. .. .. . : . .. . CCDS74 QQQETHTGEKL-YKCKECGKAFHHFSYLVKHQRIHTGEKPCACKEYGKAFISGSHLIQHQ 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB8 SSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRGPFRNADGEMCFRHELTHPSHRLPQQ . .: .: :.:: . :..: ::: :.. . : : .:. . CCDS74 KMYTDERPHECQESVKAFRPSAHLIQHWRIHTGDKPYECKECGKSFTSGSTLNQHQQIHT 220 230 240 250 260 270 300 310 320 330 340 pF1KB8 GEKPAQCTPCGKRSLPVDSTQARRCQ-HSREGPASWRE-GRGASSSVHSGQKPGSRLPQE :::: .: ::: :. : :: :. : :. : : . .: :.. .: :: : . CCDS74 GEKPYHCKQCGK-SFTVGSTLIRHQQIHTGEKPYDCKECGKSFAS--------GSALIR- 280 290 300 310 320 350 360 370 380 390 400 pF1KB8 GNSHQEGDTEALQHGAEGPCSCSECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLR ::. : .: : .:.:::. . . : : ::::::..: .: : : .: CCDS74 ---HQR------IHTGEKPYDCKECGKSFTFHSALIRHQRIHTGEKPYDCKECGKSFTFR 330 340 350 360 370 410 420 430 440 450 460 pF1KB8 RLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLL : :: : ::.:..:..:::.:. : .: :.:.::::. : .::..: . . :: CCDS74 SGLIGHQAIHTGEKPYDCKECGKSFTAGSTLIQHQRIHTGEKPYDCKECGKSFASGSALL 380 390 400 410 420 430 470 480 490 500 510 520 pF1KB8 RHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLR .:::.:: :::. : ::: :: ..: :. : ::.:..:.:::..:. : .: : CCDS74 QHQRIHTGEKPYCCKECGKSFTFRSTRNRHQRIHTGEKPYNCKECGKSFASGSALLQHQR 440 450 460 470 480 490 530 540 550 560 570 580 pF1KB8 VHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSG .:.::.:..: .: : : ... : .:: .:. :.:..: ::::.:: .: : .: :.:.: CCDS74 IHTGEKPYHCKECGKSFTFRSGLIGHQAVHTGEKPYDCKECGKSFTSRSALIQHQRIHTG 500 510 520 530 540 550 590 600 610 620 630 640 pF1KB8 ERPFQCPECNRSFRLKGQLLSHQRLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPF :.:..: ::..:: . . ::.::..::::.:..: :: : .:.. . :: .:.:: :. CCDS74 EKPYHCKECGKSFTVGSTLLQHQQIHTGEKPYDCKECGKAFRLRLRLTQHQQIHTGEKPY 560 570 580 590 600 610 650 660 670 680 690 700 pF1KB8 SC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPE .: ::::.::. : : .: : ::::::..:: : :.:: .. : .:. .::::.:..: : CCDS74 QCQECGKAFVSVSGLTQHHRIHTGEKPYECPDCGKAFRQRTYLNQHRRIHTGEKPYECKE 620 630 640 650 660 670 710 720 730 740 750 760 pF1KB8 CDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKK : :.: . ...::. : :.:. .:::.: .: : .: ..:: : CCDS74 CGKSFTFCSGLIQHQQNHTDEKPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDCKECGKS 680 690 700 710 720 730 770 780 pF1KB8 RLSQLFAMIEADWS CCDS74 FTSHSTLIQHQQIHTGEKLYDCKECGKSFTSHSTLIQHQPLHTGEKPYHCKECGKSFTLR 740 750 760 770 780 790 >-- initn: 1998 init1: 1036 opt: 1086 Z-score: 663.4 bits: 134.0 E(32554): 1.2e-30 Smith-Waterman score: 1247; 45.5% identity (75.6% similar) in 332 aa overlap (425-754:725-1055) 400 410 420 430 440 450 pF1KB8 KPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGFAKQCKLTEHIRVHSGEKPFR ..:..:::.:... : .: ..:.::: . CCDS74 KPYDGKECGKSFTSHSTLIQHQQIHTGEKPYDCKECGKSFTSHSTLIQHQQIHTGEKLYD 700 710 720 730 740 750 460 470 480 490 500 510 pF1KB8 CAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLESMLRAHRLRHGGERPFSCSEC : .::..: ... :..:: ::: :::..: ::: :: :.: : :: : ::. .::.:: CCDS74 CKECGKSFTSHSTLIQHQPLHTGEKPYHCKECGKSFTLRSALIQHRPVHTGEKRYSCKEC 760 770 780 790 800 810 520 530 540 550 560 570 pF1KB8 GRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKAHQHTHSKERPFSCGECGKGF :..:: . : :: :.:.::.:..: .: : : ... . :.. :. :.:..: ::::.: CCDS74 GKSFTSRSTLIEHQRIHTGEKPYHCKECGKSFAFRSAIIQHRRIHTGEKPYDCKECGKAF 820 830 840 850 860 870 580 590 600 610 620 630 pF1KB8 TRQSKLTEHLRVHSGERPFQCPECNRSF-RLKGQLLSHQRLHTGERPFQCPECDKRYRVK :.::::.: :.:.::.:..: ::...: :..: : .:. .::::.:..: : : .: . CCDS74 RRRSKLTQHQRIHTGEKPYRCHECGKAFVRFSG-LTKHHSIHTGEKPYECKTCGKSFRQR 880 890 900 910 920 930 640 650 660 670 680 690 pF1KB8 ADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGEKPFQCPKCDKSFRLKAQLL . . :: .:.:. :. : ::::.:. :.::.: ::::::::..: .: :.:: .:: CCDS74 THLTLHQRIHTGDRPYECKECGKSFTCGSELIRHQRTHTGEKPYDCKECGKAFRCPSQLS 940 950 960 970 980 990 700 710 720 730 740 750 pF1KB8 SHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFACGDCGKGFIYKSKLAEHIR .:. .::::. ..:::: : :. . . ::: .: :.:. : :::.: ..:..: : CCDS74 QHKRIHTGEKTYQCPECGKAFFYASGLSRHQSVHTGEKPYECKTCGKAFKQLTQLTRHQR 1000 1010 1020 1030 1040 1050 760 770 780 pF1KB8 VHTKSCPAPNELDIKKRLSQLFAMIEADWS .: CCDS74 IHDLT >>CCDS33097.1 ZNF347 gene_id:84671|Hs108|chr19 (839 aa) initn: 4803 init1: 1001 opt: 1461 Z-score: 886.2 bits: 174.9 E(32554): 4.8e-43 Smith-Waterman score: 1604; 33.3% identity (60.8% similar) in 798 aa overlap (9-759:8-792) 10 20 30 40 50 60 pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPELISW .::.:::: ::..:: :. :. ::. :: ::..:.:: . .:: CCDS33 MALTQGQVTFRDVAIEFSQEEWTCLDPAQRTLYRDVMLENYRNLASLGISCFDLSIISM 10 20 30 40 50 70 80 90 100 110 pF1KB8 IEHGGEPFRKWRESQKSGN--------IICSSVDMHFDPGFEEQLFWGSQQAMNSGKTKS .:.: ::: . : .:: . .... .: ... : :.. :.:.. . CCDS33 LEQGKEPFTLESQVQIAGNPDGWEWIKAVITALSSEFV--MKDLLHKGKS---NTGEVFQ 60 70 80 90 100 110 120 130 140 150 160 pF1KB8 HFQLD-PESQCSFGSFVSFRPDQGITLGSP-QRHDARAPPPLACGPSESTLKEGIP---- .:. ::: : ::: : : : : .::.. . .:..: .: CCDS33 TVMLERQESQDIEG--CSFREVQKNTHGLEYQCRDAEGNYKGVLLTQEGNLTHGRDEHDK 120 130 140 150 160 170 170 180 190 200 210 pF1KB8 -GPRN------LDLPGLWDVPAWESTQHPWPV--CG--ESCWENNHLVMHQRGHSKDRTR :: : : .: . :. . :. :. ..:: : . . CCDS33 RDARNKLIKNQLGLSLQSHLPELQLFQYEGKIYECNQVEKSFNNNSSVSPPQQMPYNVKT 180 190 200 210 220 230 220 230 240 250 260 pF1KB8 RAWEKFNK---------RAETQMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTGRG . .:. : ... :.:: .. . :: : .. : : .:: . CCDS33 HISKKYLKDFISSLLLTQGQKANNWGSP-----YKSNGCGMVFPQNSHLASHQRSHTKEK 240 250 260 270 280 270 280 290 300 310 320 pF1KB8 PFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTPCGKRSLPVDSTQARRCQHSREGPASW :.. . :: . . .:.. . ::: .:. ::: .. . .. :. : : . CCDS33 PYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKVFSRNSQLSQHQKIHTGEKPYKC 290 300 310 320 330 340 330 340 350 360 370 pF1KB8 RE-GRGASSS--------VHSGQKPGSRLPQEGNSHQEGDTEALQ---HGAEGPCSCSEC : :. ... .:.:.:: . . :.. . .. :.. :..: : .:.:: CCDS33 NECGKVFTQNSHLVRHRGIHTGEKP-YKCNECGKAFRARSSLAIHQATHSGEKPYKCNEC 350 360 370 380 390 400 380 390 400 410 420 430 pF1KB8 GERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGKGF :. ....:.. : ::::::..: .: : : .: : .: : ::.:..:..::: : CCDS33 GKVFTQNSHLTNHWRIHTGEKPYKCNECGKAFGVRSSLAIHLVIHTGEKPYKCHECGKVF 410 420 430 440 450 460 440 450 460 470 480 490 pF1KB8 AKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRLES .. .:..: .:.::::..: .::. :: ...: :: .:: :::..: ::: : .: CCDS33 RRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTTHQVIHTGEKPYKCNECGKVFTQNS 470 480 490 500 510 520 500 510 520 530 540 550 pF1KB8 MLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGILKA : :. : : .:. :.:::..:. .: : .:.::.:..: .: : : .. : CCDS33 HLANHQRIHTGVKPYMCNECGKAFSVYSSLTTHQVIHTGEKPYKCNECGKVFTQNSHLAR 530 540 550 560 570 580 560 570 580 590 600 610 pF1KB8 HQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQRL :. :. :.:..:.:::: : ..: :..: :.:.::.:.. : ...: ...: .:: . CCDS33 HRGIHTGEKPYKCNECGKVFRHNSYLSRHQRIHTGEKPYKYNEYGKAFSEHSNLTTHQVI 590 600 610 620 630 640 620 630 640 650 660 670 pF1KB8 HTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHTGE ::::.:..: :: : . .. . :. .:.: :..: ::::.: . ::: .: :.:::: CCDS33 HTGEKPYKCNECGKVFTQNSHLARHRRVHTGGKPYQCNECGKAFSQTSKLARHQRVHTGE 650 660 670 680 690 700 680 690 700 710 720 730 pF1KB8 KPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERPFA ::..: .: :.: ....: .::..:::..:..: :: : : . .:. ::. :: :.:. CCDS33 KPYECNQCGKAFSVRSSLTTHQAIHTGKKPYKCNECGKVFTQNSHLARHRGIHTGEKPYK 710 720 730 740 750 760 740 750 760 770 780 pF1KB8 CGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS :..:::.: ::::.: :.:: : CCDS33 CNECGKAFSQTSKLARHQRIHTGEKPYECGKPFSICSSLTTHQTIHTGGKPYKCNVWKVL 770 780 790 800 810 820 >>CCDS54314.1 ZNF347 gene_id:84671|Hs108|chr19 (840 aa) initn: 4803 init1: 1001 opt: 1457 Z-score: 883.9 bits: 174.5 E(32554): 6.5e-43 Smith-Waterman score: 1600; 33.5% identity (60.9% similar) in 800 aa overlap (9-759:8-793) 10 20 30 40 50 pF1KB8 MAEPPRLPLTFEDVAIYFSEQEWQDLEAWQKELYKHVMRSNYETLVSLDDGLPKPEL--I .::.:::: ::..:: :. :. ::. :: ::..:.:: :. .: : CCDS54 MALTQGQVTFRDVAIEFSQEEWTCLDPAQRTLYRDVMLENYRNLASLA-GISCFDLSII 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 SWIEHGGEPFRKWRESQKSGN--------IICSSVDMHFDPGFEEQLFWGSQQAMNSGKT : .:.: ::: . : .:: . .... .: ... : :.. :.:.. CCDS54 SMLEQGKEPFTLESQVQIAGNPDGWEWIKAVITALSSEFV--MKDLLHKGKS---NTGEV 60 70 80 90 100 110 120 130 140 150 160 pF1KB8 KSHFQLD-PESQCSFGSFVSFRPDQGITLGSP-QRHDARAPPPLACGPSESTLKEGIP-- . .:. ::: : ::: : : : : .::.. . .:..: .: CCDS54 FQTVMLERQESQDIEG--CSFREVQKNTHGLEYQCRDAEGNYKGVLLTQEGNLTHGRDEH 120 130 140 150 160 170 170 180 190 200 210 pF1KB8 ---GPRN------LDLPGLWDVPAWESTQHPWPV--CG--ESCWENNHLVMHQRGHSKDR :: : : .: . :. . :. :. ..:: : . . CCDS54 DKRDARNKLIKNQLGLSLQSHLPELQLFQYEGKIYECNQVEKSFNNNSSVSPPQQMPYNV 180 190 200 210 220 230 220 230 240 250 260 pF1KB8 TRRAWEKFNK---------RAETQMPWSSPRVQRHFRCGVCGKSFRRKLCLLRHLAAHTG . .:. : ... :.:: .. . :: : .. : : .:: CCDS54 KTHISKKYLKDFISSLLLTQGQKANNWGSP-----YKSNGCGMVFPQNSHLASHQRSHTK 240 250 260 270 280 270 280 290 300 310 320 pF1KB8 RGPFRNADGEMCFRHELTHPSHRLPQQGEKPAQCTPCGKRSLPVDSTQARRCQHSREGPA . :.. . :: . . .:.. . ::: .:. ::: .. . .. :. : : CCDS54 EKPYKCYECGKAFRTRSNLTTHQVIHTGEKRYKCNECGKVFSRNSQLSQHQKIHTGEKPY 290 300 310 320 330 340 330 340 350 360 370 pF1KB8 SWRE-GRGASSS--------VHSGQKPGSRLPQEGNSHQEGDTEALQ---HGAEGPCSCS . : :. ... .:.:.:: . . :.. . .. :.. :..: : .:. CCDS54 KCNECGKVFTQNSHLVRHRGIHTGEKP-YKCNECGKAFRARSSLAIHQATHSGEKPYKCN 350 360 370 380 390 400 380 390 400 410 420 430 pF1KB8 ECGERSPMSARLASPCRAHTGEKPFQCAHCTKRFRLRRLLQVHQHAHGGERPFSCRKCGK :::. ....:.. : ::::::..: .: : : .: : .: : ::.:..:..::: CCDS54 ECGKVFTQNSHLTNHWRIHTGEKPYKCNECGKAFGVRSSLAIHLVIHTGEKPYKCHECGK 410 420 430 440 450 460 440 450 460 470 480 490 pF1KB8 GFAKQCKLTEHIRVHSGEKPFRCAKCGRNFRQRGQLLRHQRLHTDEKPFQCPECGLSFRL : .. .:..: .:.::::..: .::. :: ...: :: .:: :::..: ::: : CCDS54 VFRRNSHLARHQLIHTGEKPYKCNECGKAFRAHSNLTTHQVIHTGEKPYKCNECGKVFTQ 470 480 490 500 510 520 500 510 520 530 540 550 pF1KB8 ESMLRAHRLRHGGERPFSCSECGRGFTHQCKLREHLRVHSGERPFQCLKCDKRFRLKGIL .: : :. : : .:. :.:::..:. .: : .:.::.:..: .: : : .. : CCDS54 NSHLANHQRIHTGVKPYMCNECGKAFSVYSSLTTHQVIHTGEKPYKCNECGKVFTQNSHL 530 540 550 560 570 580 560 570 580 590 600 610 pF1KB8 KAHQHTHSKERPFSCGECGKGFTRQSKLTEHLRVHSGERPFQCPECNRSFRLKGQLLSHQ :. :. :.:..:.:::: : ..: :..: :.:.::.:.. : ...: ...: .:: CCDS54 ARHRGIHTGEKPYKCNECGKVFRHNSYLSRHQRIHTGEKPYKYNEYGKAFSEHSNLTTHQ 590 600 610 620 630 640 620 630 640 650 660 670 pF1KB8 RLHTGERPFQCPECDKRYRVKADMKAHQLLHSGEMPFSC-ECGKGFVKHSKLIEHIRTHT .::::.:..: :: : . .. . :. .:.: :..: ::::.: . ::: .: :.:: CCDS54 VIHTGEKPYKCNECGKVFTQNSHLARHRRVHTGGKPYQCNECGKAFSQTSKLARHQRVHT 650 660 670 680 690 700 680 690 700 710 720 730 pF1KB8 GEKPFQCPKCDKSFRLKAQLLSHQGLHTGERPFHCPECDKNFWERGHMLRHQRIHRPERP ::::..: .: :.: ....: .::..:::..:..: :: : : . .:. ::. :: :.: CCDS54 GEKPYECNQCGKAFSVRSSLTTHQAIHTGKKPYKCNECGKVFTQNSHLARHRGIHTGEKP 710 720 730 740 750 760 740 750 760 770 780 pF1KB8 FACGDCGKGFIYKSKLAEHIRVHTKSCPAPNELDIKKRLSQLFAMIEADWS . :..:::.: ::::.: :.:: : CCDS54 YKCNECGKAFSQTSKLARHQRIHTGEKPYECGKPFSICSSLTTHQTIHTGGKPYKCNVWK 770 780 790 800 810 820 782 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 12:37:02 2016 done: Fri Nov 4 12:37:03 2016 Total Scan time: 3.670 Total Display time: 0.270 Function used was FASTA [36.3.4 Apr, 2011]