FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0557, 480 aa 1>>>pF1KSDA0557 480 - 480 aa - 480 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8687+/-0.000912; mu= 8.6665+/- 0.055 mean_var=229.5892+/-45.480, 0's: 0 Z-trim(115.9): 942 B-trim: 230 in 1/51 Lambda= 0.084644 statistics sampled from 15457 (16477) to 15457 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.811), E-opt: 0.2 (0.506), width: 16 Scan time: 2.930 The best scores are: opt bits E(32554) CCDS32383.1 ZNF500 gene_id:26048|Hs108|chr16 ( 480) 3413 429.4 4e-120 CCDS76814.1 ZNF500 gene_id:26048|Hs108|chr16 ( 441) 3066 387.0 2.2e-107 CCDS10495.1 ZNF213 gene_id:7760|Hs108|chr16 ( 459) 1051 141.0 2.6e-33 CCDS4647.1 ZKSCAN4 gene_id:387032|Hs108|chr6 ( 545) 1008 135.8 1.1e-31 CCDS4650.1 ZKSCAN3 gene_id:80317|Hs108|chr6 ( 538) 1000 134.8 2.2e-31 CCDS12975.1 ZSCAN22 gene_id:342945|Hs108|chr19 ( 491) 902 122.8 8.3e-28 CCDS10504.1 ZNF174 gene_id:7727|Hs108|chr16 ( 407) 819 112.6 8.2e-25 CCDS59048.1 ZNF853 gene_id:54753|Hs108|chr7 ( 659) 766 106.3 1e-22 CCDS10095.2 ZSCAN29 gene_id:146050|Hs108|chr15 ( 852) 758 105.5 2.4e-22 CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 ( 470) 701 98.2 2e-20 CCDS66920.1 ZSCAN32 gene_id:54925|Hs108|chr16 ( 408) 694 97.3 3.2e-20 CCDS10503.1 ZSCAN32 gene_id:54925|Hs108|chr16 ( 485) 694 97.4 3.6e-20 CCDS43307.1 PRDM9 gene_id:56979|Hs108|chr5 ( 894) 698 98.2 3.9e-20 CCDS32410.1 ZKSCAN2 gene_id:342357|Hs108|chr16 ( 967) 698 98.2 4.1e-20 CCDS66921.1 ZSCAN32 gene_id:54925|Hs108|chr16 ( 697) 694 97.6 4.6e-20 CCDS6354.1 ZNF572 gene_id:137209|Hs108|chr8 ( 529) 691 97.1 5e-20 CCDS12972.1 ZNF329 gene_id:79673|Hs108|chr19 ( 541) 687 96.6 7.1e-20 CCDS33090.1 ZNF616 gene_id:90317|Hs108|chr19 ( 781) 688 96.9 8.3e-20 CCDS32330.1 ZNF774 gene_id:342132|Hs108|chr15 ( 483) 682 95.9 1e-19 CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16 ( 869) 684 96.5 1.3e-19 CCDS4440.1 ZFP2 gene_id:80108|Hs108|chr5 ( 461) 679 95.5 1.3e-19 CCDS58688.1 ZNF211 gene_id:10520|Hs108|chr19 ( 503) 674 95.0 2e-19 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 675 95.2 2.1e-19 CCDS58687.1 ZNF211 gene_id:10520|Hs108|chr19 ( 555) 674 95.0 2.2e-19 CCDS12957.1 ZNF211 gene_id:10520|Hs108|chr19 ( 564) 674 95.0 2.2e-19 CCDS12956.1 ZNF211 gene_id:10520|Hs108|chr19 ( 577) 674 95.0 2.2e-19 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 675 95.2 2.2e-19 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 675 95.2 2.3e-19 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 675 95.2 2.3e-19 CCDS74468.1 ZNF211 gene_id:10520|Hs108|chr19 ( 616) 674 95.1 2.3e-19 CCDS58686.1 ZNF211 gene_id:10520|Hs108|chr19 ( 629) 674 95.1 2.4e-19 CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 675 95.3 2.6e-19 CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 675 95.3 2.6e-19 CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15 ( 614) 672 94.8 2.7e-19 CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 673 95.0 2.8e-19 CCDS12977.1 ZNF497 gene_id:162968|Hs108|chr19 ( 498) 670 94.5 2.8e-19 CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 ( 606) 671 94.7 3e-19 CCDS41300.1 ZSCAN20 gene_id:7579|Hs108|chr1 (1043) 673 95.2 3.6e-19 CCDS45460.1 ZNF771 gene_id:51333|Hs108|chr16 ( 317) 663 93.4 3.8e-19 CCDS43429.1 ZNF391 gene_id:346157|Hs108|chr6 ( 358) 663 93.5 4.1e-19 CCDS35235.1 ZNF182 gene_id:7569|Hs108|chrX ( 620) 666 94.1 4.6e-19 CCDS35236.1 ZNF182 gene_id:7569|Hs108|chrX ( 639) 666 94.1 4.7e-19 CCDS12638.1 ZNF285 gene_id:26974|Hs108|chr19 ( 590) 664 93.8 5.3e-19 CCDS54001.1 ZNF764 gene_id:92595|Hs108|chr16 ( 407) 661 93.3 5.3e-19 CCDS74389.1 ZNF285 gene_id:26974|Hs108|chr19 ( 597) 664 93.8 5.3e-19 CCDS10683.1 ZNF764 gene_id:92595|Hs108|chr16 ( 408) 661 93.3 5.3e-19 CCDS12637.1 ZNF112 gene_id:7771|Hs108|chr19 ( 907) 667 94.4 5.4e-19 CCDS54276.1 ZNF112 gene_id:7771|Hs108|chr19 ( 913) 667 94.4 5.5e-19 CCDS41502.1 ZNF239 gene_id:8187|Hs108|chr10 ( 458) 661 93.3 5.7e-19 CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 664 93.9 5.9e-19 >>CCDS32383.1 ZNF500 gene_id:26048|Hs108|chr16 (480 aa) initn: 3413 init1: 3413 opt: 3413 Z-score: 2270.0 bits: 429.4 E(32554): 4e-120 Smith-Waterman score: 3413; 100.0% identity (100.0% similar) in 480 aa overlap (1-480:1-480) 10 20 30 40 50 60 pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD PPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD MDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRPAPVRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRPAPVRG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD LVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD GFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA 430 440 450 460 470 480 >>CCDS76814.1 ZNF500 gene_id:26048|Hs108|chr16 (441 aa) initn: 3066 init1: 3066 opt: 3066 Z-score: 2041.4 bits: 387.0 E(32554): 2.2e-107 Smith-Waterman score: 3066; 100.0% identity (100.0% similar) in 433 aa overlap (1-433:1-433) 10 20 30 40 50 60 pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD PPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 PPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD MDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRPAPVRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 MDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRPAPVRG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD LVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 LVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD GFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 GFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA ::::::::::::: CCDS76 SSHFSAHRRTHTGHILRSGCT 430 440 >>CCDS10495.1 ZNF213 gene_id:7760|Hs108|chr16 (459 aa) initn: 1749 init1: 549 opt: 1051 Z-score: 711.4 bits: 141.0 E(32554): 2.6e-33 Smith-Waterman score: 1129; 43.8% identity (63.6% similar) in 470 aa overlap (9-459:4-451) 10 20 30 40 50 pF1KSD MATVPGLQPLPTLEQ-DLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQ :: . .: : : .:::::: : :.: . . . . :. :: :: ::: CCDS10 MAAPLEAQDQAPGEGEGLLIVKVE-DSSWEQESAQHEDGRDSEACRQRFRQFCYG 10 20 30 40 50 60 70 80 90 100 110 pF1KSD EVAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGE .: ::.::.:.:::::::::::::::::::::::::::::::::::::. ::::.: ::: CCDS10 DVHGPHEAFSQLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQGWVREQHPGSGE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD EAVVLVEGLQRKPRKH-RQRGSELLSDDEVPLGIG-GQFLKHQAEAQPEDLSLEEEARFS :::.::: ::..: : :: .. :.. : . : :. :: . : .. :: CCDS10 EAVALVEDLQKQPVKAWRQ---DVPSEEAEPEAAGRGS----QATGPPPTVG----ARRR 120 130 140 150 160 180 190 200 210 220 230 pF1KSD SQQPPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEE . : : :: : :: ..: :. .. . :.:. . :: : :. :.: :: CCDS10 PSVPQEQHSHSAQPPALL--KEGRPGE-----TTDTCFVSG-VHGPVALGDIPFYFSREE 170 180 190 200 210 240 250 260 270 280 290 pF1KSD PRCMDPAQRDA--PLENEGP-GIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQR .:::::: .. :. . : : :. . : .: :. . : . . CCDS10 WGTLDPAQRDLFWDIKRENSRNTTLGFGLKGQSEKSLLQEMVPVVPG--QTGSDVTVSWS 220 230 240 250 260 270 300 310 320 330 340 pF1KSD PAPVRGLVRPDQPRG--GP--------PPGRRASH---GADKPYTCPECGKGFSKTSHLT : ... ..::. :: :: :: . .:.::..: .::: : : :. CCDS10 PEEAEAWESENRPRAALGPVVGARRGRPPTRRRQFRDLAAEKPHSCGQCGKRFRWGSDLA 280 290 300 310 320 330 350 360 370 380 390 400 pF1KSD KHQRTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRR .::::::::.:.:: : :.: . :.. :: :::::::. : :::: ::.:. :. :.: CCDS10 RHQRTHTGEKPHKCPECDKSFRSSSDLVRHQGVHTGEKPFSCSECGKSFSRSAYLADHQR 340 350 360 370 380 390 410 420 430 440 450 460 pF1KSD THSGERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMG :.::.:..:..::: :. :.. :::.::::.:. : : ..:.. . : :: : CCDS10 IHTGEKPFGCSDCGKSFSLRSYLLDHRRVHTGERPFGCGECDKSFKQRAHLIAHQSLHAK 400 410 420 430 440 450 470 480 pF1KSD AGSLPTLQPVAPGGPGAKA CCDS10 MAQPVG >>CCDS4647.1 ZKSCAN4 gene_id:387032|Hs108|chr6 (545 aa) initn: 1924 init1: 598 opt: 1008 Z-score: 682.1 bits: 135.8 E(32554): 1.1e-31 Smith-Waterman score: 1011; 41.7% identity (61.9% similar) in 465 aa overlap (18-459:18-454) 10 20 30 40 50 pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETE-DPS--PETFRQLFRLFC .: .: ::::.. :.. .:. :: :: :: : CCDS46 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRGFR 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD YQEVAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPES : :.:::::::::: ::: .::.::...:::::::::::::::.:::..:. ::::.::: CCDS46 YPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPES 70 80 90 100 110 120 120 130 140 150 160 170 pF1KSD GEEAVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFS :::.:::.: :.:. . .::.: :: : : : . .. : CCDS46 GEEVVVLLEYLERQLDE---------PAPQVPVGDQGQELLCCKMA----LLTQTQGSQS 130 140 150 160 180 190 200 210 220 230 pF1KSD SQ-QPPAQLSHRPQRGPLLWPERGPPAPRH------QEMASASPFLSAWSQVPVNLEDVA :: :: : .. . : .: .: .: : .. :. :: ...:::: CCDS46 SQCQPMKALFKHESLGSQPLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVA 170 180 190 200 210 220 240 250 260 270 280 pF1KSD VYLSGEEPRCMDPAQ----RDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGP . :. . .: .: :: ::.. ..: ::. . ..: : CCDS46 LTLTPGWTQ-LDSSQVNLYRDEKQENHSSLVSL--GGEIQT------------KSRDLPP 230 240 250 260 270 290 300 310 320 330 pF1KSD GHPLPGQRPAPVRGLVR-----PDQPRGGPPPGR--RASHGA--DKPYTCPECGKGFSKT . :: .. . . : . : . ..: :: : ...: .. . : ::::.:... CCDS46 VKKLPEKEHGKICHLREDIAQIPTHAEAGEQEGRLQRKQKNAIGSRRHYCHECGKSFAQS 280 290 300 310 320 330 340 350 360 370 380 390 pF1KSD SHLTKHQRTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLV : ::::.: ::::.::.: ::: : : . ::::::::::: : :::: ::.::.:. CCDS46 SGLTKHRRIHTGEKPYECEDCGKTFIGSSALVIHQRVHTGEKPYECEECGKVFSHSSNLI 340 350 360 370 380 390 400 410 420 430 440 450 pF1KSD IHRRTHSGERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQR :.:::.::.:: : .::: :..: . :.. ::::::: : ::..:::.. : .::: CCDS46 KHQRTHTGEKPYECDDCGKTFSQSCSLLEHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQR 400 410 420 430 440 450 460 470 480 pF1KSD THMGAGSLPTLQPVAPGGPGAKA : CCDS46 IHGDKNVQNPEHGESWESQGRTESQWENTEAPVSYKCNECERSFTRNRSLIEHQKIHTGE 460 470 480 490 500 510 >>CCDS4650.1 ZKSCAN3 gene_id:80317|Hs108|chr6 (538 aa) initn: 1989 init1: 610 opt: 1000 Z-score: 676.9 bits: 134.8 E(32554): 2.2e-31 Smith-Waterman score: 1040; 42.0% identity (64.3% similar) in 459 aa overlap (18-461:18-450) 10 20 30 40 50 60 pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE .: :.:..:::: :: . : . : :. :: : : : CCDS46 MARELSESTALDAQSTEDQMELLVIKVEE----EEAGFPSSPDLGSEGSRERFRGFRYPE 10 20 30 40 50 70 80 90 100 110 120 pF1KSD VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE .:::::::::: ::: .::.::...:::::::::::::::.:::..:. ::::.:::::: CCDS46 AAGPREALSRLRELCRQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPESGEE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ .:::.: :.:. . . : . . .:. : .: .: ...: . : .. .. CCDS46 VVVLLEYLERQLDEPAPQVSGVDQGQEL-LCCKMALLTPAPGSQSSQFQLMK-ALLKHES 120 130 140 150 160 170 190 200 210 220 230 pF1KSD PPAQ-LSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPR .: :. : . :.: .: . . .:: :. :: ...::::. :. : . CCDS46 VGSQPLQDRVLQVPVL--AHGGCCREDKVVASR---LTPESQGLLKVEDVALTLTPEWTQ 180 190 200 210 220 240 250 260 270 280 290 pF1KSD CMDPAQ----RDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRP .: .: :: ::.: ..: :: .. ..: :.. :: .. CCDS46 -QDSSQGNLCRDEKQENHGSLVSL---GDEKQT-----------KSRDLPPAEELPEKEH 230 240 250 260 270 300 310 320 330 340 pF1KSD APVRGLVR------PDQPRGGPPPGR--RASHGAD--KPYTCPECGKGFSKTSHLTKHQR . . .: : ..: :: : ...: . . : ::::.:...: :.::.: CCDS46 GKISCHLREDIAQIPTCAEAGEQEGRLQRKQKNATGGRRHICHECGKSFAQSSGLSKHRR 280 290 300 310 320 330 350 360 370 380 390 400 pF1KSD THTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSG ::::.::.: :::.: : . ::::::::::: : :::: ::.::.:. :.:::.: CCDS46 IHTGEKPYECEECGKAFIGSSALVIHQRVHTGEKPYECEECGKAFSHSSDLIKHQRTHTG 340 350 360 370 380 390 410 420 430 440 450 460 pF1KSD ERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSL :.:: : .::: :..: . :.: ::::::: : ::..:::.. : .::: : : CCDS46 EKPYECDDCGKTFSQSCSLLEHHRIHTGEKPYQCSMCGKAFRRSSHLLRHQRIHTGDKNV 400 410 420 430 440 450 470 480 pF1KSD PTLQPVAPGGPGAKA CCDS46 QEPEQGEAWKSRMESQLENVETPMSYKCNECERSFTQNTGLIEHQKIHTGEKPYQCNACG 460 470 480 490 500 510 >>CCDS12975.1 ZSCAN22 gene_id:342945|Hs108|chr19 (491 aa) initn: 2618 init1: 803 opt: 902 Z-score: 612.7 bits: 122.8 E(32554): 8.3e-28 Smith-Waterman score: 933; 37.1% identity (59.4% similar) in 475 aa overlap (7-473:8-442) 10 20 30 40 50 pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSP-------ETFRQL :.:.: :.. .: ::::: ::: :. : :. : CCDS12 MAIPKHSLSPVP-----WEEDSFLQVKVEE----EEEASLSQGGESSHDHIAHSEAARLR 10 20 30 40 50 60 70 80 90 100 110 pF1KSD FRLFCYQEVAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVRE :: : :.:..::.:::..: :::.::.:: ..:::::::::::::: .:: :::: : CCDS12 FRHFRYEEASGPHEALAHLRALCCQWLQPEAHSKEQILELLVLEQFLGALPPEIQAWVGA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD QQPESGEEAVVLVEGL-QRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLE :.:.:::::.:::: : : .. . :.: . .: . .. .:. .:: CCDS12 QSPKSGEEAAVLVEDLTQVLDKRGWDPGAEPTEASCKQSDLGESEPSNVTETLMGGVSLG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD EEARFSSQQPPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAV : . : :.: . .: . . .. ...:. .:: . CCDS12 PA--FVKACEPEGSSERSGLSGEIWTKSVTQQIHFKK--TSGPY-----------KDVPT 180 190 200 210 240 250 260 270 280 290 pF1KSD YLSGEEPRCMDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLP :.: . :.:.. . :.. .. : . . ...: : . CCDS12 DQRGRE----SGASRNS--SSAWPNLT-------SQEKPPSEDKFDLVDAYGTEPPYTYS 220 230 240 250 260 300 310 320 330 340 350 pF1KSD GQRPAPVRGLVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGER :.: . : . : .. ... .:. ::.: ::::.::...::..:: .::: . CCDS12 GKRSSKCRECRKMFQS-ASALEAHQKTHSRKTPYACSECGKAFSRSTHLAQHQVVHTGAK 270 280 290 300 310 320 360 370 380 390 400 410 pF1KSD PYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYAC :..: :::.:: .... :::.::::::: : :::: ::.:. :. :.:.:.::::: : CCDS12 PHECKECGKAFSRVTHLTQHQRIHTGEKPYKCGECGKTFSRSTHLTQHQRVHTGERPYEC 330 340 350 360 370 380 420 430 440 450 460 470 pF1KSD TQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPV ::: :..:.:.. :.: ::::::: : ::::.: . : .: : : .: : : CCDS12 DACGKAFSQSTHLTQHQRIHTGEKPYKCDACGRAFSDCSALIRHLRIH--SGEKPYQCKV 390 400 410 420 430 440 480 pF1KSD APGGPGAKA : CCDS12 CPKAFAQSSSLIEHQRIHTGEKPYKCSDCGKAFSRSSALMVHLRIHITVLQ 450 460 470 480 490 >>CCDS10504.1 ZNF174 gene_id:7727|Hs108|chr16 (407 aa) initn: 1104 init1: 416 opt: 819 Z-score: 558.9 bits: 112.6 E(32554): 8.2e-25 Smith-Waterman score: 831; 37.0% identity (62.5% similar) in 424 aa overlap (14-434:14-407) 10 20 30 40 50 60 pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE : . .::. .:.:.:: .. : .. . :.:: :: :: ::::: CCDS10 MAAKMEITLSSNTEASSKQERHIIAKLEE----KRGPPLQKNCPDPELCRQSFRRFCYQE 10 20 30 40 50 70 80 90 100 110 120 pF1KSD VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE :.::.::::.: .:: .::.:::.::::::::::.:::::.:: :::::::.. : :..: CCDS10 VSGPQEALSQLRQLCRQWLQPELHTKEQILELLVMEQFLTILPPEIQARVRHRCPMSSKE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ :.::: ..: .: .: . .. ..: : :. : .: . . . ... : :: CCDS10 IVTLVEDFHRASKKPKQWVAVCMQGQKVLLEKTGSQLGEQELPDFQPQTPRRDLRESSPA 120 130 140 150 160 170 190 200 210 220 230 pF1KSD PPAQLSHRPQRGPLLWPERGP--PAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEP :.: . . .: : :..: : . .. .: . . .. . : . .: .: CCDS10 EPSQAGAYDRLSPHHW-EKSPLLQEPTPKLAGTEAPRMRSDNKENPQQEGA----KGAKP 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD RCMDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGP-GHPLPGQRPAP : : : ..: :.: . . . : :. .: : : : .: :: CCDS10 -CAVSAGR-----SKGNGLQNPEPRGANMSEP-RLSRRQVSSPNAQKPFAH---YQRHCR 240 250 260 270 280 300 310 320 330 340 350 pF1KSD VRGLVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLV :. . : .. : . :.:. . . .. .:: :: :.....:::: CCDS10 VEYISSPL--KSHPLRELKKSKGGKRSLS--------NRLQHLG-HQPTRSAKKPYKCDD 290 300 310 320 330 360 370 380 390 400 410 pF1KSD CGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKR :::.:. :... :.::::::.:: : :::. :...:.: .:.: :.::.:: : :::: CCDS10 CGKSFTWNSELKRHKRVHTGERPYTCGECGNCFGRQSTLKLHQRIHTGEKPYQCGQCGKS 340 350 360 370 380 390 420 430 440 450 460 470 pF1KSD FNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPG : .::.. :.: : :. CCDS10 FRQSSNLHQHHRLHHGD 400 >>CCDS59048.1 ZNF853 gene_id:54753|Hs108|chr7 (659 aa) initn: 1141 init1: 694 opt: 766 Z-score: 521.4 bits: 106.3 E(32554): 1e-22 Smith-Waterman score: 788; 33.5% identity (57.8% similar) in 510 aa overlap (7-480:159-645) 10 20 30 pF1KSD MATVPGLQPLPTLEQD---LEQEEILIVKVEEDFCL ::: . ::. .::.. ...:. : CCDS59 QLSQLQQEKHQSVHHQELKPELQLMHQQQQLQPQQVQEQQRLQQQQEQLQTQQAQEQQVL 130 140 150 160 170 180 40 50 60 70 80 90 pF1KSD EEEPSVETEDPSPETFRQLFRLFCYQEVAGPREALSRLWELCCRWLRPELRTKEQILELL ... ... . . ..: . . :.. .: :.. . . .:. ..:.: : CCDS59 QQQEQLQQQVQEQQLLQQQQEQLQQQQLLQQQEQLQQQQ---FQQQQEQLQQQQQLLLLQ 190 200 210 220 230 240 100 110 120 130 140 150 pF1KSD VLEQFLTVLPGEIQARVREQQPESGEEAVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIG :. : . ::....: :. . . ::.. . ..:. ..::.... : CCDS59 QQGQLQQQLLQQQQAQLQQQLLEQQQAQLQQQLLLQQQEQLQQQQQQQLLQQQQEQL--- 250 260 270 280 290 300 160 170 180 190 200 pF1KSD GQFLKHQAEAQPEDLSLEEEARFSSQQPPAQLSHRP----QRGPLLWPERGPPAPRHQEM .: . :: : ::: . . :..:. . :: : :: :.::. CCDS59 -----QQQQLQPPPLEPEEEEEVELELMPVDLGSEQELEQQRQEL---ERQQELERQQEQ 310 320 330 340 350 210 220 230 240 250 260 pF1KSD ASASPFLSA-WSQVPVNLEDVAVYLSGEE------PRCMDPAQRDAPLENEG--PGIQLE . . :. .:. .::. : .: : . :... :: : .::: CCDS59 RQLQLKLQEELQQLEQQLEQQQQQLEQQEVQLELTPVELGAQQQEVQLELTPVQPELQLE 360 370 380 390 400 410 270 280 290 300 310 pF1KSD ------DGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQR---PA-PVRGLVRPDQPRGG :: . :: :. : ::. . . :: . ..: : :. CCDS59 LVPAAGGGGAAVPGAPAA-----VVVA---PPGYVVVQELMVLPAVAAPAVVAIPGPAGS 420 430 440 450 460 320 330 340 350 360 pF1KSD ----PPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGKGFSDRS : :: .. :.: : :::::::... :..:: :::::::..: ::::::..: CCDS59 AALTPARQRRRRRARDRPTICGECGKGFSRSTDLVRHQATHTGERPHRCGECGKGFSQHS 470 480 490 500 510 520 370 380 390 400 410 420 pF1KSD NFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNNSSHFSA :. ::::.::::::: : :.::::.::.:: :.:::.::::::: .:::::. ::.. CCDS59 NLVTHQRIHTGEKPYACSYCAKRFSESSALVQHQRTHTGERPYACGDCGKRFSVSSNLLR 530 540 550 560 570 580 430 440 450 460 470 480 pF1KSD HRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGS------LPTLQPVAPGGPGAKA :::::.::.::.: ::. ::. .....:.: ::: : . .:.: ::: :.: CCDS59 HRRTHSGERPYVCEDCGERFRHKVQIRRHERQLHGAGRSRGLGLLRASRPAALGGP-ARA 590 600 610 620 630 640 CCDS59 EQAATATAPADKAL 650 >>CCDS10095.2 ZSCAN29 gene_id:146050|Hs108|chr15 (852 aa) initn: 2294 init1: 753 opt: 758 Z-score: 514.8 bits: 105.5 E(32554): 2.4e-22 Smith-Waterman score: 758; 49.3% identity (70.7% similar) in 225 aa overlap (244-461:593-814) 220 230 240 250 260 270 pF1KSD PFLSAWSQVPVNLEDVAVYLSGEEPRCMDPAQRDAP-LENEGPGIQLEDGGDGREDAPLR ..: : ..: : . : .::. : CCDS10 RGFEAGFENEDNSKRDISEEVQLHRTLLARSERKIPRYLHQGKGNE-SDCRSGRQWAKTS 570 580 590 600 610 620 280 290 300 310 320 pF1KSD MEWYRVLSARCQGPGHPLPGQRPA----PVRGLVRPDQPRGGPPP--GRRASHGADKPYT : :. .. .. : ::: : . : . :: ...:: ...:: CCDS10 GEKRGKLTLPEKSLSEVLSQQRPCLGERPYKYLKYSKS--FGPNSLLMHQVSHQVENPYK 630 640 650 660 670 330 340 350 360 370 380 pF1KSD CPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPEC : .:::.::....: .:.: ::::.::::: :::.: : ::: ::.:.::::::: : :: CCDS10 CADCGKSFSRSARLIRHRRIHTGEKPYKCLDCGKSFRDSSNFITHRRIHTGEKPYQCGEC 680 690 700 710 720 730 390 400 410 420 430 440 pF1KSD GKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGF :: :.:::::.::.:::.::.:: : .::: :::::::::::: ::::.:..:: ::..: CCDS10 GKCFNQSSSLIIHQRTHTGEKPYQCEECGKSFNNSSHFSAHRRIHTGERPHVCPDCGKSF 740 750 760 770 780 790 450 460 470 480 pF1KSD RRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA ...::. :.::: : CCDS10 SKSSDLRAHHRTHTGEKPYGCHDCGKCFSKSSALNKHGEIHAREKLLTQSAPK 800 810 820 830 840 850 >-- initn: 537 init1: 477 opt: 519 Z-score: 357.1 bits: 76.3 E(32554): 1.4e-13 Smith-Waterman score: 519; 51.8% identity (72.6% similar) in 168 aa overlap (47-205:15-180) 20 30 40 50 60 70 pF1KSD LEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQEVAGPREALSRLWELCC ::::: :: : ::::::::::.:.:::::: CCDS10 MMAKSALRENGTNSETFRQRFRRFHYQEVAGPREAFSQLWELCC 10 20 30 40 80 90 100 110 120 130 pF1KSD RWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEEAVVLVEGLQRKPRKHR ::::::.::::::.::::::::::::::::: :.:: ::.:::::.::: :.:.: . : CCDS10 RWLRPEVRTKEQIVELLVLEQFLTVLPGEIQNWVQEQCPENGEEAVTLVEDLEREPGRPR 50 60 70 80 90 100 140 150 160 170 180 pF1KSD Q------RGSELLSDDEVPLGIGGQFL---KHQAEAQPEDLSLEEEARFSSQQPPAQLSH . .:.:. . .: . ..: ....: ::. . .:.:: . : :.. CCDS10 SSVTVSVKGQEVRLEKMTPPKSSQELLSVRQESVEPQPRGVPKKERARSPDLGPQEQMNP 110 120 130 140 150 160 190 200 210 220 230 240 pF1KSD RPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRCMDPAQRD . . : . . : : :. CCDS10 KEKLKP--FQRSGLPFPKSGVVSRLEQGEPWIPDLLGSKEKELPSGSHIGDRRVHADLLP 170 180 190 200 210 220 >>CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 (470 aa) initn: 5471 init1: 687 opt: 701 Z-score: 480.3 bits: 98.2 E(32554): 2e-20 Smith-Waterman score: 703; 41.7% identity (58.9% similar) in 302 aa overlap (212-461:2-302) 190 200 210 220 230 240 pF1KSD PAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRCM :. .: : ::.::..::.:.::. :: : . CCDS23 MAATLLMAGSQAPVTFEDMAMYLTREEWRPL 10 20 30 250 260 270 pF1KSD DPAQRD----APLENEGPGIQL-----------------ED---G------GDGREDAPL : :::: . :: : ..: :: : ... :. : CCDS23 DAAQRDLYRDVMQENYGNVVSLDFEIRSENEVNPKQEISEDVQFGTTSERPAENAEENPE 40 50 60 70 80 90 280 290 300 310 pF1KSD RMEWYRVLSARCQGPGHPLPGQR----P-APVRGLVRPDQPRGG------PPPGR----- : .. . : . : ... : :: :. . . : :. CCDS23 SEEGFES-GDRSERQWGDLTAEEWVSYPLQPVTDLLVHKEVHTGIRYHICSHCGKAFSQI 100 110 120 130 140 150 320 330 340 350 360 pF1KSD ------RASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGKGFSDRSNFS . .: .:.:: : :::::::..::: .::::::::::: : :::.:. :.. CCDS23 SDLNRHQKTHTGDRPYKCYECGKGFSRSSHLIQHQRTHTGERPYDCNECGKSFGRSSHLI 160 170 180 190 200 210 370 380 390 400 410 420 pF1KSD THQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNNSSHFSAHRR :: .::::::. : :::: : . : :. :.::::::.:: : .::: :. :::.. :.: CCDS23 QHQTIHTGEKPHKCNECGKSFCRLSHLIQHQRTHSGEKPYECEECGKSFSRSSHLAQHQR 220 230 240 250 260 270 430 440 450 460 470 480 pF1KSD THTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA :::::::: : ::::: . .:: :: :.: : CCDS23 THTGEKPYECNECGRGFSERSDLIKHYRVHTGERPYKCDECGKNFSQNSDLVRHRRAHTG 280 290 300 310 320 330 CCDS23 EKPYHCNECGENFSRISHLVQHQRTHTGEKPYECNACGKSFSRSSHLITHQKIHTGEKPY 340 350 360 370 380 390 >-- initn: 2408 init1: 632 opt: 649 Z-score: 446.0 bits: 91.9 E(32554): 1.6e-18 Smith-Waterman score: 649; 57.2% identity (82.8% similar) in 145 aa overlap (315-459:325-468) 290 300 310 320 330 340 pF1KSD GPGHPLPGQRPAPVRGLVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQ ::: : ..::: : :::..::. :::..:: CCDS23 KHYRVHTGERPYKCDECGKNFSQNSDLVRHRRA-HTGEKPYHCNECGENFSRISHLVQHQ 300 310 320 330 340 350 350 360 370 380 390 400 pF1KSD RTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHS ::::::.::.: .:::.:: :.. :::..::::::: : :: . :.. :.:. :.:::. CCDS23 RTHTGEKPYECNACGKSFSRSSHLITHQKIHTGEKPYECNECWRSFGERSDLIKHQRTHT 360 370 380 390 400 410 410 420 430 440 450 460 pF1KSD GERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGS ::.:: :.:::: :..::.. .:.:.::::::: : : ..: :.. : ::.:.: CCDS23 GEKPYECVQCGKGFTQSSNLITHQRVHTGEKPYECTECEKSFSRSSALIKHKRVHTD 420 430 440 450 460 470 470 480 pF1KSD LPTLQPVAPGGPGAKA 480 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 02:05:25 2016 done: Thu Nov 3 02:05:26 2016 Total Scan time: 2.930 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]