FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0557, 480 aa
1>>>pF1KSDA0557 480 - 480 aa - 480 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.8687+/-0.000912; mu= 8.6665+/- 0.055
mean_var=229.5892+/-45.480, 0's: 0 Z-trim(115.9): 942 B-trim: 230 in 1/51
Lambda= 0.084644
statistics sampled from 15457 (16477) to 15457 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.811), E-opt: 0.2 (0.506), width: 16
Scan time: 2.930
The best scores are: opt bits E(32554)
CCDS32383.1 ZNF500 gene_id:26048|Hs108|chr16 ( 480) 3413 429.4 4e-120
CCDS76814.1 ZNF500 gene_id:26048|Hs108|chr16 ( 441) 3066 387.0 2.2e-107
CCDS10495.1 ZNF213 gene_id:7760|Hs108|chr16 ( 459) 1051 141.0 2.6e-33
CCDS4647.1 ZKSCAN4 gene_id:387032|Hs108|chr6 ( 545) 1008 135.8 1.1e-31
CCDS4650.1 ZKSCAN3 gene_id:80317|Hs108|chr6 ( 538) 1000 134.8 2.2e-31
CCDS12975.1 ZSCAN22 gene_id:342945|Hs108|chr19 ( 491) 902 122.8 8.3e-28
CCDS10504.1 ZNF174 gene_id:7727|Hs108|chr16 ( 407) 819 112.6 8.2e-25
CCDS59048.1 ZNF853 gene_id:54753|Hs108|chr7 ( 659) 766 106.3 1e-22
CCDS10095.2 ZSCAN29 gene_id:146050|Hs108|chr15 ( 852) 758 105.5 2.4e-22
CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 ( 470) 701 98.2 2e-20
CCDS66920.1 ZSCAN32 gene_id:54925|Hs108|chr16 ( 408) 694 97.3 3.2e-20
CCDS10503.1 ZSCAN32 gene_id:54925|Hs108|chr16 ( 485) 694 97.4 3.6e-20
CCDS43307.1 PRDM9 gene_id:56979|Hs108|chr5 ( 894) 698 98.2 3.9e-20
CCDS32410.1 ZKSCAN2 gene_id:342357|Hs108|chr16 ( 967) 698 98.2 4.1e-20
CCDS66921.1 ZSCAN32 gene_id:54925|Hs108|chr16 ( 697) 694 97.6 4.6e-20
CCDS6354.1 ZNF572 gene_id:137209|Hs108|chr8 ( 529) 691 97.1 5e-20
CCDS12972.1 ZNF329 gene_id:79673|Hs108|chr19 ( 541) 687 96.6 7.1e-20
CCDS33090.1 ZNF616 gene_id:90317|Hs108|chr19 ( 781) 688 96.9 8.3e-20
CCDS32330.1 ZNF774 gene_id:342132|Hs108|chr15 ( 483) 682 95.9 1e-19
CCDS45463.1 ZNF629 gene_id:23361|Hs108|chr16 ( 869) 684 96.5 1.3e-19
CCDS4440.1 ZFP2 gene_id:80108|Hs108|chr5 ( 461) 679 95.5 1.3e-19
CCDS58688.1 ZNF211 gene_id:10520|Hs108|chr19 ( 503) 674 95.0 2e-19
CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 675 95.2 2.1e-19
CCDS58687.1 ZNF211 gene_id:10520|Hs108|chr19 ( 555) 674 95.0 2.2e-19
CCDS12957.1 ZNF211 gene_id:10520|Hs108|chr19 ( 564) 674 95.0 2.2e-19
CCDS12956.1 ZNF211 gene_id:10520|Hs108|chr19 ( 577) 674 95.0 2.2e-19
CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 675 95.2 2.2e-19
CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 675 95.2 2.3e-19
CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 675 95.2 2.3e-19
CCDS74468.1 ZNF211 gene_id:10520|Hs108|chr19 ( 616) 674 95.1 2.3e-19
CCDS58686.1 ZNF211 gene_id:10520|Hs108|chr19 ( 629) 674 95.1 2.4e-19
CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 675 95.3 2.6e-19
CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 675 95.3 2.6e-19
CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15 ( 614) 672 94.8 2.7e-19
CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 673 95.0 2.8e-19
CCDS12977.1 ZNF497 gene_id:162968|Hs108|chr19 ( 498) 670 94.5 2.8e-19
CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 ( 606) 671 94.7 3e-19
CCDS41300.1 ZSCAN20 gene_id:7579|Hs108|chr1 (1043) 673 95.2 3.6e-19
CCDS45460.1 ZNF771 gene_id:51333|Hs108|chr16 ( 317) 663 93.4 3.8e-19
CCDS43429.1 ZNF391 gene_id:346157|Hs108|chr6 ( 358) 663 93.5 4.1e-19
CCDS35235.1 ZNF182 gene_id:7569|Hs108|chrX ( 620) 666 94.1 4.6e-19
CCDS35236.1 ZNF182 gene_id:7569|Hs108|chrX ( 639) 666 94.1 4.7e-19
CCDS12638.1 ZNF285 gene_id:26974|Hs108|chr19 ( 590) 664 93.8 5.3e-19
CCDS54001.1 ZNF764 gene_id:92595|Hs108|chr16 ( 407) 661 93.3 5.3e-19
CCDS74389.1 ZNF285 gene_id:26974|Hs108|chr19 ( 597) 664 93.8 5.3e-19
CCDS10683.1 ZNF764 gene_id:92595|Hs108|chr16 ( 408) 661 93.3 5.3e-19
CCDS12637.1 ZNF112 gene_id:7771|Hs108|chr19 ( 907) 667 94.4 5.4e-19
CCDS54276.1 ZNF112 gene_id:7771|Hs108|chr19 ( 913) 667 94.4 5.5e-19
CCDS41502.1 ZNF239 gene_id:8187|Hs108|chr10 ( 458) 661 93.3 5.7e-19
CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 664 93.9 5.9e-19
>>CCDS32383.1 ZNF500 gene_id:26048|Hs108|chr16 (480 aa)
initn: 3413 init1: 3413 opt: 3413 Z-score: 2270.0 bits: 429.4 E(32554): 4e-120
Smith-Waterman score: 3413; 100.0% identity (100.0% similar) in 480 aa overlap (1-480:1-480)
10 20 30 40 50 60
pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD PPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD MDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRPAPVRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRPAPVRG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD LVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD GFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA
430 440 450 460 470 480
>>CCDS76814.1 ZNF500 gene_id:26048|Hs108|chr16 (441 aa)
initn: 3066 init1: 3066 opt: 3066 Z-score: 2041.4 bits: 387.0 E(32554): 2.2e-107
Smith-Waterman score: 3066; 100.0% identity (100.0% similar) in 433 aa overlap (1-433:1-433)
10 20 30 40 50 60
pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD PPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 PPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD MDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRPAPVRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 MDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRPAPVRG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD LVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 LVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD GFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 GFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA
:::::::::::::
CCDS76 SSHFSAHRRTHTGHILRSGCT
430 440
>>CCDS10495.1 ZNF213 gene_id:7760|Hs108|chr16 (459 aa)
initn: 1749 init1: 549 opt: 1051 Z-score: 711.4 bits: 141.0 E(32554): 2.6e-33
Smith-Waterman score: 1129; 43.8% identity (63.6% similar) in 470 aa overlap (9-459:4-451)
10 20 30 40 50
pF1KSD MATVPGLQPLPTLEQ-DLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQ
:: . .: : : .:::::: : :.: . . . . :. :: :: :::
CCDS10 MAAPLEAQDQAPGEGEGLLIVKVE-DSSWEQESAQHEDGRDSEACRQRFRQFCYG
10 20 30 40 50
60 70 80 90 100 110
pF1KSD EVAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGE
.: ::.::.:.:::::::::::::::::::::::::::::::::::::. ::::.: :::
CCDS10 DVHGPHEAFSQLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQGWVREQHPGSGE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD EAVVLVEGLQRKPRKH-RQRGSELLSDDEVPLGIG-GQFLKHQAEAQPEDLSLEEEARFS
:::.::: ::..: : :: .. :.. : . : :. :: . : .. ::
CCDS10 EAVALVEDLQKQPVKAWRQ---DVPSEEAEPEAAGRGS----QATGPPPTVG----ARRR
120 130 140 150 160
180 190 200 210 220 230
pF1KSD SQQPPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEE
. : : :: : :: ..: :. .. . :.:. . :: : :. :.: ::
CCDS10 PSVPQEQHSHSAQPPALL--KEGRPGE-----TTDTCFVSG-VHGPVALGDIPFYFSREE
170 180 190 200 210
240 250 260 270 280 290
pF1KSD PRCMDPAQRDA--PLENEGP-GIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQR
.:::::: .. :. . : : :. . : .: :. . : . .
CCDS10 WGTLDPAQRDLFWDIKRENSRNTTLGFGLKGQSEKSLLQEMVPVVPG--QTGSDVTVSWS
220 230 240 250 260 270
300 310 320 330 340
pF1KSD PAPVRGLVRPDQPRG--GP--------PPGRRASH---GADKPYTCPECGKGFSKTSHLT
: ... ..::. :: :: :: . .:.::..: .::: : : :.
CCDS10 PEEAEAWESENRPRAALGPVVGARRGRPPTRRRQFRDLAAEKPHSCGQCGKRFRWGSDLA
280 290 300 310 320 330
350 360 370 380 390 400
pF1KSD KHQRTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRR
.::::::::.:.:: : :.: . :.. :: :::::::. : :::: ::.:. :. :.:
CCDS10 RHQRTHTGEKPHKCPECDKSFRSSSDLVRHQGVHTGEKPFSCSECGKSFSRSAYLADHQR
340 350 360 370 380 390
410 420 430 440 450 460
pF1KSD THSGERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMG
:.::.:..:..::: :. :.. :::.::::.:. : : ..:.. . : :: :
CCDS10 IHTGEKPFGCSDCGKSFSLRSYLLDHRRVHTGERPFGCGECDKSFKQRAHLIAHQSLHAK
400 410 420 430 440 450
470 480
pF1KSD AGSLPTLQPVAPGGPGAKA
CCDS10 MAQPVG
>>CCDS4647.1 ZKSCAN4 gene_id:387032|Hs108|chr6 (545 aa)
initn: 1924 init1: 598 opt: 1008 Z-score: 682.1 bits: 135.8 E(32554): 1.1e-31
Smith-Waterman score: 1011; 41.7% identity (61.9% similar) in 465 aa overlap (18-459:18-454)
10 20 30 40 50
pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETE-DPS--PETFRQLFRLFC
.: .: ::::.. :.. .:. :: :: :: :
CCDS46 MAREPRKNAALDAQSAEDQTGLLTVKVEKEEASALTAEVRAPCSPARGPERSRQRFRGFR
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD YQEVAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPES
: :.:::::::::: ::: .::.::...:::::::::::::::.:::..:. ::::.:::
CCDS46 YPEAAGPREALSRLRELCGQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPES
70 80 90 100 110 120
120 130 140 150 160 170
pF1KSD GEEAVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFS
:::.:::.: :.:. . .::.: :: : : : . .. :
CCDS46 GEEVVVLLEYLERQLDE---------PAPQVPVGDQGQELLCCKMA----LLTQTQGSQS
130 140 150 160
180 190 200 210 220 230
pF1KSD SQ-QPPAQLSHRPQRGPLLWPERGPPAPRH------QEMASASPFLSAWSQVPVNLEDVA
:: :: : .. . : .: .: .: : .. :. :: ...::::
CCDS46 SQCQPMKALFKHESLGSQPLHDRVLQVPGLAQGGCCREDAMVASRLTPGSQGLLKMEDVA
170 180 190 200 210 220
240 250 260 270 280
pF1KSD VYLSGEEPRCMDPAQ----RDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGP
. :. . .: .: :: ::.. ..: ::. . ..: :
CCDS46 LTLTPGWTQ-LDSSQVNLYRDEKQENHSSLVSL--GGEIQT------------KSRDLPP
230 240 250 260 270
290 300 310 320 330
pF1KSD GHPLPGQRPAPVRGLVR-----PDQPRGGPPPGR--RASHGA--DKPYTCPECGKGFSKT
. :: .. . . : . : . ..: :: : ...: .. . : ::::.:...
CCDS46 VKKLPEKEHGKICHLREDIAQIPTHAEAGEQEGRLQRKQKNAIGSRRHYCHECGKSFAQS
280 290 300 310 320 330
340 350 360 370 380 390
pF1KSD SHLTKHQRTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLV
: ::::.: ::::.::.: ::: : : . ::::::::::: : :::: ::.::.:.
CCDS46 SGLTKHRRIHTGEKPYECEDCGKTFIGSSALVIHQRVHTGEKPYECEECGKVFSHSSNLI
340 350 360 370 380 390
400 410 420 430 440 450
pF1KSD IHRRTHSGERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQR
:.:::.::.:: : .::: :..: . :.. ::::::: : ::..:::.. : .:::
CCDS46 KHQRTHTGEKPYECDDCGKTFSQSCSLLEHHKIHTGEKPYQCNMCGKAFRRNSHLLRHQR
400 410 420 430 440 450
460 470 480
pF1KSD THMGAGSLPTLQPVAPGGPGAKA
:
CCDS46 IHGDKNVQNPEHGESWESQGRTESQWENTEAPVSYKCNECERSFTRNRSLIEHQKIHTGE
460 470 480 490 500 510
>>CCDS4650.1 ZKSCAN3 gene_id:80317|Hs108|chr6 (538 aa)
initn: 1989 init1: 610 opt: 1000 Z-score: 676.9 bits: 134.8 E(32554): 2.2e-31
Smith-Waterman score: 1040; 42.0% identity (64.3% similar) in 459 aa overlap (18-461:18-450)
10 20 30 40 50 60
pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE
.: :.:..:::: :: . : . : :. :: : : :
CCDS46 MARELSESTALDAQSTEDQMELLVIKVEE----EEAGFPSSPDLGSEGSRERFRGFRYPE
10 20 30 40 50
70 80 90 100 110 120
pF1KSD VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE
.:::::::::: ::: .::.::...:::::::::::::::.:::..:. ::::.::::::
CCDS46 AAGPREALSRLRELCRQWLQPEMHSKEQILELLVLEQFLTILPGNLQSWVREQHPESGEE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KSD AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ
.:::.: :.:. . . : . . .:. : .: .: ...: . : .. ..
CCDS46 VVVLLEYLERQLDEPAPQVSGVDQGQEL-LCCKMALLTPAPGSQSSQFQLMK-ALLKHES
120 130 140 150 160 170
190 200 210 220 230
pF1KSD PPAQ-LSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPR
.: :. : . :.: .: . . .:: :. :: ...::::. :. : .
CCDS46 VGSQPLQDRVLQVPVL--AHGGCCREDKVVASR---LTPESQGLLKVEDVALTLTPEWTQ
180 190 200 210 220
240 250 260 270 280 290
pF1KSD CMDPAQ----RDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQRP
.: .: :: ::.: ..: :: .. ..: :.. :: ..
CCDS46 -QDSSQGNLCRDEKQENHGSLVSL---GDEKQT-----------KSRDLPPAEELPEKEH
230 240 250 260 270
300 310 320 330 340
pF1KSD APVRGLVR------PDQPRGGPPPGR--RASHGAD--KPYTCPECGKGFSKTSHLTKHQR
. . .: : ..: :: : ...: . . : ::::.:...: :.::.:
CCDS46 GKISCHLREDIAQIPTCAEAGEQEGRLQRKQKNATGGRRHICHECGKSFAQSSGLSKHRR
280 290 300 310 320 330
350 360 370 380 390 400
pF1KSD THTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSG
::::.::.: :::.: : . ::::::::::: : :::: ::.::.:. :.:::.:
CCDS46 IHTGEKPYECEECGKAFIGSSALVIHQRVHTGEKPYECEECGKAFSHSSDLIKHQRTHTG
340 350 360 370 380 390
410 420 430 440 450 460
pF1KSD ERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSL
:.:: : .::: :..: . :.: ::::::: : ::..:::.. : .::: : :
CCDS46 EKPYECDDCGKTFSQSCSLLEHHRIHTGEKPYQCSMCGKAFRRSSHLLRHQRIHTGDKNV
400 410 420 430 440 450
470 480
pF1KSD PTLQPVAPGGPGAKA
CCDS46 QEPEQGEAWKSRMESQLENVETPMSYKCNECERSFTQNTGLIEHQKIHTGEKPYQCNACG
460 470 480 490 500 510
>>CCDS12975.1 ZSCAN22 gene_id:342945|Hs108|chr19 (491 aa)
initn: 2618 init1: 803 opt: 902 Z-score: 612.7 bits: 122.8 E(32554): 8.3e-28
Smith-Waterman score: 933; 37.1% identity (59.4% similar) in 475 aa overlap (7-473:8-442)
10 20 30 40 50
pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSP-------ETFRQL
:.:.: :.. .: ::::: ::: :. : :. :
CCDS12 MAIPKHSLSPVP-----WEEDSFLQVKVEE----EEEASLSQGGESSHDHIAHSEAARLR
10 20 30 40 50
60 70 80 90 100 110
pF1KSD FRLFCYQEVAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVRE
:: : :.:..::.:::..: :::.::.:: ..:::::::::::::: .:: :::: :
CCDS12 FRHFRYEEASGPHEALAHLRALCCQWLQPEAHSKEQILELLVLEQFLGALPPEIQAWVGA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD QQPESGEEAVVLVEGL-QRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLE
:.:.:::::.:::: : : .. . :.: . .: . .. .:. .::
CCDS12 QSPKSGEEAAVLVEDLTQVLDKRGWDPGAEPTEASCKQSDLGESEPSNVTETLMGGVSLG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD EEARFSSQQPPAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAV
: . : :.: . .: . . .. ...:. .:: .
CCDS12 PA--FVKACEPEGSSERSGLSGEIWTKSVTQQIHFKK--TSGPY-----------KDVPT
180 190 200 210
240 250 260 270 280 290
pF1KSD YLSGEEPRCMDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGPGHPLP
:.: . :.:.. . :.. .. : . . ...: : .
CCDS12 DQRGRE----SGASRNS--SSAWPNLT-------SQEKPPSEDKFDLVDAYGTEPPYTYS
220 230 240 250 260
300 310 320 330 340 350
pF1KSD GQRPAPVRGLVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGER
:.: . : . : .. ... .:. ::.: ::::.::...::..:: .::: .
CCDS12 GKRSSKCRECRKMFQS-ASALEAHQKTHSRKTPYACSECGKAFSRSTHLAQHQVVHTGAK
270 280 290 300 310 320
360 370 380 390 400 410
pF1KSD PYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYAC
:..: :::.:: .... :::.::::::: : :::: ::.:. :. :.:.:.::::: :
CCDS12 PHECKECGKAFSRVTHLTQHQRIHTGEKPYKCGECGKTFSRSTHLTQHQRVHTGERPYEC
330 340 350 360 370 380
420 430 440 450 460 470
pF1KSD TQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPV
::: :..:.:.. :.: ::::::: : ::::.: . : .: : : .: : :
CCDS12 DACGKAFSQSTHLTQHQRIHTGEKPYKCDACGRAFSDCSALIRHLRIH--SGEKPYQCKV
390 400 410 420 430 440
480
pF1KSD APGGPGAKA
:
CCDS12 CPKAFAQSSSLIEHQRIHTGEKPYKCSDCGKAFSRSSALMVHLRIHITVLQ
450 460 470 480 490
>>CCDS10504.1 ZNF174 gene_id:7727|Hs108|chr16 (407 aa)
initn: 1104 init1: 416 opt: 819 Z-score: 558.9 bits: 112.6 E(32554): 8.2e-25
Smith-Waterman score: 831; 37.0% identity (62.5% similar) in 424 aa overlap (14-434:14-407)
10 20 30 40 50 60
pF1KSD MATVPGLQPLPTLEQDLEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQE
: . .::. .:.:.:: .. : .. . :.:: :: :: :::::
CCDS10 MAAKMEITLSSNTEASSKQERHIIAKLEE----KRGPPLQKNCPDPELCRQSFRRFCYQE
10 20 30 40 50
70 80 90 100 110 120
pF1KSD VAGPREALSRLWELCCRWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEE
:.::.::::.: .:: .::.:::.::::::::::.:::::.:: :::::::.. : :..:
CCDS10 VSGPQEALSQLRQLCRQWLQPELHTKEQILELLVMEQFLTILPPEIQARVRHRCPMSSKE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KSD AVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIGGQFLKHQAEAQPEDLSLEEEARFSSQQ
:.::: ..: .: .: . .. ..: : :. : .: . . . ... : ::
CCDS10 IVTLVEDFHRASKKPKQWVAVCMQGQKVLLEKTGSQLGEQELPDFQPQTPRRDLRESSPA
120 130 140 150 160 170
190 200 210 220 230
pF1KSD PPAQLSHRPQRGPLLWPERGP--PAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEP
:.: . . .: : :..: : . .. .: . . .. . : . .: .:
CCDS10 EPSQAGAYDRLSPHHW-EKSPLLQEPTPKLAGTEAPRMRSDNKENPQQEGA----KGAKP
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD RCMDPAQRDAPLENEGPGIQLEDGGDGREDAPLRMEWYRVLSARCQGP-GHPLPGQRPAP
: : : ..: :.: . . . : :. .: : : : .: ::
CCDS10 -CAVSAGR-----SKGNGLQNPEPRGANMSEP-RLSRRQVSSPNAQKPFAH---YQRHCR
240 250 260 270 280
300 310 320 330 340 350
pF1KSD VRGLVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLV
:. . : .. : . :.:. . . .. .:: :: :.....::::
CCDS10 VEYISSPL--KSHPLRELKKSKGGKRSLS--------NRLQHLG-HQPTRSAKKPYKCDD
290 300 310 320 330
360 370 380 390 400 410
pF1KSD CGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKR
:::.:. :... :.::::::.:: : :::. :...:.: .:.: :.::.:: : ::::
CCDS10 CGKSFTWNSELKRHKRVHTGERPYTCGECGNCFGRQSTLKLHQRIHTGEKPYQCGQCGKS
340 350 360 370 380 390
420 430 440 450 460 470
pF1KSD FNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPG
: .::.. :.: : :.
CCDS10 FRQSSNLHQHHRLHHGD
400
>>CCDS59048.1 ZNF853 gene_id:54753|Hs108|chr7 (659 aa)
initn: 1141 init1: 694 opt: 766 Z-score: 521.4 bits: 106.3 E(32554): 1e-22
Smith-Waterman score: 788; 33.5% identity (57.8% similar) in 510 aa overlap (7-480:159-645)
10 20 30
pF1KSD MATVPGLQPLPTLEQD---LEQEEILIVKVEEDFCL
::: . ::. .::.. ...:. :
CCDS59 QLSQLQQEKHQSVHHQELKPELQLMHQQQQLQPQQVQEQQRLQQQQEQLQTQQAQEQQVL
130 140 150 160 170 180
40 50 60 70 80 90
pF1KSD EEEPSVETEDPSPETFRQLFRLFCYQEVAGPREALSRLWELCCRWLRPELRTKEQILELL
... ... . . ..: . . :.. .: :.. . . .:. ..:.: :
CCDS59 QQQEQLQQQVQEQQLLQQQQEQLQQQQLLQQQEQLQQQQ---FQQQQEQLQQQQQLLLLQ
190 200 210 220 230 240
100 110 120 130 140 150
pF1KSD VLEQFLTVLPGEIQARVREQQPESGEEAVVLVEGLQRKPRKHRQRGSELLSDDEVPLGIG
:. : . ::....: :. . . ::.. . ..:. ..::.... :
CCDS59 QQGQLQQQLLQQQQAQLQQQLLEQQQAQLQQQLLLQQQEQLQQQQQQQLLQQQQEQL---
250 260 270 280 290 300
160 170 180 190 200
pF1KSD GQFLKHQAEAQPEDLSLEEEARFSSQQPPAQLSHRP----QRGPLLWPERGPPAPRHQEM
.: . :: : ::: . . :..:. . :: : :: :.::.
CCDS59 -----QQQQLQPPPLEPEEEEEVELELMPVDLGSEQELEQQRQEL---ERQQELERQQEQ
310 320 330 340 350
210 220 230 240 250 260
pF1KSD ASASPFLSA-WSQVPVNLEDVAVYLSGEE------PRCMDPAQRDAPLENEG--PGIQLE
. . :. .:. .::. : .: : . :... :: : .:::
CCDS59 RQLQLKLQEELQQLEQQLEQQQQQLEQQEVQLELTPVELGAQQQEVQLELTPVQPELQLE
360 370 380 390 400 410
270 280 290 300 310
pF1KSD ------DGGDGREDAPLRMEWYRVLSARCQGPGHPLPGQR---PA-PVRGLVRPDQPRGG
:: . :: :. : ::. . . :: . ..: : :.
CCDS59 LVPAAGGGGAAVPGAPAA-----VVVA---PPGYVVVQELMVLPAVAAPAVVAIPGPAGS
420 430 440 450 460
320 330 340 350 360
pF1KSD ----PPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGKGFSDRS
: :: .. :.: : :::::::... :..:: :::::::..: ::::::..:
CCDS59 AALTPARQRRRRRARDRPTICGECGKGFSRSTDLVRHQATHTGERPHRCGECGKGFSQHS
470 480 490 500 510 520
370 380 390 400 410 420
pF1KSD NFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNNSSHFSA
:. ::::.::::::: : :.::::.::.:: :.:::.::::::: .:::::. ::..
CCDS59 NLVTHQRIHTGEKPYACSYCAKRFSESSALVQHQRTHTGERPYACGDCGKRFSVSSNLLR
530 540 550 560 570 580
430 440 450 460 470 480
pF1KSD HRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGS------LPTLQPVAPGGPGAKA
:::::.::.::.: ::. ::. .....:.: ::: : . .:.: ::: :.:
CCDS59 HRRTHSGERPYVCEDCGERFRHKVQIRRHERQLHGAGRSRGLGLLRASRPAALGGP-ARA
590 600 610 620 630 640
CCDS59 EQAATATAPADKAL
650
>>CCDS10095.2 ZSCAN29 gene_id:146050|Hs108|chr15 (852 aa)
initn: 2294 init1: 753 opt: 758 Z-score: 514.8 bits: 105.5 E(32554): 2.4e-22
Smith-Waterman score: 758; 49.3% identity (70.7% similar) in 225 aa overlap (244-461:593-814)
220 230 240 250 260 270
pF1KSD PFLSAWSQVPVNLEDVAVYLSGEEPRCMDPAQRDAP-LENEGPGIQLEDGGDGREDAPLR
..: : ..: : . : .::. :
CCDS10 RGFEAGFENEDNSKRDISEEVQLHRTLLARSERKIPRYLHQGKGNE-SDCRSGRQWAKTS
570 580 590 600 610 620
280 290 300 310 320
pF1KSD MEWYRVLSARCQGPGHPLPGQRPA----PVRGLVRPDQPRGGPPP--GRRASHGADKPYT
: :. .. .. : ::: : . : . :: ...:: ...::
CCDS10 GEKRGKLTLPEKSLSEVLSQQRPCLGERPYKYLKYSKS--FGPNSLLMHQVSHQVENPYK
630 640 650 660 670
330 340 350 360 370 380
pF1KSD CPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPEC
: .:::.::....: .:.: ::::.::::: :::.: : ::: ::.:.::::::: : ::
CCDS10 CADCGKSFSRSARLIRHRRIHTGEKPYKCLDCGKSFRDSSNFITHRRIHTGEKPYQCGEC
680 690 700 710 720 730
390 400 410 420 430 440
pF1KSD GKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGF
:: :.:::::.::.:::.::.:: : .::: :::::::::::: ::::.:..:: ::..:
CCDS10 GKCFNQSSSLIIHQRTHTGEKPYQCEECGKSFNNSSHFSAHRRIHTGERPHVCPDCGKSF
740 750 760 770 780 790
450 460 470 480
pF1KSD RRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA
...::. :.::: :
CCDS10 SKSSDLRAHHRTHTGEKPYGCHDCGKCFSKSSALNKHGEIHAREKLLTQSAPK
800 810 820 830 840 850
>--
initn: 537 init1: 477 opt: 519 Z-score: 357.1 bits: 76.3 E(32554): 1.4e-13
Smith-Waterman score: 519; 51.8% identity (72.6% similar) in 168 aa overlap (47-205:15-180)
20 30 40 50 60 70
pF1KSD LEQEEILIVKVEEDFCLEEEPSVETEDPSPETFRQLFRLFCYQEVAGPREALSRLWELCC
::::: :: : ::::::::::.:.::::::
CCDS10 MMAKSALRENGTNSETFRQRFRRFHYQEVAGPREAFSQLWELCC
10 20 30 40
80 90 100 110 120 130
pF1KSD RWLRPELRTKEQILELLVLEQFLTVLPGEIQARVREQQPESGEEAVVLVEGLQRKPRKHR
::::::.::::::.::::::::::::::::: :.:: ::.:::::.::: :.:.: . :
CCDS10 RWLRPEVRTKEQIVELLVLEQFLTVLPGEIQNWVQEQCPENGEEAVTLVEDLEREPGRPR
50 60 70 80 90 100
140 150 160 170 180
pF1KSD Q------RGSELLSDDEVPLGIGGQFL---KHQAEAQPEDLSLEEEARFSSQQPPAQLSH
. .:.:. . .: . ..: ....: ::. . .:.:: . : :..
CCDS10 SSVTVSVKGQEVRLEKMTPPKSSQELLSVRQESVEPQPRGVPKKERARSPDLGPQEQMNP
110 120 130 140 150 160
190 200 210 220 230 240
pF1KSD RPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRCMDPAQRD
. . : . . : : :.
CCDS10 KEKLKP--FQRSGLPFPKSGVVSRLEQGEPWIPDLLGSKEKELPSGSHIGDRRVHADLLP
170 180 190 200 210 220
>>CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 (470 aa)
initn: 5471 init1: 687 opt: 701 Z-score: 480.3 bits: 98.2 E(32554): 2e-20
Smith-Waterman score: 703; 41.7% identity (58.9% similar) in 302 aa overlap (212-461:2-302)
190 200 210 220 230 240
pF1KSD PAQLSHRPQRGPLLWPERGPPAPRHQEMASASPFLSAWSQVPVNLEDVAVYLSGEEPRCM
:. .: : ::.::..::.:.::. :: : .
CCDS23 MAATLLMAGSQAPVTFEDMAMYLTREEWRPL
10 20 30
250 260 270
pF1KSD DPAQRD----APLENEGPGIQL-----------------ED---G------GDGREDAPL
: :::: . :: : ..: :: : ... :. :
CCDS23 DAAQRDLYRDVMQENYGNVVSLDFEIRSENEVNPKQEISEDVQFGTTSERPAENAEENPE
40 50 60 70 80 90
280 290 300 310
pF1KSD RMEWYRVLSARCQGPGHPLPGQR----P-APVRGLVRPDQPRGG------PPPGR-----
: .. . : . : ... : :: :. . . : :.
CCDS23 SEEGFES-GDRSERQWGDLTAEEWVSYPLQPVTDLLVHKEVHTGIRYHICSHCGKAFSQI
100 110 120 130 140 150
320 330 340 350 360
pF1KSD ------RASHGADKPYTCPECGKGFSKTSHLTKHQRTHTGERPYKCLVCGKGFSDRSNFS
. .: .:.:: : :::::::..::: .::::::::::: : :::.:. :..
CCDS23 SDLNRHQKTHTGDRPYKCYECGKGFSRSSHLIQHQRTHTGERPYDCNECGKSFGRSSHLI
160 170 180 190 200 210
370 380 390 400 410 420
pF1KSD THQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHSGERPYACTQCGKRFNNSSHFSAHRR
:: .::::::. : :::: : . : :. :.::::::.:: : .::: :. :::.. :.:
CCDS23 QHQTIHTGEKPHKCNECGKSFCRLSHLIQHQRTHSGEKPYECEECGKSFSRSSHLAQHQR
220 230 240 250 260 270
430 440 450 460 470 480
pF1KSD THTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGSLPTLQPVAPGGPGAKA
:::::::: : ::::: . .:: :: :.: :
CCDS23 THTGEKPYECNECGRGFSERSDLIKHYRVHTGERPYKCDECGKNFSQNSDLVRHRRAHTG
280 290 300 310 320 330
CCDS23 EKPYHCNECGENFSRISHLVQHQRTHTGEKPYECNACGKSFSRSSHLITHQKIHTGEKPY
340 350 360 370 380 390
>--
initn: 2408 init1: 632 opt: 649 Z-score: 446.0 bits: 91.9 E(32554): 1.6e-18
Smith-Waterman score: 649; 57.2% identity (82.8% similar) in 145 aa overlap (315-459:325-468)
290 300 310 320 330 340
pF1KSD GPGHPLPGQRPAPVRGLVRPDQPRGGPPPGRRASHGADKPYTCPECGKGFSKTSHLTKHQ
::: : ..::: : :::..::. :::..::
CCDS23 KHYRVHTGERPYKCDECGKNFSQNSDLVRHRRA-HTGEKPYHCNECGENFSRISHLVQHQ
300 310 320 330 340 350
350 360 370 380 390 400
pF1KSD RTHTGERPYKCLVCGKGFSDRSNFSTHQRVHTGEKPYPCPECGKRFSQSSSLVIHRRTHS
::::::.::.: .:::.:: :.. :::..::::::: : :: . :.. :.:. :.:::.
CCDS23 RTHTGEKPYECNACGKSFSRSSHLITHQKIHTGEKPYECNECWRSFGERSDLIKHQRTHT
360 370 380 390 400 410
410 420 430 440 450 460
pF1KSD GERPYACTQCGKRFNNSSHFSAHRRTHTGEKPYTCPACGRGFRRGTDLHKHQRTHMGAGS
::.:: :.:::: :..::.. .:.:.::::::: : : ..: :.. : ::.:.:
CCDS23 GEKPYECVQCGKGFTQSSNLITHQRVHTGEKPYECTECEKSFSRSSALIKHKRVHTD
420 430 440 450 460 470
470 480
pF1KSD LPTLQPVAPGGPGAKA
480 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 02:05:25 2016 done: Thu Nov 3 02:05:26 2016
Total Scan time: 2.930 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]