FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0737, 621 aa
1>>>pF1KA0737 621 - 621 aa - 621 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.5256+/-0.00104; mu= -6.8788+/- 0.062
mean_var=391.3651+/-80.877, 0's: 0 Z-trim(115.4): 33 B-trim: 432 in 1/55
Lambda= 0.064831
statistics sampled from 15891 (15921) to 15891 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.772), E-opt: 0.2 (0.489), width: 16
Scan time: 4.580
The best scores are: opt bits E(32554)
CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14 ( 621) 4134 400.8 2.8e-111
CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16 ( 571) 1181 124.6 3.7e-28
CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16 ( 576) 1169 123.4 8.1e-28
CCDS34897.1 TOX gene_id:9760|Hs108|chr8 ( 526) 926 100.7 5.2e-21
CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20 ( 506) 749 84.1 4.9e-16
CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20 ( 464) 734 82.7 1.2e-15
CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20 ( 488) 618 71.8 2.3e-12
>>CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14 (621 aa)
initn: 4134 init1: 4134 opt: 4134 Z-score: 2111.3 bits: 400.8 E(32554): 2.8e-111
Smith-Waterman score: 4134; 100.0% identity (100.0% similar) in 621 aa overlap (1-621:1-621)
10 20 30 40 50 60
pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFEIPPISLDSDPSLAVSDVVGHFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFEIPPISLDSDPSLAVSDVVGHFD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 DLADPSSSQDGSFSAQYGVQTLDMPVGMTHGLMEQGGGLLSGGLTMDLDHSIGTQYSANP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DLADPSSSQDGSFSAQYGVQTLDMPVGMTHGLMEQGGGLLSGGLTMDLDHSIGTQYSANP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 PVTIDVPMTDMTSGLMGHSQLTTIDQSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PVTIDVPMTDMTSGLMGHSQLTTIDQSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 SSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA0 IKGQNPNATFGEVSKIVASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 IKGQNPNATFGEVSKIVASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA0 ETVELDPAPPSQTPSPPPMATVDPASPAPASIEPPALSPSIVVNSTLSSYVANQASSGAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ETVELDPAPPSQTPSPPPMATVDPASPAPASIEPPALSPSIVVNSTLSSYVANQASSGAG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA0 GQPNITKLIITKQMLPSSITMSQGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GQPNITKLIITKQMLPSSITMSQGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA0 RSVLQAAAAAAAAASMQLPPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RSVLQAAAAAAAAASMQLPPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA0 RINLQQQPPPLQIKSVPLPTLKMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RINLQQQPPPLQIKSVPLPTLKMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEM
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA0 ITDVVPEVESPSQMDVELVSGSPVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ITDVVPEVESPSQMDVELVSGSPVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKH
550 560 570 580 590 600
610 620
pF1KA0 CRDVFLAWVASRNSNTVVFVK
:::::::::::::::::::::
CCDS32 CRDVFLAWVASRNSNTVVFVK
610 620
>>CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16 (571 aa)
initn: 915 init1: 566 opt: 1181 Z-score: 619.1 bits: 124.6 E(32554): 3.7e-28
Smith-Waterman score: 1208; 42.7% identity (67.0% similar) in 548 aa overlap (5-536:27-549)
10 20 30
pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFE
:.:.::.... .. :....::::::::::::::
CCDS54 MKCQPRSGARRIEERLHYLITTYLKFGNNNNYMNMAEANNAFFAASETFHTPSLGDEEFE
10 20 30 40 50 60
40 50 60 70 80 90
pF1KA0 IPPISL--DSDPSLAVSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMP-VGMTHGLMEQ
::::. .:::.:.. ::. :. :.:: :: . :. :. :.::.: . ....:.::
CCDS54 IPPITPPPESDPALGMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLPSITISRNLVEQ
70 80 90 100 110 120
100 110 120 130 140 150
pF1KA0 GGGLLSGGLTMDLDHSIGTQYSANPPVTID--VPMTDMT-SGLMGHSQLTTIDQSELSSQ
: : :.:: :: .:. .:: .: . . : ::: . ::.: .:::::.::.::.:
CCDS54 DGVLHSSGLHMDQSHTQVSQYRQDPSLIMRSIVHMTDAARSGVMPPAQLTTINQSQLSAQ
130 140 150 160 170 180
160 170 180 190 200 210
pF1KA0 LGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAP
:::.:::... . :: :.::::.::..:. ... : . ..: .. ..::: :.:
CCDS54 LGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAI-GEKRAAPDSGKKPKTP
190 200 210 220 230
220 230 240 250 260 270
pF1KA0 KKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQVY
::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQVY
240 250 260 270 280 290
280 290 300 310 320 330
pF1KA0 KRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPASPAPASI
::::::::::::::::::. . .:..:..: .:: . .:. ..
CCDS54 KRKTEAAKKEYLKALAAYRASLVSKAAAESAE------AQT-----IRSVQQ------TL
300 310 320 330 340
340 350 360 370 380
pF1KA0 EPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQM---LP-----SSITMSQG
:. :...:. ::.. . .:: . : .. . : : . :: .:.:.. .
CCDS54 ASTNLTSSLLLNTPLSQHGTVSASPQTL-QQSLPRSIAPKPLTMRLPMNQIVTSVTIA-A
350 360 370 380 390 400
390 400 410 420 430 440
pF1KA0 GMVTVIPATVVTSRGLQL-GQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRL
.: . : : ...: : . :.. .. ..:: :.: . :: .:. .:
CCDS54 NMPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQ-HQMQLQQQQQQQQQQMQQMQQQQL
410 420 430 440 450
450 460 470 480 490 500
pF1KA0 QPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTLK-
: ..:. : ::: .. :: .:: :. :: :: :: . . : :.
CCDS54 QQHQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQ--INQQQLQQQLQ-QRLQLQQLQH
460 470 480 490 500 510
510 520 530 540 550 560
pF1KA0 MQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSGS
:: : . :: . .:: .. .:.: .
CCDS54 MQHQSQPSPRQHSPVASQITSP-IPAIGSPQPASQQHQSQIQSQTQTQVLSQVSIF
520 530 540 550 560 570
570 580 590 600 610 620
pF1KA0 PVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKHCRDVFLAWVASRNSNTVVFVK
>>CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16 (576 aa)
initn: 872 init1: 566 opt: 1169 Z-score: 612.9 bits: 123.4 E(32554): 8.1e-28
Smith-Waterman score: 1196; 42.6% identity (66.8% similar) in 549 aa overlap (5-536:31-554)
10 20 30
pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAE-TFHTPSLG
:.:.::.... .. :....: ::::::::
CCDS54 MDVRFYPAAAGDPASLDFAQCLGYYGYSKFGNNNNYMNMAEANNAFFAASEQTFHTPSLG
10 20 30 40 50 60
40 50 60 70 80 90
pF1KA0 DEEFEIPPISL--DSDPSLAVSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMP-VGMTH
:::::::::. .:::.:.. ::. :. :.:: :: . :. :. :.::.: . ...
CCDS54 DEEFEIPPITPPPESDPALGMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLPSITISR
70 80 90 100 110 120
100 110 120 130 140
pF1KA0 GLMEQGGGLLSGGLTMDLDHSIGTQYSANPPVTID--VPMTDMT-SGLMGHSQLTTIDQS
.:.:: : : :.:: :: .:. .:: .: . . : ::: . ::.: .:::::.::
CCDS54 NLVEQDGVLHSSGLHMDQSHTQVSQYRQDPSLIMRSIVHMTDAARSGVMPPAQLTTINQS
130 140 150 160 170 180
150 160 170 180 190 200
pF1KA0 ELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGK
.::.::::.:::... . :: :.::::.::..:. ... : . ..: .. ..::
CCDS54 QLSAQLGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAI-GEKRAAPDSGK
190 200 210 220 230
210 220 230 240 250 260
pF1KA0 KQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEE
: :.:::.::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEE
240 250 260 270 280 290
270 280 290 300 310 320
pF1KA0 QKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPASP
:::::::::::::::::::::::. . .:..:..: .:: . .:.
CCDS54 QKQVYKRKTEAAKKEYLKALAAYRASLVSKAAAESAE------AQT-----IRSVQQ---
300 310 320 330 340
330 340 350 360 370
pF1KA0 APASIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQM---LP-----SSI
.. :. :...:. ::.. . .:: . : .. . : : . :: .:.
CCDS54 ---TLASTNLTSSLLLNTPLSQHGTVSASPQTL-QQSLPRSIAPKPLTMRLPMNQIVTSV
350 360 370 380 390 400
380 390 400 410 420 430
pF1KA0 TMSQGGMVTVIPATVVTSRGLQL-GQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQL
:.. ..: . : : ...: : . :.. .. ..:: :.: . :: .:.
CCDS54 TIA-ANMPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQ-HQMQLQQQQQQQQQQMQQM
410 420 430 440 450
440 450 460 470 480 490
pF1KA0 PPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPL
.:: ..:. : ::: .. :: .:: :. :: :: :: . . :
CCDS54 QQQQLQQHQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQ--INQQQLQQQLQ-QRLQL
460 470 480 490 500 510
500 510 520 530 540 550
pF1KA0 PTLK-MQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVE
:. :: : . :: . .:: .. .:.: .
CCDS54 QQLQHMQHQSQPSPRQHSPVASQITSP-IPAIGSPQPASQQHQSQIQSQTQTQVLSQVSI
520 530 540 550 560 570
560 570 580 590 600 610
pF1KA0 LVSGSPVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKHCRDVFLAWVASRNSNTV
CCDS54 F
>>CCDS34897.1 TOX gene_id:9760|Hs108|chr8 (526 aa)
initn: 1060 init1: 748 opt: 926 Z-score: 490.6 bits: 100.7 E(32554): 5.2e-21
Smith-Waterman score: 989; 36.5% identity (59.3% similar) in 600 aa overlap (6-594:37-514)
10 20 30
pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDE
:.. :...: ::. .. ..... ::: .:
CCDS34 PPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSLESE
10 20 30 40 50 60
40 50 60 70 80 90
pF1KA0 EFEIPPISLDSDP--SLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGL
.:.::::. : : ::. ...: . . .: : . ..: . . :..:.: . ..
CCDS34 DFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMN-HNGLL--PFHPQNMDLPEITVSNM
70 80 90 100 110 120
100 110 120 130 140
pF1KA0 MEQGGGLLSGGLTM--DLDHSIGTQYSANPPVTIDVPM---TDMTS--GLMGHSQLTTID
. : : :::..... :. . :::::..: .. : .:. . :.: :.:::::.
CCDS34 LGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLTTIN
130 140 150 160 170 180
150 160 170 180 190 200
pF1KA0 QSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEA
::.::.::::..::... . :: :.::::.::.::: .: . ..: . .
CCDS34 QSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPASDM
190 200 210 220 230 240
210 220 230 240 250 260
pF1KA0 GKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLG
::: :.:::.:::::::::::::::::::::::::::::::::::::::::::::::.::
CCDS34 GKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDGLG
250 260 270 280 290 300
270 280 290 300 310 320
pF1KA0 EEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPA
::::::::.::::::::::: ::::. . .. : :.. .: .:: .
CCDS34 EEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDV------KTSQPPQLI-----
310 320 330 340 350
330 340 350 360 370 380
pF1KA0 SPAPASIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQMLPSSITMSQGG
. :. .. :. . : . :::. .: : .:..: : ::
CCDS34 NSKPSVFHGPSQAHSALY---LSSHYHQQP----GMNPHLT------AMHPS--------
360 370 380 390
390 400 410 420 430 440
pF1KA0 MVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRLQP
.: ... .:..: :: :. :.: . ::
CCDS34 ----LPRNIAP--------------KPNNQMP-VTVSI----------ANMAVSPP----
400 410
450 460 470 480 490 500
pF1KA0 PPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKS-VPLPTLKMQ
:::: .:: .:... .:: :: .:::: ... :.:..: . ::...
CCDS34 PPLQI--SPPLHQHLN-MQQHQPL-TMQQPLGNQL---------PMQVQSALHSPTMQQG
420 430 440 450 460
510 520 530 540 550 560
pF1KA0 TTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSGSPV
:: .:. .:. :. : ...:... :
CCDS34 FTL---------------QPDYQTIINPTS-TAAQVVTQAMEYV----------------
470 480 490
570 580 590 600 610 620
pF1KA0 ALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKHCRDVFLAWVASRNSNTVVFVK
::::.::: ::.:.:::.
CCDS34 ---------RSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT
500 510 520
>>CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20 (506 aa)
initn: 699 init1: 528 opt: 749 Z-score: 401.4 bits: 84.1 E(32554): 4.9e-16
Smith-Waterman score: 811; 36.1% identity (61.8% similar) in 477 aa overlap (6-477:36-471)
10 20 30
pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDE
:.. :. .. . .:: ..:.. : ..:
CCDS46 YPSAPAVGARPGAEPAGLAHLDYYHGGKFDGDSAYVGMSDGNPELLSTSQTYNGQSENNE
10 20 30 40 50 60
40 50 60 70 80 90
pF1KA0 EFEIPPISLDS--DPSLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGL
..:::::. . .::: ..: . . .: . . .: . : :. :..:.:. :. ..
CCDS46 DYEIPPITPPNLPEPSLLHLGDHEASYHSLCH-GLTPNGLLPA-YSYQAMDLPAIMVSNM
70 80 90 100 110 120
100 110 120 130 140 150
pF1KA0 MEQGGGLLSGGLT--MDLDHSIGTQYSANPPVTIDVPMTDMTSGLMGHSQLTTIDQSELS
. : . :::: : ... :: . :... : :. . : .: .....::.:
CCDS46 LAQDSHLLSGQLPTIQEMVHSEVAAYDSGRPG----PLLGRPAMLASH--MSALSQSQLI
130 140 150 160 170
160 170 180 190 200 210
pF1KA0 SQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGKKQK
::.:. ..: . :: :.::::.:: .:. : . .. ..: .. ::: :
CCDS46 SQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESE-VHFKISGEKRPSADPGKKAK
180 190 200 210 220 230
220 230 240 250 260 270
pF1KA0 APKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQ
:::.:::::::::::::::::::::::::::::::.::::.::::::::::::::::::
CCDS46 NPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMWDSLGEEQKQ
240 250 260 270 280 290
280 290 300 310 320 330
pF1KA0 VYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPASPAPA
.:::::::::::::::::::. . ... : . ..: . :: . : .: :
CCDS46 AYKRKTEAAKKEYLKALAAYRASLVSKSSP-----DQGETKSTQANPPAKMLPPKQPMYA
300 310 320 330 340
340 350 360 370 380 390
pF1KA0 SIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQMLPSSITMSQGGMVTVI
:.:. :... : :... :::. .... . .:..:: :. .
CCDS46 M---PGLA-SFLTPSDLQAF-----RSGAS-PASLARTLGSKSLLP--------GLSASP
350 360 370 380 390
400 410 420 430 440 450
pF1KA0 PATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRLQPPPLQQ
: : :. . .. : :. ... : .. : . :: : : .
CCDS46 PPP--PSFPLSPTLHQQLSLPPHAQGALLSPPVSMSPAPQPPV----LPTPMALQVQLAM
400 410 420 430 440
460 470 480 490 500 510
pF1KA0 MPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTLKMQTTLVPP
:.:: :. ... : .. .: :
CCDS46 SPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRDKSLY
450 460 470 480 490 500
>>CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20 (464 aa)
initn: 699 init1: 528 opt: 734 Z-score: 394.3 bits: 82.7 E(32554): 1.2e-15
Smith-Waterman score: 796; 36.9% identity (61.3% similar) in 463 aa overlap (20-477:8-429)
10 20 30 40 50
pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFEIPPISLDS--DPSLA-VSDVVG
.:: ..:.. : ..:..:::::. . .::: ..: .
CCDS13 MSDGNPELLSTSQTYNGQSENNEDYEIPPITPPNLPEPSLLHLGDHEA
10 20 30 40
60 70 80 90 100 110
pF1KA0 HFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGLMEQGGGLLSGGLT--MDLDHSIGTQ
. .: . . .: . : :. :..:.:. :. ... : . :::: : ... :: .
CCDS13 SYHSLCH-GLTPNGLLPA-YSYQAMDLPAIMVSNMLAQDSHLLSGQLPTIQEMVHSEVAA
50 60 70 80 90 100
120 130 140 150 160 170
pF1KA0 YSANPPVTIDVPMTDMTSGLMGHSQLTTIDQSELSSQLGLSLGGGTILPPAQSPEDRLST
:... : :. . : .: .....::.: ::.:. ..: . :: :.
CCDS13 YDSGRP----GPLLGRPAMLASH--MSALSQSQLISQMGIR---SSIAHSSPSPPGSKSA
110 120 130 140 150
180 190 200 210 220 230
pF1KA0 TPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAPKKRKKKDPNEPQKPVSAYALFFR
::::.:: .:. : . .. ..: .. ::: : :::.::::::::::::::::::::
CCDS13 TPSPSSSTQEEESE-VHFKISGEKRPSADPGKKAKNPKKKKKKDPNEPQKPVSAYALFFR
160 170 180 190 200 210
240 250 260 270 280 290
pF1KA0 DTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYKDNQE
:::::::::::.::::.::::::::::::::::::.:::::::::::::::::::.
CCDS13 DTQAAIKGQNPSATFGDVSKIVASMWDSLGEEQKQAYKRKTEAAKKEYLKALAAYR----
220 230 240 250 260 270
300 310 320 330 340 350
pF1KA0 CQATVETVELDPAPPSQTPSPPPMATVDPASPAPASIEPPALSPSIVVNSTLSSYVANQA
. : : . ..: . :: . : .: : :.:. :... : :...
CCDS13 -ASLVSKSSPDQGETKSTQANPPAKMLPPKQPMYAM---PGLA-SFLTPSDLQAF-----
280 290 300 310 320
360 370 380 390 400 410
pF1KA0 SSGAGGQPNITKLIITKQMLPSSITMSQGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQ
:::. .... . .:..:: :. . : . : : .. : :
CCDS13 RSGAS-PASLARTLGSKSLLP--------GLSASPPPPPSFPLSPTLHQQ--LSLPPHAQ
330 340 350 360 370
420 430 440 450 460 470
pF1KA0 AQIVTRSVLQAAAAAAAAASMQLPPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQP
. ... : .. : . :: : : . :.:: :. ... : .. .:
CCDS13 GALLSPPVSMSPAPQPPV----LPTPMALQVQLAMSPSPPGPQDFPHISEFPSSSGSCSP
380 390 400 410 420
480 490 500 510 520 530
pF1KA0 PPQKVRINLQQQPPPLQIKSVPLPTLKMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPE
:
CCDS13 GPSNPTSSGDWDSSYPSGECGISTCSLLPRDKSLYLT
430 440 450 460
>>CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20 (488 aa)
initn: 583 init1: 412 opt: 618 Z-score: 335.4 bits: 71.8 E(32554): 2.3e-12
Smith-Waterman score: 649; 32.9% identity (57.1% similar) in 483 aa overlap (3-477:39-453)
10 20
pF1KA0 MEFP---GGNDNYLTITGPSHPFLSGAETFHT
:: :.. :. .. . .:: ..:..
CCDS42 VAGAFSRCLGFCGMRLGLLLLARHWCIAGVFPQKFDGDSAYVGMSDGNPELLSTSQTYNG
10 20 30 40 50 60
30 40 50 60 70 80
pF1KA0 PSLGDEEFEIPPISLDS--DPSLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPV
: ..:..:::::. . .::: ..: . . .: . . .: . : :. :..:.:.
CCDS42 QSENNEDYEIPPITPPNLPEPSLLHLGDHEASYHSLCH-GLTPNGLLPA-YSYQAMDLPA
70 80 90 100 110 120
90 100 110 120 130 140
pF1KA0 GMTHGLMEQGGGLLSGGLT--MDLDHSIGTQYSANPPVTIDVPMTDMTSGLMGHSQLTTI
:. ... : . :::: : ... :: . :... : :. . : .: ....
CCDS42 IMVSNMLAQDSHLLSGQLPTIQEMVHSEVAAYDSGRPG----PLLGRPAMLASH--MSAL
130 140 150 160 170 180
150 160 170 180 190 200
pF1KA0 DQSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVE
.::.: ::.:. ..: . :: :.::::.:: .:. : . .. ..: ..
CCDS42 SQSQLISQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESE-VHFKISGEKRPSAD
190 200 210 220 230
210 220 230 240 250 260
pF1KA0 AGKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSL
::: : :::.:::::::::::::::::::::::::::::::.::::.::::::::::::
CCDS42 PGKKAKNPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMWDSL
240 250 260 270 280 290
270 280 290 300 310 320
pF1KA0 GEEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDP
:::::: . :. : ..: . .: : .. : ::
CCDS42 GEEQKQ------------------SSPDQGETKST----QANP-PAKMLPPKQPMY----
300 310 320
330 340 350 360 370 380
pF1KA0 ASPAPASIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQMLPSSITMSQG
: :. ::. :.:: :... :::. .... . .:..::
CCDS42 AMPGLASF----LTPS-----DLQAF-----RSGAS-PASLARTLGSKSLLP--------
330 340 350 360
390 400 410 420 430 440
pF1KA0 GMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRLQ
:. . : : :. . .. : :. ... : .. : . :: :
CCDS42 GLSASPPPP--PSFPLSPTLHQQLSLPPHAQGALLSPPVSMSPAPQPPV----LPTPMAL
370 380 390 400 410 420
450 460 470 480 490 500
pF1KA0 PPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTLKMQ
: . :.:: :. ... : .. .: :
CCDS42 QVQLAMSPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLP
430 440 450 460 470 480
510 520 530 540 550 560
pF1KA0 TTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSGSPV
CCDS42 RDKSLYLT
621 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 19:37:45 2016 done: Wed Nov 2 19:37:45 2016
Total Scan time: 4.580 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]