FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0808, 526 aa
1>>>pF1KA0808 526 - 526 aa - 526 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.9648+/-0.000882; mu= -1.2273+/- 0.053
mean_var=256.4546+/-51.148, 0's: 0 Z-trim(115.7): 25 B-trim: 0 in 0/51
Lambda= 0.080088
statistics sampled from 16196 (16220) to 16196 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.795), E-opt: 0.2 (0.498), width: 16
Scan time: 3.950
The best scores are: opt bits E(32554)
CCDS34897.1 TOX gene_id:9760|Hs108|chr8 ( 526) 3660 435.7 6.1e-122
CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16 ( 576) 1320 165.4 1.6e-40
CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16 ( 571) 1259 158.3 2.1e-38
CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14 ( 621) 926 119.9 8.7e-27
CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20 ( 506) 906 117.5 3.7e-26
CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20 ( 464) 885 115.1 1.8e-25
CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20 ( 488) 722 96.2 8.9e-20
>>CCDS34897.1 TOX gene_id:9760|Hs108|chr8 (526 aa)
initn: 3660 init1: 3660 opt: 3660 Z-score: 2302.7 bits: 435.7 E(32554): 6.1e-122
Smith-Waterman score: 3660; 100.0% identity (100.0% similar) in 526 aa overlap (1-526:1-526)
10 20 30 40 50 60
pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 PSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLPFHPQNMDLPEITV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLPFHPQNMDLPEITV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 SNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 TINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA0 SDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA0 GLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSKPSVFH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSKPSVFH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA0 GPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVSPPPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVSPPPP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA0 LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQTIINPTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQTIINPTS
430 440 450 460 470 480
490 500 510 520
pF1KA0 TAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT
::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT
490 500 510 520
>>CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16 (576 aa)
initn: 924 init1: 641 opt: 1320 Z-score: 840.9 bits: 165.4 E(32554): 1.6e-40
Smith-Waterman score: 1328; 49.2% identity (69.6% similar) in 494 aa overlap (1-464:1-476)
10 20 30 40 50
pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPAS-QSYP
::::::: ::: : : . :: : .:: ..: ::.:.: .. . :: :..
CCDS54 MDVRFYP-----AAAGDPASLDFAQCLGYYGYSKFGNNNNYMNMAEANNAFFAASEQTFH
10 20 30 40 50
60 70 80 90 100 110
pF1KA0 GPSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNG--LLP-FHPQNMDLP
::: .:.:.::::::: : .: . .: ...: :. .: . : : ::..:::
CCDS54 TPSLGDEEFEIPPITPPPESDPAL-GMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KA0 EITVS-NMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMP
::.: :.. :::.: :... . : . . .:: . :.. :: . .: .. :.::
CCDS54 SITISRNLVEQDGVLHSSGLHM--DQSHTQVSQYRQDPSLI-MRSIVHMTDAARS-GVMP
120 130 140 150 160 170
180 190 200 210 220 230
pF1KA0 HGQLTTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGG
.:::::::::::::::::.::...::.:::::.:::::::::::..:...:.... :
CCDS54 PAQLTTINQSQLSAQLGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAIG-
180 190 200 210 220
240 250 260 270 280 290
pF1KA0 EKRPASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIV
::: : : ::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EKRAAPDSGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIV
230 240 250 260 270 280
300 310 320 330 340 350
pF1KA0 ASMWDGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSK
:::::.::::::::::.::::::::::: :::::::::::. .: ....: . : ..
CCDS54 ASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYRASLVSKAAAESAEAQTIRSVQQTLAS
290 300 310 320 330 340
360 370 380 390 400
pF1KA0 PSVFHGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKP------NNQMPVTVS
.. :.: :.. :. .. ... ::::.::::: ::. ..:.
CCDS54 TNLT-------SSLLLNTPLSQHGTVSASPQTLQQSLPRSIAPKPLTMRLPMNQIVTSVT
350 360 370 380 390 400
410 420 430 440 450
pF1KA0 IA-NMA--VSPP-------------PPLQISPPLH--QH-LNMQQHQPLTMQQPLGNQLP
:: :: .. : : :.:: .. :: ...::.: .:: :
CCDS54 IAANMPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQHQMQLQQQQQQQQQQMQQMQQQ
410 420 430 440 450 460
460 470 480 490 500 510
pF1KA0 MQVQSALHSPTMQQGFTLQPDYQTIINPTSTAAQVVTQAMEYVRSGCRNPPPQPVDWNND
. : .:. .::
CCDS54 QLQQHQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQINQQQLQQQLQQRLQLQQLQHM
470 480 490 500 510 520
>>CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16 (571 aa)
initn: 925 init1: 641 opt: 1259 Z-score: 802.9 bits: 158.3 E(32554): 2.1e-38
Smith-Waterman score: 1267; 49.3% identity (71.1% similar) in 460 aa overlap (34-464:25-471)
10 20 30 40 50 60
pF1KA0 RFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSL
:: ..: ::.:.: .. . ::... :::
CCDS54 MKCQPRSGARRIEERLHYLITTYLKFGNNNNYMNMAEANNAFFAASETFHTPSL
10 20 30 40 50
70 80 90 100 110 120
pF1KA0 ESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNG--LLP-FHPQNMDLPEITV
.:.:.::::::: : .: . .: ...: :. .: . : : ::..::: ::.
CCDS54 GDEEFEIPPITPPPESDPAL-GMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLPSITI
60 70 80 90 100 110
130 140 150 160 170
pF1KA0 S-NMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQL
: :.. :::.: :... . : . . .:: . :.. :: . .: .. :.:: .::
CCDS54 SRNLVEQDGVLHSSGLHM--DQSHTQVSQYRQDPSLI-MRSIVHMTDAARS-GVMPPAQL
120 130 140 150 160
180 190 200 210 220 230
pF1KA0 TTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRP
:::::::::::::::.::...::.:::::.:::::::::::..:...:.... : :::
CCDS54 TTINQSQLSAQLGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAIG-EKRA
170 180 190 200 210 220
240 250 260 270 280 290
pF1KA0 ASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMW
: : ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 APDSGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMW
230 240 250 260 270 280
300 310 320 330 340 350
pF1KA0 DGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSKPSVF
:.::::::::::.::::::::::: :::::::::::. .: ....: . : .. ..
CCDS54 DSLGEEQKQVYKRKTEAAKKEYLKALAAYRASLVSKAAAESAEAQTIRSVQQTLASTNLT
290 300 310 320 330 340
360 370 380 390 400 410
pF1KA0 HGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKP------NNQMPVTVSIA-N
:.: :.. :. .. ... ::::.::::: ::. ..:.:: :
CCDS54 -------SSLLLNTPLSQHGTVSASPQTLQQSLPRSIAPKPLTMRLPMNQIVTSVTIAAN
350 360 370 380 390 400
420 430 440 450
pF1KA0 MA--VSPP-------------PPLQISPPLH--QH-LNMQQHQPLTMQQPLGNQLPMQVQ
: .. : : :.:: .. :: ...::.: .:: : . :
CCDS54 MPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQHQMQLQQQQQQQQQQMQQMQQQQLQQ
410 420 430 440 450 460
460 470 480 490 500 510
pF1KA0 SALHSPTMQQGFTLQPDYQTIINPTSTAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSS
.:. .::
CCDS54 HQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQINQQQLQQQLQQRLQLQQLQHMQHQS
470 480 490 500 510 520
>>CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14 (621 aa)
initn: 1060 init1: 748 opt: 926 Z-score: 594.4 bits: 119.9 E(32554): 8.7e-27
Smith-Waterman score: 962; 38.8% identity (64.6% similar) in 492 aa overlap (37-508:6-483)
10 20 30 40 50 60
pF1KA0 PPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSLESE
:.. :...: ::. .. ..... ::: .:
CCDS32 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDE
10 20 30
70 80 90 100 110 120
pF1KA0 DFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMN-HNGLLP--FHPQNMDLPEITVSNM
.:.::::. : : ::. ...: . . .: : . ..: . . :..:.: . ..
CCDS32 EFEIPPISLDS--DPSLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGL
40 50 60 70 80 90
130 140 150 160 170 180
pF1KA0 LGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLTTIN
. : : :::..... :. . :::::..: .. : .:. . :.: :.:::::.
CCDS32 MEQGGGLLSGGLTM--DLDHSIGTQYSANPPVTIDVPM---TDMTS--GLMGHSQLTTID
100 110 120 130 140
190 200 210 220 230 240
pF1KA0 QSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPASDM
::.::.::::..::... . :: :.::::.::.::: .: . ..: . .
CCDS32 QSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEA
150 160 170 180 190 200
250 260 270 280 290 300
pF1KA0 GKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDGLG
::: :.:::.:::::::::::::::::::::::::::::::::::::::::::::::.::
CCDS32 GKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLG
210 220 230 240 250 260
310 320 330 340 350
pF1KA0 EEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDV------KTSQPPQLI-----
::::::::.::::::::::: ::::. . .. : :.. .: .:: .
CCDS32 EEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPA
270 280 290 300 310 320
360 370 380 390 400
pF1KA0 NSKPSVFHGPSQAHSALY---LSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVS
. :. .. :. . : . :::. .: . . .. .:.. . : : .:.:
CCDS32 SPAPASIEPPALSPSIVVNSTLSSYVANQASSG---AGGQPNITKLIITKQMLPSSITMS
330 340 350 360 370 380
410 420 430 440 450 460
pF1KA0 IANMAVSPPPPLQISPPLHQ-HLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQ-QGFT
..:.. : . : :. . . :: . : . .. . . .: . .::
CCDS32 QGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPR
390 400 410 420 430 440
470 480 490 500 510 520
pF1KA0 LQPD-YQTIINPTSTAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT
::: : . .: : ::. . .. ..:::: : :
CCDS32 LQPPPLQQMPQPP-TQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTL
450 460 470 480 490 500
CCDS32 KMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSG
510 520 530 540 550 560
>>CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20 (506 aa)
initn: 1110 init1: 629 opt: 906 Z-score: 583.2 bits: 117.5 E(32554): 3.7e-26
Smith-Waterman score: 1389; 46.1% identity (69.5% similar) in 544 aa overlap (1-526:1-506)
10 20 30 40 50 60
pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPG
::::.:: .: : : : . :: :. .::::.. :..:.. . . . .::.: :
CCDS46 MDVRLYPSAPAVGARPGAEPAGLAH-LDYYHGGKFDGDSAYVGMSDGNPELLSTSQTYNG
10 20 30 40 50
70 80 90 100 110
pF1KA0 PSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLP-FHPQNMDLPEIT
: ..::..:::::::.::. ::.::.. :..:::::: .. ::::: . : :::: :
CCDS46 QSENNEDYEIPPITPPNLPEPSLLHLGDHEASYHSLCHGLTPNGLLPAYSYQAMDLPAIM
60 70 80 90 100 110
120 130 140 150 160 170
pF1KA0 VSNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQL
:::::.::. :::.. .: : : : ..::. :.:. . .:.:. ...
CCDS46 VSNMLAQDSHLLSGQ---LPTI------QEMVHSEVAAY-DSGRPGPLLGRPAMLA-SHM
120 130 140 150 160
180 190 200 210 220 230
pF1KA0 TTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRP
....:::: .:.:. :.. :.:::::::::::::::::..:.:.. ::.: ::::
CCDS46 SALSQSQLISQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESEVHFKISG-EKRP
170 180 190 200 210 220
240 250 260 270 280 290
pF1KA0 ASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMW
..: ::: :.:::::::::::::::::::::::::::::::::::.::::.:::::::::
CCDS46 SADPGKKAKNPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMW
230 240 250 260 270 280
300 310 320 330 340 350
pF1KA0 DGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQ--PP-QLINSKP
:.:::::::.::.::::::::::: :::::::::::: . ..:..: :: ... :
CCDS46 DSLGEEQKQAYKRKTEAAKKEYLKALAAYRASLVSKSSPDQGETKSTQANPPAKMLPPKQ
290 300 310 320 330 340
360 370 380 390 400 410
pF1KA0 SVFHGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVS
.. :. : : : :. . : .: :: :... : . .: ....:
CCDS46 PMYAMPGLA-SFLTPSDLQAFRSGASP------ASLARTLGSK--SLLP------GLSAS
350 360 370 380
420 430 440 450 460 470
pF1KA0 PPPP--LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQT
:::: . .:: :::.:.. : .. .: :.... : . :.. ..:: :
CCDS46 PPPPPSFPLSPTLHQQLSLPPHAQGALLSP-----PVSMSPAPQPPVLPTPMALQ--VQL
390 400 410 420 430 440
480 490 500 510 520
pF1KA0 IINPTSTAAQVVTQAMEYVRSG--CRNPPPQPV---DWNNDY----C---SSGGMQRDKA
..:. . : . :. :. : : .:. ::...: : . . . :::.
CCDS46 AMSPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRDKS
450 460 470 480 490 500
pF1KA0 LYLT
::::
CCDS46 LYLT
>>CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20 (464 aa)
initn: 1052 init1: 629 opt: 885 Z-score: 570.6 bits: 115.1 E(32554): 1.8e-25
Smith-Waterman score: 1291; 46.5% identity (70.1% similar) in 501 aa overlap (44-526:1-464)
20 30 40 50 60 70
pF1KA0 AAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSLESEDFNIPPI
:.. . . . .::.: : : ..::..::::
CCDS13 MSDGNPELLSTSQTYNGQSENNEDYEIPPI
10 20 30
80 90 100 110 120 130
pF1KA0 TPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLP-FHPQNMDLPEITVSNMLGQDGTLLS
:::.::. ::.::.. :..:::::: .. ::::: . : :::: : :::::.::. :::
CCDS13 TPPNLPEPSLLHLGDHEASYHSLCHGLTPNGLLPAYSYQAMDLPAIMVSNMLAQDSHLLS
40 50 60 70 80 90
140 150 160 170 180 190
pF1KA0 NSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLTTINQSQLSAQLG
.. .: : : : ..::. :.:. . .:.:. .......:::: .:.:
CCDS13 GQ---LPTI------QEMVHSEVAAY-DSGRPGPLLGRPAMLA-SHMSALSQSQLISQMG
100 110 120 130
200 210 220 230 240 250
pF1KA0 LNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPASDMGKKPKTPKK
. :.. :.:::::::::::::::::..:.:.. ::.: ::::..: ::: :.:::
CCDS13 IR---SSIAHSSPSPPGSKSATPSPSSSTQEEESEVHFKISG-EKRPSADPGKKAKNPKK
140 150 160 170 180 190
260 270 280 290 300 310
pF1KA0 KKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDGLGEEQKQVYKK
::::::::::::::::::::::::::::::::.::::.::::::::::.:::::::.::.
CCDS13 KKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMWDSLGEEQKQAYKR
200 210 220 230 240 250
320 330 340 350 360
pF1KA0 KTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQ--PP-QLINSKPSVFHGPSQAHSAL
::::::::::: :::::::::::: . ..:..: :: ... : .. :. : : :
CCDS13 KTEAAKKEYLKALAAYRASLVSKSSPDQGETKSTQANPPAKMLPPKQPMYAMPGLA-SFL
260 270 280 290 300 310
370 380 390 400 410 420
pF1KA0 YLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVSPPPP--LQISPPL
:. . : .: :: :... : . .: ....::::: . .:: :
CCDS13 TPSDLQAFRSGASP------ASLARTLGSK--SLLP------GLSASPPPPPSFPLSPTL
320 330 340 350 360
430 440 450 460 470 480
pF1KA0 HQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQTIINPTSTAAQVVT
::.:.. : .. .: :.... : . :.. ..:: : ..:. . :
CCDS13 HQQLSLPPHAQGALLSP-----PVSMSPAPQPPVLPTPMALQ--VQLAMSPSPPGPQDFP
370 380 390 400 410
490 500 510 520
pF1KA0 QAMEYVRSG--CRNPPPQPV---DWNNDY----C---SSGGMQRDKALYLT
. :. :. : : .:. ::...: : . . . :::.::::
CCDS13 HISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRDKSLYLT
420 430 440 450 460
>>CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20 (488 aa)
initn: 934 init1: 470 opt: 722 Z-score: 468.5 bits: 96.2 E(32554): 8.9e-20
Smith-Waterman score: 1145; 41.3% identity (65.5% similar) in 516 aa overlap (26-526:34-488)
10 20 30 40 50
pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPAS
:. . .::::.. :..:.. . . . .:
CCDS42 TRTEAVAGAFSRCLGFCGMRLGLLLLARHWCIAGVFPQKFDGDSAYVGMSDGNPELLSTS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KA0 QSYPGPSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLP-FHPQNMD
:.: : : ..::..:::::::.::. ::.::.. :..:::::: .. ::::: . : ::
CCDS42 QTYNGQSENNEDYEIPPITPPNLPEPSLLHLGDHEASYHSLCHGLTPNGLLPAYSYQAMD
70 80 90 100 110 120
120 130 140 150 160 170
pF1KA0 LPEITVSNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMM
:: : :::::.::. :::.. .: : : : ..::. :.:. . .:.:.
CCDS42 LPAIMVSNMLAQDSHLLSGQ---LPTI------QEMVHSEVAAY-DSGRPGPLLGRPAML
130 140 150 160 170
180 190 200 210 220 230
pF1KA0 PHGQLTTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKING
.......:::: .:.:. :.. :.:::::::::::::::::..:.:.. ::.:
CCDS42 A-SHMSALSQSQLISQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESEVHFKISG
180 190 200 210 220
240 250 260 270 280 290
pF1KA0 GEKRPASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKI
::::..: ::: :.:::::::::::::::::::::::::::::::::::.::::.::::
CCDS42 -EKRPSADPGKKAKNPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKI
230 240 250 260 270 280
300 310 320 330 340 350
pF1KA0 VASMWDGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINS
::::::.::::::: : . .: ..... : ...
CCDS42 VASMWDSLGEEQKQS------------------------SPDQGETKSTQANPPAKMLPP
290 300 310 320
360 370 380 390 400 410
pF1KA0 KPSVFHGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMA
: .. :. : : : :. . : .: :: :... : . .: ...
CCDS42 KQPMYAMPGLA-SFLTPSDLQAFRSGASP------ASLARTLGSK--SLLP------GLS
330 340 350 360
420 430 440 450 460 470
pF1KA0 VSPPPP--LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDY
.::::: . .:: :::.:.. : .. .: :.... : . :.. ..::
CCDS42 ASPPPPPSFPLSPTLHQQLSLPPHAQGALLSP-----PVSMSPAPQPPVLPTPMALQ--V
370 380 390 400 410 420
480 490 500 510 520
pF1KA0 QTIINPTSTAAQVVTQAMEYVRSG--CRNPPPQPV---DWNNDY----C---SSGGMQRD
: ..:. . : . :. :. : : .:. ::...: : . . . ::
CCDS42 QLAMSPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRD
430 440 450 460 470 480
pF1KA0 KALYLT
:.::::
CCDS42 KSLYLT
526 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 19:45:50 2016 done: Wed Nov 2 19:45:51 2016
Total Scan time: 3.950 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]