FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0808, 526 aa 1>>>pF1KA0808 526 - 526 aa - 526 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.9648+/-0.000882; mu= -1.2273+/- 0.053 mean_var=256.4546+/-51.148, 0's: 0 Z-trim(115.7): 25 B-trim: 0 in 0/51 Lambda= 0.080088 statistics sampled from 16196 (16220) to 16196 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.795), E-opt: 0.2 (0.498), width: 16 Scan time: 3.950 The best scores are: opt bits E(32554) CCDS34897.1 TOX gene_id:9760|Hs108|chr8 ( 526) 3660 435.7 6.1e-122 CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16 ( 576) 1320 165.4 1.6e-40 CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16 ( 571) 1259 158.3 2.1e-38 CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14 ( 621) 926 119.9 8.7e-27 CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20 ( 506) 906 117.5 3.7e-26 CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20 ( 464) 885 115.1 1.8e-25 CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20 ( 488) 722 96.2 8.9e-20 >>CCDS34897.1 TOX gene_id:9760|Hs108|chr8 (526 aa) initn: 3660 init1: 3660 opt: 3660 Z-score: 2302.7 bits: 435.7 E(32554): 6.1e-122 Smith-Waterman score: 3660; 100.0% identity (100.0% similar) in 526 aa overlap (1-526:1-526) 10 20 30 40 50 60 pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 PSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLPFHPQNMDLPEITV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLPFHPQNMDLPEITV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 SNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 TINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 SDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 GLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSKPSVFH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSKPSVFH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 GPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVSPPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVSPPPP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA0 LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQTIINPTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQTIINPTS 430 440 450 460 470 480 490 500 510 520 pF1KA0 TAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT :::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT 490 500 510 520 >>CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16 (576 aa) initn: 924 init1: 641 opt: 1320 Z-score: 840.9 bits: 165.4 E(32554): 1.6e-40 Smith-Waterman score: 1328; 49.2% identity (69.6% similar) in 494 aa overlap (1-464:1-476) 10 20 30 40 50 pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPAS-QSYP ::::::: ::: : : . :: : .:: ..: ::.:.: .. . :: :.. CCDS54 MDVRFYP-----AAAGDPASLDFAQCLGYYGYSKFGNNNNYMNMAEANNAFFAASEQTFH 10 20 30 40 50 60 70 80 90 100 110 pF1KA0 GPSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNG--LLP-FHPQNMDLP ::: .:.:.::::::: : .: . .: ...: :. .: . : : ::..::: CCDS54 TPSLGDEEFEIPPITPPPESDPAL-GMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KA0 EITVS-NMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMP ::.: :.. :::.: :... . : . . .:: . :.. :: . .: .. :.:: CCDS54 SITISRNLVEQDGVLHSSGLHM--DQSHTQVSQYRQDPSLI-MRSIVHMTDAARS-GVMP 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA0 HGQLTTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGG .:::::::::::::::::.::...::.:::::.:::::::::::..:...:.... : CCDS54 PAQLTTINQSQLSAQLGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAIG- 180 190 200 210 220 240 250 260 270 280 290 pF1KA0 EKRPASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIV ::: : : :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EKRAAPDSGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIV 230 240 250 260 270 280 300 310 320 330 340 350 pF1KA0 ASMWDGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSK :::::.::::::::::.::::::::::: :::::::::::. .: ....: . : .. CCDS54 ASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYRASLVSKAAAESAEAQTIRSVQQTLAS 290 300 310 320 330 340 360 370 380 390 400 pF1KA0 PSVFHGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKP------NNQMPVTVS .. :.: :.. :. .. ... ::::.::::: ::. ..:. CCDS54 TNLT-------SSLLLNTPLSQHGTVSASPQTLQQSLPRSIAPKPLTMRLPMNQIVTSVT 350 360 370 380 390 400 410 420 430 440 450 pF1KA0 IA-NMA--VSPP-------------PPLQISPPLH--QH-LNMQQHQPLTMQQPLGNQLP :: :: .. : : :.:: .. :: ...::.: .:: : CCDS54 IAANMPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQHQMQLQQQQQQQQQQMQQMQQQ 410 420 430 440 450 460 460 470 480 490 500 510 pF1KA0 MQVQSALHSPTMQQGFTLQPDYQTIINPTSTAAQVVTQAMEYVRSGCRNPPPQPVDWNND . : .:. .:: CCDS54 QLQQHQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQINQQQLQQQLQQRLQLQQLQHM 470 480 490 500 510 520 >>CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16 (571 aa) initn: 925 init1: 641 opt: 1259 Z-score: 802.9 bits: 158.3 E(32554): 2.1e-38 Smith-Waterman score: 1267; 49.3% identity (71.1% similar) in 460 aa overlap (34-464:25-471) 10 20 30 40 50 60 pF1KA0 RFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSL :: ..: ::.:.: .. . ::... ::: CCDS54 MKCQPRSGARRIEERLHYLITTYLKFGNNNNYMNMAEANNAFFAASETFHTPSL 10 20 30 40 50 70 80 90 100 110 120 pF1KA0 ESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNG--LLP-FHPQNMDLPEITV .:.:.::::::: : .: . .: ...: :. .: . : : ::..::: ::. CCDS54 GDEEFEIPPITPPPESDPAL-GMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLPSITI 60 70 80 90 100 110 130 140 150 160 170 pF1KA0 S-NMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQL : :.. :::.: :... . : . . .:: . :.. :: . .: .. :.:: .:: CCDS54 SRNLVEQDGVLHSSGLHM--DQSHTQVSQYRQDPSLI-MRSIVHMTDAARS-GVMPPAQL 120 130 140 150 160 180 190 200 210 220 230 pF1KA0 TTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRP :::::::::::::::.::...::.:::::.:::::::::::..:...:.... : ::: CCDS54 TTINQSQLSAQLGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAIG-EKRA 170 180 190 200 210 220 240 250 260 270 280 290 pF1KA0 ASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMW : : :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 APDSGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMW 230 240 250 260 270 280 300 310 320 330 340 350 pF1KA0 DGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINSKPSVF :.::::::::::.::::::::::: :::::::::::. .: ....: . : .. .. CCDS54 DSLGEEQKQVYKRKTEAAKKEYLKALAAYRASLVSKAAAESAEAQTIRSVQQTLASTNLT 290 300 310 320 330 340 360 370 380 390 400 410 pF1KA0 HGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKP------NNQMPVTVSIA-N :.: :.. :. .. ... ::::.::::: ::. ..:.:: : CCDS54 -------SSLLLNTPLSQHGTVSASPQTLQQSLPRSIAPKPLTMRLPMNQIVTSVTIAAN 350 360 370 380 390 400 420 430 440 450 pF1KA0 MA--VSPP-------------PPLQISPPLH--QH-LNMQQHQPLTMQQPLGNQLPMQVQ : .. : : :.:: .. :: ...::.: .:: : . : CCDS54 MPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQHQMQLQQQQQQQQQQMQQMQQQQLQQ 410 420 430 440 450 460 460 470 480 490 500 510 pF1KA0 SALHSPTMQQGFTLQPDYQTIINPTSTAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSS .:. .:: CCDS54 HQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQINQQQLQQQLQQRLQLQQLQHMQHQS 470 480 490 500 510 520 >>CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14 (621 aa) initn: 1060 init1: 748 opt: 926 Z-score: 594.4 bits: 119.9 E(32554): 8.7e-27 Smith-Waterman score: 962; 38.8% identity (64.6% similar) in 492 aa overlap (37-508:6-483) 10 20 30 40 50 60 pF1KA0 PPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSLESE :.. :...: ::. .. ..... ::: .: CCDS32 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDE 10 20 30 70 80 90 100 110 120 pF1KA0 DFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMN-HNGLLP--FHPQNMDLPEITVSNM .:.::::. : : ::. ...: . . .: : . ..: . . :..:.: . .. CCDS32 EFEIPPISLDS--DPSLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGL 40 50 60 70 80 90 130 140 150 160 170 180 pF1KA0 LGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLTTIN . : : :::..... :. . :::::..: .. : .:. . :.: :.:::::. CCDS32 MEQGGGLLSGGLTM--DLDHSIGTQYSANPPVTIDVPM---TDMTS--GLMGHSQLTTID 100 110 120 130 140 190 200 210 220 230 240 pF1KA0 QSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPASDM ::.::.::::..::... . :: :.::::.::.::: .: . ..: . . CCDS32 QSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEA 150 160 170 180 190 200 250 260 270 280 290 300 pF1KA0 GKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDGLG ::: :.:::.:::::::::::::::::::::::::::::::::::::::::::::::.:: CCDS32 GKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLG 210 220 230 240 250 260 310 320 330 340 350 pF1KA0 EEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDV------KTSQPPQLI----- ::::::::.::::::::::: ::::. . .. : :.. .: .:: . CCDS32 EEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPA 270 280 290 300 310 320 360 370 380 390 400 pF1KA0 NSKPSVFHGPSQAHSALY---LSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVS . :. .. :. . : . :::. .: . . .. .:.. . : : .:.: CCDS32 SPAPASIEPPALSPSIVVNSTLSSYVANQASSG---AGGQPNITKLIITKQMLPSSITMS 330 340 350 360 370 380 410 420 430 440 450 460 pF1KA0 IANMAVSPPPPLQISPPLHQ-HLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQ-QGFT ..:.. : . : :. . . :: . : . .. . . .: . .:: CCDS32 QGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPR 390 400 410 420 430 440 470 480 490 500 510 520 pF1KA0 LQPD-YQTIINPTSTAAQVVTQAMEYVRSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT ::: : . .: : ::. . .. ..:::: : : CCDS32 LQPPPLQQMPQPP-TQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTL 450 460 470 480 490 500 CCDS32 KMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSG 510 520 530 540 550 560 >>CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20 (506 aa) initn: 1110 init1: 629 opt: 906 Z-score: 583.2 bits: 117.5 E(32554): 3.7e-26 Smith-Waterman score: 1389; 46.1% identity (69.5% similar) in 544 aa overlap (1-526:1-506) 10 20 30 40 50 60 pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPG ::::.:: .: : : : . :: :. .::::.. :..:.. . . . .::.: : CCDS46 MDVRLYPSAPAVGARPGAEPAGLAH-LDYYHGGKFDGDSAYVGMSDGNPELLSTSQTYNG 10 20 30 40 50 70 80 90 100 110 pF1KA0 PSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLP-FHPQNMDLPEIT : ..::..:::::::.::. ::.::.. :..:::::: .. ::::: . : :::: : CCDS46 QSENNEDYEIPPITPPNLPEPSLLHLGDHEASYHSLCHGLTPNGLLPAYSYQAMDLPAIM 60 70 80 90 100 110 120 130 140 150 160 170 pF1KA0 VSNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQL :::::.::. :::.. .: : : : ..::. :.:. . .:.:. ... CCDS46 VSNMLAQDSHLLSGQ---LPTI------QEMVHSEVAAY-DSGRPGPLLGRPAMLA-SHM 120 130 140 150 160 180 190 200 210 220 230 pF1KA0 TTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRP ....:::: .:.:. :.. :.:::::::::::::::::..:.:.. ::.: :::: CCDS46 SALSQSQLISQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESEVHFKISG-EKRP 170 180 190 200 210 220 240 250 260 270 280 290 pF1KA0 ASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMW ..: ::: :.:::::::::::::::::::::::::::::::::::.::::.::::::::: CCDS46 SADPGKKAKNPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMW 230 240 250 260 270 280 300 310 320 330 340 350 pF1KA0 DGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQ--PP-QLINSKP :.:::::::.::.::::::::::: :::::::::::: . ..:..: :: ... : CCDS46 DSLGEEQKQAYKRKTEAAKKEYLKALAAYRASLVSKSSPDQGETKSTQANPPAKMLPPKQ 290 300 310 320 330 340 360 370 380 390 400 410 pF1KA0 SVFHGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVS .. :. : : : :. . : .: :: :... : . .: ....: CCDS46 PMYAMPGLA-SFLTPSDLQAFRSGASP------ASLARTLGSK--SLLP------GLSAS 350 360 370 380 420 430 440 450 460 470 pF1KA0 PPPP--LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQT :::: . .:: :::.:.. : .. .: :.... : . :.. ..:: : CCDS46 PPPPPSFPLSPTLHQQLSLPPHAQGALLSP-----PVSMSPAPQPPVLPTPMALQ--VQL 390 400 410 420 430 440 480 490 500 510 520 pF1KA0 IINPTSTAAQVVTQAMEYVRSG--CRNPPPQPV---DWNNDY----C---SSGGMQRDKA ..:. . : . :. :. : : .:. ::...: : . . . :::. CCDS46 AMSPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRDKS 450 460 470 480 490 500 pF1KA0 LYLT :::: CCDS46 LYLT >>CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20 (464 aa) initn: 1052 init1: 629 opt: 885 Z-score: 570.6 bits: 115.1 E(32554): 1.8e-25 Smith-Waterman score: 1291; 46.5% identity (70.1% similar) in 501 aa overlap (44-526:1-464) 20 30 40 50 60 70 pF1KA0 AAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSLESEDFNIPPI :.. . . . .::.: : : ..::..:::: CCDS13 MSDGNPELLSTSQTYNGQSENNEDYEIPPI 10 20 30 80 90 100 110 120 130 pF1KA0 TPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLP-FHPQNMDLPEITVSNMLGQDGTLLS :::.::. ::.::.. :..:::::: .. ::::: . : :::: : :::::.::. ::: CCDS13 TPPNLPEPSLLHLGDHEASYHSLCHGLTPNGLLPAYSYQAMDLPAIMVSNMLAQDSHLLS 40 50 60 70 80 90 140 150 160 170 180 190 pF1KA0 NSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLTTINQSQLSAQLG .. .: : : : ..::. :.:. . .:.:. .......:::: .:.: CCDS13 GQ---LPTI------QEMVHSEVAAY-DSGRPGPLLGRPAMLA-SHMSALSQSQLISQMG 100 110 120 130 200 210 220 230 240 250 pF1KA0 LNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPASDMGKKPKTPKK . :.. :.:::::::::::::::::..:.:.. ::.: ::::..: ::: :.::: CCDS13 IR---SSIAHSSPSPPGSKSATPSPSSSTQEEESEVHFKISG-EKRPSADPGKKAKNPKK 140 150 160 170 180 190 260 270 280 290 300 310 pF1KA0 KKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDGLGEEQKQVYKK ::::::::::::::::::::::::::::::::.::::.::::::::::.:::::::.::. CCDS13 KKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMWDSLGEEQKQAYKR 200 210 220 230 240 250 320 330 340 350 360 pF1KA0 KTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQ--PP-QLINSKPSVFHGPSQAHSAL ::::::::::: :::::::::::: . ..:..: :: ... : .. :. : : : CCDS13 KTEAAKKEYLKALAAYRASLVSKSSPDQGETKSTQANPPAKMLPPKQPMYAMPGLA-SFL 260 270 280 290 300 310 370 380 390 400 410 420 pF1KA0 YLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMAVSPPPP--LQISPPL :. . : .: :: :... : . .: ....::::: . .:: : CCDS13 TPSDLQAFRSGASP------ASLARTLGSK--SLLP------GLSASPPPPPSFPLSPTL 320 330 340 350 360 430 440 450 460 470 480 pF1KA0 HQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDYQTIINPTSTAAQVVT ::.:.. : .. .: :.... : . :.. ..:: : ..:. . : CCDS13 HQQLSLPPHAQGALLSP-----PVSMSPAPQPPVLPTPMALQ--VQLAMSPSPPGPQDFP 370 380 390 400 410 490 500 510 520 pF1KA0 QAMEYVRSG--CRNPPPQPV---DWNNDY----C---SSGGMQRDKALYLT . :. :. : : .:. ::...: : . . . :::.:::: CCDS13 HISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRDKSLYLT 420 430 440 450 460 >>CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20 (488 aa) initn: 934 init1: 470 opt: 722 Z-score: 468.5 bits: 96.2 E(32554): 8.9e-20 Smith-Waterman score: 1145; 41.3% identity (65.5% similar) in 516 aa overlap (26-526:34-488) 10 20 30 40 50 pF1KA0 MDVRFYPPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPAS :. . .::::.. :..:.. . . . .: CCDS42 TRTEAVAGAFSRCLGFCGMRLGLLLLARHWCIAGVFPQKFDGDSAYVGMSDGNPELLSTS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KA0 QSYPGPSLESEDFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMNHNGLLP-FHPQNMD :.: : : ..::..:::::::.::. ::.::.. :..:::::: .. ::::: . : :: CCDS42 QTYNGQSENNEDYEIPPITPPNLPEPSLLHLGDHEASYHSLCHGLTPNGLLPAYSYQAMD 70 80 90 100 110 120 120 130 140 150 160 170 pF1KA0 LPEITVSNMLGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMM :: : :::::.::. :::.. .: : : : ..::. :.:. . .:.:. CCDS42 LPAIMVSNMLAQDSHLLSGQ---LPTI------QEMVHSEVAAY-DSGRPGPLLGRPAML 130 140 150 160 170 180 190 200 210 220 230 pF1KA0 PHGQLTTINQSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKING .......:::: .:.:. :.. :.:::::::::::::::::..:.:.. ::.: CCDS42 A-SHMSALSQSQLISQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESEVHFKISG 180 190 200 210 220 240 250 260 270 280 290 pF1KA0 GEKRPASDMGKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKI ::::..: ::: :.:::::::::::::::::::::::::::::::::::.::::.:::: CCDS42 -EKRPSADPGKKAKNPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKI 230 240 250 260 270 280 300 310 320 330 340 350 pF1KA0 VASMWDGLGEEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDVKTSQPPQLINS ::::::.::::::: : . .: ..... : ... CCDS42 VASMWDSLGEEQKQS------------------------SPDQGETKSTQANPPAKMLPP 290 300 310 320 360 370 380 390 400 410 pF1KA0 KPSVFHGPSQAHSALYLSSHYHQQPGMNPHLTAMHPSLPRNIAPKPNNQMPVTVSIANMA : .. :. : : : :. . : .: :: :... : . .: ... CCDS42 KQPMYAMPGLA-SFLTPSDLQAFRSGASP------ASLARTLGSK--SLLP------GLS 330 340 350 360 420 430 440 450 460 470 pF1KA0 VSPPPP--LQISPPLHQHLNMQQHQPLTMQQPLGNQLPMQVQSALHSPTMQQGFTLQPDY .::::: . .:: :::.:.. : .. .: :.... : . :.. ..:: CCDS42 ASPPPPPSFPLSPTLHQQLSLPPHAQGALLSP-----PVSMSPAPQPPVLPTPMALQ--V 370 380 390 400 410 420 480 490 500 510 520 pF1KA0 QTIINPTSTAAQVVTQAMEYVRSG--CRNPPPQPV---DWNNDY----C---SSGGMQRD : ..:. . : . :. :. : : .:. ::...: : . . . :: CCDS42 QLAMSPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRD 430 440 450 460 470 480 pF1KA0 KALYLT :.:::: CCDS42 KSLYLT 526 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 19:45:50 2016 done: Wed Nov 2 19:45:51 2016 Total Scan time: 3.950 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]