FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0737, 621 aa 1>>>pF1KA0737 621 - 621 aa - 621 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.5256+/-0.00104; mu= -6.8788+/- 0.062 mean_var=391.3651+/-80.877, 0's: 0 Z-trim(115.4): 33 B-trim: 432 in 1/55 Lambda= 0.064831 statistics sampled from 15891 (15921) to 15891 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.772), E-opt: 0.2 (0.489), width: 16 Scan time: 4.580 The best scores are: opt bits E(32554) CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14 ( 621) 4134 400.8 2.8e-111 CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16 ( 571) 1181 124.6 3.7e-28 CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16 ( 576) 1169 123.4 8.1e-28 CCDS34897.1 TOX gene_id:9760|Hs108|chr8 ( 526) 926 100.7 5.2e-21 CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20 ( 506) 749 84.1 4.9e-16 CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20 ( 464) 734 82.7 1.2e-15 CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20 ( 488) 618 71.8 2.3e-12 >>CCDS32043.1 TOX4 gene_id:9878|Hs108|chr14 (621 aa) initn: 4134 init1: 4134 opt: 4134 Z-score: 2111.3 bits: 400.8 E(32554): 2.8e-111 Smith-Waterman score: 4134; 100.0% identity (100.0% similar) in 621 aa overlap (1-621:1-621) 10 20 30 40 50 60 pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFEIPPISLDSDPSLAVSDVVGHFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFEIPPISLDSDPSLAVSDVVGHFD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 DLADPSSSQDGSFSAQYGVQTLDMPVGMTHGLMEQGGGLLSGGLTMDLDHSIGTQYSANP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DLADPSSSQDGSFSAQYGVQTLDMPVGMTHGLMEQGGGLLSGGLTMDLDHSIGTQYSANP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 PVTIDVPMTDMTSGLMGHSQLTTIDQSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PVTIDVPMTDMTSGLMGHSQLTTIDQSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 SSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 IKGQNPNATFGEVSKIVASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IKGQNPNATFGEVSKIVASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 ETVELDPAPPSQTPSPPPMATVDPASPAPASIEPPALSPSIVVNSTLSSYVANQASSGAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ETVELDPAPPSQTPSPPPMATVDPASPAPASIEPPALSPSIVVNSTLSSYVANQASSGAG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 GQPNITKLIITKQMLPSSITMSQGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GQPNITKLIITKQMLPSSITMSQGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA0 RSVLQAAAAAAAAASMQLPPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RSVLQAAAAAAAAASMQLPPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA0 RINLQQQPPPLQIKSVPLPTLKMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RINLQQQPPPLQIKSVPLPTLKMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEM 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA0 ITDVVPEVESPSQMDVELVSGSPVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ITDVVPEVESPSQMDVELVSGSPVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKH 550 560 570 580 590 600 610 620 pF1KA0 CRDVFLAWVASRNSNTVVFVK ::::::::::::::::::::: CCDS32 CRDVFLAWVASRNSNTVVFVK 610 620 >>CCDS54008.1 TOX3 gene_id:27324|Hs108|chr16 (571 aa) initn: 915 init1: 566 opt: 1181 Z-score: 619.1 bits: 124.6 E(32554): 3.7e-28 Smith-Waterman score: 1208; 42.7% identity (67.0% similar) in 548 aa overlap (5-536:27-549) 10 20 30 pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFE :.:.::.... .. :....:::::::::::::: CCDS54 MKCQPRSGARRIEERLHYLITTYLKFGNNNNYMNMAEANNAFFAASETFHTPSLGDEEFE 10 20 30 40 50 60 40 50 60 70 80 90 pF1KA0 IPPISL--DSDPSLAVSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMP-VGMTHGLMEQ ::::. .:::.:.. ::. :. :.:: :: . :. :. :.::.: . ....:.:: CCDS54 IPPITPPPESDPALGMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLPSITISRNLVEQ 70 80 90 100 110 120 100 110 120 130 140 150 pF1KA0 GGGLLSGGLTMDLDHSIGTQYSANPPVTID--VPMTDMT-SGLMGHSQLTTIDQSELSSQ : : :.:: :: .:. .:: .: . . : ::: . ::.: .:::::.::.::.: CCDS54 DGVLHSSGLHMDQSHTQVSQYRQDPSLIMRSIVHMTDAARSGVMPPAQLTTINQSQLSAQ 130 140 150 160 170 180 160 170 180 190 200 210 pF1KA0 LGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAP :::.:::... . :: :.::::.::..:. ... : . ..: .. ..::: :.: CCDS54 LGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAI-GEKRAAPDSGKKPKTP 190 200 210 220 230 220 230 240 250 260 270 pF1KA0 KKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQVY ::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQVY 240 250 260 270 280 290 280 290 300 310 320 330 pF1KA0 KRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPASPAPASI ::::::::::::::::::. . .:..:..: .:: . .:. .. CCDS54 KRKTEAAKKEYLKALAAYRASLVSKAAAESAE------AQT-----IRSVQQ------TL 300 310 320 330 340 340 350 360 370 380 pF1KA0 EPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQM---LP-----SSITMSQG :. :...:. ::.. . .:: . : .. . : : . :: .:.:.. . CCDS54 ASTNLTSSLLLNTPLSQHGTVSASPQTL-QQSLPRSIAPKPLTMRLPMNQIVTSVTIA-A 350 360 370 380 390 400 390 400 410 420 430 440 pF1KA0 GMVTVIPATVVTSRGLQL-GQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRL .: . : : ...: : . :.. .. ..:: :.: . :: .:. .: CCDS54 NMPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQ-HQMQLQQQQQQQQQQMQQMQQQQL 410 420 430 440 450 450 460 470 480 490 500 pF1KA0 QPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTLK- : ..:. : ::: .. :: .:: :. :: :: :: . . : :. CCDS54 QQHQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQ--INQQQLQQQLQ-QRLQLQQLQH 460 470 480 490 500 510 510 520 530 540 550 560 pF1KA0 MQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSGS :: : . :: . .:: .. .:.: . CCDS54 MQHQSQPSPRQHSPVASQITSP-IPAIGSPQPASQQHQSQIQSQTQTQVLSQVSIF 520 530 540 550 560 570 570 580 590 600 610 620 pF1KA0 PVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKHCRDVFLAWVASRNSNTVVFVK >>CCDS54009.1 TOX3 gene_id:27324|Hs108|chr16 (576 aa) initn: 872 init1: 566 opt: 1169 Z-score: 612.9 bits: 123.4 E(32554): 8.1e-28 Smith-Waterman score: 1196; 42.6% identity (66.8% similar) in 549 aa overlap (5-536:31-554) 10 20 30 pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAE-TFHTPSLG :.:.::.... .. :....: :::::::: CCDS54 MDVRFYPAAAGDPASLDFAQCLGYYGYSKFGNNNNYMNMAEANNAFFAASEQTFHTPSLG 10 20 30 40 50 60 40 50 60 70 80 90 pF1KA0 DEEFEIPPISL--DSDPSLAVSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMP-VGMTH :::::::::. .:::.:.. ::. :. :.:: :: . :. :. :.::.: . ... CCDS54 DEEFEIPPITPPPESDPALGMPDVLLPFQALSDPLPSQGSEFTPQFPPQSLDLPSITISR 70 80 90 100 110 120 100 110 120 130 140 pF1KA0 GLMEQGGGLLSGGLTMDLDHSIGTQYSANPPVTID--VPMTDMT-SGLMGHSQLTTIDQS .:.:: : : :.:: :: .:. .:: .: . . : ::: . ::.: .:::::.:: CCDS54 NLVEQDGVLHSSGLHMDQSHTQVSQYRQDPSLIMRSIVHMTDAARSGVMPPAQLTTINQS 130 140 150 160 170 180 150 160 170 180 190 200 pF1KA0 ELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGK .::.::::.:::... . :: :.::::.::..:. ... : . ..: .. ..:: CCDS54 QLSAQLGLNLGGASMPHTSPSPPASKSATPSPSSSINEEDADEANRAI-GEKRAAPDSGK 190 200 210 220 230 210 220 230 240 250 260 pF1KA0 KQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEE : :.:::.:::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEE 240 250 260 270 280 290 270 280 290 300 310 320 pF1KA0 QKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPASP :::::::::::::::::::::::. . .:..:..: .:: . .:. CCDS54 QKQVYKRKTEAAKKEYLKALAAYRASLVSKAAAESAE------AQT-----IRSVQQ--- 300 310 320 330 340 330 340 350 360 370 pF1KA0 APASIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQM---LP-----SSI .. :. :...:. ::.. . .:: . : .. . : : . :: .:. CCDS54 ---TLASTNLTSSLLLNTPLSQHGTVSASPQTL-QQSLPRSIAPKPLTMRLPMNQIVTSV 350 360 370 380 390 400 380 390 400 410 420 430 pF1KA0 TMSQGGMVTVIPATVVTSRGLQL-GQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQL :.. ..: . : : ...: : . :.. .. ..:: :.: . :: .:. CCDS54 TIA-ANMPSNIGAPLISSMGTTMVGSAPSTQVSPSVQTQQ-HQMQLQQQQQQQQQQMQQM 410 420 430 440 450 440 450 460 470 480 490 pF1KA0 PPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPL .:: ..:. : ::: .. :: .:: :. :: :: :: . . : CCDS54 QQQQLQQHQMHQQIQQQMQQQHFQHHMQQHLQQQQQHLQQQ--INQQQLQQQLQ-QRLQL 460 470 480 490 500 510 500 510 520 530 540 550 pF1KA0 PTLK-MQTTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVE :. :: : . :: . .:: .. .:.: . CCDS54 QQLQHMQHQSQPSPRQHSPVASQITSP-IPAIGSPQPASQQHQSQIQSQTQTQVLSQVSI 520 530 540 550 560 570 560 570 580 590 600 610 pF1KA0 LVSGSPVALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKHCRDVFLAWVASRNSNTV CCDS54 F >>CCDS34897.1 TOX gene_id:9760|Hs108|chr8 (526 aa) initn: 1060 init1: 748 opt: 926 Z-score: 490.6 bits: 100.7 E(32554): 5.2e-21 Smith-Waterman score: 989; 36.5% identity (59.3% similar) in 600 aa overlap (6-594:37-514) 10 20 30 pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDE :.. :...: ::. .. ..... ::: .: CCDS34 PPPAQPAAAPDAPCLGPSPCLDPYYCNKFDGENMYMSMTEPSQDYVPASQSYPGPSLESE 10 20 30 40 50 60 40 50 60 70 80 90 pF1KA0 EFEIPPISLDSDP--SLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGL .:.::::. : : ::. ...: . . .: : . ..: . . :..:.: . .. CCDS34 DFNIPPITPPSLPDHSLVHLNEVESGYHSLCHPMN-HNGLL--PFHPQNMDLPEITVSNM 70 80 90 100 110 120 100 110 120 130 140 pF1KA0 MEQGGGLLSGGLTM--DLDHSIGTQYSANPPVTIDVPM---TDMTS--GLMGHSQLTTID . : : :::..... :. . :::::..: .. : .:. . :.: :.:::::. CCDS34 LGQDGTLLSNSISVMPDIRNPEGTQYSSHPQMAAMRPRGQPADIRQQPGMMPHGQLTTIN 130 140 150 160 170 180 150 160 170 180 190 200 pF1KA0 QSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEA ::.::.::::..::... . :: :.::::.::.::: .: . ..: . . CCDS34 QSQLSAQLGLNMGGSNVPHNSPSPPGSKSATPSPSSSVHEDEGDDTSKINGGEKRPASDM 190 200 210 220 230 240 210 220 230 240 250 260 pF1KA0 GKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLG ::: :.:::.:::::::::::::::::::::::::::::::::::::::::::::::.:: CCDS34 GKKPKTPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDGLG 250 260 270 280 290 300 270 280 290 300 310 320 pF1KA0 EEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPA ::::::::.::::::::::: ::::. . .. : :.. .: .:: . CCDS34 EEQKQVYKKKTEAAKKEYLKQLAAYRASLVSKSYSEPVDV------KTSQPPQLI----- 310 320 330 340 350 330 340 350 360 370 380 pF1KA0 SPAPASIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQMLPSSITMSQGG . :. .. :. . : . :::. .: : .:..: : :: CCDS34 NSKPSVFHGPSQAHSALY---LSSHYHQQP----GMNPHLT------AMHPS-------- 360 370 380 390 390 400 410 420 430 440 pF1KA0 MVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRLQP .: ... .:..: :: :. :.: . :: CCDS34 ----LPRNIAP--------------KPNNQMP-VTVSI----------ANMAVSPP---- 400 410 450 460 470 480 490 500 pF1KA0 PPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKS-VPLPTLKMQ :::: .:: .:... .:: :: .:::: ... :.:..: . ::... CCDS34 PPLQI--SPPLHQHLN-MQQHQPL-TMQQPLGNQL---------PMQVQSALHSPTMQQG 420 430 440 450 460 510 520 530 540 550 560 pF1KA0 TTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSGSPV :: .:. .:. :. : ...:... : CCDS34 FTL---------------QPDYQTIINPTS-TAAQVVTQAMEYV---------------- 470 480 490 570 580 590 600 610 620 pF1KA0 ALSPQPRCVRSGCENPPIVSKDWDNEYCSNECVVKHCRDVFLAWVASRNSNTVVFVK ::::.::: ::.:.:::. CCDS34 ---------RSGCRNPPPQPVDWNNDYCSSGGMQRDKALYLT 500 510 520 >>CCDS46603.1 TOX2 gene_id:84969|Hs108|chr20 (506 aa) initn: 699 init1: 528 opt: 749 Z-score: 401.4 bits: 84.1 E(32554): 4.9e-16 Smith-Waterman score: 811; 36.1% identity (61.8% similar) in 477 aa overlap (6-477:36-471) 10 20 30 pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDE :.. :. .. . .:: ..:.. : ..: CCDS46 YPSAPAVGARPGAEPAGLAHLDYYHGGKFDGDSAYVGMSDGNPELLSTSQTYNGQSENNE 10 20 30 40 50 60 40 50 60 70 80 90 pF1KA0 EFEIPPISLDS--DPSLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGL ..:::::. . .::: ..: . . .: . . .: . : :. :..:.:. :. .. CCDS46 DYEIPPITPPNLPEPSLLHLGDHEASYHSLCH-GLTPNGLLPA-YSYQAMDLPAIMVSNM 70 80 90 100 110 120 100 110 120 130 140 150 pF1KA0 MEQGGGLLSGGLT--MDLDHSIGTQYSANPPVTIDVPMTDMTSGLMGHSQLTTIDQSELS . : . :::: : ... :: . :... : :. . : .: .....::.: CCDS46 LAQDSHLLSGQLPTIQEMVHSEVAAYDSGRPG----PLLGRPAMLASH--MSALSQSQLI 130 140 150 160 170 160 170 180 190 200 210 pF1KA0 SQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGKKQK ::.:. ..: . :: :.::::.:: .:. : . .. ..: .. ::: : CCDS46 SQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESE-VHFKISGEKRPSADPGKKAK 180 190 200 210 220 230 220 230 240 250 260 270 pF1KA0 APKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQ :::.:::::::::::::::::::::::::::::::.::::.:::::::::::::::::: CCDS46 NPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMWDSLGEEQKQ 240 250 260 270 280 290 280 290 300 310 320 330 pF1KA0 VYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDPASPAPA .:::::::::::::::::::. . ... : . ..: . :: . : .: : CCDS46 AYKRKTEAAKKEYLKALAAYRASLVSKSSP-----DQGETKSTQANPPAKMLPPKQPMYA 300 310 320 330 340 340 350 360 370 380 390 pF1KA0 SIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQMLPSSITMSQGGMVTVI :.:. :... : :... :::. .... . .:..:: :. . CCDS46 M---PGLA-SFLTPSDLQAF-----RSGAS-PASLARTLGSKSLLP--------GLSASP 350 360 370 380 390 400 410 420 430 440 450 pF1KA0 PATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRLQPPPLQQ : : :. . .. : :. ... : .. : . :: : : . CCDS46 PPP--PSFPLSPTLHQQLSLPPHAQGALLSPPVSMSPAPQPPV----LPTPMALQVQLAM 400 410 420 430 440 460 470 480 490 500 510 pF1KA0 MPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTLKMQTTLVPP :.:: :. ... : .. .: : CCDS46 SPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLPRDKSLY 450 460 470 480 490 500 >>CCDS13324.1 TOX2 gene_id:84969|Hs108|chr20 (464 aa) initn: 699 init1: 528 opt: 734 Z-score: 394.3 bits: 82.7 E(32554): 1.2e-15 Smith-Waterman score: 796; 36.9% identity (61.3% similar) in 463 aa overlap (20-477:8-429) 10 20 30 40 50 pF1KA0 MEFPGGNDNYLTITGPSHPFLSGAETFHTPSLGDEEFEIPPISLDS--DPSLA-VSDVVG .:: ..:.. : ..:..:::::. . .::: ..: . CCDS13 MSDGNPELLSTSQTYNGQSENNEDYEIPPITPPNLPEPSLLHLGDHEA 10 20 30 40 60 70 80 90 100 110 pF1KA0 HFDDLADPSSSQDGSFSAQYGVQTLDMPVGMTHGLMEQGGGLLSGGLT--MDLDHSIGTQ . .: . . .: . : :. :..:.:. :. ... : . :::: : ... :: . CCDS13 SYHSLCH-GLTPNGLLPA-YSYQAMDLPAIMVSNMLAQDSHLLSGQLPTIQEMVHSEVAA 50 60 70 80 90 100 120 130 140 150 160 170 pF1KA0 YSANPPVTIDVPMTDMTSGLMGHSQLTTIDQSELSSQLGLSLGGGTILPPAQSPEDRLST :... : :. . : .: .....::.: ::.:. ..: . :: :. CCDS13 YDSGRP----GPLLGRPAMLASH--MSALSQSQLISQMGIR---SSIAHSSPSPPGSKSA 110 120 130 140 150 180 190 200 210 220 230 pF1KA0 TPSPTSSLHEDGVEDFRRQLPSQKTVVVEAGKKQKAPKKRKKKDPNEPQKPVSAYALFFR ::::.:: .:. : . .. ..: .. ::: : :::.:::::::::::::::::::: CCDS13 TPSPSSSTQEEESE-VHFKISGEKRPSADPGKKAKNPKKKKKKDPNEPQKPVSAYALFFR 160 170 180 190 200 210 240 250 260 270 280 290 pF1KA0 DTQAAIKGQNPNATFGEVSKIVASMWDSLGEEQKQVYKRKTEAAKKEYLKALAAYKDNQE :::::::::::.::::.::::::::::::::::::.:::::::::::::::::::. CCDS13 DTQAAIKGQNPSATFGDVSKIVASMWDSLGEEQKQAYKRKTEAAKKEYLKALAAYR---- 220 230 240 250 260 270 300 310 320 330 340 350 pF1KA0 CQATVETVELDPAPPSQTPSPPPMATVDPASPAPASIEPPALSPSIVVNSTLSSYVANQA . : : . ..: . :: . : .: : :.:. :... : :... CCDS13 -ASLVSKSSPDQGETKSTQANPPAKMLPPKQPMYAM---PGLA-SFLTPSDLQAF----- 280 290 300 310 320 360 370 380 390 400 410 pF1KA0 SSGAGGQPNITKLIITKQMLPSSITMSQGGMVTVIPATVVTSRGLQLGQTSTATIQPSQQ :::. .... . .:..:: :. . : . : : .. : : CCDS13 RSGAS-PASLARTLGSKSLLP--------GLSASPPPPPSFPLSPTLHQQ--LSLPPHAQ 330 340 350 360 370 420 430 440 450 460 470 pF1KA0 AQIVTRSVLQAAAAAAAAASMQLPPPRLQPPPLQQMPQPPTQQQVTILQQPPPLQAMQQP . ... : .. : . :: : : . :.:: :. ... : .. .: CCDS13 GALLSPPVSMSPAPQPPV----LPTPMALQVQLAMSPSPPGPQDFPHISEFPSSSGSCSP 380 390 400 410 420 480 490 500 510 520 530 pF1KA0 PPQKVRINLQQQPPPLQIKSVPLPTLKMQTTLVPPTVESSPERPMNNSPEAHTVEAPSPE : CCDS13 GPSNPTSSGDWDSSYPSGECGISTCSLLPRDKSLYLT 430 440 450 460 >>CCDS42875.1 TOX2 gene_id:84969|Hs108|chr20 (488 aa) initn: 583 init1: 412 opt: 618 Z-score: 335.4 bits: 71.8 E(32554): 2.3e-12 Smith-Waterman score: 649; 32.9% identity (57.1% similar) in 483 aa overlap (3-477:39-453) 10 20 pF1KA0 MEFP---GGNDNYLTITGPSHPFLSGAETFHT :: :.. :. .. . .:: ..:.. CCDS42 VAGAFSRCLGFCGMRLGLLLLARHWCIAGVFPQKFDGDSAYVGMSDGNPELLSTSQTYNG 10 20 30 40 50 60 30 40 50 60 70 80 pF1KA0 PSLGDEEFEIPPISLDS--DPSLA-VSDVVGHFDDLADPSSSQDGSFSAQYGVQTLDMPV : ..:..:::::. . .::: ..: . . .: . . .: . : :. :..:.:. CCDS42 QSENNEDYEIPPITPPNLPEPSLLHLGDHEASYHSLCH-GLTPNGLLPA-YSYQAMDLPA 70 80 90 100 110 120 90 100 110 120 130 140 pF1KA0 GMTHGLMEQGGGLLSGGLT--MDLDHSIGTQYSANPPVTIDVPMTDMTSGLMGHSQLTTI :. ... : . :::: : ... :: . :... : :. . : .: .... CCDS42 IMVSNMLAQDSHLLSGQLPTIQEMVHSEVAAYDSGRPG----PLLGRPAMLASH--MSAL 130 140 150 160 170 180 150 160 170 180 190 200 pF1KA0 DQSELSSQLGLSLGGGTILPPAQSPEDRLSTTPSPTSSLHEDGVEDFRRQLPSQKTVVVE .::.: ::.:. ..: . :: :.::::.:: .:. : . .. ..: .. CCDS42 SQSQLISQMGIR---SSIAHSSPSPPGSKSATPSPSSSTQEEESE-VHFKISGEKRPSAD 190 200 210 220 230 210 220 230 240 250 260 pF1KA0 AGKKQKAPKKRKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPNATFGEVSKIVASMWDSL ::: : :::.:::::::::::::::::::::::::::::::.::::.:::::::::::: CCDS42 PGKKAKNPKKKKKKDPNEPQKPVSAYALFFRDTQAAIKGQNPSATFGDVSKIVASMWDSL 240 250 260 270 280 290 270 280 290 300 310 320 pF1KA0 GEEQKQVYKRKTEAAKKEYLKALAAYKDNQECQATVETVELDPAPPSQTPSPPPMATVDP :::::: . :. : ..: . .: : .. : :: CCDS42 GEEQKQ------------------SSPDQGETKST----QANP-PAKMLPPKQPMY---- 300 310 320 330 340 350 360 370 380 pF1KA0 ASPAPASIEPPALSPSIVVNSTLSSYVANQASSGAGGQPNITKLIITKQMLPSSITMSQG : :. ::. :.:: :... :::. .... . .:..:: CCDS42 AMPGLASF----LTPS-----DLQAF-----RSGAS-PASLARTLGSKSLLP-------- 330 340 350 360 390 400 410 420 430 440 pF1KA0 GMVTVIPATVVTSRGLQLGQTSTATIQPSQQAQIVTRSVLQAAAAAAAAASMQLPPPRLQ :. . : : :. . .. : :. ... : .. : . :: : CCDS42 GLSASPPPP--PSFPLSPTLHQQLSLPPHAQGALLSPPVSMSPAPQPPV----LPTPMAL 370 380 390 400 410 420 450 460 470 480 490 500 pF1KA0 PPPLQQMPQPPTQQQVTILQQPPPLQAMQQPPPQKVRINLQQQPPPLQIKSVPLPTLKMQ : . :.:: :. ... : .. .: : CCDS42 QVQLAMSPSPPGPQDFPHISEFPSSSGSCSPGPSNPTSSGDWDSSYPSGECGISTCSLLP 430 440 450 460 470 480 510 520 530 540 550 560 pF1KA0 TTLVPPTVESSPERPMNNSPEAHTVEAPSPETICEMITDVVPEVESPSQMDVELVSGSPV CCDS42 RDKSLYLT 621 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 19:37:45 2016 done: Wed Nov 2 19:37:45 2016 Total Scan time: 4.580 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]