テーマ 39ゲノムは遺伝子の全ての集まりです

ジェームズ・ワトソンが、マーカーとBACを用いたヒトゲノムの配列解析を説明し、クレイグ・ヴェンターが、cDNAライブラリーとESTs、ショットガン配列決定法を用いた方法を説明します。

ハイ!私は、ジム・ワトソンです。あなたは19章で私のことを覚えているかもしれません。1953年に、フランシス・クリックと私は、DNAの構造を発見しました。 多くのゲノム配列が得られる前は、遺伝子の“探索”は難しく、染色体上の遺伝子の位置を決めるためのマーカーを探すなど複雑でした。 [細胞][ヒトゲノム] 初期の染色体地図は、染色してできる、目に見えるバンドのパターンをマーカーとして用いていました。しかし、それぞれのバンドの中には、数百万の塩基と数千個の遺伝子があります。 政府支援のヒトゲノムプロジェクトの最初の指導者としての私のゴールのひとつは、これら染色体上により多くのマーカーを作ることでした。これらのマーカーは、特徴あるDNA配列に基づきます。 [染色体] 私たちは、約15万塩基ごとにマーカーを見つけようとしました。平均的な遺伝子(の長さ)は、1万塩基程度なので、染色体相当の(長さの)DNAの中より、15万塩基の中に遺伝子を見つけることはより易しいことです。 [15万塩基] 最終的には、私たちは3万個の異なるマーカーからなる地図を作成しました。それぞれのマーカーは、ゲノムの中にある100から200塩基対の配列でした。 [100塩基対のマーカー配列] ハイ!私は、クレイグ・ヴェンターです。私がジム・ワトソンと共にNIH(国立衛生研究所)に居たとき、私もまた、ヒトの遺伝子の位置を決めることに興味がありました。遺伝子は、私たちのゲノムのわずか約3%から構成されています。私は、それらを探索するための速くて安価な方法を見いだしました。 私は最初、この方法をヒトの脳で発現している遺伝子を見つけるのに使いました。私は、他の研究者がファージライブラリーに格納していた脳のcDNAを用いました。 [ヒトの脳] そのライブラリーは、まずヒトの脳組織から抽出したmRNAから作られました。 mRNAは逆転写され、cDNAは、ファージ粒子の中にクローンのライブラリーとして格納されます。 [逆転写酵素][ファージ] 私たちは、これらのcDNAから、150から400塩基対のDNA断片を作製するために、ポリメラーゼ連鎖反応(PCR)を用いました。 このPCR反応には、非特異的なプライマーを用いました。taqポリメラーゼは、そのプライマーから始まる脳のcDNAの短いコピーを作りました。 [プライマー][Taqポリメラーゼ] 私は、結果として得られる短い配列を、発現したシーケンスタグ(EST)、と呼びました。ESTは、長さが異なり、全てがユニークでした。ESTは、ヒトのmRNA由来なので、それぞれのESTは、脳で発現した遺伝子を同定します。 私たちは、ヒトの脳から2,375個のESTの配列を決め、公的データベースにすでに登録されている遺伝子と配列を比較しました。私たちのESTのたった17%しか既知の遺伝子配列に一致しませんでした。 既知の遺伝子に一致した17%の中のいくつかのESTは、ベータ-アクチンのように、体中で発現しているものでした。他のものは、ショウジョウバエの big-brain遺伝子のように、脳組織により特異的なものでした。 [ベータ-アクチン遺伝子] 最も興奮したのは、ESTの83%が、未知の遺伝子だったことです!私たちは、ESTを作り続け、数年の内に、3万を超える新しい遺伝子を捕まえました。 一部の研究者にとっては、これは情報の宝の山です。ヒューマン・ゲノム・サイエンスやインサイト・ジェノミクスなど、いくつかのバイオ企業は、この遺伝子バンクに投資し始めました。 私[ワトソン]には、クレイグや彼の企業の仲間は、特許を取ることができる遺伝子を探したいだけのように見えました。私は、全ゲノムやその全てがどのように働くのかに興味がありました。ESTライブラリーはとてもすばらしいですが、発現が高くなければ見つかりません。また、ESTライブラリーには、上流の制御領域はまったくありません。 全ゲノムからの情報を手に入れるために、私たちはより小さな扱いやすい断片に分解しなくてはなりませんでした。最初に、それぞれの染色体は、およそ15万塩基対の大きさの断片を作るために、切断場所が多くない制限酵素によって切断されます。これらの断片は、細菌の人工染色体(BAC)にクローニングされます。 [2番染色体][15万塩基対の断片] 私たちは、全染色体を表すオーバーラップした断片を得るために、異なる酵素を用いて同じ染色体のコピーを切断します。物理的なマーカーは、いくつかのBACを同定しました。マーカーのないBACは、よりありふれた制限酵素を用いて更に位置を決めました。 [制限酵素] これらの制限酵素部位とマーカーは、BACを同定して並べるために使います。そして、BACは順番に従ってまとめられています。 整列後に、私たちは全染色体に広がる、必要最小限の数のBACを選びました。 しかし、BACは、自動配列解析にはまだ大きすぎます。私たちは、分断化の過程を繰り返し、ランダムにそれぞれのBACを1,500塩基対程度の大きさの断片に壊しました。それぞれの断片はファージにサブクローニングされました。簡単にするために、ここでは、2つの断片だけを示しています。 ここでも、私たちは、オーバーラップする断片を取得するよう徹底しました。それぞれのサブクローンの端は、自動配列解析装置で配列を決めました。ひとつのサブクローンの配列が決まった端の部分は、他の未知の端とオーバーラップするので、断片の全体の配列を決める必要はありません。 私たちが配列を決め終わったときには、それぞれのBAC由来のサブクローンは、照合配列に沿って正しい順番に並べられました。 それらの配列やマーカー地図を使って、全てのサブクローンは、BACの中に集められ、そのBACは、染色体の中に組み込まれました。それぞれの染色体が組み立てられたとき、全ヒトゲノムの配列が決まりました。 はい、戻ってきました。私[ヴェンター]のEST技術が商品化されてから、多くのすばらしい発現ライブラリーが作られるのに時間はかかりませんでした。私は、他のプロジェクトを探し始めました。私は、連邦政府資金によるヒトゲノムプロジェクトの動きがあまりにも遅いと思ったので、ご推察のように、より安く速い方法を考えました。 私が、ショットガン配列解析と名づけた、この方法は、最初に、2,000塩基対程度のオーバーラップするDNA断片をランダムに作ることから始まります。これは、注射器を通してDNAの溶液に物理的に力を加えることによって行います。 [2,000塩基対の配列] 私たちはまた、1万塩基対の断片も作りました。全ての断片は、ひとつひとつ細菌のプラスミドの中に格納しました。 [2,000+1万塩基対の配列] それぞれの断片の端は、自動配列解析装置で配列が解析されました。前に学んだように、多くの断片がお互いにオーバーラップすると、各断片の断片全体の配列を決める必要はありません。 そして、私たちは、特別に開発した全ての断片を並べるためのコンピュータプログラムにデータを入れました。そのプログラムは、オーバーラップした配列を一致させることによって全体のゲノムを組み立てました。 ショットガン・シーケンシングでは、マーカーやBACのサブクローニングや組み立てで頭を悩ます必要がありません。私は最初にこの方法を、私がNIHを離れた後の1995年に、インフルエンザ菌(Haemophilus influenza)の180万塩基対のゲノムの配列解析でテストしました。 [インフルエンザ菌のゲノム] そして、1999年に、私自身の会社、セレラでヒトゲノムの予行演習として、ショウジョウバエ・ゲノムプロジェクトと協力し、ショウジョウバエ(Drosophila melanogaster)ゲノムの配列を解析してまとめました。 [4番染色体のマーカー地図][ショウジョウバエ] 2000年6月に、ヒトゲノムプロジェクトの指導者のフランシス・コリンズと私は、ホワイトハウスで、ヒトゲノムの“作業草案”のDNA配列を完成させましたと、公表しました。私たちは、この作業草案の最初の解析を2001年の2月に論文発表しました。 2001年の出版にもかかわらず、ヒトゲノムについて、まだ多くのやるべき仕事があります。解決すべき配列の中の小さな“穴”があるのです。 これらのいくつかの穴は、複数の反復配列を含むセントロメアの近くにあるので、完全に解決されないかもしれません。あなたも分かるように、反復配列の断片は、いくつかの方法で並べることができます。ひとつだけが正しいのですが…。 更に、32億塩基対のDNAが何を表しているか、私たちの配列の中にコードされた情報を理解するための大変な仕事は実際のところ、始まったばかりです。

factoid Did you know ?

クレイグ・ヴェンターの会社、セレラは、配列解析のためにDNAを提供する6人を探すための広告を出しました。

Hmmm...

なぜゲノムは、独立した染色体に分けられているのでしょうか?