より完全なヒトゲノム参照配列「パンゲノム」公開

遺伝性疾患プラス編集部

POINT

  1. ヒトゲノム参照配列は、遺伝性疾患の原因遺伝子を見つける上でも重要
  2. 従来の参照配列は、ヒトの多様性を網羅できていなかったため、根本的な限界があった
  3. ヒトの多様性を反映し正確性を増した「パンゲノム」の公開でゲノム医療への貢献が期待される

従来のゲノム参照配列は少人数由来で偏りも大きかった

米国国立衛生研究所(NIH)は、従来活用されていたヒトゲノム参照配列よりも高精度な、異なる複数のヒト集団の多様性を網羅した新たな参照配列「パンゲノム」を公開したことを発表しました。これは、NIH傘下の米国国立ヒトゲノム研究所(NHGRI)が資金提供している国際コンソーシアム、「ヒト・パンゲノム・リファレンス・コンソーシアム」(Human Pangenome Reference Consortium)が主導して行ったものです。

ゲノムとは、生物が持つDNAに刻まれた遺伝情報のセットのことです。ゲノムは個体によって若干の違いがありますが、ヒトの場合、他人と比べて平均99%以上同じです。このわずかな違いが、一人ひとりの個性や健康状態に関する情報となり、病気の診断や予後予測、治療の手掛かりとなります。

こうしたゲノムの違いを理解するために、「標準」として使用するヒトゲノムの参照配列があります。これは、ヒトゲノム配列のデジタル融合データで、他のヒトのゲノム配列と異なる部分などを比較検討するために用いられます。

最初にヒトゲノム参照配列が作られたのは20年近く前で、その後、技術の進歩や研究者による間違いの発見と修正、ヒトゲノムのより多くの領域の発見に伴い、定期的に更新されています。しかし、この参照配列はわずか約20人分のゲノムから構成されており、しかもその大部分はたった1人からのものであるため、人種の多様性を表現するには根本的に限界がありました。

ヒトはそれぞれ固有のゲノムをもっているため、全てのヒトに単一の参照配列を用いると、ゲノム解析に偏りが生じることがあります。例えば、参照配列と異なる部分が多いゲノム配列を持つヒトで遺伝性疾患に関連する配列の予測を行おうとした場合、うまく見つけられない可能性もあります。

また、ヒトゲノムには、構造バリアントと呼ばれる大きなバリアント(~数千塩基)があり、このバリアントは、個人の違いや病気に多く関わる部分です。しかし、特にショートリードシーケンスという、いま全ゲノム解析に最もよく用いられている方法で決定したゲノム配列は、直線的で偏りの多い従来の参照配列とうまく比較することができず、構造バリアントの大部分は特定することができませんでした。

今回、パンゲノムの参照配列を用いることで、これらの問題が解決できるようになりました。

350人の配列を盛り込む予定、複数のバージョンで多様性を網羅

構築された新しいヒトパンゲノム参照配列は、高度な計算技術により、99%以上の配列が99%以上の精度でカバーされており、従来の参照配列から、新たに1億塩基以上が追加されています。従来のヒトゲノム参照配列には、特に反復的で読み取りが困難な領域に、情報が抜けている部分(ギャップ)がありましたが、一度に長いDNA配列を読み取る「ロングリードDNAシーケンス」など、技術的進歩によりギャップが補填され、T2Tコンソーシアムにより、最初の「完全な」ヒトゲノム配列が発表されました。この完全なヒトゲノム配列が、今回のパンゲノムに組み込まれています。

以前の参照ゲノム配列は単一で直線的なものでしたが、パンゲノムは多様なヒトゲノム配列を複数のバージョンという形で表しており、幅広い選択肢の中からより適切な配列を選んで比較することが可能です。

「パンゲノム」参照配列には47人分のゲノム配列が含まれており、2024年半ばまでに350人分までに増やすことが目標とされています。ヒトはそれぞれ一対の染色体を持っているため、現在のパンゲノムには94の異なるゲノム配列が含まれており、プロジェクト終了時には700の異なるゲノム配列に到達することとなります。

この新しいヒトパンゲノム参照配列を構築するために決定された個人のゲノム配列の多くは、もともと1,000ゲノムプロジェクトの一環として集められたものです。これは2008年に国際コンソーシアムが開始したプロジェクトで、世界中の1,000人以上のヒトゲノムを解読して、多様な集団におけるゲノム変異のカタログを作る目的で開始されました。パンゲノムの改善は現在進行形であるため、国際コンソーシアムの研究者は、今後より多くのゲノム配列を追加し、パンゲノム参照配列の質をますます向上させていきます。ゲノム研究やゲノム医療へのさらなる貢献が期待されます。(遺伝性疾患プラス編集部)

関連リンク