ヒトゲノムの最初のドラフトは ちょうど20年前に公開されました。 完了までにXNUMX年近くかかり、費用はXNUMX億ドル近くになりました。 ザ・ プロジェクト ヒトゲノム これにより、科学者は、人間を生物学的に定義する3億塩基対のDNA(または「文字」)をほぼ一端から他端まで読み取ることができました。
それは画期的な事業でした。 そのプロジェクトにより、新世代の研究者が特定することができました がん治療の新しいターゲット、設計 人間の免疫システムを持つマウス そしてそれを構築する Páginaウェブ Googleマップのようにヒトゲノム全体をナビゲートできます。
最初の完全なヒトゲノムは、少数の匿名のドナーから生成されました。 目的は、複数の個人を表すリファレンスゲノムを作成することでした。 予想通り、理解するだけでは不十分でした 世界中の人口の多様性. XNUMX人が同じであるということはなく、XNUMXつのゲノムが同じであるということもありません。 研究者が人類の多様性のすべてをより正確に理解したいのであれば、単一のヒトゲノムでは十分ではありません。
それらの数千または数百万をシーケンスする必要があります。これはまさに現在進行中のプロジェクトの目的です。
遺伝的多様性を理解する
人々の間の遺伝的多様性の豊かさは、一人一人をユニークにするものです。 しかし、遺伝的変化はまた、多くの病気を引き起こし、一部の人々のグループを他のグループよりも特定の病気にかかりやすくします。
ヒトゲノムプロジェクトの時点で、研究者はまた、次のようなより単純な生物の完全なゲノムを配列決定していました。 マウス , ショウジョウバエ , 酵母 e いくつかの植物 。 これらの最初のゲノムを生成するために行われた多大な努力は、ゲノムを読み取るために必要な技術に革命をもたらしました。 今日、ヒトゲノム全体を配列決定するのに何年も何百万ユーロもかからないという点まで進歩した技術。 今それがかかります 数日でXNUMXユーロ未満の費用がかかります.
何千ものゲノム
技術の進歩により、科学者は世界中の何千人もの個人の完全なゲノムを配列決定することができました。 などのイニシアチブ ゲノムアグリゲーションコンソーシアム 彼らはこの散在するデータを収集して整理するために多大な努力を払っています。 これまでのところ、そのグループは約150.000のゲノムを収集することができました。 このデータセット内で、研究者は人々のゲノムに241億XNUMX万以上の違いがあることを発見しました。 XNUMX塩基対ごとに平均XNUMXつのバリアント .
これらのバリエーションのほとんどは非常にまれであり、人に影響を与えることはありません。 しかし、それらの中に隠されているのは、重要な生理学的および医学的結果を伴う変異体です。 たとえば、BRCA1遺伝子のいくつかの変異体は、アシュケナージユダヤ人などの特定の女性グループの素因となります。 ガンに へ 卵巣と乳房。 その遺伝子の他の変異体はいくつかを運びます ナイジェリアの女性は通常よりも高い死亡率を経験する 乳がんのために。
ヒトゲノムのこれらの変異体を特定する方法は?
研究者が集団レベルでこれらのタイプの変異体を特定できる最善の方法は、大規模なグループの人々のゲノムを対照グループと比較する研究を通じてです。 しかし、病気は複雑です。 個人のライフスタイル、症状、発症までの時間は大きく異なる可能性があり、多くの病気に対する遺伝学の影響を区別することは困難です。 現在のゲノミクス研究の予測力は低すぎて、これらの影響の多くを除外することはできません。 十分なゲノムデータがありません .
複雑な病気の遺伝学、特に民族間の遺伝的差異に関連するものを理解することは、本質的にビッグデータの問題です。 そして、研究者はより多くのデータを必要としています。 はるかに多くのデータ。
1.000.000ゲノム
より多くのデータの必要性に対処するために、国立衛生研究所はと呼ばれるプログラムを開始しました 私たち全員 。 このプロジェクトは、調査やウェアラブルデバイスから遺伝子情報、医療記録、健康習慣を収集することを目的としています。 10年間で米国のXNUMX万人以上の人々の。 2018年に一般公開され、以来270.000万人以上がサンプルを提供してきました。
このプロジェクトの大きな可能性は、最も異なるデータを横断することによって研究を行う可能性にあります。 神経科学者は、たとえば運動レベルを考慮して、うつ病に関連する遺伝的変異を探すことができます。 オンコロジストは、民族の違いに基づいて皮膚がんのリスクに関連する変異を探すかもしれません。
XNUMX万のヒトゲノムを使用して、個人だけでなくさまざまなグループの人々の病気に対する遺伝的変異の影響を発見するための非常に豊富なデータがあります。
ヒトゲノムの暗い森
このプロジェクトのもうXNUMXつの利点は、科学者が現在研究が非常に難しいヒトゲノムの部分について学ぶことができることです。 遺伝子研究のほとんどは、タンパク質をコードするゲノムの部分に関するものです。 ただし、これらはヒトゲノムの1,5%.
有望な研究のXNUMXつは、人のDNAにエンコードされたメッセージをタンパク質に変換する分子であるRNAに焦点を当てています。 しかし、タンパク質を産生しないヒトゲノムの98,5%に由来するRNAには、他にも多くの機能があります。 これらのANNの一部は、次のようなプロセスに関与しています。 道 in どの癌が広がるか , 胚発生 または 女性のX染色体の制御。 All of Usプロジェクトには、ゲノムのすべてのコーディング部分と非コーディング部分が含まれているため、これらの神秘的なRNAに光を当てるために利用できるデータセットとしては群を抜いて最大になります。