新しいアルゴリズムとITの進歩の間で、マシンはますます複雑になるモデルを学習できるようになりました。 写実的な画像や架空の人間の履歴書など、高品質の合成データを生成するようになります。
現在 国際ジャーナルに掲載された研究 PLOS遺伝 は、生体認証データでの機械学習の高度な使用法を示しています。 このシステムは、既存のバイオバンクから、実際の人間には属さないが実際のゲノムの特性を備えたヒトゲノムのブロック全体を生成します。
プライバシーの問題を回避する
「既存のゲノムデータベースは、 生物医学研究」と彼は言う ブラク・イェルメン、研究の筆頭著者であり、タルトゥ大学の現代集団遺伝学のジュニアリサーチフェロー。 「問題は、正当な倫理的懸念のために、それらが公的にアクセス可能でなく、長くて徹底的な執行手順によって保護されていないことです。 これは、研究者にとって重要な科学的障壁を生み出します。 機械によって生成されたゲノム、「人工ゲノム」は、安全な倫理的枠組みの中で問題を克服するのに役立ちます。
学際的なチームは、実際のゲノムと比較して、機械学習によって生成されたゲノムの品質を評価するために、より多くの分析を実行しました。 「驚くべきことに、このゲノムは、実際の人間の集団内で観察できる複雑さを模倣しており、ほとんどの特性について、 それらは、アルゴリズムのトレーニングに使用されるバイオバンクの他のゲノムと区別がつきません。。 XNUMXつの詳細を除いて、それらはどの遺伝子ドナーにも属していない」と述べた。 博士ルカ・パガーニ、研究の上級著者のXNUMX人であり、MobilitasPlussの仲間です。
機械で生成されたゲノム、「人工ゲノム」は、安全な倫理的枠組みの中で問題を克服するのに役立ちます
ブラク・イェルメン
それは本当にオリジナルのゲノムなのか、それとも「唾を吐く」コピーなのか?
この研究では、元のサンプルのプライバシーが保護されているかどうかを検証するために、人工ゲノムと実際のゲノムの近接性を評価することもできます。 「何千ものゲノムにわたるプライバシーリークを検出することは、干し草の山の中の針を探すように見えるかもしれませんが、複数の統計的測定の組み合わせにより、すべてのモデルを綿密に監視できます。 興味深いことに、複雑な分散パターンの詳細な調査は、次の評価における他の改善につながります。 GAN そしてそれは機械学習の分野に活気を与えるでしょう」。 それは博士であると言うこと。 フローラジェイ、CNRS、フランス国立科学研究センターの研究コーディネーターおよび研究者)。
全体として、すでに提供されている機械学習アプローチ ボルト、伝記と 他の多くの機能 一握りの架空の人間に。 私たちは今、彼らの生物学についてももっと知っています。 現実的なゲノムを持つこれらの架空の人間は、公に利用可能ではない実際のゲノムの代わりに実験ベンチとして機能する可能性があります。