灰色の猫を想像できますか? 良い。 さて、彼が白い毛皮を着ていると想像してみてください。 さて、彼が万里の長城を歩いているところを想像してみてください。 終わり? ここで、これらの瞬間に、脳内の一連の急速な神経活動が、世界に関する以前の知識に基づいて、提示された画像のバリエーションを生み出しました.
私たち人間にとっては容易に想像できます。 ただし、人工知能の場合はまったく別の話です。 特定の活動において人間のパフォーマンスと同等またはそれを超えるニューラル ネットワークの進歩にもかかわらず、コンピューターは人間の想像力にはまだほど遠い状態にあります。
想像? AIには不可能です。 少なくとも昨日まで。
現在、USC の研究チームは、人間のような能力を使用して、これまでに見たことのないさまざまな属性を持つオブジェクトを想像する人工知能を開発しました。 「グループ教師あり学習によるゼロショット合成」というタイトルのドキュメントは、 XNUMX月にリリースされました、そして担保研究はそれ以来繁栄してきました。
「私たちは、機械で人間の想像力をシミュレートしようとする人間の視覚的一般化スキルに触発されました」と研究の筆頭著者は述べています。 ユンハオゲ. 「人間は、形、ポーズ、位置、色などの属性によって学習した知識を分離し、それを再結合して新しいオブジェクトを想像することができます。私たちの論文は、ニューラル ネットワークを使用してこのプロセスをシミュレートしようとしています。」

人工知能の一般化の問題
車の画像を生成する人工知能システムを作成したいとします。 最初に、車の画像をアルゴリズムに提供します。 タスクは、複数の角度から、任意の色の多くの種類の車を生成することです。 これは深刻な課題です。 基礎となるルールを抽出し、これまでに見たことのない幅広い新しい例に適用できるニューラルネットワークを作成します。 しかし、今日のネットワークは、オブジェクトの属性を考慮せずに、サンプルの特性についてトレーニングされています。
この新しい研究では、研究者たちはこの制限を克服しようとしました。
秘密? それはもつれを解くと呼ばれています

研究チームの研究は、もつれをほどくことと呼ばれる方法の適用に基づいていました。 もつれを解くことを使用して生成できます ディープフェイク、たとえば、ある人物のアイデンティティを別の人物に置き換える新しい画像やビデオを合成しますが、元の動きは維持します。
新しいアプローチでは、従来のアルゴリズムのように一度に XNUMX つのサンプルではなく、サンプル画像のグループを使用します。 Ddはそれらの間の類似性を抽出して、「制御可能なもつれのない表現学習」と呼ばれるものを取得します。
そして、この知識を組み合わせて「新しい制御可能な画像合成」を取得します。 「想像する」という動詞を使うことができます。
これは、私たち人間が推定する方法と非常によく似たプロセスです。 人間が物体の色を見ると、元の色を新しい色に置き換えることで、他の物体に簡単に適用できます。 チームは、もつれを解く技術を使用して、この分野での将来の研究に役立つ可能性のある1,56万枚の画像を含む新しいデータセットを生成しました。
想像することは世界を理解するのに役立ちます
もつれを解くことは新しいアイデアではありませんが、その構造はほとんどすべてのタイプのデータや知識と互換性があると研究者は述べています。 これにより、アプリケーションの機会が広がります。
たとえば、医学の分野では、もつれを解くことは、医学的機能を他の特性から分離し、それらを再結合して新薬を合成することにより、医師や生物学者がより有用な薬を発見するのに役立ちます. 機械に「想像」させることは、より安全な人工知能の作成にも役立つ可能性があります。 たとえば、自動運転車がトレーニング中にこれまでに見たことのない危険なシナリオを想像して回避できるようにします。
「ディープ ラーニングは、多くの分野で卓越した性能と有望性をすでに実証しています。ただし、これは表面的な模倣によってもたらされ、各オブジェクトを一意にする個別の属性をより深く理解することなく行われることが多すぎます」と情報学の教授である Laurent Itti は述べています。 「このもつれを解くという新しいアプローチは、初めて AI システムに新しい想像力を解き放ち、世界に対する人間の理解に近づけます。」