灰色の猫を想像できますか? 良い。 今、白い毛皮で彼を想像してみてください。 今、彼が万里の長城を歩いていると想像してみてください。 終わり? ここで、これらの瞬間に、あなたの脳内の急速な一連のニューロンの活性化は、あなたの以前の世界の知識に基づいて、提示された画像のバリエーションを生み出しました。
私たち人間にとって、想像しやすいです。 ただし、人工知能の場合、それはまったく別の話です。 特定の活動における人間のパフォーマンスに匹敵する、またはそれを超えるニューラルネットワークの進歩にもかかわらず、コンピューターは依然として人間が物事を想像する能力からはほど遠いものです。
想像? AIには不可能です。 少なくとも昨日まで。
現在、USCの研究チームは、人間のような機能を使用して、さまざまな属性を持つこれまでに見たことのないオブジェクトを想像する人工知能を開発しました。 「グループ教師あり学習によるゼロショット合成」というタイトルのドキュメント、 XNUMX月にリリースされました、そして担保研究はそれ以来繁栄してきました。
「私たちは、機械で人間の想像力をシミュレートしようとする人間の視覚一般化スキルに触発されました」と、研究の筆頭著者は述べています。 ユンハオゲ。 「人間は、学んだ知識を形、ポーズ、位置、色などの属性で分離し、それを再結合して新しいオブジェクトを想像することができます。 私たちの記事は、ニューラルネットワークを使用してこのプロセスをシミュレートしようとしています」。
人工知能の一般化の問題
車の画像を生成する人工知能システムを作成するとします。 最初に、車のいくつかの画像をアルゴリズムに提供します。 タスクは、さまざまな角度から、任意の色で、多くの種類の車を生成することです。 これは深刻な課題です。 基礎となるルールを抽出し、これまでに見たことのない幅広い新しい例に適用できるニューラルネットワークを作成します。 しかし、今日のネットワークは、オブジェクトの属性を考慮せずに、サンプルの特性についてトレーニングされています。
この新しい研究では、研究者たちはこの制限を克服しようとしました。
秘密? それはもつれを解くと呼ばれています
研究チームの仕事は、もつれを解くと呼ばれる方法の適用に基づいていました。 もつれを解くことは、生成するために使用することができます ディープフェイクたとえば、ある人のアイデンティティを別の人に置き換える新しい画像やビデオを合成しますが、元の動きは維持します。
新しいアプローチでは、従来のアルゴリズムのように一度にXNUMXつのサンプルではなく、サンプル画像のグループを取得します。 Ddはそれらの間の類似性を抽出して、「制御可能なもつれのない表現学習」と呼ばれるものを取得します。
次に、この知識を再結合して、「画像の新しい制御可能な合成」を取得します。 「想像する」という動詞を使うことができます。
これは、私たち人間が推定する方法と非常によく似たプロセスです。 人間が物体の色を見ると、元の色を新しい色に置き換えることで、他の物体に簡単に適用できます。 チームは、もつれを解く技術を使用して、この分野での将来の研究に役立つ可能性のある1,56万枚の画像を含む新しいデータセットを生成しました。
想像することは世界を理解するのに役立ちます
もつれを解くことは新しい考えではありませんが、研究者たちは、それらの構造はほとんどすべてのタイプのデータまたは知識と互換性があると言います。 これにより、アプリケーションの機会が広がります。
たとえば、医学の分野では、もつれを解くことは、医師や生物学者が医学的機能を他の特性から分離し、それらを再結合して新しい薬を合成することにより、より有用な薬を発見するのに役立ちます。 機械を「想像」させることができることは、より安全な人工知能の作成にも役立つ可能性があります。 たとえば、自動運転車がトレーニング中にこれまでに見たことのない危険なシナリオを想像して回避できるようにします。
「ディープラーニングは、すでに多くの分野で卓越したパフォーマンスと期待を示しています。 ただし、これは表面的な模倣によって発生し、各オブジェクトを一意にする個別の属性を深く理解していないことがよくあります」と、コンピュータサイエンスの教授であるLaurentItti氏は述べています。 「この新しいもつれを解くアプローチは、初めて、AIシステムの新しい想像力を解き放ち、人間の世界理解に近づけます。」