の出現からまだ回復していません。 ダル-E2、メタが発表した中途半端な仲間たち ビデオを作ります、テキストの説明から短いビデオ クリップを生成するツール。 これは、AI によって生成されたコンテンツの世界における次のステップです。
テキストからビデオへの変換ツールがこれほど最終的なリリースに近づいたのはこれが初めてです。 「人工知能の研究は、新しいコンテンツを迅速かつ簡単に作成するためのツールを人々に提供することで、創造的な表現を推進しています」と読みます。 プレスリリース プレゼンテーション
Make-A-Video は、数語または数行のテキストで創造性に命を吹き込み、色、キャラクター、設定が豊富な独特の映画を作成することができます。 このシステムは、既存の写真やビデオを同様の新しいムービーに変換することもできます。
素晴らしいショット、デビッド
「写真よりも動画を生成する方がはるかに難しい」と Meta の CEO は言います マーク·ザッカーバーグ で Facebookに投稿. しかし、私は考えていませんでした。 「各ピクセルを正しく生成するだけでなく、システムはそれらが時間の経過とともにどのように変化するかを予測する必要もあります。 Make-A-Video は、システムが物理世界の動きを理解し、それを従来のテキストから画像への生成に適用できるようにする教師なし学習レイヤーを追加することで、この問題を解決します。
Il ウェブサイト の Make-A-Video では、「空を飛んでいる赤いケープ付きのスーパーヒーローの衣装を着た犬」や「テディベアの絵」など、人工知能によって作成されたいくつかのサンプルビデオを特集しています。 これは、これらのシステムの信じられないほど急速な進歩のもう XNUMX つのデモンストレーションです。 XNUMXつだけ? XNUMX年前? これらは事実上サイエンスフィクションでした。
Make-A-Video、不思議 (そしてもちろん危険)
アートを生成するために AI への依存度が高まるにつれて、企業がこれらのアルゴリズムに透明性ポリシーを採用することがますます重要になります。 Make-A-Video の背後にある研究論文を読むと、この人工知能は、LAOIN と呼ばれるデータ セットのサブセットを使用して「トレーニング」されているようです。これには、汚れた画像も含まれています。 どれの? ISIS の処刑、同意のないヌードなど。 メタは、このデータを十分にふるいにかけ、ヌードやその他の偽の画像を自動的に破棄します。
サラ。 一方、倫理をめぐる戦いは続く。
アーティストやクリエーター向けのツールとしてのテキストからビデオへの導入は、AI によって生成されたアートの正当性に関する (すでに非常に厄介な) 問題を複雑にしています。 XNUMX 月には、Jason Allen という男が Midjourney によって作成された画像を使用したアート コンペティションで優勝し、論争のハイブを引き起こしました。
商用目的で画像を収集する企業 (Shutterstock や Getty Images など) も、このコンテンツへの扉を閉ざしています。 この場合、倫理的な問題はありません。 法務のみ。 アルゴリズムがトレーニングに使用する画像の所有者は誰ですか? それらの画像を新しいものに変えることは著作権侵害ですか? 法律はまだ適応していません。
一方で、津波は続いています。これらのテクノロジーは、完璧に習得するのと同じスピードで、文字通り大衆を圧倒しています。 昨日の Make-A-Video での発表から XNUMX 日遅れて DALLE-2の公開 OpenAIによる。 DALLE-2 を開発した会社は、システムから待機リストを削除し、誰でもテキスト行から画像を生成できるようにしました。
しかし、一般の人々がますます多くの AI アート生成ツールにアクセスできるようになったとしても、それらの使用に関する基本的な倫理的問題のいくつかは未解決のままであり、それらに答える必要があります。