Microsoft は、ChatGPT が単純なテキスト メッセージからビデオを作成できるようにする AI アップデートである GPT-4 をリリースしようとしています。 アンドレアス・ブラウン、Microsoft Germany の CTO、 発表 「AI in Focus - Digital Kickoff」イベント中のニュース。 GPT-4 は「マルチモード」になり、インテリジェンスがテキストを他の種類のメディアに変換できるようになります。 ブラウン氏は、新しいアップデートは「ビデオなど、まったく異なる可能性」を提供すると説明した. 率直に言って、私は画像と音、おそらく音楽も期待しています。
最初ではありませんが、最高です
脚光を浴びているAI分野の実験では、テキストの指示から動画を作成できるシステムがすでにXNUMXつある。 それは ビデオを作ります、Facebook メタが所有する AI (ここで話しました)、そして、 ドリーミックス、Google によって開発されました (ここで話しました)。 ただし、GPT-4 を搭載した ChatGPT の次のバージョンでは、さらに多くのことができるようになるようです。
Microsoft は使用例を提供しています。シナリオはコール センターのシナリオです。 ブラウンが示したモデルでは、AI が電話での会話を自動的にテキストに変換し、従業員の時間と労力を節約します。 それは単純な味です: GPT-4 の特性はすべて発見され、評価されるべきであり、私たちはすぐにそうするでしょう. いつ? 早ければ来週から、レドモンドの巨像が発表します。

GPT-4、別のページをめくる
最近の開発により、私たちはニュースを収集するのにかなり早く慣れてきていますが、物事はますます速くなっています。 GPT-4 は目前に迫っており、この技術のさらなる開発がすでに予見されています。 AI は、より複雑で洗練されたレベルの自然言語を理解します。 彼らは、ますます正確で状況に応じた方法で情報を処理および解釈し、迅速に適応して「動的な」状況に対応できるようになります。
最も重要なことは、より速く学習することです。マルチモーダルな複合体全体で「アウトソーシング」する機能により、AI により多くの「感覚」が追加されます。 これらのシステムと、コンピュータ ビジョンなどの他の高度なテクノロジとの統合が間近に迫っています。 ロボット工学. 「知覚力のある」ロボットはありませんが、ロボット工学が試行錯誤を繰り返し始めて以来、私たちが見たどのロボットよりもはるかに高度になります (そしてそれは確かです)。
私は何を言うことができます: 私も「歯を食いしばる」GPT-4 が待ちきれません。 あなたも?