Microsoft は、ChatGPT が単純なテキスト メッセージからビデオを作成できるようにする AI アップデートである GPT-4 をリリースしようとしています。 アンドレアス・ブラウン、Microsoft Germany の CTO、 発表 「AI in Focus – Digital Kickoff」イベント中のニュース。 GPT-4 は「マルチモーダル」となり、知能がテキストを他のタイプのメディアに翻訳できるようになります。ブラウン氏は、新しいアップデートは「ビデオなど、まったく異なる可能性」を提供すると説明した。率直に言って、私は画像や音、おそらく音楽も期待しています。
最初ではありませんが、最高です
AI分野での実験が注目されているが、テキストの指示から動画を制作できるシステムがすでに2つある。それは ビデオを作ります、Facebook メタが所有する AI (ここで話しました)、そして、 ドリーミックス、Google によって開発されました (ここで話しました)。 ただし、GPT-4 を搭載した ChatGPT の次のバージョンでは、さらに多くのことができるようになるようです。
Microsoft は使用例を提供しました。シナリオはコールセンターのシナリオです。ブラウン氏が示すモデルでは、AI が電話での会話を自動的にテキストに変換し、従業員の時間と労力を節約します。これは単純な話です。GPT-4 の特性はすべて発見され、評価されるべきものであり、すぐにそれを行う予定です。いつ?来週から、レドモンドの巨人は言う。
GPT-4、新たなページをめくる
最近の発展により、私たちはニュースをかなり早くキャッチすることに慣れてきましたが、物事のスピードはますます速くなっています。 GPT-4 は目前に迫っており、この技術のさらなる発展はすでに予見可能です。 AI は、より複雑で高度なレベルで自然言語を理解するようになります。彼らは、ますます正確かつ状況に応じた方法で情報を処理および解釈し、「動的な」状況に迅速に適応して対応できるようになります。
何よりも、学習がより迅速になります。複雑なマルチモダリティを通じて「外部」に到達する能力により、AI に他の「感覚」が追加されます。これらのシステムと人工視覚などの他の先進技術の統合が目前に迫っています。 ロボット工学。私たちは「感覚を持った」ロボットを手に入れることはできませんが、ロボット工学が大量の試みを始めて以来、私たちが目にしてきたすべてのロボットよりもはるかに進歩したものになるでしょう(そしてこれは確かです)。
何と言えばいいでしょうか。私も GPT-4 に「挑戦する」のが待ちきれません。あなたも?