イタリア時間午後 21 時に YouTube でライブ ブロードキャストを行い、OpenAI は、わずか数か月前にリリースされた前バージョンよりも明らかに高いレベルにある新しい宝石である GPT-4 を発表しました。 「会話のエキスパート」ChatGPT はさらに強力になっただけでなく、「見る」こともできます。そしてこの要因により、人工知能の開発が前例のないほど加速する可能性があります。
GPT-3 から GPT-4 に海が通過する
ChatGPT は、メッセージにテキストとコードで応答する OpenAI の「小さな電子天才」であり、急速に史上最速で成長するアプリとなり、月間ユーザー数は 100 億人を超えています。
その開発と並行して、ユーザー コミュニティとユーザー ガイドが誕生しました (私も公開しました: 興味があれば あなたはAmazonでそれを見つけることができます)そして「原型の職業」さえも、 迅速なエンジニア.
ただし、成功にもかかわらず、ChatGPT には解決すべき問題がいくつかありました。彼は「幻覚」を起こす傾向があり、もっともらしく聞こえるが実際はそうではないテキストを生成しました。それは偏見を反映しており、時には作成者が予見した違法なフレーズのフィルターを「貫通」しました。
新しい GPT-4 ベースのバージョンは、これらの問題のほとんどを解決し、パフォーマンスを (大幅に) 向上させます。
世界に目を向ける
このモデルの大きな新規性は、テキストと視覚の両方のプロンプトに応答できることです。可能性について考えてみましょう: 絵画の作者を特定する、ミームの意味を説明する、写真のキャプションを作成する...実際のところ、考えられる応用分野は非常に拡大し、考えられるリストは巨大になります。
しかし、GPT-4 はそれだけではありません。GPT-XNUMX は、以前のバージョンよりもはるかに「インテリジェント」であり、法曹界向けのテストなど、いくつかのテストでその結果を上回っています。 (LSAT)、アメリカの大学への入学に使用されるもの(土曜日)、および他の多く。 OpenAI は、GPT-4 が 40% 正確です 真実のコンテンツを生成する際に 傾斜が 82% 減少 不正なプロンプトに応答するため (チャットボットの「邪悪な」バージョンはさようなら)。
残りはすべて歴史です
私たちは、生成型人工知能がますます (そしてますます急速に) 獲得するであろう驚くべき特性について多くの疑問を抱くでしょう。 GPT-4 は「見る」機能のおかげで、私たちが毎日使用する多くのアプリケーションを強化します。
まず、前述のように、新しいもの AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 (有料版)、最大 25.000 語のテキストを処理できるようになりました。本全体を要約、作成、および書き換え、管理できます。 GPT-4 は検索エンジンの一部でもあります ビング。 ザ カーンアカデミー 学生向けの仮想家庭教師を作成するために使用していますが、 私の目になる は、視覚障害者向けに写真を分析して説明できる AI アシスタントを開発しました。
その進化についていくことは、ますます複雑になります。
GPT-4、今後の展望
明らかに、このシステムにはまだ改善の余地があり、まだ不完全な点もありますが、進歩は著しく、非常に急速です。同社はすでに、オーディオ、ビデオ、その他の入力をモデルの将来のバージョンに統合する方法を検討しています。彼らの目標は、GPT-4 が多数のアプリケーションを強化することで人々の生活を改善するための価値あるツールになることです。
間もなく、このデバイスは私たちの服装についてどう思うかを教えてくれたり、最適なヘアカットを推奨したりすることもできるでしょう。それは私たちが友人や親戚に提示する監視システムを刺激し、彼らだけに即座に開かれるようにします。それは私たちの車を、ドライバーと個人的な方法で対話する「スーパーカー」にするでしょう。それは多くの視覚障害者の「物語の声」となり、彼らがより統合されていると感じるのに役立つでしょう。他に何があるかは誰にも分かりません。
前述したように、すべての到着点を示すことはできません。せいぜい公式発表で出発点に戻すだけです。 OpenAI ブログで、または 昨日のプレゼン動画, 自分でアイデアを得ることができます。
しかし今のところは、まだ理解していない人のために、すでに私たちの生活を変えたこの並外れたオールラウンダーに「ようこそ」と言いましょう。