イタリア時間の午後 21 時に YouTube でライブ ブロードキャストが行われ、OpenAI は新しい宝石 GPT-4 を発表しました。これは、わずか数か月前にリリースされた以前のバージョンよりも明らかに高いレベルにあります。 「会話のエキスパート」ChatGPT は、より強力になっただけでなく、「見る」こともできます。 そしてこの要因は、人工知能の開発において前例のない加速に取って代わられる可能性があります。
GPT-3 から GPT-4 に海が通過する
テキストとコードでメッセージに返信する OpenAI の「小さな電子の天才」である ChatGPT は、月間 100 億人を超えるユーザーを抱える、歴史上最も急速に成長しているアプリになりました。
その開発と並行して、ユーザーのコミュニティとユーザーガイドが生まれました(私もXNUMXつ公開しました:興味がある場合 あなたはAmazonでそれを見つけることができます)そして「プロトプロフェッション」でさえ、 迅速なエンジニア.
ただし、その成功にもかかわらず、ChatGPT には解決すべきいくつかの問題がありました。 彼は「幻覚」を起こす傾向があり、もっともらしく聞こえたがそうではなかった歌詞を生成しました。 それは偏見を反映しており、作成者によって提供された違法なフレーズのフィルターを「パンチ」することもありました。
新しい GPT-4 ベースのバージョンは、これらの問題のほとんどを解決し、パフォーマンスを (大幅に) 向上させます。

世界に目を向ける
このテンプレートの大きなニュースは、テキスト プロンプトと視覚的プロンプトの両方に応答できることです。 可能性を考えてみてください。絵画の作者を特定したり、ミームの意味を説明したり、写真のキャプションを作成したりします。実際には、可能なアプリケーションの分野が非常に広がるため、可能なリストは膨大になります。
しかし、GPT-4 はそれだけにとどまりません。それはまた、前任者よりもはるかに「インテリジェント」であり、法律専門家向けのものなど、さまざまなテストでその結果を上回っています。 (LSAT)、アメリカの大学への入学に使用されるもの (土)、および他の多く。 OpenAI は、GPT-4 が 40% 正確です 真実のコンテンツを生成する際に 82% 傾斜が少ない 違法なプロンプトに答える (さようなら「悪」バージョンのチャットボット)。

残りはすべて歴史です
私たちは、生成型人工知能がますます多く (そしてますます速く) 獲得する驚くべき特性について、自問自答します。 「見る」能力のおかげで、GPT-4 は私たちが日常的に使用する多くのアプリケーションを強化します。
まず、前述のように、新しいもの チャットGPT (有料版)、最大 25.000 語のテキストを処理できるようになりました。本全体を要約、作成、および書き換え、管理できます。 GPT-4 は検索エンジンの一部でもあります ビング。 ザ カーンアカデミー 学生向けの仮想家庭教師を作成するために使用していますが、 私の目になる は、視覚障害者向けに写真を分析して説明できる AI アシスタントを開発しました。
その進化についていくことは、ますます複雑になります。

GPT-4、今後の展望
もちろん、このシステムはまだ改善の余地があり、不完全な部分もありますが、進歩は目覚ましく、非常に急速です。 同社は、オーディオ、ビデオ、およびその他の入力をモデルの将来のバージョンに統合する方法をすでに検討しています。 彼らの目標は、GPT-4 が多数のアプリケーションを強化することで、人々の生活を改善するためのかけがえのないツールになることです。

しばらくすると、このガジェットは私たちの服についてどう思うかを教えてくれたり、最適なヘアカットを提案してくれたりします。 これは、私たちが友人や親戚に紹介する監視システムを強化し、彼らだけにすぐに公開します. 私たちの車は、ドライバーと個人的に対話する「スーパーカー」になります。 それは多くの視覚障害者の「物語の声」となり、彼らがより統合されていると感じるのに役立ちます. そして、誰が他に何を知っていますか。
前述のように、すべての到着地点を示すことはできません。せいぜい、公式発表で出発地点に戻ることができます。 OpenAI ブログで、または 昨日のプレゼン動画、だからあなたは自分でアイデアを得る。
しかし、今のところ、この並外れた便利屋に「ようこそ」と言いましょう。