DeepMind が RT-2 を発表: 見て、学習し、行動するロボット

7月30 2023

628644ed1fd288f73df6d946 IMG 0831 1 スケーリング済み

Robotica, 技術

DeepMind が開発した、視覚と言語を組み合わせて機械を制御する AI モデルは、ロボット工学の新たな地平を切り開きます。

モニターやテクノロジー機器があふれる明るい環境の中で、ロボットが主役として立っています。金属組織は光を反射しますが、本当の魔法はその「目」に隠されています。これらの目は、DeepMind の RT-2 モデルによって強化されており、見て、解釈し、行動することができます。

ロボットが優雅に動くと、周囲の科学者たちはロボットの一挙手一投足を注意深く観察します。それは単なる金属片や回路ではなく、ウェブの広大な世界と具体的な現実を結び付ける知性の具現化です。

RT-2の進化

ロボット工学は近年大きく進歩していますが、 ディープマインド それはゲームをまったく新しいレベルに引き上げただけです。イラスト付き論文で発売したばかりです、届きました RT-2。もの？これは、Web データだけでなくロボットデータからも学習し、この知識をロボット制御の一般化された命令に変換するビジョン言語アクション (VLA) モデルです。

テクノロジーが飛躍的に進歩する時代において、RT-2 は大きな飛躍を遂げ、ロボット工学の分野だけでなく、私たちの日常の生活や働き方にも革命をもたらすことを約束します。しかし、これは実際には何を意味するのでしょうか?

DeepMind RT-2、ビジョンからアクションへ

のモデル 高容量ビジョン言語 (VLM) 彼らは大規模なデータセットでトレーニングされているため、視覚的または言語的パターン (たとえば、異なる言語で動作する) を認識することにも非常に優れています。しかし、これらのモデルと同じことをロボットに実行させることができると想像してみてください。実際、想像するのはやめてください。DeepMind は RT-2 でそれを可能にしています。

ロボットトランスフォーマー1 (RT-1) それ自体が驚異でしたが、RT-2 はさらに進化し、強化された汎化機能と、これまでさらされてきたロボットデータを超えた意味論的および視覚的理解を示しています。

連鎖推論

RT-2 の最も魅力的な側面の XNUMX つは、その連鎖推論能力です。彼は、どんな物体がその場しのぎのハンマーとして使えるか、あるいは疲れた人にはどんな飲み物が最適かを決めることができる。この深い推論能力は、私たちがロボットと対話する方法に革命をもたらす可能性があります。

そして最悪なことに、頭の明晰さを取り戻すためにロボットにおいしいコーヒーを入れてもらうこともできます。

しかし、DeepMind RT-2 はどのようにしてロボットを制御するのでしょうか?

答えは彼がどのように訓練されたかにあります。実際、ChatGPT などのテンプレートによって利用される言語トークンと似たような表現が使用されています。

RT-2 は、シンボルの理解、推論、人間の認識などの驚くべき創発能力を実証しました。現在、以前のモデルと比較して3倍以上の向上を示しているスキル。

RT-2では、 ディープマインド これは、視覚言語モデルを強力な視覚言語行動モデルに変換できることを示しただけでなく、ロボットが推論し、問題を解決し、情報を解釈して現実のさまざまなタスクを実行できる未来への扉も開きました。世界。

そしていま？

人工知能とロボット工学がますます中心となる世界において、RT-2 は次の進化が純粋に技術的なものではなく、「知覚」的なものになることを示しています。機械は私たちが想像もしていなかった方法で私たちのニーズを理解し、それに応えてくれるでしょう。

これがほんの始まりに過ぎないとしたら、将来どうなるかは誰にもわかりません。

ジャンルカリッチョ、メランシアadvのクリエイティブディレクター、コピーライター、ジャーナリスト。イタリア未来研究所、世界未来協会、H+ の一部です。 2006 年以来、イタリアの未来学のリソースである Futuroprossimo.it を監督しています。

研究、発見、発明を報告するため、 編集チームまでご連絡ください！ Whatsapp で Futuro Prossimo をフォローしてください: 独占的なニュースと最新情報 (無料)。

ファット・クオティディアーノのFP
アルベルト・ロビアーティとジャンルカ・リッチョは、未来のシナリオ、つまり可能性のある明日を創造するために私たちが持つ機会、リスク、可能性を読者にガイドします。

同じトピックについて:

最後

DeepMind が RT-2 を発表: 見て、学習し、行動するロボット

Robotica, 技術

シェア

RT-2の進化

DeepMind RT-2、ビジョンからアクションへ

連鎖推論

しかし、DeepMind RT-2 はどのようにしてロボットを制御するのでしょうか?

そしていま？

自律型兵器、ウィーン会議：「人類を守るために今すぐ行動を」

変形性関節症、AI 血液検査が X 線を上回り、10 年前に予測

これまでにないスピードと精度: Astribot S1 ロボットは稲妻です

環境の画期的な進歩、特殊な胞子のおかげで自己破壊するプラスチックが作られる

ネアンデルタール人と目と目を合わせる：シャニダール Z の驚くべき顔

アイルトン・セナ、30年後: 彼の悲劇的な最後がF1の未来を変えた

自律型兵器、ウィーン会議：「人類を守るために今すぐ行動を」

垂直農法: どのくらい知っていますか?払拭すべき4つの神話