カリフォルニア大学サンディエゴ校の研究者は最近、どの鳥が歌おうとしているのかを予測する機械学習システムを構築しました。
実用的な可能性があまりない場合は、まず、音声補綴物のリアルタイム予測音声合成はすでに素晴らしいことだとお話しします。 しかし、鳥のさえずりを理解することの意味は、はるかに進む可能性があります。
鳥のさえずり、非常に明瞭な世界
鳥のさえずりは、リズム、音色、そして最も重要なこととして、習得した行動を含む複雑な形のコミュニケーションです。
研究者によると、AI に鳥のさえずりを理解するように教えること (そして十分に予測できるように構築できるようにすること) は、生物学的な人間の発声を置き換えるための重要なステップです。
運動義足は動物モデルとして霊長類を使用しました。 ボイスプロテーゼに類似のモデルはありません。 これがおそらく、ニューラル インターフェース技術、脳の範囲、および行動研究の設計に関して、これらがより制限されている理由です。

鳥のさえずりを「考える」のは簡単ではありませんが、重要なステップです
鳴き鳥は、学習された複雑な発声行動の興味深いモデルです。 鳥のさえずりは、人間の言語と多くの独特の類似点を共有しています。 それを研究することで、発声運動能力の学習、実行、維持の根底にあるメカニズムと回路に関する優れた一般情報がすでに提供されています.
しかし、発声をリアルタイムで翻訳することは簡単なことではありません。 現在のシステムは、私たちの自然な思考-スピーチパターンと比較してまだ遅いです。
考えてみてください。それは素晴らしいことです。最先端の自然言語処理システムは、依然として人間の思考に追いつくために苦労しています。
私たちはまだ車には速すぎます
Google アシスタントや Alexa とやり取りするときは、実際の人と話している場合よりも長い間休止することがよくあります。 これは、人工知能が私たちの音声を処理し、その機能に関連して各単語の意味を判断し、応答するためにアクセスする反応またはプログラムを発見しているためです。
もちろん、これらのクラウドベースのシステムがこの速度で実行されることには、すでに驚くべきことです。 しかし、彼らはまだ、声のない人が思考の速度で話すことを可能にするリアルタイムのインターフェースを作成するのに十分ではありません.
鳥のさえずりに関する研究

まず、チームは XNUMX 羽の鳥の脳 (キンカチョウ) に電極を埋め込み、鳥のさえずり中の脳活動の記録を開始しました。
しかし、さえずり中の鳥の神経活動を認識できるように人工知能を訓練するだけでは十分ではありません。鳥の脳でさえ、神経細胞間の通信機能を完全にマッピングするには複雑すぎます。
このため、研究者は人工知能が処理できる認識可能なパターンにリアルタイムで曲を削減する別のシステムをトレーニングしました。
それは未解決の問題の解決策を提供するので、それは非常に興味深いものです。
リアルタイムの鳥のさえずり処理が印象的 そして、これらの結果を人間の言語で複製することは歴史的です。
しかし、この最初の仕事はまだ準備ができていません。 そして、それはまだ他の音声システムに適応できません。 鳥のさえずりを超えては機能しないかもしれません。
しかし、もしそうなら、それは2014年の深層学習の復活以来、ブレインコンピューターインターフェースの最初の巨大な技術的飛躍のXNUMXつになるでしょう。