近いうちに、何も言わずに唇を動かすだけで携帯電話をチェックしたり、音楽を聴いたりするようになるかもしれません。 コーネル大学の研究者グループ 彼は開発しました 顔の動きを追跡してコマンドとして解釈できるソナー ゴーグル。
ソナーゴーグルの仕組み
ルイドン・チャンコーネル大学の博士課程の学生である は、この革新的なプロジェクトの頭脳です。 ソナーゴーグルは、マイクと小さなスピーカーを使用して、私たちが静かに「話す」言葉を検出し、デバイスにコマンドを送信します。 このシステムは、チームの別の発明、ワイヤレス ヘッドセット、およびカメラを使用した初期のモデルに基づいて構築されています。

この新しい形状のおかげで、ヘッドセットを装着したり、カメラに囲まれたりする必要がなくなりました。 チェンチャンコーネル大学の情報科学の助教授である . 準備が整うと、ソナー デバイスはユーザーの顔で音波を送受信し、唇の動きを検出し、ディープ ラーニング アルゴリズムを通じてリアルタイムでエコー パターンを分析します。 95% の精度で。
プライバシーの名の下での実用的なアプリケーション
システムはスマートフォン上でデータをワイヤレスで処理するため、アクセサリーを小さく目立たなくすることができます。 現在のバージョンでは、音響検出用に約 10 時間のバッテリー寿命が提供され、電話からデータが送信されないため、プライバシーに関する懸念はありません。
このテクノロジーを実際に使用する可能性を考えるとき、プライバシーも重要な要素です。 Zhang は、ソナー ゴーグルを使用して、静かな図書館で音楽の再生を (ハンズフリーで見ずに) 制御したり、標準的なオプションが機能しない大音量のコンサート中にメッセージを口述したりするために使用できると示唆しています。
最もエキサイティングな見通しの XNUMX つは、この技術を何らかの発話障害を持つ人々が使用することです。彼らは眼鏡を使用して音声シンセサイザーにテキストを静かに「ディクテーション」し、その言葉を声に出して話すことができます。 Cheng Zhang は次のように述べています。
ウェアラブル技術における真に驚くべき飛躍。