間もなく、私たちは何も言わずに唇を動かすだけで携帯電話をチェックしたり、音楽を聴いたりできるようになりました。コーネル大学の研究者グループ 彼は開発しました 顔の動きを追跡してコマンドとして解釈できるソナー ゴーグル。
ソナーゴーグルの仕組み
ルイドン・チャンコーネル大学の博士課程の学生である彼は、この革新的なプロジェクトの頭脳です。ソナーグラスは、小さなマイクとスピーカーを使用して、私たちが静かに「話す」言葉を検出し、コマンドをデバイスに送信します。このシステムは、チームのもう 1 つの発明であるワイヤレス ヘッドセットと、カメラを使用していた以前のモデルに基づいています。
この新しい形状のおかげで、ヘッドセットを装着したり、カメラに囲まれたりする必要がなくなりました。 チェンチャンコーネル大学情報科学助教授は、このシステムがユーザーの発音パターンを学習するには、一連の数字を読み取るなどの数分間のトレーニング データが必要であると説明しています。準備が完了すると、ソナー デバイスはユーザーの顔に音波を送受信し、唇の動きを検出し、深層学習アルゴリズムを通じてリアルタイムでエコー プロファイルを分析します。 95% の精度で。
プライバシーに特化した実用的なアプリケーション
このシステムはスマートフォン上でデータをワイヤレスで処理するため、アクセサリを小型で目立たないようにすることができます。現在のバージョンでは、音響検出のためのバッテリー寿命が約 10 時間あり、電話機からデータが流出しないため、プライバシーの懸念はありません。
このテクノロジーを実際に使用する可能性を考えるとき、プライバシーも重要な要素です。 Zhang は、ソナー ゴーグルを使用して、静かな図書館で音楽の再生を (ハンズフリーで見ずに) 制御したり、標準的なオプションが機能しない大音量のコンサート中にメッセージを口述したりするために使用できると示唆しています。
最も興味深い展望の 1 つは、何らかの言語障害を持つ人々がこのテクノロジーを使用することであり、眼鏡を使用してテキストを音声合成装置に黙って「書き取り」、音声合成装置がその単語を声に出して話すことができるようになります。 「私たちは、メガネが日常の状況における人間の活動を理解するための重要なパーソナル コンピューティング プラットフォームになると信じています」と Cheng Zhang 氏は言います。
ウェアラブル技術における真に驚くべき飛躍。