顔がリモコンになるソナーゴーグル「EchoSpeech」

ジャンルカリッチョ

4月7 2023

4e63bc30 d498 11ed 9edf 4904a60c

技術

コーネル大学で開発されたソナーゴーグルにより、デバイスをハンズフリーおよび音声なしで使用できるようになります。

シェア

間もなく、私たちは何も言わずに唇を動かすだけで携帯電話をチェックしたり、音楽を聴いたりできるようになりました。コーネル大学の研究者グループ彼は開発しました顔の動きを追跡してコマンドとして解釈できるソナーゴーグル。

ソナーゴーグルの仕組み

ルイドン・チャンコーネル大学の博士課程の学生である彼は、この革新的なプロジェクトの頭脳です。ソナーグラスは、小さなマイクとスピーカーを使用して、私たちが静かに「話す」言葉を検出し、コマンドをデバイスに送信します。このシステムは、チームのもう 1 つの発明であるワイヤレスヘッドセットと、カメラを使用していた以前のモデルに基づいています。

ソナーゴーグル — ソナーゴーグルのクローズアップショット (ブリッジにテープが貼られています。非常にマニアックです)

この新しい形状のおかげで、ヘッドセットを装着したり、カメラに囲まれたりする必要がなくなりました。 チェンチャンコーネル大学情報科学助教授は、このシステムがユーザーの発音パターンを学習するには、一連の数字を読み取るなどの数分間のトレーニングデータが必要であると説明しています。準備が完了すると、ソナーデバイスはユーザーの顔に音波を送受信し、唇の動きを検出し、深層学習アルゴリズムを通じてリアルタイムでエコープロファイルを分析します。 95% の精度で。

プライバシーに特化した実用的なアプリケーション

このシステムはスマートフォン上でデータをワイヤレスで処理するため、アクセサリを小型で目立たないようにすることができます。現在のバージョンでは、音響検出のためのバッテリー寿命が約 10 時間あり、電話機からデータが流出しないため、プライバシーの懸念はありません。

このテクノロジーを実際に使用する可能性を考えるとき、プライバシーも重要な要素です。 Zhang は、ソナーゴーグルを使用して、静かな図書館で音楽の再生を (ハンズフリーで見ずに) 制御したり、標準的なオプションが機能しない大音量のコンサート中にメッセージを口述したりするために使用できると示唆しています。

最も興味深い展望の 1 つは、何らかの言語障害を持つ人々がこのテクノロジーを使用することであり、眼鏡を使用してテキストを音声合成装置に黙って「書き取り」、音声合成装置がその単語を声に出して話すことができるようになります。「私たちは、メガネが日常の状況における人間の活動を理解するための重要なパーソナルコンピューティングプラットフォームになると信じています」と Cheng Zhang 氏は言います。

ウェアラブル技術における真に驚くべき飛躍。

ジャンルカリッチョ、メランシアadvのクリエイティブディレクター、コピーライター、ジャーナリスト。イタリア未来研究所、世界未来協会、H+ の一部です。 2006 年以来、イタリアの未来学のリソースである Futuroprossimo.it を監督しています。

研究、発見、発明を報告するため、 編集チームまでご連絡ください！ Whatsapp で Futuro Prossimo をフォローしてください: 独占的なニュースと最新情報 (無料)。

ロビアティ・リッチョ

ファット・クオティディアーノのFP
アルベルト・ロビアーティとジャンルカ・リッチョは、未来のシナリオ、つまり可能性のある明日を創造するために私たちが持つ機会、リスク、可能性を読者にガイドします。

同じトピックについて:

ベジエ、完璧なメガネ: 3D プリントされ、アルゴリズムによって顔に「縫い付けられた」

10月4 2022

クボタ、近視を治すメガネの小売販売を開始

8月11 2022

DARPAは、軍医向けの拡張現実メガネであるMAGICAIを発売しました

9月2022

アーカイブ

最後

オーバーツーリズム: ヴェネツィアへの入場料は芸術都市の未来ですか?

4月25 2024

バッテリーリサイクル2.0、「電気自動車はイエスかノーか？」というテーマの墓標

4月25 2024

合成だが生きている：人工と生物学の境界に挑戦する細胞

4月25 2024

ドイツよ、1年前に我々は原子力発電に別れを告げた：なぜ原子力発電は戻らないのか

4月25 2024

ヘルクラネウムがプラトンの秘密を明らかにする: 再構成された彼の最後

4月24 2024