未来の研究所は、人工知能を使用して人々の声を保存 (および再現) することを目指しています。
「ボイスバンク」イニシアチブに参加している研究者は、病気や事故の結果として声を失っていることに気付いたすべての人々の生活を変えることができることを望んでいます. 声を失うことは、一時的に音が小さくなったり、声がかすれたりするようなものではありません。 声の喪失は、アイデンティティの喪失の一部です。
それはすべて、ボストンのノースイースタン大学と 母音D.. 咽喉がんや変性疾患の後に発話能力を失った人に、アイデンティティの感覚を維持する方法を提供することは重要です。 このプロジェクトでは、自分の声に非常によく似た合成フォームを使用して「話す」ことができます。
それはこのタイプの最初のセンターであり、教授によって導かれるでしょう。 Rupal Patel、VocaliDの創設者兼CEO。
同社はすでに個人向けにそのようなサービスを提供していますが、多くの人は適切にボーカルをサンプリングするのに十分な品質の機器を持っていません. 「ボイスバンク」を構築することで、将来の患者はまだチャンスがあるときに声を維持できます。
「多くの場合、患者は最後の瞬間に私たちのところに来ます。」 言う 「彼らは病気や手術などに翻弄されているため、声を上げ続ける時間が十分にありません。 そして、それは非常にイライラします。」
ボイスバンク
その結果、技術を一般に広めるためのノースイースタンとのコラボレーションが実現しました。 プロジェクトの中心は、声を失うリスクのある患者が声を保護するために声を登録できるセンターである音声保存クリニックです。
このアプローチは、従来の音声合成に基づくものよりもはるかに複雑です。 機械学習アルゴリズムは、合字、音素、さらには呼吸に関連するリズムさえも再構成します。 特別ブースでは、さまざまなテーマの小さな物語、詩、会話が収録されています。 誰かが自分の声を失うことについて冗談を言うことさえありました。
「必要なのは、話すのに約XNUMX、XNUMX時間です。 これらの録音から、私たちの人工知能は同じ音の音声エンジンを生成できます。 声を失った人に声を返すようなものです」.
再生成された音声は、書かれたテキストを変換することによって話す音声合成として使用でき、明日統合することができます メンタルパスから単語、画像、アクションを生成するソフトウェアを使用します。
非常に急速な改善
パテルによると、テクノロジーは急速に進歩しており、人間の発話と区別がつかない発話をすぐに再現できるようになるという。
チームはまた、声を年齢に合わせて年齢に合わせて調整することもできますが、少年の声を大人に変換して「育てる」ことはまだできません。