未来の研究所は、人工知能を使用して人々の声を保存(および再現)することを目的としています。
「ボイスバンク」イニシアチブに関与する研究者たちは、病気や事故の結果として声を失うことに気づいたすべての人々の生活を変えることを望んでいます。 声を失うことは、音が一時的に低下したり、かすれたりするのとはまったく異なります。 声の喪失は、部分的にはアイデンティティの喪失です。
それはすべて、ボストンのノースイースタン大学と 母音D.. 喉の癌や変性疾患の後に、話し言葉を失った人に自分のアイデンティティーを保つ方法を提供することは重要です。 このプロジェクトでは、自分の声に非常に似た合成形式を使用して「話す」ことができます。
それはこのタイプの最初のセンターであり、教授によって導かれるでしょう。 Rupal Patel、VocaliDの創設者兼CEO。
同社はすでに個人向けにこのようなサービスを提供しているが、多くの人々は適切にボーカルをサンプリングするのに十分な品質の機器を欠いている。 「ボイスバンク」を構築することで、将来の患者がまだチャンスがあるときに自分の声を保つことができます。
「最後の瞬間に患者が来ることがよくある」 言う 「彼らは病気や手術などに翻弄されているため、彼らの声を維持するのに十分な時間がありません。 そして、それは非常にイライラさせられます。
ボイスバンク
その結果、技術を一般に広めるためのノースイースタンとのコラボレーションが実現しました。 プロジェクトの中心は、声を失うリスクのある患者が声を保護するために声を登録できるセンターである音声保存クリニックです。
このアプローチは、従来の音声合成に基づくアプローチよりもはるかに複雑です。 機械学習アルゴリズムは、合字、音素、さらには呼吸に関連するリズムさえも再構成します。 特別ブースでは、さまざまなテーマの小さな物語、詩、会話が収録されています。 誰かが自分の声を失うことについて冗談を言うことさえありました。
「必要なのは、約XNUMX〜XNUMX時間話すことです。 これらの録音から、人工知能は同じ音を持つ音声エンジンを生成できます。 失った人に声を返すようなものです」
再生成された音声は、書かれたテキストを変換することによって話す音声合成として使用でき、明日統合することができます メンタルパスから単語、画像、アクションを生成するソフトウェアを使用します。
非常に急速な改善
パテルによると、テクノロジーは急速に進歩しており、人間の発話と区別がつかない発話をすぐに再現できるようになるという。
チームはまた、声を「老化」させて人の年齢に適応させることもできますが、少年の声を大人に変えることによって「成長」させることはまだ不可能です。