Battlefield 開発者のマルチプレイヤー シューター The Finals は AI の音声でいっぱいです - そして、おわかりいただけるでしょう

Embark Studios は、テキスト読み上げ技術により「品質の面で十分なレベルに達し、新しいアイデアに非常に敏感になることができる」と述べています。

画像クレジット:エンバーク スタジオ

決勝戦、現金を奪い取る、破壊可能な風景マルチプレイヤー FPS元バトルフィールド開発者による、現在オープンベータの真っ最中ですこれにより、誰でもそのシューティング、スマッシュ、キャッシュのゲームプレイを体験することができます。聞いてみることもできます。聞いてみると、ゲーム内ゲーム ショーのアナウンサーが少し違うことに気づくかもしれません。そうです。これらは AI によって生成された音声であり、人間の俳優ではありません。

YouTubeで見る

Embark Studios のオーディオ デザイナー、アンドレアス アルムストローム氏は、7 月に行われた The Finals の制作に関するポッドキャスト エピソードで AI テキスト読み上げ技術を使用する決定を認めました。最近ジャンニ・マトラグラーノによって発見された。マトラグラノ自身もビデオゲームの俳優であり、原神邪悪な西トレパン2などなど。

「それではここからが重要です。ナレーションは何をしたのですか?」ポッドキャストの司会者から、ザ・ファイナルのナレーションを誰が担当したか尋ねられたとき、アルムストロムはこう答えた。 「実際のところ、私たちはいくつかの例外を除いて AI を使用していました。」

アルムストローム氏は、「吠え声などの出場者の声はすべて、そしてコメンテーターの二人も AI テキスト読み上げ機能を備えている」と説明し、「私たちが発声と呼ぶもの」には、プレイヤー キャラクターが走ったり、跳んだり、跳んだりするときに発する息の音やうめき声が含まれます。ジャンプ - Embark 自身の開発者によって提供されます。アルムストローム氏は、努力が足りないわけではなく、「AIにそのようなタスクを実際に実行させることはまだ不可能です」と述べた。

アルムストロム氏は、AIが生成した音声を使用する決定は、人間の声に十分近い音声を提供できると同時に、人間の俳優がブースに入る場合と比較して比較的短時間で生成できるテクノロジーの能力によるものだと主張した。

「私たちがこの道を進む理由は、AI テキスト読み上げがついに非常に強力になったからです」とアルムストロム氏は語った。 「これにより、品質の面で十分なレベルに達し、新しいアイデアに非常に敏感になり、物事を本当に新鮮に保つことができます。」

マトラグラノが共有したファイナルのアナウンサーのクリップでは、「十分な距離を獲得する」という目標がかなりはっきりと聞こえ、特定の単語の強調が著しく奇妙で、文への奇妙な流れが見られる。「最初に十分な資金を隠し持つチームの声を聞いてください」以下のクリップの 0:08 からの「勝利」。「最初の勝利」に一時停止がないことが、ほとんど 1 つの単語に溶け込んでいます。アンリアルトーナメント、これは違います。

アルムストローム氏はポッドキャストの中で、「少々違和感があるように聞こえるとしても、美的にはバーチャル ゲーム ショーのファンタジーとうまく調和しています」と付け加え、不気味な AI 音声パフォーマンスに対する批判をかわしているようだ。個人的には、私は納得できません。これは未来のバーチャル アナウンサーのようには聞こえません。ただのテキスト読み上げプログラムであり、普通の人間、ましてやプロの俳優が行うような方法で単純な単語にアプローチする方法を知りません。 。

マトラグラーノ氏は、デザイナーが作成した新しいゲームモードのナレーションを録音するには「何か月」かかるというアルムストロム氏の主張に疑問を呈し、アルムストロム氏はAIを使えば「数時間」かかると述べ、人間の俳優は環境内で高品質のセッションを録音することに慣れていると反論した。 1日か2日。

もちろん、これは AI 生成のプロセスと、報酬をもらったアクターの代わりに AI を使用することに関する明らかな倫理的懸念を指摘するわけではありません。最近のSAG-AFTRAストライキの重要なポイント組合は、俳優のデジタルレプリカがインフォームドコンセントや適切な支払いなしに使用されることに懸念を表明したためです。

「文字通り、総額以下の費用でプログレードの VO を入手でき、数回の録音セッションをやり遂げれば、必要なオーディオがすべて揃ったということになります」とマトラグラノ氏は言います。 「実際、私たちはそれをとても簡単にしています。そうすれば、それは単に良いものに聞こえるだけであり、AI 倫理をあまり気にしないプレイヤーでさえ不平を言い続けるものではなくなります。」

ビデオ ゲームで AI が使用されている最近の別の事例では、CD Projekt Red がその技術を使用して、故ポーランド人俳優ミウォゴスト・レチェクの声を再現する- 俳優の家族の許可を得て - 再出演のためにサイバーパンク 2077今年の拡張版のリッパードック Viktor Vektorファントム・リバティ。他の場所では、戦争の神ラグナロクは、アトレウスの俳優サニー・スルジッチが思春期前の口調に合わせて録音した会話の年齢を下げるのに同様のテクノロジーを使用しました。

たとえ許可を得ていたとしても、亡くなった俳優の声を再現したり、もともと人間が演じていたセリフを変更したりすることは、ゲーム内で人間の出演者を完全に置き換えることとは明らかに異なるように感じられるが、少なくともアルムストローム氏は、この状況がますます一般的になるだろうと予想している。

「ビデオゲームの音声に関しては、私たちはまさに新たな夜明けを迎えつつあるのです」とオーディオデザイナーは語った。

The Finals の AI 音声についてどう思うかは関係なく、良くも悪くも、それは間違いなく真実です。