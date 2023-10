Die Open-Beta zu The Finals ist ein voller Erfolg, doch viele Spieler diskutieren aktuell über die Verwendung von KI-generierten Voice-Lines. (Bild: Steam, Embark Studios)

The Finals zieht aktuell eine riesige Menge an Spielern in den Bann. Über 250.000 Spieler konnte Steam in den letzten 24 Stunde verzeichnen. Dabei befindet sich das Spiel gerade nur in einer Open-Beta. Die große Beliebtheit wird allerdings durch eine andere Diskussion getrübt.

In einem Podcast des Embark Studios - die Entwickler hinter dem Spiel - reden die Audiodesigner Carl Strandberg und Andreas Almström über die Audio-Technik hinter ihrem Egoshooter The Finals .

Kernpunkt der Diskussion sind einige Aussagen, die die beiden laut PCGamer während des Podcasts getätigt haben:

Wir verwenden bis auf wenige Ausnahmen künstliche Intelligenz, das heißt alle Stimmen der Teilnehmer, wie zum Beispiel das Bellen und die Voiceover-Kommentatoren, sind künstliche Sprachausgaben. Carl Strandberg und Andreas Almström, Spotify-Podcast MTM | THE FINALS: Audio

ABER: Diverse Voice-Over-Aufnahmen wie Grunzen, Schmerzgeräusche oder das Springen über Gegenstände werden noch mit echten Menschen aufgenommen.

In der Regel zeichnen Synchronsprecher - im Englischen als Voice-Actors bekannt - stundenlang Dialoge, Ausrufe und die bereits erwähnten Geräusche auf. Dies erhöht den Realismus und die Immersion der Spiele.

Bei diesem Shooter geht mächtig was zu Bruch. Nahezu die gesamte Karte ist zerstörbar. Aktuell gibt es aber auch einen Bruch in der Community über die Verwendung einer KI für Voice-Lines. (Quelle: Screenshot YouTube-Trailer The Finals; Embark Studios)

Was ist daran so kontrovers, eine KI für das Einsprechen von Texten zu verwenden?

Grundsätzlich gilt: Einer KI muss das Sprechen beigebracht werden. Dabei lernt sie mithilfe von Sprachsequenzen echter Menschen, wie sie Aussprache und Betonung verwenden muss.

Oft wird die KI dabei mit Lern-Material gefüttert, für welches keine Einwilligung vorliegt. Aktuell verklagen beispielsweise amerikanische Schriftsteller ChatGPT, weil die KI angeblich ohne Einwilligung mit Texten der Autoren gefüttert wurde.

Das Resultat: Die KI hat gelernt, Texte in Sprache umzuwandeln. Das nennt man im Englischen Text-To-Speech. Sie kann jetzt auf die direkte Texteingabe der Spieleentwickler reagieren und diese passend im Spiel als Stimme wiedergeben.

Wie läuft das ohne KI: Normalerweise werden hier professionelle Synchronsprecher eingestellt, welche die Entwickler zu Aufnahmesessions buchen können. Das dauert dann je nach Arbeitsumfang mehrere Tage.

Warum wollen die Entwickler von The Finals dafür eine KI zu verwenden? Die beiden Audiodesigner sehen das laut PCGamer im Podcast so:

Der Grund, warum wir uns für diesen Weg entschieden haben, ist, dass KI-Text-to-Speech endlich extrem leistungsstark ist. Sie bringt uns in Bezug auf die Qualität weit genug und ermöglicht es uns, extrem reaktiv auf neue Ideen zu reagieren. Wenn ein Spieldesigner eine neue Idee für einen Spielmodus hat, können wir diese innerhalb von Stunden statt Monaten mit einer Sprachausgabe versehen. Carl Strandberg und Andreas Almström, Spotify-Podcast MTM | THE FINALS: Audio

Daraufhin meldete sich Gianni Matragano auf Twitter. Er ist ein professioneller Synchronsprecher und hat bereits in Spielen wie Ultrakill, Genshin Impact, Gloomwood oder Evil West mitgewirkt:

Er beschwert sich, dass diese Aussagen falsch seien. Wenn eine Änderung nötig sei, könne man einfach eine neue Aufnahmesession buchen. Dann klingen die eingesprochenen Stimmen echt.

Auf diesen Einwand meldete sich Kit Harrison, ein weiterer Synchronsprecher:

Er findet es seltsam, dass die KI keine Geräusche wie Grunzen darstellen kann, aber von der sprachlichen Qualität ähnlich gut sein soll wie echte Menschen.

Was sagen Reddit-Nutzer zu dieser KI-Diskussion?

Auf Reddit gibt es dazu gespaltene Meinungen. Der entsprechende Post hat mittlerweile 3100 Upvotes und 1200 Kommentare. Der Nutzer Pearse_Borty war positiv überrascht von der KI:

Moment, deshalb sind die Ansager so flüssig? Es hat mich irgendwie umgehauen, wie viel sie im Spiel ansprechen konnten. Pearse_Borty, Reddit

Der Nutzer wellspoken_token34 hingegen vermutet ein gerichtliches Nachspiel, falls Spiele in Zukunft KI verwenden wollen:

Ich wette, dass all diese VAs (Voice Actors, Anmerkung d. Redaktion) ihre Anwälte auf jede erdenkliche Art und Weise einsetzen werden, um ihre Stimmen / Abbilder / Charaktere auf jede erdenkliche Weise zu schützen. Wenn sie es nicht schon getan haben. wellspoken_token34, Reddit

Natürlich kann eine KI Änderungswünsche schneller umsetzen und wird vermutlich in der Zukunft auch so klingen wie ein echter Mensch. Allerdings ist es aus ethischer Sicht schwierig, eine KI zu verwenden, die von echten Menschen gelernt hat, um damit professionelle Sprecher auszubooten. Was denkt ihr über den Einsatz von Sprach-KIs in Spielen? Findet ihr diese Entwicklung gut oder schlecht? Wie könnte der Einsatz solcher KI fair gestaltet werden? Schreibt es gerne in die Kommentare.