Krankheit nahm ihre Stimme weg. KI erstellte eine Replik, die sie in ihrem Telefon trägt

(SeaPRwire) –   PROVIDENCE, R.I. — Die Stimme von Alexis “Lexi” Bogan war vor letztem Sommer begeistert.

Sie liebte es, Taylor Swift und Zach Bryan Balladen laut im Auto zu singen. Sie lachte die ganze Zeit – sogar beim Zurechtweisen von Kindergartenkindern oder bei politischen Debatten mit Freunden am Lagerfeuer. In der High School war sie Sopranistin im Chor.

Dann war diese Stimme weg.

Ärzte entfernten im August einen lebensbedrohlichen Tumor in der Nähe des Hinterkopfs. Als einen Monat später der Atemtube herausgenommen wurde, hatte Bogan Schwierigkeiten beim Schlucken und Mühe, “hallo” zu ihren Eltern zu sagen. Monate der Rehabilitation halfen bei ihrer Genesung, aber ihre Sprache ist immer noch beeinträchtigt. Freunde, Fremde und ihre eigene Familie haben Schwierigkeiten zu verstehen, was sie ihnen mitzuteilen versucht.

Im April bekam die 21-Jährige ihre alte Stimme zurück. Nicht die echte, aber ein geklonter Stimme, der von einem Telefon-App erzeugt wurde. Auf der Grundlage eines 15-sekündigen Zeitzeugnisses ihrer Teenager-Stimme – aus einem für die High School aufgenommenen Kochvideo – kann ihre synthetische aber erstaunlich echt klingende KI-Stimme nun fast alles sagen, was sie möchte.

Sie tippt einige Wörter oder Sätze in ihr Telefon ein und die App liest sie sofort laut vor.

“Hallo, kann ich bitte einen großen braunen Zucker Hafermilch-Espresso bekommen”, sagte Bogans KI-Stimme, als sie das Telefon aus dem Fenster ihres Autos an der Starbucks-Drive-Thru hielt.

dass sich die sich schnell verbessernde KI-Stimmen-Klon-Technologie für Telefonbetrug, Störungen und die Verletzung der Würde von Menschen – lebendig oder tot – missbrauchen lässt, die niemals in ihre Stimme repliziert zu werden zugestimmt haben, um Dinge zu sagen, die sie nie gesprochen haben.

Es wurde verwendet, um falsche Anrufe an Wähler in New Hampshire zu produzieren, die Präsident Joe Biden imitieren. In Maryland wurde ein Schulleiter einer Oberschule beschuldigt, KI zu nutzen, um einen gefälschten Audioclip des Schulleiters zu erzeugen, in dem er rassistische Bemerkungen machte.

Aber Bogan und ein Team von Ärzten der Lifespan Krankenhausgruppe in Rhode Island glauben, eine Verwendung gefunden zu haben, die die Risiken rechtfertigt. Bogan ist eine der ersten Menschen – der Einzige mit ihrer Erkrankung – der es gelungen ist, eine verlorene Stimme mit dem neuen Voice Engine von OpenAI wiederherzustellen. Einige andere Anbieter von KI, wie das Startup ElevenLabs, haben ähnliche Technologien getestet, um Menschen mit Sprachbeeinträchtigungen und -verlust zu helfen – darunter ein Anwalt, der nun seine geklonte Stimme vor Gericht verwendet.

“Wir hoffen, dass Lexi eine Pionierin ist, während sich die Technologie weiterentwickelt”, sagte Dr. Rohaid Ali, ein Neurochirurgie-Assistenzarzt an der medizinischen Fakultät der Brown University und am Rhode Island Hospital. Millionen von Menschen mit beeinträchtigenden Schlaganfällen, Halskrebs oder neurogenerativen Erkrankungen könnten davon profitieren, sagte er.

“Wir sollten uns der Risiken bewusst sein, aber wir dürfen den Patienten und den sozialen Nutzen nicht vergessen”, sagte Dr. Fatima Mirza, ein weiterer Assistenzarzt, der an dem Pilotprojekt arbeitet. “Wir sind in der Lage, Lexi ihre wahre Stimme zurückzugeben und sie kann in Begriffen sprechen, die ihr am authentischsten entsprechen.”

Mirza und Ali, die verheiratet sind, zogen die Aufmerksamkeit von ChatGPT-Hersteller OpenAI auf sich, weil sie zuvor bei Lifespan ein Forschungsprojekt durchgeführt hatten, bei dem sie den KI-Chatbot nutzten, um medizinische Einwilligungsformulare für Patienten zu vereinfachen. Das Unternehmen aus San Francisco nahm Kontakt auf, als es früher in diesem Jahr nach vielversprechenden medizinischen Anwendungen für seinen neuen KI-Stimmengenerator suchte.

Bogan erholte sich noch langsam von der Operation. Die Krankheit begann letzten Sommer mit Kopfschmerzen, verschwommenem Sehen und hängenden Gesichtszügen, was die Ärzte im Hasbro Children’s Hospital in Providence alarmierte. Sie entdeckten einen gutballgroßen vaskulären Tumor, der das Hirnstamm drückte und in Blutgefäßen und Hirnnerven verwickelt war.

“Es war ein Kampf, die Blutung unter Kontrolle zu bekommen und den Tumor herauszuholen”, sagte die pädiatrische Neurochirurgin Dr. Konstantina Svokos.

Die 10-stündige Dauer der Operation in Kombination mit der Lage und Schwere des Tumors beschädigte Bogans Zungenmuskeln und Stimmritzen, was ihr Essen und Sprechen erschwerte, sagte Svokos.

“Es ist fast so, als wäre ein Teil meiner Identität weggenommen worden, als ich meine Stimme verlor”, sagte Bogan.

Die Ernährungssonde kam dieses Jahr heraus. Die Sprachtherapie geht weiter und ermöglicht es ihr, in einem ruhigen Raum verständlich zu sprechen, aber es gibt keine Anzeichen dafür, dass sie die volle Klarheit ihrer natürlichen Stimme wiedererlangen wird.

“Irgendwann habe ich angefangen, mich an mein altes Ich nicht mehr erinnern zu können”, sagte Bogan. “Ich habe mich so sehr daran gewöhnt, wie ich jetzt klinge.”

Wenn immer das Telefon in ihrem Zuhause in North Smithfield klingelte, schob sie es ihrer Mutter zu, damit diese ihre Anrufe annahm. Sie fühlte sich belastend für ihre Freunde, wenn sie in ein lautes Restaurant gingen. Ihr Vater, der schwerhörig ist, hatte Schwierigkeiten, sie zu verstehen.

Zurück im Krankenhaus suchten die Ärzte nach einem Pilotpatienten, um OpenAIs Technologie auszuprobieren.

“Der erste Mensch, der Dr. Svokos in den Sinn kam, war Lexi”, sagte Ali. “Wir haben Lexi kontaktiert, um zu sehen, ob sie daran interessiert wäre, es auszuprobieren, ohne zu wissen, wie sie reagieren würde. Sie war bereit, es auszuprobieren und zu sehen, wie es funktionieren würde.”

Bogan musste einige Jahre zurückgehen, um eine geeignete Aufnahme ihrer Stimme zu finden, um das KI-System “anzutrainieren”, wie sie sprach. Es war ein Video, in dem sie erklärte, wie man einen Pasta-Salat macht.

Ihre Ärzte gaben dem KI-System absichtlich nur einen 15-Sekunden-Ausschnitt. Kochgeräusche machen andere Teile des Videos ungeeignet. Es war auch alles, was OpenAI brauchte – eine Verbesserung gegenüber früherer Technologie, die viel längere Proben erforderte.

Sie wussten auch, dass es bei zukünftigen Patienten, die keine Spur ihrer Stimme im Internet haben, entscheidend sein könnte, aus nur 15 Sekunden etwas Brauchbares herauszuholen. Eine kurze Voicemail an einen Verwandten könnte ausreichen müssen.

Als sie es das erste Mal testeten, waren alle von der Qualität des geklonten Stimmen überrascht. Gelegentliche Fehler – ein falsch ausgesprochenes Wort, eine fehlende Betonung – waren meist nicht wahrnehmbar. Im April statteten die Ärzte Bogan mit einer speziell entwickelten Telefon-App aus, die nur sie benutzen kann.

“Ich werde jedes Mal sehr emotional, wenn ich ihre Stimme höre”, sagte ihre Mutter, Pamela Bogan, mit Tränen in den Augen.

“Ich finde es toll, dass ich diesen Klang wieder haben kann”, fügte Lexi Bogan hinzu und sagte, es habe ihr Selbstvertrauen “einigermaßen wieder auf das Niveau von vorher” gebracht.

Sie benutzt die App jetzt etwa 40 Mal am Tag und sendet Feedback, von dem sie hofft, dass es zukünftigen Patienten helfen wird. Eines ihrer ersten Experimente war, mit den Kindern im Kindergarten zu sprechen, in dem sie als Erzieherin arbeitet. Sie tippte “ha ha ha ha” ein und erwartete eine roboterhafte Antwort. Zu ihrer Überraschung klang es wie ihr altes Lachen.

Sie hat sie bei Target und Marshalls benutzt, um nach Artikeln zu fragen. Es hat ihr geholfen, sich wieder mit ihrem Vater zu verbinden. Und es ist einfacher für sie geworden, Fast Food zu bestellen.

Bogans Ärzte haben damit begonnen, die Stimmen anderer einwilligender Patienten aus Rhode Island zu klonen und hoffen, die Technologie in Krankenhäuser auf der ganzen Welt zu bringen. OpenAI sagte, es schreite vorsichtig bei der Ausweitung der Nutzung von Voice Engine voran, das derzeit nicht öffentlich verfügbar ist.

Eine Reihe kleinerer KI-Startups bieten bereits Stimmen-Klon-Dienste an oder stellen sie breiter zur Verfügung. Die meisten Anbieter von Stimmengenerierung geben an, dass sie Impersonation oder Missbrauch verbieten, variieren aber in der Durchsetzung ihrer Nutzungsbedingungen.

“Wir möchten sicherstellen, dass die Stimme jeder Person, die im Dienst verwendet wird, fortlaufend einwilligt”, sagte Jeff Harris, OpenAIs Leiter für das Produkt. “Wir möchten sicherstellen, dass es nicht in politischen Kontexten verwendet wird. Deshalb haben wir einen Ansatz gewählt, die Technologie nur sehr begrenzt zur Verfügung zu stellen.”

Harris sagte, OpenAIs nächster Schritt bestehe darin, ein sicheres “Stimmauthentifizierungswerkzeug” zu entwickeln, so dass Benutzer nur ihre eigene Stimme replizieren können. “Das könnte für eine Patientin wie Lexi, die plötzlich ihre Sprechfähigkeiten verloren hat, einschränkend sein”, sagte er. “Wir gehen davon aus, dass wir vertrauensvolle Beziehungen brauchen werden, insbesondere mit medizinischen Anbietern, um den Zugang zur Technologie ein wenig uneingeschränkter zu gewähren.”

Bogan hat ihre Ärzte mit ihrem Fokus beeindruckt, darüber nachzudenken, wie die Technologie anderen Menschen mit ähnlichen oder schwereren Sprachbeeinträchtigungen helfen könnte.

“Ein Teil dessen, was sie während dieses gesamten Prozesses getan hat, bestand darin, über Wege nachzudenken, diese Technologie zu verfeinern und zu verändern”, sagte Mirza. “Sie war eine große Inspiration für uns.”

Während sie derzeit mit ihrem Telefon hantieren muss, um ihre KI-Stimme abzurufen, hofft Bogan, dass die Technologie weiterentwickelt wird, so dass sie eines Tages wieder vollständig sprechen kann.

Der Artikel wird von einem Drittanbieter bereitgestellt. SeaPRwire (https://www.seaprwire.com/) gibt diesbezüglich keine Zusicherungen oder Darstellungen ab.

Branchen: Top-Story, Tagesnachrichten

SeaPRwire liefert Echtzeit-Pressemitteilungsverteilung für Unternehmen und Institutionen und erreicht mehr als 6.500 Medienshops, 86.000 Redakteure und Journalisten sowie 3,5 Millionen professionelle Desktops in 90 Ländern. SeaPRwire unterstützt die Verteilung von Pressemitteilungen in Englisch, Koreanisch, Japanisch, Arabisch, Vereinfachtem Chinesisch, Traditionellem Chinesisch, Vietnamesisch, Thailändisch, Indonesisch, Malaiisch, Deutsch, Russisch, Französisch, Spanisch, Portugiesisch und anderen Sprachen.