Darum wird ChatGPT den Google Assistant auf meinem Handy ersetzen

ChatGPT bietet zahlenden Smartphone-Nutzern neuerdings die Möglichkeit, in der App für Android und iOS die neue Sprachausgabe zu verwenden.

ChatGPT kann viel mehr als nur Text. ChatGPT kann viel mehr als nur Text.

Der seit spätestens diesem Jahr allseits bekannte und umstrittene Chatbot »ChatGPT« bietet zahlenden Smartphone-Nutzern neuerdings die Möglichkeit, in der App für Android und iOS die neue Sprachausgabe zu verwenden.

Was sich auf den ersten Blick nicht nach viel anhört, ist auf den zweiten Blick etwas ganz Besonderes. Ich erkläre, was es damit auf sich hat.

Sky, Ember, Breeze, Juniper, Cove

Nein, es geht hier nicht um die neue Mannschaft von Paw Patrol - das sind die Stimmen, die dem Nutzer oder der Nutzerinnen zur Auswahl stehen, wenn man sich mit ChatGPT via Sprache unterhalten möchte.

Zwei männliche, zwei weibliche und eine diverse Stimme sind von professionellen, englisch-sprachigen Sprechern eingesprochen worden.

Hat man sich für eine Auswahl entschieden, kann man direkt loslegen und mit dem Chatbot in einen direkten Sprachdialog treten.

Und da kommt direkt der Aha-Moment. Wer den Film »Her« mit Joaquin Phoenix kennt, weiß in etwa, was einen hier erwartet. Siri, Alexa oder Google Assistant sehen gegen diese Erfahrung, die ChatGPT bietet, kein Land mehr.

Der sogenannte Turing-Test bekommt eine ganz neue Bedeutung. Es ist nämlich so, als würde man sich mit einem menschlichen Gegenüber unterhalten.

Haltet diese Form von ChatGPT jemandem vor die Nase, der bisher wenig Berührungspunkte mit generativen Sprachmodellen hatte. Ich lehne mich nicht weit aus dem Fenster: Die Testperson würde kaum merken, dass sie sich gerade mit einer KI unterhält.

Oben mittig findet man unter dem Punkt GPT-4 die aktuellen Auswahlmöglichkeiten. Es fehlen noch die Plugins, die in der Web-App bereits länger verfügbar sind. Oben rechts startet man mit einem Klick auf das Kopfhörer-Symbol die Konversation. Oben mittig findet man unter dem Punkt "GPT-4" die aktuellen Auswahlmöglichkeiten. Es fehlen noch die Plugins, die in der Web-App bereits länger verfügbar sind. Oben rechts startet man mit einem Klick auf das Kopfhörer-Symbol die Konversation.

Ein echter Dialog ist in der Regel problemlos möglich. Die Sprachassistenten von Amazon und Google hingegen können (Stand heute) nur Befehle entgegennehmen und mit einer Antwort oder einem Suchergebnis quittieren - das war's. Von einem echten Gespräch ist das Lichtjahre entfernt.

Wie läuft das ab?

Um mit dem Sprachmodell von ChatGPT in Dialog zu treten, ist natürlich die hauseigene App von OpenAI erforderlich. Habt ihr das kostenpflichtige Abonnement gebucht, klickt auf das neu hinzugekommene Kopfhörer-Icon oben rechts.

Dann erscheint ein neues, minimalistisch gehaltenes UI. Es erscheint ein animierter, sich stauchender Kreis vor schwarzem Hintergrund, während das System die Verbindung zu den Servern von OpenAI herstellt.

Dies kann einige Sekunden dauern. Bleibt der Kreis stehen, ist das System bereit für die Spracheingabe. Dass ChatGPT zuhört, erkennt man an vier kleinen Kreisen, die den ankommenden Gesprächspegel symbolisieren.

ChatGPT hört gerade zu, wie man etwas einspricht. Hier empfiehlt es sich, ähnliche Prompts zu verwenden, wie man sie auch bei der Texteingabe benutzt. ChatGPT hört gerade zu, wie man etwas einspricht. Hier empfiehlt es sich, ähnliche Prompts zu verwenden, wie man sie auch bei der Texteingabe benutzt.

Im Anschluss zeigt eine animierte Sprechblase, dass im Hintergrund die Informationen verarbeitet werden. Auch das dauert wieder mehrere Sekunden.

Schließlich erfolgt die Ausgabe als Sprachausgabe in der zuvor gewählten Stimme. Die Ausgabe ist alternativ auch in Textform verfügbar, wenn wieder in den Textchat gewechselt wird.

Standardmäßig soll ChatGPT nur auf Englisch wie vorgesehen funktionieren, doch auch auf Deutsch ist die Sprachausgabe stets in hervorragender Qualität.

Je nach gewählter Stimme ist manchmal bei den Antworten ein leicht amerikanischer Akzent wahrnehmbar, aber sonst ist die Sprachausgabe wirklich erstklassig.

Die Sprachausgabe klingt nie mechanisch oder wie ein Roboter, der die Texte monoton runterrattert. Je nach Situation werden sogar »Ähs« eingebaut, die später im Textprotokoll nicht auftauchen.

Die Sprachausgabe kann leider nicht durch Spracheingabe gestoppt werden. Wenn ihr also zwischendurch plaudert, könnt ihr den Chatbot während der Sprachausgabe nicht anhalten.

Erst, wenn ihr auf das rot-weiße »X« tippt, landet ihr wieder im Textchatmodus, der direkt das gesamte vorherige Gespräch in Textform ausgibt.

Was wäre, wenn ...

Leider funktioniert die Sprachausgabe zum jetzigen Zeitpunkt noch nicht in Verbindung mit der Browsing-Funktion.

Beim Versuch, mit ChatGPT in ausgewählter Browsing-Funktion in einen Dialog zu treten und sich beispielsweise die News des Tages vorlesen zu lassen, wird darauf hingewiesen, dass der Chatbot nicht auf aktuelle Nachrichten zugreifen kann.

Dies liegt daran, dass die aktuellsten Trainingsdaten auf dem Stand vom September 2021 sind. Mit der Sprachausgabe befindet sich ChatGPT also auf dem funktionalen Stand wie zu Beginn des Hypes Anfang dieses Jahres.

Davon kann Elon Musk ein Lied singen: ein Satz mit X, das war wohl nix. Leider funktioniert das Webbrowsen mit der Sprachausgabe zusammen noch nicht. Dabei wäre genau das der Game-Changer. Davon kann Elon Musk ein Lied singen: ein Satz mit X, das war wohl nix. Leider funktioniert das Webbrowsen mit der Sprachausgabe zusammen noch nicht. Dabei wäre genau das der Game-Changer.

Wenn aber in hoffentlich nicht allzu ferner Zukunft die Plugins aus der Web-App mit der Smartphone-App und zusammen mit der Sprachausgabe funktionieren, eröffnen sich ganz neue Möglichkeiten, die weit über das hinausgehen, was heute mit Alexa oder Siri möglich ist.

Google hat zwar vor kurzem »Assistant with Bard« angekündigt, was theoretisch dem sehr nahe kommen dürfte, was ich hier mit ChatGPT herbei-orakel. Aber erstens ist Bard auch heute noch qualitativ meilenweit von den Antworten entfernt, die ChatGPT ausspuckt.

Und zweitens war die Präsentation bei genauerem Hinsehen eher ernüchternd. Es wurde keine Sprachausgabe gezeigt, also kein wechselseitiger Dialog.

Die Ausgaben waren dagegen in typischer Assistentmanier in Textform mit ausformulierten oder optisch schick aufbereiteten Suchergebnissen. Was also in naher Zukunft wirklich von Google auf den Markt gebracht wird, ist derzeit eher fraglich und rein spekulativ.

Wenn OpenAI aber die Plugins in der App freischaltet und diese in Verbindung mit der Sprachausgabe genutzt werden können, dann steht uns definitiv der nächste Paradigmenwechsel in Sachen generativer KI bevor.

Dann kann man nicht nur das Licht per Sprachbefehl ausschalten, dann ist in der ältesten Kommunikationsform der Menschheit viel mehr möglich.

Es gibt auch einen einfachen Unterschied zwischen einem Text-Chat und einem echten Gespräch: Menschen verarbeiten Geschriebenes anders als Gesprochenes.

Ein echtes Assistenzsystem wie ChatGPT ermöglicht es beispielsweise, gemeinsam ein mehrseitiges PDF zu zerlegen. Man könnte »gemeinsam« eine Reise zusammenstellen, einen Geschäftsbrief diktieren und gleichzeitig im Dialog mit dem Chatbot eine Erinnerung einrichten.

Forscher könnten eine wissenschaftliche Arbeit auf der Grundlage von Daten aus Wolfram Alpha zusammenstellen und vieles mehr.

Genau dann, wenn das möglich ist, wird ChatGPT den Google Assistant auf meinem Smartphone ersetzen.

Hoffentlich dauert es nicht mehr lange. Denn dann wäre ChatGPT allein schon aus praktischer Sicht wesentlich nützlicher als jedes halbgare Assistenzsystem, das derzeit auf unseren Smartphones vor sich hin dümpelt.

So langsam kristallisiert sich ein Bild davon heraus, was generative KI in Zukunft tatsächlich alles möglich machen wird. Wir befinden uns erst am Anfang einer äußerst spannenden Reise.

Folgende Beiträge zum Thema haben die Kollegen bereits für Euch erstellt, die euch ergänzend dazu interessieren könnten:

Schaut euch den neuen KI-Assistenten für Windows 11 an! Video starten 1:23 Schaut euch den neuen KI-Assistenten für Windows 11 an!

Arbeitet ihr bereits mit ChatGPT? Nutzt ihr den Bot regelmäßig oder nur sporadisch? Zahlt ihr dafür, oder nutzt ihr lieber die kostenlose Variante? Gibt es vielleicht sogar noch Personen unter euch, die ChatGPT noch gar nicht kennen? Mich würde interessieren, was ihr vom Chatbot haltet. Schreibt mir eure Bedenken, Sorgen, Erfahrungen und Meinungen, wie immer, gern unten in die Kommentare!

zu den Kommentaren (3)

Kommentare(3)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.