Zeigen Sie ChatGPT, was Sie sehen: Sprach- und Bildfunktionen sind live (gegen Gebühr)


Was du wissen musst

  • OpenAI erweitert ChatGPT um Bild- und Spracherkennungsfunktionen, wobei letztere neben einer neuen fortschrittlichen Text-to-Speech-Engine exklusiv für mobile Geräte verfügbar sind.
  • Für beide Funktionen ist ein Abonnement von ChatGPT Plus oder ChatGPT Enterprise erforderlich.
  • Das Update wird in den nächsten zwei Wochen schrittweise für englischsprachige Benutzer weltweit bereitgestellt.

ChatGPT arbeitet an der Entwicklung einer natürlicheren Benutzererfahrung durch die Implementierung von Sprach- und Bildkommunikation, die in beide Richtungen funktioniert. Theoretisch können Benutzer weniger Zeit mit dem Tippen und Nachdenken über die effektivsten Eingabeaufforderungen verbringen und mehr Zeit damit verbringen, Antworten zu sehen. Einzelheiten zu seinen Plänen zur schrittweisen Einführung dieser neuen Funktionen in ein aktueller BlogbeitragOpenAI erklärt, wer wann Zugriff hat.

Diejenigen, die ein individuelles ChatGPT Plus-Abonnement für 20 US-Dollar oder ein unternehmensorientiertes Enterprise-Abonnement abonniert haben, werden innerhalb der nächsten zwei Wochen auf allen Plattformen bildbasierte Eingabeaufforderungen und Antworten sehen. In der Zwischenzeit sind Sprachgespräche exklusiv für iOS- und Android-Geräte verfügbar. Eine manuelle Aktivierung finden Sie im Menü „Einstellungen“ der App unter „Neue Funktionen“. OpenAI zielt darauf ab, Fehler durch die schrittweise Bereitstellung dieser neuen Modi zu minimieren. Machen Sie sich also keine Sorgen, wenn Sie sie noch nicht sehen können.

Mehr sehen

Gibt es diese Technologie nicht schon?

Bing kann Ihre Rede bereits interpretieren und in Eingabeaufforderungen umwandeln, aber es gibt immer Möglichkeiten zur Verbesserung. (Bildnachweis: Windows Central)

Obwohl OpenAI offensichtlich stolz auf diese Ankündigung ist, gibt es Spracherkennungs- und Text-to-Speech-Technologien schon seit Jahren. Fast jede Smartphone-App kann Ihre Stimme in schriftliche Eingabeaufforderungen umwandeln, allerdings kann die Qualität der Ergebnisse je nach zugrunde liegendem Code variieren. ChatGPT verwendet jetzt Whisperein Open-Source-Spracherkennungssystem, das von internen Entwicklern geschrieben wurde, sowie eine Partnerschaft mit professionellen Synchronsprechern, um seiner generativen KI lebensechtere Sprache beizubringen.



source-108

Leave a Reply