Als die Maschinen sprechen lernten
Der Eintritt in das Zeitalter der KI wird uns ähnlich verändern wie die erste industrielle Revolution, die uns von der Agrargesellschaft zur Industriegesellschaft geführt hat. Alle Lebensbereiche werden betroffen sein, aber der Unterschied wird in der Geschwindigkeit liegen, denn diesmal wird es keine 80 Jahre dauern. James Watt konnte nicht ahnen, welche enorme Bedeutung seine Erfindung der Dampfmaschine haben würde und dass diese ganze Industrien antreiben würde. Genauso wenig können wir uns heute vorstellen, wie KI unsere Arbeitswelt und unser Privatleben verändern wird. Unter den vielen Punkten, die uns diese Entwicklung bringt, ist ein grundlegender, nämlich der, dass Maschinen sprechen gelernt haben.
Regelbasierte Systeme und die ersten neuronalen Netze haben nie richtig funktioniert. Es waren einfach Befehle, die wir per Sprachsteuerung geben konnten und die oft auch nicht verstanden wurden. Wer kennt es nicht, wenn Siri mal wieder die falsche Person anruft. Mit der Umstellung auf Transfermodelle, also das T am Ende von ChatGPT, kam der Durchbruch. Science-Fiction wie aus Stanley Kubricks „Space Odyssey“, in dem die sprechende künstliche Intelligenz HAL 9000 sich fließend mit dem Captain unterhalten, diskutieren und alle Aufgaben im Hintergrund erledigen kann, wird in diesem Jahr Realität.
Doch was ist das Besondere und Neue an der Maschinensprache? Einfache Spracheingabe kennen wir schon länger. Flüssige Gespräche in Echtzeit mit der Fähigkeit, sie gleichzeitig in Softwarecode zu übersetzen, ist eine neue Entwicklung, die erst durch die leistungsfähige Kombination verschiedener KI-Modelle möglich wurde. Das ist deshalb so wichtig, weil die Welt bisher in menschliche Sprachen und Programmiersprachen aufgeteilt war. Softwareentwickler waren und sind eine begehrtere Spezies als Fremdsprachenübersetzer. Denn Programmiersprachen sind unverzichtbar, um mit Maschinen zu kommunizieren oder Software zu entwickeln.
2025 ist das Jahr der Sprache. Stellen Sie sich vor, dass alle Menschen fließend in ihrer Muttersprache mit Maschinen kommunizieren können, ohne dass eine Software dahinter programmiert oder bedient werden muss. Dann werden wir zum ersten Mal eine wirkliche Demokratisierung der digitalen Welt erleben und all ihre nützlichen Fähigkeiten für unseren Alltag einfach nutzen können. Ein Sechsjähriger, der wissen will, warum die Sonne untergeht, bekommt zu seiner Frage dann nicht nur einen Blogbeitrag ausgespielt, sondern hat einen wirklichen Gesprächspartner.
Dieses einfache Beispiel zeigt, dass die Messlatte für die digitale Welt sehr niedrig liegt. Klettern wir ein wenig höher. Wenn wir mit Maschinen, die über künstliche Intelligenz verfügen, sprachlich kommunizieren können, dann können wir auch jede dafür vorbereitete Software und jedes Computersystem der Welt so bedienen, wie wir Menschen es gerne tun.
Bis jetzt musste man Programmiersprachen lernen, selbst die besten Programme mussten gelernt werden. Man musste sich ständig weiterbilden, wenn ein Update kam, um damit umgehen zu können. Und wer hat schon gerne Handbücher gelesen? Jetzt sage ich, was ich will, und wenn es nicht geht, lasse ich mir erklären, warum nicht – und kann anschließend fragen, wie es denn gehen würde, und zwar auf meine persönliche Art, in meiner Muttersprache. Es gibt keine Grenzen mehr im Umgang und in der Kommunikation mit der Maschine, nur noch die Grenzen der Maschine selbst.
Die Abkürzungen, die diese unglaubliche Entwicklung technisch beschreiben, sind Speech to Text und Text to Speech. Ja, genau, Sprache wird in Text umgewandelt, dann verarbeitet und von Text zurück in Sprache. Der ChatGPT-Erfinder OpenAI hat schon vor einiger Zeit mit der Sprachkommunikation begonnen, aber erst die neue „Realtime“-Funktion zeigt das volle Potenzial. Erst damit hat man den Eindruck eines flüssigen Gesprächs und kann durchaus glauben, mit einem Menschen zu sprechen.
2025 ist das Jahr, in dem die Maschinen gelernt haben, mit uns zu sprechen. Jetzt ist es an der Zeit, dass auch wir lernen, mit Maschinen zu sprechen, Fragen zu stellen, nachzufragen, wenn wir etwas nicht verstanden haben, um Vorschläge zu bitten, wenn wir nicht weiterwissen.
Lasst uns reden! Das gilt ab sofort auch für Maschinen.