Ja, es fällt schwer, sich dieser Tage der Faszination von ChatGPT zu entziehen! Es ist ein Meilenstein im Bereich der Conversational AI, der in kürzester Zeit für viel Aufsehen gesorgt hat, zugleich sehr kontrovers diskutiert wird. Sind ernsthafte Veränderungen in Wirtschaft und Gesellschaft zu erwarten? Was sind typische Anwendungsbereiche, und welche Aufgaben sind für statistische Herangehensweisen nach wie vor unerreichbar? Dieser Blog-Beitrag liefert Antworten, die (zumindest in Teilen) selbst von ChatGPT geschrieben wurden.

Im Kern eine semantische Suche

Am meisten Konkurrenz haben durch diese neue Technologie Google und Wikipedia zu erwarten. Das mag erstaunlich klingen, doch letztlich stellt uns OpenAI eine neue Variante der Internetrecherche zur Verfügung. Die semantische Suche versucht, den Kontext und die Bedeutung von Wörtern zu verstehen, um relevantere Ergebnisse zu liefern. Im Gegensatz zu einer traditionellen Suche, die lediglich nach exakten Übereinstimmungen von Suchbegriffen sucht, versucht eine semantische Suche, die Absicht des Benutzers und den Kontext der Suche zu verstehen, um Ergebnisse zu liefern, die für den Benutzer relevanter sind. Manchmal unterscheidet sich der Output nicht von klassischen Suchmaschinen. „Erstelle eine Liste der 10 höchsten Gebäude der Welt“ wird so beantwortet:

  1. Burj Khalifa (Dubai, Vereinigte Arabische Emirate) – 828 Meter
  2. Shanghai Tower (Shanghai, China) – 632 Meter
  3. Makkah Royal Clock Tower (Mekka, Saudi-Arabien) – 601 Meter
  4. Ping An Finance Center (Shenzhen, China) – 599 Meter
  5. Lotte World Tower (Seoul, Südkorea) – 555 Meter
  6. One World Trade Center (New York City, USA) – 541 Meter
  7. Taipei 101 (Taipeh, Taiwan) – 509 Meter
  8. Shanghai World Financial Center (Shanghai, China) – 492 Meter
  9. International Commerce Centre (Hongkong, China) – 484 Meter
  10. Petronas Twin Towers (Kuala Lumpur, Malaysia) – 452 Meter

Ein Ergebnis, das auch über Google oder Wikipedia nicht anders gefunden werden kann. Aber ChatGPT kann weitaus mehr. Bei Bedarf bereitet es das Suchergebnis in Form eines ausformulierten abstracts auf und ist damit nicht nur wesentlich komfortabler, sondern antwortet auch viel aussagekräftiger auf die Suchanfrage. Es stellt keine langen Listen zur Verfügung, durch die sich der Anwender mühsam durchwühlen muss. ChatGPT ist in der Lage, vollständige Aufsätze zu fast jedem Thema zu schreiben – und schafft damit eine weitere Ebene komplexer Technologie, die Professoren der Geisteswissenschaften jetzt bei der Lehre und der Vergabe von Aufgaben berücksichtigen müssen.

Traum für Schüler und Studenten

Aktuell werden Aufsätze mit einer Länge von bis zu 650 Wörtern generiert. Dabei werden Wissenschaftler korrekt zitiert, umfangreiche Quellinformationen durchforstet und das ganze grammatikalisch so korrekt aufbereitet, dass nicht ohne weiteres ermittelt werden kann, ob der Text wirklich von einer KI oder von einem Menschen geschrieben wurde. Wieviele Nachrichtenartikel bereits heute von künstlichen Intelligenzen geschrieben werden kann gar nicht so einfach bestimmt werden. Zu den Profiteuren dieser Technologie gehören auch Schüler oder Studenten. Aufsätze über ferne Länder, berühmte Persönlichkeiten oder gesellschaftliche Themen kann die künstliche Intelligenz so gekonnt formulieren, dass manuelles Nacharbeiten kaum noch erforderlich ist. Generell eignet sich die Lösung hervorragend, um bereits vorhandenes Wissen, das sich auf viele Bücher, Artikel oder andere Publikationen verteilt, zu suchen, zu bündeln und als strukturierten, zusammenhängenden Text aufzubereiten. Das führte an einer Universität in Texas zu Überlegungen, wie man autogenerierte Texte durch eine Art elektronisches Wasserzeichen kenntlich machen kann.

Im beruflichen Alltag gibt es ebenfalls viele Anwendungsbereiche, wie das Verfassen von E-Mails, Beschwerdeschreiben und Arbeitszeugnissen, um nur einige Beispiele zu nennen. Ob ein gesamter Text, oder nur Teile eines Textes generiert werden, spielt keine Rolle. Eine der schwierigsten Teile beim Schreiben eines Aufsatzes ist die erste Zeile. Wird diese von einer KI geliefert, kann man hervorragend darauf aufbauen, die Arbeitszeit für die Ausformulierung von Texten reduziert sich erheblich. ChatGPT bereitet Wissen aus allen Themengebieten in einer Qualität auf, die in dieser Form bislang nicht dagewesen ist.

Entwicklungskosten reduzieren durch automatische Codegenerierung

Erstaunliche Ergebnisse erzielt die AI in der automatischen Erzeugung von Programmcode. Es werden Programme in verschiedensten Sprachen wie Java, C++, ABAP oder Python erstellt. Beeindruckend ist, wie ChatGPT aus fließendem Text den passenden Quellcode generiert. Es erstellt eigenständig Klassen und legt Methoden an, die mit einer adäquaten Namensgebung versehen werden. Alles funktioniert automatisch. So lassen sich Programme erzeugen, die Zinsberechnungen durchführen oder physikalische Formeln berechnen. Eine Verbindung zu einer Datenbank wird automatisch angelegt, die gewünschten Felder einer Tabelle ausgelesen und APIs werden automatisch erstellt – alles nur mit dem Einsatz natürlicher Sprache.

Anwender können konkrete Programmierschritte an den digitalen Assistenten delegieren. ChatGPT hat keine Mühe, folgende Anweisung korrekt in Code umzusezten: Erstelle eine Datenreihe mit gegebenen monatlichen Werten, erstelle dazu eine zweite Datenreihe, welche die Quartalswerte aufsummiert, und erstelle eine dritte Datenreihe, welche die monatlichen Werte in kumulierte Werte umrechnet. Zu einem strategischen Kostenfaktor in der Softwareentwicklung würde eine AI dann, wenn aus einer in Text formulierten Spezifikation automatisch der passende Quellcode generiert wird. Die Beauftragung eines externen Dienstleisters für die Umsetzung würde sich erübrigen, wie auch die Abstimmungsrunden über die gewünschte Funktionalität.

Im praktischen Alltag ist das problematisch, weil Code in den seltensten Fällen auf der grünen Wiese entsteht. Er ist eingebunden in die bestehenden Systemlandschaften und besitzt dort Abhängigkeiten und logische Eigenheiten aller Art. Anforderungen, die eine KI wie ChatGPT derzeit, und vielleicht auch auf lange Sicht, nicht erfüllen kann. Doch auch hier kann der Entwickler unterstützt werden, wenn er nicht ganze Programme, sondern nur einzelne Programmbausteine autogenerieren lässt. Weiter kann sich ein Programmierer im Debuggen von Code unterstützen lassen, denn ChatGPT kann nicht nur die syntaktische Korrektheit von Quellcode untersuchen, sondern bis zu einem gewissen Grad auch dessen inhaltliche Konsistenz. Unerfahrene wie auch erfahrene Programmierer können die KI einsetzen um die Entwicklung von Software zu vereinfachen und zu beschleunigen.

Schwächen von stochastischen AI-Lösungen

Das Funktionsprinzip ist in hohem Maße stochastisch, das bringt einige Schwächen und Gefahren mit sich. Der Fangfrage „Was ist schwerer: 5 Kilo Eisen oder 5 Kilo Wolle“ war die künstliche Intelligenz von OpenAI hilflos ausgeliefert. Stochastische Verfahren basieren auf zufälligen Prozessen oder Ereignissen. Sie werden häufig in maschinellen Lernverfahren verwendet, um Prognosen oder Vorhersagen oder Entscheidungen zu treffen. Eine Schwäche dieser Verfahren ist, dass sie manchmal Schwierigkeiten haben, konsistente Ergebnisse zu liefern. Da sie auf zufälligen Prozessen oder Ereignissen basieren, können sie unvorhergesehene oder unerwartete Ergebnisse liefern, die schwer vorherzusagen sind. Eine weitere Schwäche ist, dass sie möglicherweise nicht in der Lage sind, die Ursachen von Ergebnissen oder Entscheidungen zu erklären. Da stochastische Verfahren auf zufälligen Prozessen basieren, kann es schwierig sein, die Gründe für bestimmte Ergebnisse oder Entscheidungen nachzuvollziehen, was für manche Anwendungen problematisch sein kann. Dennoch können stochastische Verfahren in vielen Fällen effektiv sein und sind ein wichtiger Bestandteil von AI-Lösungen. Sie können in Kombination mit anderen Algorithmen oder Verfahren verwendet werden, um bessere Ergebnisse zu erzielen und Schwächen auszugleichen.

Stochastische Verfahren sind grundsätzlich hervorragend geeignet, wenn eine Anfrage den Charakter einer Suche in unstrukturierten Daten hat. Das Durchforsten großer Datenmengen, wie beispielsweise wissenschaftliche Publikationen, Blogbeiträge oder auch Beiträge in Foren fallen in diese Kategorie. Probleme bekommt man, wenn die Daten, in denen gesucht wird, bereits über einen hohen Ordnungsgrad verfügen. Bisher ist es nicht gelungen, mit Sprachassistenten wie AskData oder Cortana Analytics zuverlässig ein Business Warehouse abzufragen. Das heißt nicht, dass diese Verfahren im Reporting keine Anwendung finden würden. Stochastische Verfahren können verwendet werden, um Vorhersagen oder Prognosen für zukünftige Ereignisse oder Entwicklungen zu treffen, beispielsweise die Nachfrage nach bestimmten Produkten oder Dienstleistungen. Oder sie könnten verwendet werden, um Vorhersagen für die Performance von Investitionen zu treffen, die dann in einem Finanzbericht dargestellt werden.

ChatGPT ist in vielen Bereichen wesentlich ausgereifter als viele seiner Vorgänger und kann sehr nützlich sein. Aufgrund der bestehenden Unzulänglichkeiten sind Anwender aber noch nicht aus der Pflicht entlassen, die Ergebnisse sehr genau zu prüfen, da die AI im Zweifelsfall einfach Dinge erfindet, oder auch den Kontext nicht richtig interpretieren kann. AI-Lösungen werden auf lange Sicht nicht nur ein faszinierender Zeitvertreib für lange Winterabende sein, sondern als praktische Helfer in vielen Bereichen des täglichen Lebens Einzug erhalten.