Ich weiß nicht, ob alle es mitbekommen haben: Seit einigen Wochen ist ChatGPT im Windows App-Store zu finden und kann von dort aus kostenlos installiert werden. Damit hat man ChatGPT dann direkt als quasi-native App (die sich sogar zu einem Tray-Icon minimieren lässt) in Windows zur Verfügung. Allerdings hat man damit nicht Zugriff auf die allerbesten KI-Modelle (die gibt es nur gegen Aufpreis). Immerhin kann man so aber ChatGPT 4o nutzen.
Dies habe ich zum Anlass genommen, mal auszuprobieren, was die KI kann oder auch nicht kann. Das Ergebnis war in meinen Augen ausgesprochen enttäuschend. Die KI ist exzellent für einen Freund von mir, der Probleme hat, Sachverhalte anschaulich in Worte zu kleiden. Er kann ChatGPT seine Gedanken als ein paar Brocken hinwerfen und erhält einen gut ausformulierten Text. Den Umgang mit Sprache beherrscht ChatGPT also.
Nach meinem Empfinden aber muss eine "Künstliche Intelligenz" insbesondere eine "Intelligenz" sein, also zu eigenständigen Denkvorgängen in der Lage. Und das sehe ich - zumindest bei ChatGPT 4o - nicht. Nach meinen Erfahrungen kann die KI nur im Netz suchen und inhaltlich nacherzählen, was sie irgendwo gefunden hat. Zu selbständigen Schlüssen habe ich sie aber nicht motivieren können.
Ein Beispiel, anhand dessen dies deutlich geworden ist: ich hatte eine sehr lange Musikdatei, die aus einer Reihe aufeinanderfolgender Lieder bestand. Zwischen diesen Liedern gab es ungewöhnlich lange Pausen (teilweise 2 Minuten oder so). Diese Datei wollte ich anhand der Pausen in einzelne Titel teilen und die Pausen selbst dabei löschen und habe ChatGPT gefragt, wie ich dies bewerkstelligen könne.
Er hat mir die Freeware Audacity für diesen Zweck vorgeschlagen. Grundsätzlich ist dieser Vorschlag gut; Audacity ist dafür geeignet. ChatGPT erläutert, dass man hierfür den Menüpunkt Analyze-->Silence Finder (bzw. die deutschsprachige Entsprechung) verwenden solle. Dumm nur, dass es in aktuellen Versionen diesen Menüpunkt nicht mehr gibt, da die Menüstruktur von Audacity umstrukturiert worden ist. Ich habe ChatGPT gebeten, mir eine Anleitung zu geben, die mit meiner (aktuellen) Version von Audacity funktioniert. Er hat mir versichert, das zu tun, aber hat es nicht auf die Reihe bekommen. Letztlich hat er doch immer wieder die nicht mehr existierenden Menüpunkte vorgebracht.
Ich habe dann selber in der offiziellen Audacity-Anleitung nachgelesen und bin auf
diese Seite gestoßen. Das Entscheidende steht im grünen Kasten ganz oben: Der Menüpunkt "Silence Finder", auf den ChatGPT immer wieder verweist, ist durch einen neuen Menüpunkt "Label Sounds" ersetzt worden. Aber nicht 1:1, sondern während man mit dem alten "Silence Finder" offenbar direkt Musikstücke an Stillen in Teile teilen konnte, ist "Label Sounds" mächtiger. Damit kann man automatisiert an Stillen Marken setzen lassen und dann in einem weiteren Schritt das Musikstück an diesen Marken teilen und Stillen dabei nicht mit übernehmen. Man muss also verstehen, wie man mit diesem neuen Werkzeug das hinbekommt, was das alte direkt geboten hat. Das steht aber nicht explizit in der Anleitung, daher kann ChatGPT es nicht nacherzählen. Für einen Menschen, der sich die Beschreibung des neuen "Label Sounds" durchliest, ist es nicht weiter schwer zu verstehen, wie man damit ein Musikstück an Stillen teilen kann. ChatGPT jedoch kriegt dies nicht auf die Reihe, weil er halt nur nacherzählt, was er irgendwo im Netz (in diesem Fall: im offiziellen Handbuch) findet. Wirklich verstehen tut er den Arbeitsvorgang aber offenbar nicht, jedenfalls nicht auf einem Niveau, das es ihm gestatten würde zu beschreiben, wie ich meine Aufgabe mit dem neuen Menüpunkt lösen kann.
Es ist möglich, dass andere KIs oder neuere, kostenpflichtige Modelle von ChatGPT da mehr können. Aber zumindest ChatGPT 4o attestiere ich auf diesem Hintergrund keine Intelligenz, jedenfalls keine, die über den bloßen Umgang mit Sprache (also das Formulieren sinnvoller Sätze) hinausgeht. Solange das so ist, sehe ich in KIs keinerlei Bedrohung für unseren Beruf. Die eigentliche Herausforderung besteht ja darin, für die Anforderung eines Kunden eine sinnvolle Softwarelösung zu erarbeiten. Dazu muss man die Zusammenhänge (!) verstehen und eigenständig denken können. Und das kann ChatGPT offenbar nicht.
Aus ähnlichen Gründen ist aus der schon vor Jahren vollmundig vorgetragenen Behauptung, man könne bald das lenkradlose Auto bauen, auch bislang nichts geworden. Man kann Fahrzeuge bauen, die auf bestimmten, genau definierten Straßen fahren können
(weil man ihnen mitgibt oder antrainiert, wie die Beschaffenheit dieser Straßen zu interpretieren ist). Aber das lenkradlose Auto, das eigenständig erkennt, wie es sich in der völlig unstrukturierten historischen Dorfstraße zu verhalten hat, wo Bauarbeiter Straßenschilder falsch angebracht haben oder man einem Hindernis über eine durchgezogene Linie (ggf. ein Stück über'n Acker) ausweichen muss, das hat man bis heute nicht hinbekommen, und bis auf weiteres sehe ich es auch nicht kommen. Denn dafür müsste man die Verkehrssituation wirklich
verstehen, einschließlich der Frage, wie eine bestimmte falsche Beschilderung offensichtlich gemeint ist und was ein bestimmter Fußgänger möglicherweise zu tun beabsichtigt. Der Klassiker mit dem Kind, das dem rollenden Ball hinterherrennt, ist dabei noch einfach und einer KI vermutlich antrainierbar, aber teilweise kann man einer Person ja auch ansehen, ob sie abgelenkt ist (Smombie), ob sie aggressiv ist, ob sie alkoholisiert ist oder generell wo sie vermutlich hinwollen und was sie vermutlich als nächstes tun wird
(einschließlich Fehlern, die sie mit einiger Wahrscheinlichkeit gleich machen wird). Solche komplexen Verständnisse von Sachverhalten, bei denen durchaus auch soziale Aspekte eine Rolle spielen können, halte ich bis auf weiteres für jenseits dessen, was eine KI kann. Jedenfalls eine, die in ein Auto passt und das in Echtzeit leisten können soll
(so wie jeder denkende Mensch es kann).