· 

Die Fantasie der Maschine

Vor einiger Zeit habe ich mich mit der – immer noch offenen – Frage beschäftigt, wie viel Zeit uns noch bleibt, bis wir eine „starke“ KI entwickeln, die sich ihrer selbst bewusst ist und die universelle Leistungsfähigkeit eines menschlichen Gehirns erreicht oder übertrifft. Vor Kurzem hat OpenAI die KI „DALL·E“ vorgestellt, die auf ihrem erfolgreichen GPT-3-Sprachmodell basiert und  in mir den Verdacht weckt, dass uns vielleicht deutlich weniger Zeit bleibt, als ich dachte (bzw. hoffte).

Bereits vor zwölf Jahren habe ich in einem Beitrag für die Zeitschrift Brand Eins die Vermutung geäußert, dass der größte Künstler des 21. Jahrhunderts eine Maschine sein wird. Denn das hartnäckige Vorurteil, dass Maschinen nicht kreativ sein können, war schon damals längst widerlegt. Dennoch hat mich die Kreativität, die DALL·E beweist, verblüfft. Bekannt war, dass GPT-3 überraschend gute, glaubwürdige Texte quasi aus dem Nichts erzeugen kann (ganze Romane schreiben kann es noch nicht, aber das ist wohl auch nur eine Frage der Zeit). Neu ist, dass eine Maschine diese Kreativität auch visuell umsetzen kann, indem sie Eingabesätze des Nutzers bildlich darstellt.

Dies gelingt DALL·E oft so überzeugend, dass es schwerfällt, zu glauben, dass das Bild tatsächlich künstlich erzeugt und nicht einfach aus einer riesigen Bilddatenbank herausgesucht wurde. Wenn ihm etwa aufgetragen wird, einen „Sessel in Form einer Avocado“ darzustellen, dann kann das Ergebnis zum Beispiel so aussehen:

Noch einmal zum Mitschreiben: Keiner dieser Sessel existiert wirklich, keines der Bilder wurde von einem Menschen gestaltet oder bearbeitet. Die Maschine war in der Lage, das Konzept „Avocado“ mit dem Konzept „Sessel“ zu kombinieren, ohne jemals einen Sessel in Avocadoform gesehen zu haben. Im OpenAI-Blog kann man selbst ausprobieren, was DALL·E sich vorstellt, wenn der Sessel stattdessen etwa die Form eines Schmetterlingsflügels, eines Donuts oder einer Schildkröte haben soll.

Aber das Programm kann noch weit mehr. Es kann Objekte räumlich zueinander anordnen, wenn es zum Beispiel den Auftrag bekommt, einen kleinen blauen Würfel darzustellen, der auf einem großen roten Würfel liegt:

Es kann auf Kommando Tonfiguren oder Röntgenbilder von Tieren erzeugen, ein Tier aus unterschiedlichen Perspektiven darstellen, Buntglasfenster oder mit Straßenkreide gemalte Zeichnungen von beliebigen Objekten anfertigen und sogar Bilderrätsel lösen, bei denen ein fehlendes Symbol gesucht wird. Besonders faszinierend finde ich daran, dass DALL·E diese Aufgaben nicht auf eine einzige, ganz bestimmte Art und Weise löst, sondern ähnlich wie ein menschlicher Künstler unzählige Varianten desselben Konzepts generieren kann. Ohne Zweifel verfügt DALL·E über eine Art kreatives Vorstellungsvermögen – das, was man bei einem Menschen „Fantasie“ nennen würde.

Natürlich ist das noch nicht dasselbe wie menschliches „Denken“. Das Programm weiß nicht wirklich, was eine Avocado ist oder ein Sessel. Aber offensichtlich erkennt es allein aus der Betrachtung vieler unterschiedlicher Bilder und deren textlicher Beschreibung schon bestimmte Zusammenhänge, z.B. dass ein „Sessel“ eine Sitzfläche, eine Rückenlehne und Beine oder einen Sockel hat, auf dem Boden steht und häufig mit „Kissen“ kombiniert wird. Das deutet darauf hin, dass ein entsprechend trainiertes Programm demnächst vielleicht auch kausale Zusammenhänge erschließen kann. Dann wäre der Schritt hin zu einem echten Weltverständnis womöglich nicht mehr weit.

Damit will ich nicht sagen, dass ein Durchbruch in Bezug auf „starke“ KI unmittelbar bevorsteht. Immer noch ist nicht klar, welche Hürden auf diesem Weg noch zu nehmen sind. Aber es erscheint mir plausibel, dass die Zeit bis dahin kürzer sein könnte als viele glauben. Der KI-Forscher Stuart Russel illustriert das in seinem lesenswerten Buch „Human Compatible“ mit dem Beispiel der Kernspaltung: 1933 hielt der renommierte Physiker Lord Rutherford einen Vortrag vor der Royal Society, in dem er die Idee, Atomenergie zu nutzen, als Hirngespinst („Moonshine“) bezeichnete. Am nächsten Morgen las der Physiker Leó Szilárd darüber einen Artikel in der Times und hatte daraufhin die entscheidende Idee der nuklearen Kettenreaktion. Nur 12 Jahre später explodierte die erste Atombombe.

Vielleicht ist DALL·E nicht nur eine eindrucksvolle, aber letztlich harmlose Spielerei, sondern ein Hinweis darauf, dass uns die Zeit davonläuft, die wir noch haben, um das „Kontrollproblem“ zu lösen.


Kommentar schreiben

Kommentare: 2
  • #1

    Heinrich (Freitag, 12 Februar 2021 01:38)

    Hallo Karl,
    wieder ein hoch interessanter Artikel und Hinweis auf Sahnestückchen im Netz! Danke!
    Gruß Heinrich

    P.S. mir läuft seit über 70 Jahren schon die Zeit davon. Ich weiß ja, dass ich sie eines Tages einholen werde. Deshalb hat man wohl das Entschleunigen erfunden, damit das nicht zu früh passiert.
    Und wenn ich das mal so anmerken darf, eine starke KI ist mir dann doch noch lieber als eine nukleare Kettenreaktion, vor allem wenn es ein Kontrollproblem gibt.
    Für Kontrollprobleme sind wir Menschen nämlich ganz ausgezeichnet geeignet! (siehe 2020 und folgende)

  • #2

    Karl Olsberg (Freitag, 12 Februar 2021 11:21)

    @Heinrich: Vielen Dank - auch für Deinen witzigen Blogbeitrag zum Thema Zeit! Ein großes Thema, das mich fast jeden Tag beschäftigt. Aber ich bin auch noch nicht weiter als der alte Bischof Augustinus, der schon vor 1.600 Jahren sinngemäß feststellte: "Wenn mich niemand danach fragt, weiß ich, was die Zeit ist, wenn ich es aber jemandem erklären soll, weiß ich es nicht". Vielleicht kapiert es ja eine KI irgendwann und kann es mir so erklären, dass ich es verstehe.