Rike ist nicht ganz glücklich über die DALL.E-Ergebnisse zu ihrem Bild mit Sinus- und Kosinusfunktionen, die ein Orthonormalsystem für 2π-periodische Funktionen bilden. Sie hatte sich gedacht, dass die „Künstliche Intelligenz“ intelligent ist und die speziellen Funktionen erkennt. Sie wird immer wütender je länger sie darüber nachdenkt.
Variationen der Überlagerung
Charly Rike, warum bist du so wütend?
Rike Weil DALL.E Sinus- und Kosinusfunktionen nicht erkennt.
Charly Rike, meinst du, das Programm arbeitet wie ein Mathematiker, meinst du, es denkt wie ein Mensch?
Rike Haha, offensichtlich tut es das nicht. Aber es könnte die „Weisheit der Vielen“ benutzen. Es hat so viele Bilder zur Verfügung, das geht über jede menschliche Vorstellung hinaus. Bei all diesen Bildern muss doch was dabei sein für meine Anfrage!
Charly Sieht wohl nicht so aus. Wollen wir ihm mal ein neues inverses Problem geben?
Rike Ja???
Charly Du gibst ihm die Überlagerung aus deinen Sinus- und Kosinusfunktionen mit seinem eigenen Ergebnis, so – wie du es mir neulich gezeigt hast. Vielleicht findet er dann das Originalbild, also die Sinus- und Kosinusfunktionen?
Rike Gute Idee. Das ist also mein Startbild . Dann schauen wir mal…
Ah, hier, das sind die Variationen.
Sie sehen schon ein bisschen wie Sinus- und Kosinusfunktionen aus... Warte, ich probier’s noch mal… Hier!
Charly Hmm. Witzig! Schon wieder so viele sexy Kurven… Irgendwie wie handgemalt...
Rike Ja, wie im Traum, mit Bleistift und Buntstift, obwohl mein Bild am Computer entstand.
Charly Dein Stil wird einem Look zugeordnet und künstlerisch gemacht, kennst du jemanden, der so malt?
Rike Nö. Schau doch mal, neben den Kurven werden Histogramm, Farbigkeit, Helligkeitsmittelwert des Ausgangsbildes aufgegriffen, das scheint ein wichtiges Prinzip zu sein. Beim Diffusionsmodell ist das auch so.
Variationen der Diffusionsbilder, geringes Rauschen
Charly Na gut. Dann habe ich noch eine Idee für ein inverses Problem: Du gibst ihm ein verrauschtes Bild und hoffst, dass er nun das Original dazu findet.
Rike Okay! Die verrauschten Bilder habe ich ja noch. Hier, starten wir mal mit einem geringen Rauschen…
Charly Zeig mal!
Rike Hier!
Charly Es hat nicht geklappt! DALL.E hat das Rauschen nicht als Rauschen erkannt, sondern als Muster – so eine Art Gitter! Die Grundhelligkeit wird jetzt dunkler in den Bildern.
Variationen der Diffusionsbilder, stärkeres Rauschen
Rike Soll ich es noch mal probieren?
Charly Na klar!
Rike Sieh‘, das Ergebnis ist ähnlich. Ich probier’s noch mal!
Variationen der Diffusionsbilder, noch stärkeres Rauschen
Charly Klar!
Rike Oh! Das geht nicht, ich kriege eine interessante Antwort, aber keine Variationen! Hey! Das kann doch nicht wahr sein!
Charly Rike! Cool down! Du hast ja recht, DALL.E ist nicht intelligent, weder künstlich intelligent noch menschlich intelligent – nicht mal mathematisch intelligent.
Rike Stimmt. Er arbeitet einfach seine Algorithmen ab und ist trainiert auf einen bestimmten Look. Innerhalb seines Algorithmus kann er sehr gut Strukturen in verrauschten Bildern erkennen, aber mit einem verrauschten Startbild kann er nicht umgehen.
Charly Doch bevor du darüber verzweifelst, lass uns zu unserer Silvesterparty aufbrechen.
Rike Ja, das machen wir.
***
[Titelbild: Ausschnitt aus einer Variation zu erzeugt von DALL.E auf https://openai.com/dall-e-2/, Aufruf am 29.12.2022.]
***
Übungsaufgabe
Teste die KI durch ein Bild mit starkem Rauschen.