Es klingt wie ein weiterer Meilenstein in der aktuell rasanten Entwicklung der künstlichen Intelligenz. Nvidias neueste Online KI-App GauGAN2 kann fotorealistische Bilder nach einer textlichen Beschreibung einer Szenerie erstellen.
Man sagt dem Netz beispielsweise "Strand mit Sonnenuntergang vor blauen Sonnenschirmen" und bekommt nach einer kurzen Wartezeit vom Server ein Bild geliefert, dass selbige Situation mit großer Wahrscheinlichkeit plausibel darstellt.
Für unerfahrene Anwender dürfte dies fast schon magisch wirken, besonders wenn man diese Funktion noch mit einer Spracheingabe kombiniert. In unseren Augen ist es dennoch nur ein relativ kleiner Sprung gegenüber früheren Versionen der Software. Denn letztlich wurden hier "nur" Bereiche im Latent Space mit zusätzlichen verbal abgrenzbaren Begriffen verknüpft, was schon seit längerem in der KI-Forschung funktioniert.
Der Raum der möglichen Ergebnisse ist ebenfalls stark begrenzt durch Szenarien, die das Netz gelernt hat. Interessant bleibt dagegen, dass man in ein generiertes Bild anschließend mit den bekannten Werkzeugen eingreifen kann. So lässt sich ein Wald oder Berge mit den entsprechenden Pinseln sehr einfach erweitern oder "begrenzen".
// Top-News auf einen Blick:
- YouTuber verliert Prozess - Bruce Willis Synchronstimme darf nicht geklont werden
- Preview auf objektbasierte Maskentools in der Premiere Pro Beta
- Blackmagic DaVinci Resolve Studio ab sofort auch mit monatlicher Lizenz
- Neu und kostenlos - Adobe Premiere für iPhone
- Canon teasert neue, kompakte Kamera - Cine-Modell zur IBC?
- Revolutionärer AF für Cine-Objektive: Tilta Autofokus-Adapter zapft interne Kamera-...

Dass man für seinen eigenen Film auf diese Weise einfach virtuelle Szenarien per Befehl im Rechner entwirft ist mit GauGan2 noch nicht möglich. Doch das Programm zeigt bereits dass mit erweiterter Samplegröße und mehr Lernressourcen solche Ideen bald in den Bereich des möglichen kommen werden.
Richtig interessant wird es noch später in der Zukunft, wenn GANs komplette Romane visuell als Spielfilme umsetzen können. Und man als Regisseur vor allem Kleinigkeiten in der Adaption mit Korrekturpinseln ändert. Das dürfte allerdings noch ein paar Jahrzehnte dauern. Doch das Erstellen virtueller, photorealistischer Szenen per Sprache dürften wir noch in diesem Jahrzehnt zu sehen bekommen.
Wer nicht fantasieren, sondern jetzt und heute einfach mal mit den Möglichkeiten von GauGan2 herumspielen möchte, kann dies hier tun.