Deep Learning - KI macht aus simplen Bildern realistische Landschaftsfotos

Nvidia-Forscher haben eine Deep-Learning-KI entwickelt, die basierend auf rudimentären Grafiken realistische Landschaftsfotos kreieren kann.

von Sara Petzold,
24.03.2019 09:12 Uhr

Nvidia hat eine Deep-Learning-KI erschaffen, die realistische Landschaftsfotos auf Basis simpler Grafiken kreiert.Nvidia hat eine Deep-Learning-KI erschaffen, die realistische Landschaftsfotos auf Basis simpler Grafiken kreiert.

In Zeiten von Instagram und Facebook sind Urlaubsfotos zum Statussymbol geworden. Alle Welt soll wissen, an welchen außergewöhnlichen, schönen Orten wir denn im vergangenen Sommer die Füße hochgelegt haben - eine schnöde Familienreise an die Ostsee kann da schon lange nicht mehr mithalten.

Künftig dürfen wir aber wohl nicht mehr einfach jedes Urlaubsfoto als echt anerkennen. Denn ein Forscherteam bei Nvidia hat eine Deep Learning KI entwickelt, die realistische Landschaftsfotos auf Basis minimalistischer, mithilfe entsprechern Software erstellter Zeichnungen generieren kann.

Das von Nvidia auf den Namen »GauGAN« getaufte Projekt funktioniert laut einem Bericht von Motherboard folgendermaßen: Mithilfe sogenannter Generative Adversarial Networks (GANs) lernt das Programm anhand vorgegebener Landschaftsfotos, selbst entsprechende Bilder zu produzieren.

Zwei KIs, ein realistisches Bild

Damit GauGAN ein solches Foto erstellt, muss der Nutzer lediglich aus einer Reihe bestimmter Landschaftselemente auswählen und die grobe Struktur des Bildes vorgeben. Dabei reicht es, rudimentäre Linien zu zeichnen und die entsprechenden Bereiche dann nach vorgegebenen Elementen zu klassifizieren.

»Es ist wie ein Bild aus einem Malbuch, das beschreibt, wo ein Baum steht, wo sich die Sonne und wo der Himmel befinden«, erklärt Bryan Catanzaro, Nvidias Vizepräsident im Bereich angewandte Deep-Learning-Forschung. In dem Video oben zeigt Nvidia, wie das Ganze in der Praxis funktioniert.

GauGAN besteht dabei konkret aus zwei unterschiedlichen KIs, einer Generator-KI und einer Discriminator-KI. Während erstere Bilder produziert, prüft letztere die Bilder auf Authentizität. Wenn die Discriminator-KI nicht erkennt, dass ein Bild von der Generator-KI erschaffen wurde, sondern es als echt ansieht, entsteht das fertige Landschaftsfoto.

Als Anwendungsbereiche könnte laut Nvidia das zügige und günstige Erstellen virtueller Welten infrage kommen, mit denen sich dann wiederum beispielsweise selbstfahrende Autos trainieren ließen.

Künstliche Intelligenz in Spielen - Teil 1: Geist aus der Maschine


Kommentare(114)

Nur angemeldete Benutzer können kommentieren und bewerten.

Cookies optimieren die Bereitstellung unserer Dienste. Mit der Nutzung unserer Dienste erklären Sie sich damit einverstanden, dass wir Cookies verwenden. Weitere Informationen oder schließen