Künstliche Intelligenz boomt. Immer mehr Unternehmen suchen nach Einsatzmöglichkeiten, mit denen sie davon profitieren können. Research und Entwicklung beginnen Früchte in Form von ersten Prototypen zu tragen. Ein spannendes Beispiel dafür hat der weltbekannte Hersteller von Chipsätzen und Grafikprozessoren NVIDIA letzte Woche gezeigt. Content Creator und Designer sind direkt betroffen.

Mit KI visuellen, vielfältigen Content blitzschnell gestalten

Ob ein Hintergrundbild für eine Landingpage, ein Coverbild für einen Blogbeitrag oder ein paar Schnappschüsse für einen Printkatalog – die lästige Suche nach passenden Bildern gehört zum Alltag jedes Content Creators. Ebenso wie: Keywords hier und dort eingeben, ein paar Euros (oder mehr) in Stockfotos investieren und dann das grafische Material bestenfalls in einem cloudbasierten Digital-Asset-Management Tool speichern. Und das immer und immer wieder.

Aber was würdest du sagen, wenn du einfach deine Idee mit ein paar Strichen aufmalen könntest, aus denen dann ein großartiges, fotorealistisches Bild entsteht? Das ist genau das, was die neue selbstlernende Software GauGAN verspricht.

Das Malprogramm von Nvidia setzt auf Deep-Learning-Technologie, ganz konkret auf Generative Adversarial Networks (GAN). Diese Art von künstlicher Intelligenz besteht aus zwei neuronalen Netzwerken. Eines davon, der Generator, produziert Bilder, die es dann dem zweiten, dem Discriminator, präsentiert. Bei NVIDIA vergleicht der „Discriminator“ das vorgestellte Bild mit einer riesigen Bilddatenbank und gibt dem Generator Feedback. Durch den Vergleich mit realen Bildern kann die KI das Verhältnis verschiedener Bildelemente wie einen Baum oder den Himmel anpassen. Bryan Catanzaro von NVIDIA beschreibt dies wie folgt:

» Das neuronale Netzwerk kann alle Details und Texturen einfügen, inklusive Reflexionen, Schatten und Farben, basierend darauf, was es über echte Bilder gelernt hat. «

Das neue Tool von NVIDIA ist ähnlich einfach zu bedienen wie Microsoft Paint und erfordert (wirklich) keine künstlerischen Fähigkeiten. Man kann verschiedene farbige Flächen erst zeichnen und danach mit gegebenen Tags jedes Element je nach seinem Wesen einordnen, wie diese Videodemo beeindruckend und selbsterklärend zeigt:

Das Ergebnis ist erstaunlich: Ein realistisches Bild, das deinen individuellen Anforderungen entspricht. Ohne Aufwand und kostenlos. In diesem Zusammenhang könnten Ideen und Prototypen besser entwickelt und schnelle Änderungen vorgenommen werden.

KI beschleunigt und verstärkt die Content-Produktion

Obwohl die Gestaltung noch nicht ausgereift und bislang auf Landschafts-bilder beschränkt ist, ist anzunehmen, dass dieser Ansatz in unzähligen Szenarien zum Einsatz kommen kann, denn er ist nicht nur für Gaming oder Architektur interessant sondern auch für die Contenterstellung von Webseiten, Blogs oder Onlineshops. Tatsächlich ist das neuronale Netzwerk in der Lage, andere Landschaftselemente wie Gebäude, Straßen und Menschen zu erfassen.

KI agiert in diesem in diesem Sinn als Motor für mehr Geschwindigkeit und Effizienz. Bilder mit ähnlichen Eigenschaften, wie z.B. ein Foto von einem Strand, kann man entweder im Farbton von: Tageslicht, Sonnenuntergang oder bei Nacht schnell und in Echtzeit darstellen. Dieses Tool könnte Content Creator sowohl bei der Suche, als auch bei der Erstellung von Produktbildern viel Arbeit abnehmen und somit Zeit sparen. Und Zeit ist Geld.

GAN bietet bereits unglaubliche Anwendungen für Produktbilder, so wie in der Fashionbranche. Die KI kann ein Bild in verschiedene Haltungen transformieren. Mehr Use Cases wurden in diesem ausführlichen Beitrag auf Medium zusammengestellt.

KI unterstützt die Content-Produktion auch in anderen Bereichen. Google Vision analysiert Produkteigenschaften wie Form und Farbe auf Produktbildern via Bilderkennungstechnologie und verfasst danach detaillierte Produktbeschreibungen selbständig.

Was kann KI für mein eigenes Business tun?

Das Takeway hier ist, dass die Zeit über KI zu philosophieren vorbei ist. Das NVIDIA Beispiel spricht für sich. Obwohl seine Lösung immer noch in den Kinderschuhen steckt, ist das Potential von KI deutlich spürbar und fordert nun ihre Verbreitung und Akzeptanz.

Die GAN App gehört zu Nvidias A.I. Playground Projekt, ein neuer Online-Space, in dem jeder die ganze Kraft der Deep-Learning-Forschung erleben kann. Auf der neuen Website gibt es derzeit drei Demos für Bildbearbeitung, Styling und fotorealistische Bildsynthese, obwohl momentan nur eine Demo für die ersten Use Cases verfügbar ist.

Die Erfahrungen und Best Practices helfen, das tatsächliche Potential dieser neuen Technologie wirklich zu etablieren. Und es ermutigt Unternehmen, mehr darüber zu lernen, sich zu fragen, wie diese ihrem Unternehmen helfen kann, zu wachsen und letztlich Mehrwert zu schaffen.

