Neuer Algorithmus ermöglicht eigene Objekte in KI-generierten Bildern

// 12:59 Do, 15. Sep 2022von Thomas Richter

In rasendem Tempo geht die Entwicklung der textbasierten Bildgenerierung per KI weiter und ermöglicht immer weitere, praktische Funktionen. So hat jetzt ein Team von Forschern von Nvidia und der Universität Tel Aviv einen neuen Algorithmus vorgestellt, der die bisherige Funktionalität um die Möglichkeit erweitert, eigene Objekte in die Bildsynthesen zu integrieren. So lassen sich ganz spezifische Objekte (wie zum Beispiel die eigene Katze oder das eigene Auto) in den erzeugten Bildern nutzen.

Dazu gibt man dem "Textual Inversion" (oder auch "Personalized Text-to-Image Generation") getauften Algorithmus einige unterschiedliche Bilder des gewünschten Objektes (optimal sind 3-5 Stück) und trainiert ihn damit. Wird dieses neue Trainingsmaterial daraufhin in das Modell einer Bild-KI importiert, kann es mittels eines besonderen Kennworts (analog zu einer Variable) aufgerufen und in Texteingaben genutzt werden.

Das kann außerdem dazu genutzt werden, um in einem vorgegebenen Bild das eigene Objekt einfach per Text zu manipulieren, etwa um seine Farbe gezielt zu ändern, es in einer anderen Umgebung oder Malstil darzustellen, es in eine Statue oder ähnliches zu verwandeln. Der neue Algorithmus gibt damit einen Vorgeschmack auf die zukünftigen Möglichkeiten dder objektbasierten KI-Bildbearbeitung (und bald auch Videoediting) per Text.

Doch nicht nur spezielle Objekte lassen sich per Kommando in die KI-generierten Bilder einfügen. Auch abstraktere Konzepte wie etwa ein abstrakter Malstil (bzw. Look) kann der KI antrainiert werden, der dann eingesetzt werden kann, um Bildern einen spezifisches Aussehen zu verpassen.

So wird im folgenden Beispiel der Textual Inversion Algorithmus etwa mit einer kopflose Statue im Schneidersitz trainiert - diese kann dann in anderen Stilen (u.a. als Ölgemälde, Icon oder auch als Häkelfigur) reproduziert werden.

Und dank der sehr aktiven Community rund um den jüngst veröffentlichten, quelloffenen KI-Bildgenerator Stable Diffusion ist die Textual Inversion Funktion ( hier der zugehörige Programmcode ) auch schon integriert in eine spezielle Version von Stable Diffusion sowie die Web UI Version mit graphischem Benutzerinterface. Die Funktion ist allerdings noch rudimentär und erfordert etwas Programmierkenntnisse und eine leistungsstarke GPU. Interessanterweise hat ein Team von Google nahezu zeitgleich ein DreamBooth getauften Algorithmus entwickelt, der ähnliches leistet.

mehr Infos bei
textual-inversion.github.io

Auf Socials teilen:

Leserkommentare // Neueste

Darth Schneider // 06:54 am 16.9.2022

@Medienonkel Die Erde fällt trotzdem weiter rund herum…;))) Gruss Boris

medienonkel // 18:12 am 15.9.2022

Ach komm, jetzt hab ich so schön alleine im ersten Satz genügend Hinweise auf die allgemeine Relativitätstheorie gegeben...

Hayos // 17:34 am 15.9.2022

+1 Daher kommen ja bald diese In-Paint-Sachen wo man "Stable Diffusion" direkt in Photoshop & Co. verwenden, zb. für gewisse Bereiche (man lässt sich zb. eine Hand...weiterlesen

Im Forum mitdiskutieren >>

Ähnliche News //

News

Neuer Nvidia Algorithmus erschafft aus Photos eines Objekts ein bearbeitbares 3D-...

Ein Forscher-Team von Nvidia hat einen neuen Algorithmus entwickelt, mit dessen Hilfe sich aus einer Reihe von Photos eines Objekts ganz einfach ein 3D-Modell davon erstellen läßt....

// 10:59 Fr, 24. Jun 2022von Thomas Richter

News

Omnimatte: Nahezu perfekte Masken bewegter Objekte per KI

Schon letztes Jahr erzielte ein DeepLearning Algorithmus von Forschern von Google und der Universität Oxford erstaunliche Ergebnisse beim Erkennen und gezielten Manipulieren von .....

// 12:14 Fr, 27. Aug 2021von Thomas Richter

News

Video Editing per KI läßt Objekte verschwinden und ersetzt Hintergründe

Ein Team aus Forschern des israelischen Weizmann Institute of Science sowie Adobe Research hat einen interessanten neuen Algorithmus vorgestellt, der einen weiteren Meilenstein ...

// 13:06 Fr, 21. Jan 2022von Thomas Richter

News

Neue Nvidia-KI generiert Bilder 30x schneller als Stable Diffusion

Ein Forscherteam von Nvidia und der Universität Tübingen hat eine neue (alte) Methode zur Bildgenerierung per KI vorgestellt, welche gleich zwei große Vorteile gegenüber der ...

// 16:10 Mi, 8. Mär 2023von Thomas Richter

News

Neue Nvidia RTX 4090: Doppelt so schnell wie RTX 3090 Ti - aber 1.949 Euro teuer

Nvidia hat die ersten zwei Modelle RTX 4090 und RTX 4080 seiner neuen Grafikkartengeneration vorgestellt, die interessante Verbesserungen für die Arbeit mit Video bringen. Viele .....

// 15:46 Mi, 21. Sep 2022von Thomas Richter

zur Newsübersicht >

Unterstützung für mehr Handys Kostenlose Blackmagic Camera App 1.1 für Android bringt viele neue Funktionen

Vor rund einem Monat hatte Blackmagic seine kostenlose Camera App auch für Android veröffentlicht, jetzt ist bereits das erste Update erschienen, das zahlreiche neue Funktionen ...

// 14:17 Mo, 22. Jul 2024von Thomas Richter

News

Nicht nur 3D Animation Blender 4.2 LTS - kostenloses 3D-Softwarepaket jetzt mit GPU-Compositor

Das quelloffene 3D-Modelling- und Animations-Paket Blender wächst weiter. In der neuen Version 4.2 LTS sind sogar ziemlich relevante Verbesserungen für die Videobearbeitung ...

// 11:50 Sa, 20. Jul 2024von Rudi Schmidts

News

6K bzw. 8K 60p RAW Video Canon EOS R1 und R5 Mark II vorgestellt mit DIGIC Accelerator und mehr

Gleich zwei neue Spitzenmodelle für sein EOS R-System präsentiert Canon heute - die EOS R1 und EOS R5 Mark II bringen beide verbesserte Autofokus-Fähigkeiten sowie eine erweiterte ...

// 12:05 Mi, 17. Jul 2024von blip

News

APS-C Wechselobjektivkamera Kompakte Sony ZV-E10 II mit 10bit 4K 60p und Kinolook-Funktionen angekündigt

Sony verbessert seine kleine "Vlogging"-Kamera ZV-E10 - so verfügt die neue Generation II (wie im Vorfeld gemunkelt) über einen neuen Sensor, Dank welchem nun 4K-Videoaufnahmen ...

// 17:23 Mi, 10. Jul 2024von blip

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Textbasiertes Editing und die Zukunft der KI in Adobe Premiere Pro

In typischen Interviewsituationen liegt der Fokus des Schnitts auf dem gesprochenen Inhalt und lässt sich daher mit klassischen Schnitt-Tools eher umständlich realisieren. Mit der ...

// 15:28 Mi, 7. Jun 2023von slashCAM

zur Artikelübersicht >

Aktuelle News //

News

Geleakte Liste Runway Gen-3 Video-KI wurde an tausenden, ausgesuchten YouTube-Videos trainiert

KI-Videomodelle werden zunehmend besser, die Qualität ihres Outputs hängt bekanntlich jedoch stark von dem Videomaterial ab, anhand dessen sie lernen, wie Videos auszusehen haben. ...

// 17:13 Fr, 26. Jul 2024von blip

News

Mit besseren Kameras? Neue Drohnen im Anflug: Erst DJI Air 3S, dann Mavic 4?

Schon seit Mai kursieren Gerüchte über ein neues Drohnenmodell von DJI: zunächst drehten sich die Leaks der bekannten Accounts @OsitaLV und @Quadro_News um vereinzelte Abbildungen ...

// 19:14 Do, 25. Jul 2024von Thomas Richter

zur Newsübersicht >