Logo Logo
/// News

Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte Hände

[12:24 So,19.März 2023 [e]  von ]    

Midjourney, eine der drei großen bildgenerierenden KIs, hat mit der eben erschienenen neuen (Alpha)Version 5 einen weiteren großen Schritt gemacht: die produzierten Bilder weisen jetzt eine noch viel höhere, fotorealistische Bildqualität auf als bisher und auch die sonst oft störenden kleinen Bildfehler sind beinahe ausgemerzt. Sogar - Trommelwirbel - die lästigen Probleme aller Bild-KIs bei der Darstellung menschlicher Hände, die mal mehr, mal weniger Finger hatten, ist in Midjourney V5 jetzt gelöst.

Finkger-ok
menschliche Hände - von Midjourney V5 jetzt endlich korrekt von der KI dargestellt




Rasender KI-Fortschritt


Dieser Fortschritt spiegelt das momentan rasende Tempo der Entwicklung im Bereich KI wieder: es ist nur knapp 1 Jahr her, dass DALL-E2 die Bühne betrat und als erste Bild-KI demonstrierte, zu was ein solcher Algorithmus sowohl in Bezug auf die Bildqualität und Bildkomposition, als auch auf die "kreative" Umsetzung von komplexen Textprompts fähig war. Die Bilder wiesen zwar oft noch zahlreiche Darstellungsfehler und verschwommene Bereiche auf, aber sie ließen ahnen, welche überraschende Qualität per KI generierte Bildern haben können.

Rabbit-on-park-bench
Frühes DALL-E 2 Demobild



Bild-KIs im Wettstreit


Seitdem gibt es einen Wettlauf der großen Bild-KIs DALLE-E2, Midjourney und Stable Diffusion, welche ihre Modelle immer weiter optimieren und so ständig bessere Bilder erzeugen. Besonders vielfältig war die Entwicklung bisher bei Stable Diffusion aufgrund seiner offenen Natur, welche schon seit einiger Zeit mit dem passenden Modell fotorealistische Porträts erzeugen kann, auf einem Smartphone lokal läuft und dank ControlNet eine exakte Kontrolle über die Bildkomposition ermöglicht. Hier unser Einführungsartikel Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg.

SD-Controlnet
Stable Diffusion plus ControlNet



Midjourney Version Alpha 5


Doch Midjourney hat jetzt mit der Version 5 wieder vorgelegt - und die anderen Bild-KIs müssen nachziehen. So brilliert Midjourney jetzt besonders bei fotorealistischen Aufnahmen von natürlichen Szenerien und Menschen, die extrem detailreich dargestellt werden und von den Portraits "echter" Menschen nicht mehr unterscheidbar sind. Das berüchtigte Uncanny Valley ist damit (im Fotobereich) endgültig überwunden.

Nick-Doglady
Midjourney V5 Portrait


Ein Schwerpunkt wurde gelegt auf realistische Hauttexturen samt Unreinheiten und Makeln, welche Gesichter noch natürlicher erscheinen lassen. Möglich sind auch auch Portraits einer Person aus verschiedenen Perspektiven.

mj5-faces-diff-perspectives


Aber auch andere Objekte werden enorm detailreich dargestellt.

Merzmensch-Museum


So gut wie ausgemerzt sind die bisher typischen KI-Fehldarstellungen von Händen oder Zähnen, anhand derer man bislang noch oft KI Bilder von echten Fotografien unterscheiden konnte. Auch die Abbildung von Schriften ist jetzt besser, allerdings noch immer nicht perfekt und die dargestellten Texte bleiben sinnlos - das könnte sich aber bald ändern, zum Beispiel durch das Zusammenspiel mit einer multimodalen KI wie ChatGPT, welche sowohl mit Bildern als auch mit Texten umgehen kann und Texte in Bildern sowie den Kontext "versteht".

Nick-Bodega


Auch können jetzt Bilder mit vielen neuen Seitenverhältnisse generiert werden. Darstellungsfehler treten dennoch weiterhin auf, etwa sind manchmal Objekte oder Personen - vor allem im Hintergrund - noch manchmal deformiert. Aber auch diese Probleme werden vermutlich bald der Vergangenheit angehören.

Nick-Lady


Midjourney versteht jetzt auch besser Textanweisungen in natürlicher Sprache, d.h. man muss nicht mehr kryptische Schlüsselwörter aneinanderreihen, um Bildinhalte und Darstellungsstile zu beschreiben. Das Ziel ist laut David Holz, dem Gründer von Midjourney, die Bedienung bedienerfreundlicher zu gestalten. Die aktuelle (Alpha)Version 5 ist nach seinen Worten noch weit von der finalen Version entfernt, es werde noch erhebliche Änderungen geben.

Die Möglichkeit, jetzt noch fotorealistischere und (KI-)fehlerfreie Bilder zu erzeugen, vergrößert zusammen mit der jetzt verbesserten Darstellung von bekannten Persönlichkeiten natürlich das bisher schon bestehende Risiko von Foto-Fakes:

Trump-Kiss



Was kostet Midjourney?


Leider bietet Midjourney keine kostenlosen Bildgenerierungen an - im Gegensatz zu anderen Diensten muss man ein Abo für mindestens einen Monat abschließen. Dieses kostet 10 Dollar pro Monat im Basic Plan, der 200 Bildgenerierungen umfasst bzw. 30 Dollar für den Standard Plan, welcher 15 Stunden schnelle Generierungszeit bietet sowie unbegrenzt viele Bilder im relaxed Modus, welcher etwas länger dauert.

Midjourney-Evolution
Die Evolution von Midjourney


Stable Diffusion - die kostenlose Alternative


Es ist damit zu rechnen, dass das quelloffene Stable Diffusion bald mit ähnlichen Verbesserungen nachzieht und so fotorealistische Bilder auf jedem Home-PC (oder sogar Smartphone) kostenlos erzeugt werden können.

mj5-droneshot
Luftaufnahmen per Bild-KI



MJ-tatooed



Link mehr Informationen bei www.midjourney.com

  
[4 Leserkommentare] [Kommentar schreiben]   Letzte Kommentare:
iasi    21:49 am 19.3.2023
Nachdem ich nun mal die V4 getestet habe, werde ich wohl die 11,90$ investieren und auch mal V5 ausprobieren. Die Möglichkeiten sind schon erstaunlich, auch wenn die Steuerung...weiterlesen
Alex    15:31 am 19.3.2023
Ob es die Relevanz verliert, wage ich zu bezweifeln. Bei Fotos und Videos haben wir doch eine ähnliche Entwicklung: Früher war es ein Privileg, heute hats jeder in der...weiterlesen
Rick SSon    14:24 am 19.3.2023
Umso beliebiger KI generiertes Material herzustellen wird, je mehr sinkt die Glaubwürdigkeit und damit auch die Relevanz desselben. Menschen koppelt Bedeutung an...weiterlesen
[ Alle Kommentare ganz lesen]

  Vorige News lesen Nächste News lesen 
bildKI verwandelt WLAN Router in Raum-Radar bildRuinieren schlechte Projektionen das Kino?


verwandte Newsmeldungen:
Machine Learning:

Wie man einen Videoclip mit KI-Tools produziert - in nur 3 Stunden 24.März 2023
Microsoft mit generativen KI-Modellen für jedermann im Browser - Bing Image Creator 23.März 2023
Adobe kündigt Firefly an: Generative KI-Modelle nun direkt von Adobe 21.März 2023
Runway Gen2: Stable Diffusion Schöpfer stellen neue Text-to-Video-KI vor 20.März 2023
VideoFusion: Erste Open Source Video-KI ist da - und läuft auch auf dem Heim-PC 20.März 2023
KI verwandelt WLAN Router in Raum-Radar 18.März 2023
Gilt das Urheberrecht auch für per KI erzeugte Inhalte? Eher nicht 17.März 2023
alle Newsmeldungen zum Thema Machine Learning


[nach oben]

















passende Forenbeiträge zur News:

Archive

2023

März - Februar - Januar

2022
Dezember - November - Oktober - September - August - Juli - Juni - Mai - April - März - Februar - Januar

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

2007

2006

2005

2004

2003

2002

2001

2000






































update am 25.März 2023 - 15:02
ist ein Projekt der channelunit GmbH
*Datenschutzhinweis*