[12:24 So,19.März 2023 [e] von Thomas Richter] |
Midjourney, eine der drei großen bildgenerierenden KIs, hat mit der eben erschienenen neuen (Alpha)Version 5 einen weiteren großen Schritt gemacht: die produzierten Bilder weisen jetzt eine noch viel höhere, fotorealistische Bildqualität auf als bisher und auch die sonst oft störenden kleinen Bildfehler sind beinahe ausgemerzt. Sogar - Trommelwirbel - die lästigen Probleme aller Bild-KIs bei der Darstellung menschlicher Hände, die mal mehr, mal weniger Finger hatten, ist in Midjourney V5 jetzt gelöst. ![]() menschliche Hände - von Midjourney V5 jetzt endlich korrekt von der KI dargestellt
Rasender KI-FortschrittDieser Fortschritt spiegelt das momentan rasende Tempo der Entwicklung im Bereich KI wieder: es ist nur knapp 1 Jahr her, dass ![]() ![]() Frühes DALL-E 2 Demobild Bild-KIs im WettstreitSeitdem gibt es einen Wettlauf der großen Bild-KIs DALLE-E2, Midjourney und Stable Diffusion, welche ihre Modelle immer weiter optimieren und so ständig bessere Bilder erzeugen. Besonders vielfältig war die Entwicklung bisher bei Stable Diffusion aufgrund seiner offenen Natur, welche schon seit einiger Zeit ![]() ![]() ![]() ![]() ![]() Stable Diffusion plus ControlNet Midjourney Version Alpha 5Doch Midjourney hat jetzt mit der Version 5 wieder vorgelegt - und die anderen Bild-KIs müssen nachziehen. So brilliert Midjourney jetzt besonders bei fotorealistischen Aufnahmen von natürlichen Szenerien und Menschen, die extrem detailreich dargestellt werden und von den Portraits "echter" Menschen nicht mehr unterscheidbar sind. Das berüchtigte ![]() ![]() Midjourney V5 Portrait Ein Schwerpunkt wurde gelegt auf realistische Hauttexturen samt Unreinheiten und Makeln, welche Gesichter noch natürlicher erscheinen lassen. Möglich sind auch auch Portraits einer Person aus verschiedenen Perspektiven. ![]() Aber auch andere Objekte werden enorm detailreich dargestellt. ![]() So gut wie ausgemerzt sind die bisher typischen KI-Fehldarstellungen von Händen oder Zähnen, anhand derer man bislang noch oft KI Bilder von echten Fotografien unterscheiden konnte. Auch die Abbildung von Schriften ist jetzt besser, allerdings noch immer nicht perfekt und die dargestellten Texte bleiben sinnlos - das könnte sich aber bald ändern, zum Beispiel durch das Zusammenspiel mit einer multimodalen KI wie ChatGPT, welche sowohl mit Bildern als auch mit Texten umgehen kann und Texte in Bildern sowie den Kontext "versteht". ![]() Auch können jetzt Bilder mit vielen neuen Seitenverhältnisse generiert werden. Darstellungsfehler treten dennoch weiterhin auf, etwa sind manchmal Objekte oder Personen - vor allem im Hintergrund - noch manchmal deformiert. Aber auch diese Probleme werden vermutlich bald der Vergangenheit angehören. ![]() Midjourney versteht jetzt auch besser Textanweisungen in natürlicher Sprache, d.h. man muss nicht mehr kryptische Schlüsselwörter aneinanderreihen, um Bildinhalte und Darstellungsstile zu beschreiben. Das Ziel ist laut David Holz, dem Gründer von Midjourney, die Bedienung bedienerfreundlicher zu gestalten. Die aktuelle (Alpha)Version 5 ist nach seinen Worten noch weit von der finalen Version entfernt, es werde noch erhebliche Änderungen geben. Die Möglichkeit, jetzt noch fotorealistischere und (KI-)fehlerfreie Bilder zu erzeugen, vergrößert zusammen mit der jetzt verbesserten Darstellung von bekannten Persönlichkeiten natürlich das bisher schon bestehende Risiko von Foto-Fakes: ![]() Was kostet Midjourney?Leider bietet Midjourney keine kostenlosen Bildgenerierungen an - im Gegensatz zu anderen Diensten muss man ein Abo für mindestens einen Monat abschließen. Dieses kostet 10 Dollar pro Monat im Basic Plan, der 200 Bildgenerierungen umfasst bzw. 30 Dollar für den Standard Plan, welcher 15 Stunden schnelle Generierungszeit bietet sowie unbegrenzt viele Bilder im relaxed Modus, welcher etwas länger dauert. ![]() Die Evolution von Midjourney Stable Diffusion - die kostenlose AlternativeEs ist damit zu rechnen, dass das quelloffene Stable Diffusion bald mit ähnlichen Verbesserungen nachzieht und so fotorealistische Bilder auf jedem Home-PC (oder sogar ![]() ![]() Luftaufnahmen per Bild-KI ![]() ![]() |
![]() |