Googles neuer Super-Resolution Algorithmus SR3 skaliert Gesichter nahezu perfekt hoch

// 18:11 Mi, 14. Jul 2021von Thomas Richter

Ein Forscherteam von Google hat einen neuen DeepLearning Super-Resolution Algorithmus vorgestellt, der alle bisher entwickelten Methoden in den Schatten stellt. Die SR3 (Super-Resolution via Repeated Refinement) getaufte Methode demonstriert besonders in Beispielen hochskalierter Gesichter ihre Stärke: so werden Photos von Gesichtern mit einer Auflösung von nur 64 x 64 Pixeln in zwei Schritten erst nach 256 x 256 Pixeln, dann nach 1.024 x 1.024 Pixeln hochgerechnet, was einer 16-fachen Vergrößerung entspricht. In einem anderen Experiment werden Bilder von Objekten wie etwa Blumen, Feuerwehrautos, Vögeln oder Bauwerken von 64 x 64 nach 256 x 256 Pixeln hochskaliert.

Die hohe Qualität der hochskalierten Bilder zeigte sich im Bildvergleichsexperiment: Probanden sollten entscheiden, ob das hochaufgelöste Orginalbild oder das erst in der Auflösung verminderte und dann per SR3 wieder hochgerechnete Bild besser aussieht - bei einer 8-fachen Hochskalierung von 8 x 8 nach 128 x 128 Pixeln wählte rund die Hälfte das hochskalierte Gesicht.

Upscaling in several steps — Hochskalierung in mehreren Schritten

Das entspricht genau der Zufallsverteilung und bedeutet, dass nicht mehr unterschieden werden kann zwischen dem Original und der per Super Resolution erzeugten Version. Bei der viel schwierigen Aufgabe der 4-fachen Hochskalierung eines 64 x 64 Photos eines natürlichen Gegenstandes auf 256 x 256 zogen immerhin noch 40% der Versuchsteilnehmer das generierte Bild dem Original vor.

Wie funktioniert Super Resolution überhaupt?

Galt bis zum letzten Jahrzehnt noch das Dogma, dass bei einer Vergrößerung der Auflösung kein Detail hinzukommen kann, was nicht im Ursprungsbild liegt, befinden wir uns seit einigen Jahren in einem Paradigmen-Wechsel. Das Schlagwort heißt Super-Resolution. Unter Super-Resolution versteht man Technologien, die in der Nachbearbeitung einem Bild mehr Details hinzufügen, als ursprünglich in digitaler Form vorliegen.

Einfach gesagt sind es Verfahren, welche die Auflösung eines Bildes erhöhen und dabei für das "Mehr an Pixeln" nicht nur Interpolation zwischen bekannten Pixeln betreiben. Eine Superresolution (SR)-Applikation muss also Details schlüssig hinzuerfinden.

// Top-News auf einen Blick:

More upscaled objects in comparison. — Weitere hochskalierte Objekte im Vergleich

Mit dem Aufkommen von Deep Learning hat Super-Resolution einen wahren Boost erfahren, da KI-Algorithmen sehr gut darin sind, Objekte zu erkennen und zu ergänzen. Wenn eine Künstliche Intelligenz beispielsweise Millionen von Gesichtern aus verschiedenen Blickwinkeln und in diversen Beleuchtungssituationen gesehen hat, kann sie anschließend jedem grob nur aufgelösten Gesicht in einem Bild gelernte passende Details hinzufügen. Das gilt jedoch genauso für Pflanzen, Autos oder Tiere.

Beim Hochskalieren machen sich neuronale Netze die typischen Muster natürlicher Objekte zunutze - d.h. Strukturen in den Bildern mit niedriger Auflösung werden beim Hochskalieren sinnvoll rekonstruiert. Mehr zum Thema in unserem Artikel Mehr Bildschärfe durch künstliche Intelligenz - Super-Resolution.

Adobe hat einen solchen Super-Resolution Algorithmus schon in Photoshop integriert und das kostenpflichtige Tool Video Enhance AI sowie TecoGAN machen ähnliches für Videos.

Der neue SR3 Algorithmus ( hier die entsprechende Forschungsarbeit) wendet dabei einen besonderen Trick an und skaliert die Bilder in mehreren Durchgängen hoch, was zu besseren Ergebnissen führt als die Interpolation vom Basisbild zur hochaufgelösten Version. Oder genauer gesagt in den Worten der Forscher: "SR3 adaptiert entrauschende Diffusions-probabilistische Modelle an die bedingte Bildgenerierung und führt die Super-Resolution durch einen stochastischen iterativen Entrauschungsprozess durch."

Ein großer Caveat besteht allerdings bei solchen Deep Learning Methoden zur Super Resolution: die Ergebnisse sehen immer echter aus, was aber nicht bedeutet, dass die hochgerechneten Bilder dem Originalbild perfekt entsprechen, sondern nur, dass sie fotorealistisch gut geraten und gerendert sind - der Betrachter kann nicht mehr entscheiden, ob so ein Bild "echt" ist oder generiert wurde.

mehr Infos bei
iterative-refinement.github.io

Auf Socials teilen:

Leserkommentare // Neueste

medienonkel // 16:23 am 18.7.2021

Wieso ein plugin? Topaz VEAI, kostet gerade 240 Euro. Über sensai wird das aber früher oder später in AE Einzug halten, nicht ganz so spezialisiert, aber in AE muss man ja eher...weiterlesen

Hannah96 // 21:07 am 15.7.2021

High! Ich arbeite mit After Effects – da gibts keine guten Build-In Lösungen, oder? Gibts günstige PlugIns die was taugen? Muss ja nicht gleich auf dem Google-Level sein...weiterlesen

CandyNinjas // 10:22 am 15.7.2021

Haleluja !!! Wo wird das enden?

Im Forum mitdiskutieren >>

Ähnliche News //

News

Nie wieder unscharfe Videos? Super Resolution im Browser per kostenloser KI

Laut Microsoft besitzt ein Drittel aller mittels des Edge Browser abgespielten Videos nur eine Auflösung von 480p oder sogar noch weniger - sei es, weil das Video nur in dieser ...

// 10:16 Mo, 6. Mär 2023von Thomas Richter

News

Neue NVIDIA KI skaliert Videos in Echtzeit im Browser von 1080p nach 4K

NVIDIA hat auf der CES 2023 seine neue RTX Video Super Resolution Technologie vorgestellt, mit deren Hilfe Besitzer von GeForce-Grafikkarten der Serien RTX 4000 und 3000 ab ...

// 11:53 Fr, 6. Jan 2023von Thomas Richter

News

Editing per Prompt Google Veo am Start - neue Video-KI macht über 60 Sekunden lange Clips

Während das einstige Spitzenmodell OpenAIs Sora noch immer nicht öffentlich ist, geht der Kampf um die beste Video-KI unvermindert geht weiter - jetzt hat Google sein erstmals Mai ...

// 11:52 Fr, 6. Dez 2024von Thomas Richter

News

Text-zu-Video KI jetzt auch von Google: Imagen Video

Nachdem Meta gerade seine Make-a-Video KI zur Generierung von Videos nach Textbeschreibung vorgestellt hatte, hat Google jetzt nachgezogen und mit Imagen Video auch eine solche KI ...

// 16:48 Do, 6. Okt 2022von Thomas Richter

News

Neue Disney KI kann Schauspieler in Sekunden altern lassen - oder verjüngen

Disney erforscht schon länger die Möglichkeiten, KIs in Form von neuronalen Netzen zu nutzen, um so arbeits- und zeitaufwändige Prozesse in der Film(post)produktion zu ...

// 11:43 Mi, 14. Dez 2022von Thomas Richter

zur Newsübersicht >

Viele Verbesserungen Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes

Kaum drei Wochen nach der Veröffentlichung der Version 20 von Resolve hat Blackmagic schon die zweite Beta seines kostenlosen Grading-, Schnitt-, Compositing- und Audio-Mastering-....

// 12:19 Mi, 23. Apr 2025von Thomas Richter

News

Universeller Speicher Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen

Forscher der Fudan-Universität in Shanghai haben einen neuen Geschwindigkeits-Weltrekord für Flash-Speicher aufgestellt. Der von ihnen in 10-jähriger Arbeit entwickelte "PoX" ...

// 10:05 Di, 22. Apr 2025von Thomas Richter

News

Fliegendes Flutlicht Freefly Flying Sun 1000 - 300.000 Lumen helle Lichtdrohne macht die Nacht zum Tag

Freefly Systems, bekannt als Gimbal-Pioniere und Hersteller von professionellen Drohnen, hat eine spezielle Lichtdrohne vorgestellt, die es in sich hat. Der "Flying Sun 1000" ...

// 16:18 Do, 17. Apr 2025von Thomas Richter

Ratgeber

Echte Cloud-Alternativen? Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...

Wer die Entwicklung aktueller Video-KI-Modelle verfolgt, sieht fast jeden Tag neue Sensationen. Da liegt es nahe, auch einmal selbst Hand anzulegen, um eigene Erfahrungen mit der ...

// 11:35 Di, 15. Apr 2025von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher?

Nach Bild- und Text-generierenden KIs gibt es noch weiteres Feld, in welchem gerade per künstlicher Intelligenz enorme Fortschritte gemacht werden und zwar bei der Synthese von ...

// 19:47 Mo, 6. Feb 2023von Thomas Richter

Meinung

Paradigmenwechsel KI Google Veo 2 zeigt neue Perspektiven für die Videoproduktion

Mit Veo 2 setzt sich Google an die Spitze aller aktuellen KI-Videogeneratoren. Und zeigt zugleich auf, wohin der KI-Hase laufen wird...

// 16:00 Do, 19. Dez 2024von Rudi Schmidts

zur Artikelübersicht >

Aktuelle News //

News

Social Media Video Adobe Express: App für Creators mit neuen KI-Tools für Animation und Video

Auf der Kreativkonferenz MAX London wurden auch neue Funktionen in Adobe Express vorgestellt, mit denen sich Videomaterial einfach bearbeiten und generieren lässt. Express kann ...

// 13:29 Fr, 25. Apr 2025von Rudi Schmidts

News

Mit KI und XMEMS-Lautsprecher BleeqUp Ranger - 4-in-1 Actioncam-Brille macht POV-Videos

Actioncams sind mittlerweile ein alter Hut – nun bekommen sie Konkurrenz von filmenden Brillen. Auf Kickstarter wird derzeit eine mit KI gepimpte Sport-Kamerabrille angeboten, ...

// 10:45 Fr, 25. Apr 2025von blip

zur Newsübersicht >