Wie nicht nur gerade ein aktueller Thread bei uns belegt ist eine objektive Beurteilung von Bildqualität ein schwieriges Feld. Viele Leser hätten am liebsten eine zuverlässige Quantifizierung, die mit einfachen Zahlen beschreibt, wie gut die Bildqualität einer Kamera ist. Das Problem zieht jedoch noch deutlich größere Kreise. Will man beispielsweise einen Codec optimieren, braucht man verlässliche quantitative Parameter, die sich verbessern oder verschlechtern können. Zum Teil kann dies durch eine Messung von Rauschen, Schärfe oder Komprimierungsartefakten gelingen, jedoch gibt es bereits hier oft große Abweichungen zwischen der gemessenen Zahl und der menschlichen Wahrnehmung. So kann eine Kamera beispielsweise quantitativ mehr Rauschen, als eine andere, wobei die Art des “stärkeren” Rauschens dennoch für einen präferierten Bildeindruck sorgen kann. Ähnliches gilt für die Schärfe oder die Sichtbarkeit von Artefakten.
Solchen Problemen will Google mit einem neuen Ansatz entgegentreten, der unter Zuhilfenahme von künstlicher Intelligenz eine quantitative Bewertung von Bildern ermöglichen soll. Genauer erklärt: Eine einzige Zahl -der NIMA-Score - soll beschreiben, wie gut die Qualität eines Bildes ist. Und hierbei sollen nicht nur quantitative Aspekte wie Rauschen oder Artefakte berücksichtigt werden, sondern auch ästhetische Gesichtspunkte wie Bildkomposition oder Farbauswahl und Farbverteilung.
Wie immer, wenn in den letzten Monaten etwas derart utopisch klingt kommt eine Lösung meistens aus dem Bereich Big Data/ Machine Learning. Und Zugriff auf Bilddaten-Massen hat Google bekanntlicherweise. Einfach gesprochen muss man einem Neuronalen Netz nun nur jede Menge Bildvergleiche präsentieren und mitteilen, welches Bild von zwei Versionen den meisten Menschen besser gefällt. Bei Milliarden von Bildern entwickelt das NIMA-Modell dabei offensichtlich eine recht gute Einschätzung, wie gut ein Bild den Massengeschmack trifft. Und dies kann es anschließend in einer einzigen quantitativen Note, also dem NIMA-Score ausdrücken.
Das wirklich interessante in dem verlinkten Abstract ist jedoch der letzte Teil: Denn wenn ein Netz den NIMA-Score eines Bildes schnell berechnen kann, kann es auch versuchen den NIMA-Score eines Bildes mit diversen Algorithmen zu erhöhen. Hierfür kommen dann sogenannte Genetische Algorithmen zum Zuge: Man erzeugt einfach eine Menge “zufällig” optimierter Bilder von der Basis-Version und lässt wählt die Bilder mit dem höchsten NIMA-Score aus, um von diesen dann weitere Optimierungen mit zufälligen Parametern zu erzeugen. Von diesen dienen dann wieder die Bilder mit den höchsten NIMA-Scores für weitere Mutuationen und so weiter. Die Ergebnisse sehen dabei tatsächlich so aus, als dürften sie im breiten Konsens als die “besseren” Bilder abscheiden, und das bei wirklich vollautomatischer Optimierung, ohne menschliches zutun: