Frage von cantsin:Mal wieder eine Deep Learning/AI-Nachricht:
Rauschfilterung durch Deep Learning-Bildrekonstruktion, entwickelt von Nvidia in Zusammenarbeit mit dem MIT und der finnischen Aalto University.
Beispielbilder:
zum Bild
Noch mehr Bilder + Bericht:
https://www.dpreview.com/news/022995764 ... ges-photos
Das geht doch erheblich weiter als Neat Video... Und könnte dafür sorgen, dass Winzsensor-Smartphones in Zukunft hinsichtlich ISO-/Rauschverhalten im prozessierten Bild mit heutigen Full Frame-Kameras konkurrieren werden.
Antwort von cantsin:
...und jetzt auch mit Demo-Video:
Antwort von mash_gh4:
naja -- rauschunterdrückung mit ML techniken ist im grunde nichts wirklich neues. es ist vielmehr eine der einprägsamsten fähigkeiten, die einem sofort in den sinn kommt, wenn man jemanden die funktionsweise und sinnhaftigkeit von autoencodern erklären will:
https://en.wikipedia.org/wiki/Autoencod ... utoencoder
https://towardsdatascience.com/how-to-r ... 5d5e6de543
https://blog.keras.io/building-autoenco ... keras.html
https://github.com/GunhoChoi/Kind-PyTor ... utoencoder
https://reyhaneaskari.github.io/AE.htm
aber natürlich ist es trotzdem eine ganz andere herausforderung, derartige fähigkeiten nicht nur im rahmen ganz einfachen MNIST beispieldaten zu demonstrieren, sondern das ganze auch wirklich praxistauglich auf reale hochaufgelöste bilder anzuwenden. so gesehen ist dein hinweis auf all die diesbezüglichen gegenwärtigen verbesserungesbemühungen natürlich durchaus berechtigt.
Antwort von Jott:
Und wie immer, von Bewegtbild ist noch lange nicht die Rede.
Antwort von Roland Schulz:
Die verwendeten Beispielfotos sind geil - die sind 100 Millionen Jahre alt ;-)! Nicht dass das was ändern würde, aber die kann bald jeder auswendig nachzeichnen, gab"s damals als Demo auf irgendner Kodak Photo CD.
Das mit dem überlagerten Text, alles relativ. Ohne Referenz, d.h. bei neu erstellten Bildern kann kein Algorithmus der Welt wissen was wirklich dahinter war, maximal so kaschieren dass es nicht auffällt. Denke darum geht es aber auch, nicht um echte Bildinhalte.
Trotzdem so eine interessante Leistung. Denke aber selbst so trotzdem ohne jegliche Praxisrelevanz, vor allem vor dem Hintergrund der notwendigen Rechenpower.