Google: automatische Objekterkennung in Videos per Deep Learning

// 14:13 So, 12. Mär 2017von Thomas Richter

Google bietet via Cloud Services eine ganze Reihe von AI (Artificial Intelligence) basierten Diensten an - für den Bereich Video besonders interessant ist eine neue, eben vorgestellte Funktion: die automatische Erkennung von Objekten in Videos via Deep Learning. Nachdem viele Objekte schon seit einiger Zeit in Standbildern mit relativ großer Wahrscheinlichkeit identifiziert werden können, war es ja nur eine Frage der Zeit, bis dies auch in bewegten Bildern gelingt.

Man kann online einige Demos ausprobieren, in welchen in beinahe Echtzeit sowohl Objekte als auch abstraktere Dinge wie Settings (Landschaft, Zoo, Natur) oder Gesichtsausdrücke, Verben, Logos oder Posen in laufenden Videos erkannt werden. Der Algorithmus gibt auch an, wie hoch die Wahrscheinlichkeit ist, daß ein Objekte korrekt identifiziert wurde.

Google bietet diese Video-Objekterkennung als cloudbasierten Service an, zum Beispiel um große Mengen an Videos zu verschlagworten bzw. nach bestimmten Objekten durchsuchbar zu machen. In jeder einzelnen Szene kann mit genauer Zeitangabe per Metadaten das Vorhandensein eines Objekts verzeichnet werden und so auch ganz bestimmte Szenen gefunden werden, in denen mehrere Objekte gleichzeitig vorhanden sind.

Große Medienunternehmen können mithilfe von Googles Video Intelligence API in Zukunft so beispielsweise große Mengen von Uservideos mit Schlagworten versehen und sie so Suchen zugänglich machen, die nicht mehr nur wie bisher auf dem Titel und von Usern eingegebenen Tags beruhen.

// Top-News auf einen Blick:

Auch für eine zukünftige Anwendung im Bereich professioneller Videobearbeitung könnte die Technik vielversprechend sein, denn durch die automatische Ergänzung von bildbeschreibenden Metadaten dürften sich Archive von selbstgedrehtem Videomaterial sinnvoll erschließen lassen und viel manuelle Arbeit sparen - zum Beispiel beim Schnitt von Dokumentarfilmen.

Das Ganze funktioniert mithilfe von Deep Learning Modellen -- mittels großer Mengen von Beispielbildern samt Schlagworten wurde die Mustererkennung so "trainiert", dass Gegenstände auch in anderen Videos als den bekannten wiedererkannt werden. Googles Objekterkennung kann so auch laufend durch neue Trainingsdaten und Änderungen am Algorithmus (bzw der Verschaltung der neuronalen Netze) verbessert werden.

Wer mehr über Deep Learning mittels Neuronaler Netzwerke wissen will, findet eine gute Erklärung im folgenden Artikel Maschinenlernen macht künstliche Intelligenz praxistauglich und eine noch detaillierte über die deren Funktionsweise.

mehr Infos bei
cloud.google.com

Auf Socials teilen:

Google: automatische Objekterkennung in Videos per Deep Learning

// Top-News auf einen Blick:

Neue Flaggschiff Smartphones Apple iPhone 16 Lineup mit neuen KI- und Kamerafunktionen sowie Kamerabutton ...

Blackmagics Cloud Store Netzwerkspeicher für Resolve wird billiger

Weltweites Live Editing Blackmagic zeigt Cloud Live Sync: Clips schon während der Aufnahme bearbeiten

Netzwerkspeicher Blackmagic Cloud Store verliert Google Drive-Synchronisierung

Fake in Echtzeit Kostenloses KI-Tool "Deep-Live-Cam" erzeugt täuschend echte DeepFakes im Live-Chat

Bessere Hinderniserkennung DJI Mavic 4 Pro ist da und filmt mit neuem 360°-Gimbal in 6K

Kostenloses Update Blackmagic DaVinci Resolve 20 Beta 3 ist da

Lumix S1II und S 24-60mm F2.8 Panasonic LUMIX S1II im Praxistest: Beste Video-DSLM ihrer Klasse Dank 5.1K Open Gate u. hohem DR?

Timeline-Compositing DaVinci Resolve 20 Workshop - Photoshop Layer-Split und der neue Keyframe Editor

Panasonic GH6 und Atomos Shogun Connect in der (Cloud)Praxis: Proxy-Upload mit LTE-Handy vom Set?

Blackmagic Cloud Pod und Cloud Store Mini 8TB - Netzspeicher einfach für Alle

Kostenloses 32-Bit Upgrade Sennheiser Profile Wireless Mikro bekommt 32-Bit Float per Firmware und eine 1-Kanal ...

Neue Vollformat-Hybride Panasonic LUMIX S1II und S1IIE für Videofilmer - bis zu 15 Blendenstufen und ARRI Log

ARTIKEL

THEMEN