Google hat gerade ein interessantes Patent zugesprochen bekommen, dass die automatische Erkennung von Objekten in Videos und Photos abdeckt. Nachdem die Gesichtserkennung per Algorithmus auf Photos schon ganz gut funktioniert, ist die Erkennung von anderen Objekten der nächste logische Schritt.
Möglich wären mit diesem Verfahren eine automatische Organisation von Videos anhand der in ihnen vorkommenden gefilmten Objekte, die in Form von Tags dann mit Videos assoziiert würden. So könnten zum Beispiel bei einer Suche auf YouTube alle Videos aufgeführt werden, die den Eiffelturm oder/und eine Katze abbilden. Die automatische Erkennung kann auch dazu genutzt werden, um von Usern eingegebene falsche (Spam-)Tags auszusortieren.
Die Merkmale, um ein Objekt zu erkennen, sollen aus einer Datenbank kommen, die mindesten 50.000 Objekte umfassen und typische Eigenschaften wie Form, Eckenorientierung, Farbe, Textur und Bewegung umfassen soll. Gefüllt werden soll die Datenbank automatisch anhand von mit Tags versehenen User-Videos, aus denen dann versucht wird, die typischen Eigenschaften der getaggten Objekt zu extrahieren - ohne weitere manuelle Interaktion zu benötigen.
// Top-News auf einen Blick:
- DaVinci Resolve 21 Photo ausführlich im Screencapture Workshop erklärt
- Cartoni Hyperroll - modulares Roll-Rig für kreative Kamerafahrten
- Adobe erklärt die Details zum neuen Premiere Color Mode
- Sennheiser HD 480 PRO - neuer geschlossener Referenzkopfhörer für Studio und Live
- Insta360 Mic Pro - Funkmikro mit farbigem E-Ink-Display und 32-Bit Audio Float
- GoPro MISSION 1 Pro - 8K-Actioncam-Modelle erklärt
Sinnvoll ist das Patent auch im Zuge Googles größerer Strategie, die Suchfunktion nicht nur auf das Netz zu beschränken sondern auf die reale Welt auszudehnen, um auch diese durchsuchbar zu machen - und zu diesem Zweck müssen Algorithmen auch alltägliche Gegenstände erkennen können. So könnten bei Suchanfragen nicht nur passende Webseiten, sondern auf Wunsch auch wirklich passende Videos eingeblendet werden (die dann auf erkannten Objekten und nicht nur den Titeln bzw. Tags der Videos basieren wie bisher).
Google hat schon einen ähnlichen Algorithmus in seiner App Goggles am laufen, welche automatisch Sehenswürdigkeiten (und berühmte Bilder) erkennen kann.


















