Frage von mika_ele:Hallo Zusammen,
ich bin auf der Suche nach einer technischen Lösung für folgende Aufgabenstellung/Idee:
Vor einem festen Hintergrund (nicht Greenbox) sollen in Echtzeit die sich bewegenden Objekte ab einer bestimmten Grösse und evtl. auch Geschwindigkeit freigestellt werden. Am besten jedes Objekt für die weitere Verarbeitung in einem eigenen Layer.
Ich hoffe, ich habe mich einigermaßen verständlich ausgedrückt.
Geht sowas überhaupt und wenn ja mit überschaubarem Aufwand?
Ich komme aus der Softwareentwicklung und könnte an der Stelle auch eigene Entwicklungsarbeit leisten.
Antwort von otaku:
ne das kannste vergessen, es sei denn du willst kuenstliche intelligenz oder HAL9000 bauen.
da gibt es andere dinge die man bauen kann die spannend sind.
im wesendlichen gibts in der post aber seit min 20 jahren keine echte innovation mehr. die funktionen die man braucht sind auch gesetzt, im grunde geht es in erster linie darum bestehende funktionen in einer sinnvollen gui zu verpacken.
Antwort von pixler:
was mir gerade in den Sinn kommt sind Z-Cams, also Kameras welche ein Tiefenbild aufzeichnen können. Hiermit lässt sich ein Key in Realzeit und ohne Greenscreen herstellen. Habe ich selber noch nie in real gesehen und weiss auch nicht wie weit die Technologie ist, aber es gibt sie.
http://research.microsoft.com/en-us/um/ ... pthkey.pdf
http://pro.jvc.com/pro/pr/2001/3dv.htm
Antwort von EnricoPerei:
Ohne Greenscreen wird das schwierig.
Bedenke, wenn Dein Hintergrund einfarbig ist, handelt es sich um Chroma- oder Lumascreening, das Du nutzen kannst, sofern die Farbe bzw. Helligkeit nicht auch im Vordergrund auftaucht.
Wenn die Kamera nicht bewegt wird, ist es möglich den Hintergrund als Maske zu nutzen, um invertiert den Vordergrund freizustellen.
Bei bewegter Kamera ist dies Prinzipiell auch möglich, aber nicht in Echtzeit und bedarf ggf. Korrekturen falls Hintergrundelemente überlappt werden,die vorher nicht bekannt sind (siehe clean Plate).
Wenn die Objekte, die du freistellen möchtest und der Hintergrund "ideal" sind, also sehr definierte Kanten und eindeutige Flächen haben, sind Algorithmen vorhanden, um diese relativ gut zu identifizieren.
Eine Echtzeitanwendung muß allerdings wahrscheinlich selbst in Cuda programmiert werden, da mir momentan keine RT Hardware hierfür einfällt.
Besser wird es, wenn zwei oder mehrere Kameras(lightfield) genutzt werden, um ein Tiefenbild zu errechnen, wie pixler erwähnte.
In beiden Fällen sind die Ergebnisse allerdings sehr unterdurchschnittlich und die Software ist nicht unbedingt im Consumersegment erhältlich.
Was genau möchtest Du den machen und für welche Zielgruppe UND in welcher Qualität/Auflösung ?