Meta hat die extrem interessante KI zur Erstellung von Objektmasken veröffentlicht und auch gleich zur freien Verfügung ins Netz gestellt. "Segment Anything" (SAM) erkennt Objekte in Bildern und stellt diese automatisch als einzelne Masken frei. Segmentierung bedeutet in diesem Zusammenhang, zu erkennen, welche Pixel in einem Bild zu einem Objekt gehören - eine Aufgabe, die uns als Menschen ganz einfach erscheint, aber für Computerprogramme bisher immer eine große Herausforderung darstellte. Metas neues KI-Modell wurde per Machine Learning anhand Millionen von Bildern samt Objektsegementierungen trainiert und hat dadurch eine allgemeine Vorstellung davon erlernt, was Objekte sind. So kann es jetzt Masken für jedes Objekt in jedem Bild oder Video erzeugen - sogar für Objekte, die nicht im Trainingsmaterial vorhanden waren.

Selbst ausprobieren
Es gibt unterschiedliche Maskierungsmodi: im interaktiven Modus kann per Maus auf Bildobjekte geklickt und diese werden dann maskiert werden - ebenso kann per Rechteck ein Bildbereich definiert werden und alle darin befindlichen Objekte werden automatisch maskiert; im "Alles"-Modus wird jedem Objekt in einem Bild eine Maske zugewiesen. Meta bietet eine Online-Demo, welche im Browser läuft und mittels welcher man SAM in allen drei Modi auch mit eigenen Bildern selbst ausprobieren kann - die Genauigkeit der Objekterkennung war bei unseren Tests beeindruckend. Theoretisch möglich, aber aktuell nicht implementiert ist die Fähigkeit, Objekte per Textprompt auszuwählen.

// Top-News auf einen Blick:
- DJI Mini 5 Pro soll so viel wie die Mini 4 Pro kosten
- Nikon Z6III bekommt u.a. Auto-Capture, USB-Streaming, Vogelmodus
- Blackmagic senkt Preise für URSA Cine 12K und 17k Kits radikal
- Google Gemini 2.5 Flash Image Nano Banana bringt Charakterkonsistenz und Multi-Imag
- Neue Sony FX3 und FX30 Firmware bringt BIG6-Startbildschirm, RAW-Video per HDMI und ...
- Google Pixel 10 Pro (XL) kommt mit Generativer KI direkt in der Kamera

"Segment Anything" besteht aus dem allgemeinen Segment Anything Model (SAM) als auch dem Segment Anything Datensatz (SA-1B), welcher von SAM erzeugt wurde und aus 11 Millionen Bildern und 1.1 Milliarden Masken besteht und der bisher größte diesbezügliche Datensatz aller Zeiten ist. Da Meta den Datensatz für Forschungszwecke zur Verfügung stellt und das Modell samt Quellcode unter einer offenen Lizenz (Apache 2.0) veröffentlicht hat, kann man damit rechnen, daß die hochwertige Bildsegmentierung per SAM bald in vielen weiteren Apps und KI-Projekten genutzt werden wird. Wie schnell das funktioniert, demonstriert das gerade veröffentlichte Chrome-Plugin Magic Copy, das SAM nutzt, um ein Vordergrundobjekt aus einem Bild im Browser zu extrahieren und es in die Zwischenablage zu kopieren.
Wer SAM auf seinem eigenen Computer ausprobieren will, findet hier den Python-Quellcode samt Modell.