GPT-4 kommt schon schon nächste Woche: KI für Text, Bild- und Video

// 11:03 Sa, 11. Mär 2023von Rudi Schmidts

Heise hatte bereits am Donnerstag als erster darüber berichtet, dass bei der Microsoft-Veranstaltung "KI im Fokus – Digitaler Kickoff" fast beiläufig erwähnt wurde, dass GPT-4 bereits nächste Woche erscheinen soll.

Dessen noch aktueller Vorläufer GPT3(.5) befeuert unter anderem das gerade omnipräsente ChatGPT von OpenAI. An OpenAI hält Microsoft mittlerweile signifikante Geschäftsanteile und dürfte deswegen in die internen Abläufe entsprechend eingeweiht sein.

Noch konkreter wurde Andreas Braun, CTO Microsoft Germany und Lead Data & AI STU, so wörtlich: "Wir werden nächste Woche GPT-4 vorstellen, da haben wir multimodale Modelle, die noch ganz andere Möglichkeiten bieten werden – zum Beispiel Videos".

Im Gegensatz zu "großen Sprachmodellen" (Large Language Modells, LLMs) sind multimodale Modelle nicht auf Sprache zur Eingabe und Ausgabe limitiert. Man kann, aber muss keinen Text als Input nutzen, sondern kann neben Text auch ein Bild, einen Ton oder -nach Microsofts Andeutung- sogar ein Video "eingeben".

Erst vor ein paar Tagen hatte Microsoft sein eigenes erstes, großes Multimodales Modell Kosmos-1 vorgestellt. Dieses MLLM (Multimodal Large Language Model) kann nach der Betrachtung von Bildern konkrete Aussagen zum Bildinhalt beantworten oder auch Bilderrätsel lösen.

// Top-News auf einen Blick:

Kosmos-1 ist nun NICHT GPT-4 und hat damit auch nur gemein, dass GPT-4 ebenfalls multimodal arbeiten kann.

Ähnliches könnte also auch bei der Eingabe von Videos bald möglich sein. Es ist zudem zu erwarten, dass in Zukunft auch multimodaler Output nutzbar sein wird. Ob es bei GPT-4 schon soweit ist, wird sich nächste Woche klären. Auf jeden Fall dürften wir in Kürze das Zusammenwachsen von GPT- und Diffusion-Modellen erleben.

Die Geschäftsführerin von Microsoft Germany, Marianne Janik, betonte auf der gleichen Veranstaltung übrigens, dass es bei KI nicht darum gehe, Jobs zu ersetzen, sondern repetitive Aufgaben auf andere Weise als bisher zu erledigen. Man werde auch weiterhin viele Menschen als Experten benötigen, um die Nutzung von KI wertschöpfend zu machen.

Also lieber schon mal das Prompten üben, liebe Leute...

mehr Infos bei
www.heise.de

Auf Socials teilen:

Leserkommentare // Neueste

medienonkel // 17:12 am 18.3.2023

Ach komm, das käme doch schon jetzt nicht per Bargeld mit der Post.

MK // 14:27 am 17.3.2023

Das mit der Ethik ist immer so ne Sache... dann macht es jemand anderes der das nicht so eng sieht und am Ende schaut man selber in die Röhre.

markusG // 11:30 am 17.3.2023

https://www.youtube.com/wat... Robotergesetze ausgesetzt.

Im Forum mitdiskutieren >>

Ähnliche News //

News

Microsoft bietet ab sofort kostenlose KI-Bildgenerierung per Edge Browser

Microsoft wittert Morgenluft und sieht KI als große Chance, Marktanteile im von Google dominierten Markt der Internet-Suche und -Browser zu erobern - nun wird nach Bing/GPT 4.0 ...

// 15:34 Sa, 8. Apr 2023von Thomas Richter

News

Kann Chat GPT Bilder besser verlustfrei komprimieren als PNG?

Was passiert eigentlich, wenn man ein Bild verlustfrei komprimiert? Um Daten zu komprimieren, muss man in den Daten wiederkehrende Muster finden. Daraufhin kann man diese ...

// 10:24 Mo, 2. Okt 2023von Rudi Schmidts

News

Lang erwartetes Upgrade DJI Mavic 4 Pro - 6K Video, 360° Gimbal, RC Pro 2,eND und bessere Hinderniserkennung

UPDATE 13. Mai: Die DJI Mavic 4 Pro ist jetzt offiziell gestartet, hier unsere News dazu mit allen neuen Features wie dem 360° Infinity-Gimbal, der neuen RC Pro 2 Fernsteuerung, .....

// 20:00 Mo, 5. Mai 2025von Thomas Richter

News

Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach ...

Forscher von Google haben eine neue KI vorgestellt, die nach einem ähnlichen Muster wie die gerade sehr populären Text-2-Image KIs wie DALL-E 2, Midjourney oder Stable Diffusion .....

// 10:57 Mo, 30. Jan 2023von Thomas Richter

News

VideoFusion: Erste Open Source Video-KI ist da - und läuft auch auf dem Heim-PC

Ein chinesisches Forscherteam hat eine neue Text-to-Video KI veröffentlicht, mit der sich Videos per Texteingabe erzeugten lassen. Ähnliche Algorithmen haben zwar schon Meta mit .....

// 13:41 Mo, 20. Mär 2023von Thomas Richter

zur Newsübersicht >

Teaser-Ankündigung Kommt die Sony Alpha 7 V am Dienstag?

Wer auf die Sony Alpha 7 V wartet, sollte sich den nächsten Dienstag Nachmittag freihalten. Denn für 15h teasert Sony nun die Neuvorstellung eines Alpha-Produkts - und ist das ...

// 20:23 Fr, 28. Nov 2025von blip

Test

Die beste Einsteiger-Drohne? DJI Neo 2: Verbesserte Mini-Drohne für Solo-Creator und Einsteiger

Mit der Neo 2 stellt DJI seine weiterentwickelte Einsteiger- und Selfie Drohne Neo 2 vor. Hinzugekommen sind wichtige Funktionen wie Hinderniserkennung, verbessertes Active Track, ...

// 14:39 Do, 27. Nov 2025von Rob

Test

Halbe Portion? Blackmagic PYXIS 12K - Sensor-Test - Rolling Shutter und Dynamik

Die PYXIS Serie bedient den Wunsch vieler Anwender nach einer riggingfähigen Boxed-Kamera. Mit der PYXIS 12K findet nun der Sensor aus der großen URSA CINE 12K in diesem kleineren ...

// 10:47 Di, 25. Nov 2025von Rudi Schmidts

200 Euro Black Friday Rabatt OBSBOT Tail 2: KI-gestützte 4K-Kamera für freihändige professionelle Produktion

Komplexe Aufnahmeumgebungen, Multikamera-Setups oder dynamische Performances ohne großes Team meistern? Mit der kompakten, KI-gestützten 4K-Kamera OBSBOT Tail 2 erzielen Kreative ...

// 11:10 Do, 20. Nov 2025von slashCAM

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Qualcomm und Microsoft Windows Laptops bald mit Apple M3 Mac auf Augenhöhe?

Seit den M-Prozessoren ist bei Apple das Preis-Leistungsverhältnis für Videowerker wieder deutlich attraktiver geworden. Doch wenn zwei schlafen, könnte sich nun ein Dritter ...

// 08:29 Do, 11. Apr 2024von Rudi Schmidts

Aktuelles

Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher?

Nach Bild- und Text-generierenden KIs gibt es noch weiteres Feld, in welchem gerade per künstlicher Intelligenz enorme Fortschritte gemacht werden und zwar bei der Synthese von ...

// 19:47 Mo, 6. Feb 2023von Thomas Richter

zur Artikelübersicht >

Aktuelle News //

News

Multimodale KI-Modelle ByteDance Vidi2 produziert selbstständig fertige Videos aus Rohmaterial

Chinas ByteDance eröffnet den Dezember KI-Präsentationsreigen und demonstriert mit Paper und Demo ihr neuestes multimodales KI-Modell Vidi 2. Multimodale Modelle akzeptieren ...

// 15:54 Mo, 1. Dez 2025von Rudi Schmidts

News

Bessere MetadatenOrga Blackmagic DaVinci Resolve 20.3 bringt Support für 32K-Workflows und mehr

Blackmagic hat gerade die neue Version 20.3 seines kostenlosen Grading-, Schnitt-, Compositing- und Audio-Mastering-Programms DaVinci Resolve (Studio) veröffentlicht. Die neue ...

// 12:39 Mo, 1. Dez 2025von Thomas Richter

zur Newsübersicht >