Wissen Optimaler Audio-Workflow Was ist Latenz und wie kann man sie minimieren?

Optimaler Audio-Workflow Was ist Latenz und wie kann man sie minimieren?

Wer sich näher mit Audio-Technik befasst, stolpert häufig über die sogenannte "Latenz". Wir wollen einmal klären, was man darunter genau versteht und wie man Probleme in diesem Bereich umschiffen kann...

// 11:29 Fr, 29. Mai 2026von

Was ist Latenz?

Der Begriff Latenz bezeichnet im Audiobereich die zeitliche Verzögerung, die durch die Verarbeitung von Daten entsteht. Von besonderem Interesse ist dabei meistens die Latenz zwischen dem Einspeisen eines Audiosignals (z. B. einem gespielten Instrument oder einem Mikrofonsignal) und dem tatsächlichen Hören oder Verarbeiten dieses Signals am Ausgang (z. B. Kopfhörer, Lautsprecher oder Aufnahmesoftware).



Latenz kann an vielen Stellen der Signalverarbeitung entstehen, wie beispielsweise bei der A/D- und D/A-Wandlung, durch Puffergrößen in Audioprogrammen (DAWs) sowie durch Effekt-Plugins:


Je nach Anwendung addieren sich Latenzen an verschiedenen Stellen im System.
Je nach Anwendung addieren sich Latenzen an verschiedenen Stellen im System.

Man kann die Latenz meistens sehr exakt in Samples angeben, wobei eine Angabe in Millisekunden oft anschaulicher ist.



Hohe Latenz kann besonders beim Musizieren störend wirken (z. B. ein verzögertes Monitorsignal), aber auch für Echtzeitanwendungen wie Aufnahmen oder Live-Monitoring ist eine niedrige Latenz erstrebenswert. Auch kann bei der Video-Synchronisation die Latenz zu groß werden - dann leidet die Lippen Synchronität oder es wird ein „Offset“ zwischen Bild und Ton bemerkbar.





Wie hoch ist zu hoch?

Ob eine Latenz im Audiobereich „zu hoch“ ist, hängt stark vom Anwendungsszenario und der individuellen Empfindlichkeit ab. Entscheidend ist vor allem, ob sie den Arbeitsablauf beeinträchtigt - beispielsweise beim Live-Monitoring, wenn sich ein Sprecher selbst über Kopfhörer hört.



Hier gilt eine Latenz von unter 5 ms als ideal, weil diese praktisch kaum wahrnehmbar ist. Aber auch Latenzen zwischen 5 und 10 ms sind selbst für Profis meistens noch akzeptabel.


Ab 10–15 ms wird es für Musiker zunehmend störend – das eigene Spiel fühlt sich „schwammig“ oder verzögert an, das Timing leidet. Und auch die Stimme im Kopfhörer wird bereits von vielen Menschen als Doppelung wie bei einem leichten Chorus Effekt wahrgenommen.


Alles über 15 Millisekunden gilt dann heutzutage eigentlich als inakzeptabel. Auch bei der Aufnahme mit Software-Effekten (z. B. Gitarre über einen Amp-Simulator in der DAW oder Audio-Voice-Over mit De-Esser, Kompressor und Hall) gelten die gleichen Grenzen wie beim Monitoring.



Bei reinem Abhören/Playback - also immer wenn es keine Interaktion zwischen Input und Output gibt - ist die Latenz ist subjektiv unkritisch. Sie äußert sich dann einfach nur in einer Verzögerung des Audiosignals, beispielsweise nach dem Drücken des Abspiel-Buttons. Hier sind auch mehrere hundert Millisekunden kaum wahrnehmbar, geschweige denn störend. Geht es um eine gekoppelte Audio-Video Wiedergabe, kann in diesen Fällen mittels Latenzkompensation eine synchrone Wiedergabe garantiert werden, indem man das frühere Signal einfach um den Betrag der Latenz später starten lässt. In vielen Apps lässt sich diese Audio-Videoverzögerung in den Systemeinstellungen an das eigene Projekt anpassen.



Bei einer Videokonferenz, Streaming mit Interaktion oder Live Übertragungen, spielt die Latenz dann auch noch im Zusammenhang mit dem Übertragungsweg eine größere Rolle. Gerade in Gesprächen oder Interviews über größere Distanzen kann sich die Gesamt-Latenz (Audio + Verarbeitung + Netzwerk) noch einmal signifikant erhöhen.



Werte unter 150 ms sind hier für flüssige Dialoge meist noch akzeptabel und entsprechen einer typischen Handy Verbindung. Über 300 ms wird eine Unterhaltung dagegen zunehmend unangenehm, es kommt zu Überschneidungen oder Verzögerungen und man fällt sich oft ungewollt in Wort, weil das Timing des Gesprächsflusses einfach nicht mehr gewohnt ist - eben wie bei einem schlechten Telefonat ins entfernte Ausland.



Doch bevor man sich nun mit Samples und Millisekunden auseinandersetzt kann man eigentlich immer die folgende Faustregel beherzigen: Sobald man die Latenz in irgendeiner Form bemerkt, ist sie zu hoch.






Mit einem Einkauf bei unseren Partnern unterstützt Du slashCam // Affiliate
�hnliche Artikel //
Umfrage
    Welche Kameraauflösung ist für Dich aktuell der Sweet Spot?






    Ergebnis ansehen

slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash