Frage von s.holmes:Ich habe je eine Aufnahme beider Seiten eines Telefongesprächs. 44100 Hz und 22050 Hz. Sie fangen noch synchron an, laufen dann aber sehr auseinander. Woran liegt es und kann ich sie mit Audition wieder synchron machen?
Antwort von srone:
nun erstmal würde ich beide dateien in 48khz (video-standard) konvertieren, dann weiter sehen...
drifted es dann immer noch auseinander ist die frage wieviel - final mehr als 10-15%, dann hilft auch kein timestretching mehr, dann nur noch dezidiertes schneiden von einem zum anderen, uU mit partiellem timestretching um dem bild zu folgen, wird wohl ne bastelei, da in schrägen standards aufgenommen skype oder so ähnlich?
lg
srone
Antwort von s.holmes:
srone hat geschrieben:
nun erstmal würde ich beide dateien in 48khz (video-standard) konvertieren, dann weiter sehen...
drifted es dann immer noch auseinander ist die frage wieviel - final mehr als 10-15%,
~40 sek nach ~13 min
srone hat geschrieben:
bastelei, da in schrägen standards aufgenommen skype oder so ähnlich?
Recorder App am Telefon + bin mir nicht sicher was
Antwort von s.holmes:
Kann man den Stretchfaktor genau ausrechnen anhand der Metadaten?
Antwort von srone:
s.holmes hat geschrieben:
~40 sek nach ~13 min
13x60s=780s
100/780*-40=-5,128% also 100% minus 5,128% = 94,872% als timestretchfaktor oder eben andersherum, je nachdem, welches file du angleichen willst.
genauer musst du selber rechnen...;-)
wenn es nur ton ist, ist simpel schneiden besser, wenn es lippensynchron sein soll, gibt es ein bild?, dann takeweise angleichen, da man nicht ausschliessen kann, dass es ungleichmässig drifted. ja ist arbeit, aber wenn es gut werden soll...:-)
lg
srone
Antwort von s.holmes:
Zum Glück, nur Ton. Schade, dass man das nicht rechnen kann.
Danke.
Antwort von srone:
s.holmes hat geschrieben:
Zum Glück, nur Ton. Schade, dass man das nicht rechnen kann.
Danke.
kannst du doch, jedoch verschlechtert timestretching den womöglich ohnehin grenzwertigen ton (-> 22050 khz), deswegen lieber die handarbeit...:-)
ich fische im trüben, wenn du nicht genau spezifizierst, was du eigentlich machen willst..:-)
lg
srone
Antwort von carstenkurz:
Ist in den beiden Aufnahmen jeweils nur EINER der Gesprächspartner zu hören, oder auch das jeweilige Gegenüber?
Grundsätzlich würde ich erstmal versuchen, per Timestretching die 44.1 KHz Version an die 22.05 anzugleichen. Dann sieht man weiter.
5% ist für Sprache mit Standardverfahren eigentlich noch problemlos machbar. Versuch kostet nur ein paar Sekunden, sofern man mit der Bedienung des Programms und dem Verständnis der Eingabeparameter halbwegs klar kommt.
- Carsten
Antwort von Blackbox:
Ja.
Alternative ohne Timestretching im Produkt geht auch:
Einfach auf drei Spuren schneiden:
z.B.
Spur1: 44,1 original
Spur2: 22,05 mit timestretching genau zu 44.1 Spur synchron, Klangqualität egal
Spur3: 22.05 original
Dann Spur 3 rein optisch anhand der Wellenform in Abschnitten passend auf die Wellenform von Spur 2 anlegen.
Ggf. bei Spur1 Pausen verlängern oder verkürzen.
Geht natürlich nicht wenn auf den Aufnahmen die jeweils anderen Stimmen gleichzeitig auch zu hören sind.
Antwort von dosaris:
alles nur Spekulation.
Eine weitere Ursache könnte auch sein, dass die Aufnahme in VBR/VFR entstanden sind. Einige Smartphones nehmen so auf.
Bei Wiedergabe mit einem unpassenden (= nicht komplementären) Decoder können so timingfehler entstehen.
Ohne weitere Infos zum Encoding, Recorder und Player/Decoder kann man nix sinnvolles diagnostizieren.
Antwort von Jott:
So lange die Aufnahme nicht „eiert“: Spuren parallel legen, Timestreching der einen Spur, Faktor ausrechnen oder ohne Taschenrechner zur Not auch Trial and Error, Ergebnis akustisch und visuell (Waveforms) prüfen - bei leichtem Echo gegen Ende noch mal feiner einstellen, bis es passt, fertig.
Qualitätsproblem? Also bitte. Den Telefonstimmen ist das Stretching im 5%-Bereich nun wirklich piepegal.
Und vorher wie schon anfangs von Srone vorgeschlagen erst mal die beiden Tracks ins gleiche Audioformat bringen.