Skalenfaktor (Audiocodierung)

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Skalenfaktoren werden in der Audiodatenkompression (z. B. MPEG-2) verwendet, um die Datenmenge einer Audiodatei zu reduzieren.

Ein gängiger Dynamikumfang in der Audiocodierung sind 16 Bit pro Abtastwert mit linearer PCM. Dieser Dynamikumfang ist ausreichend um das Quantisierungsrauschen nicht mehr wahrnehmen zu können. Da diese 16 Bit jedoch selten voll ausgenutzt werden, kann eine Datenreduktion erfolgen, indem zuerst gröber mit z. B. 6 Bit quantisiert wird. Der Skalenfaktor gibt nun an, in welcher Stufe dieser 6-Bit-Quantisierung das Tonsignal liegt. Dieser Stufenwert wird weiter mit so vielen Bits quantisiert, bis das Quantisierungsrauschen unterhalb der Hörschwelle des jeweiligen Frequenzbandes liegt (siehe Teilbandkodierung), was je nach Signalamplitude mit weniger als 16 Bit passiert. Die Summe der Bits für den Skalenfaktor und der Bits für die Amplitude ist oft kleiner als 16 Bit. Empirische Untersuchungen zeigen, dass sich der Skalenfaktor für unmittelbar aufeinander folgende Abtastwerte kaum ändert. Dadurch kann eine nochmalige Datenreduktion herbeigeführt werden, indem ein Skalenfaktor z. B. für acht aufeinander folgende Abtastwerte gilt.

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Udo Zölzer: Digitale Audiosignalverarbeitung. 3., überarbeitete und erweiterte Auflage, Nachdruck. Vieweg + Teubner, Wiesbaden 2008, ISBN 978-3-519-26180-3.
  • Roland Enders: Das Homerecording Handbuch. Der Weg zu optimalen Aufnahmen. 3., überarbeitete Auflage, überarbeitet von Andreas Schulz. Carstensen, München 2003, ISBN 3-910098-25-8.