Quantisierung

Current version of the page has been reviewed and is approved ().



Quantisierung

Der zweite notwendige Schritt zu einem digitalen Signal besteht darin, die zeitdiskreten Werte zusätzlich im Wertebereich zu diskretisieren. Dazu ist es notwendig, eine bestimmte Auflösung und einen bestimmten abzudeckenden Wertebereich festzulegen. Da wir die Signale digital speichern, ist die Auflösung immer in 2er Potenzen angegeben. Jedes weitere Bit erhöht die möglichen Wertestufen um den Faktor 2. Übliche Auflösungen sind 8 Bit = 1 Byte, 16 Bit = 1 Word oder 32 Bit = 1 Long Word. Damit sind dann
2^{8} = 256
,
2^{16} = 65536
oder
2^{32}
verschiedene Werte darstellbar.

Zusätzlich muss der Wertebereich nach oben und unten begrenzt sein, da der Wertebereich von
- \infty ... + \infty
   nicht durch eine begrenzte Anzahl an Stufen aufzulösen ist, wenn alle Wertestufen den gleichen Abstand haben sollen.

Die eigentliche Werteumwandlung lässt sich am einfachsten anhand von Abbildung 2.8 zeigen. Auf der x-Achse ist der analoge, wertkontinuierliche Eingang aufgetragen und auf der y-Achse der Ausgang des Diskretisierers, im weiteren Quantisierer genannt.
Fig. 2.8 Einfache Quantisierungskennlinie.

Diese stufenförmige Funktion wird Quantisierungskennlinie genannt und kann unterschiedlich aufgebaut sein. In den meisten Fällen sind alle Wertestufen gleich hoch. Man spricht in diesem Fall auch von einer linearen Quantisierung. (Wir werden auf den Begriff der Linearität später noch kommen und diesen Begriff hinterfragen.)
Es gibt aber auch andere Kennlinien, die beispielsweise eine hohe Auflösung im Bereich um Null und bei großen Eingangswerten eine geringere Auflösung besitzen (siehe Abbildung 2.9).
Fig. 2.9 Beispiel einer linearen und einer nichtlinearen Quantisierungskennlinie

Ein Beispiel hierfür benutzen Sie fast täglich beim Telefonieren, wo das Signal fast logarithmisch quantisiert wird. Der Vorteil dieser nicht-gleichförmigen Quantisierung ist die bessere Anpassung an das zu quantisierende Signal. Als Nachteil erweist sich aber, dass die Signalverarbeitung mit diesen Signalen sehr viel aufwändiger ist. Deshalb werden diese nicht-gleichförmigen Quantisierer meistens bei der Speicherung und der Übertragung von Daten verwendet.

Weitere Variationen ergeben sich im Verhalten am Nulldurchgang. Zum einen kann man das Nullsignal ausschließen oder man weist sehr kleine Werte alle dem Nullsignal zu (siehe Abbildung 2.10). Die letztere ist die Form, die in den allermeisten Fällen in der Praxis verwendet wird.

Fig. 2.10 Quantisierungskennlinie eines Mid-Rise und eines Mid-Tread Quantisierers. Üblich ist Mid-Tread.

Problematisch ist nun aber, dass die benötigte Auflösung bei einer vollständig symmetrischen Lösung ungerade sein müsste, da die Null weder eine positive noch eine negative Zahl darstellt. Gleichzeitig muss aber eine 2er Potenz und somit eine gerade Zahl erreicht werden. Dies wird gelöst, indem die Null zu den positiven Werten gezählt wird. Aus diesem Grund ergeben sich am Ausgang der meisten Quantisierer
2^{Bit - 1}
negative Werte, aber nur
2^{Bit-1} - 1
positive Werte. Diese Werte werden für die Verarbeitung meist normiert angewendet. Es ergibt sich dann ein Wertebereich von

-1 \leq x \leq 1 - \frac {1} {2^{Bit-1}}
.

Die Frage, welche Auflösung nötig ist, um eine perfekte Rekonstruktion für einen bestimmten Wertebereich zu ermöglichen, ist aber damit noch nicht beantwortet. Das Problem ist in Abbildung 2.11 veranschaulicht, die die Quantisierung einer Sinusfunktion mit wenigen Stufen zeigt.

Fig. 2.11 Veranschaulichung der Quantisierung bei einem Sinus als Eingangssignal (Midtread Kennlinie)


Es wird deutlich, dass viele unterschiedliche Eingangswerte einem einzigen Ausgangswert zugewiesen werden (im Englischen auch als Many-to-One-Transformation bezeichnet). Dieser Prozess ist aber immer irreversibel, da aus den quantisierten Werten nicht eindeutig auf die Originalwerte geschlossen werden kann.
Wichtig: Bei einer Quantisierung kommt es immer zu einem Informationsverlust.

Die Quantisierung muss also immer so groß gewählt werden, dass sie für den jeweiligen Empfänger angepasst ist. In der Audiologie ist der Empfänger meist das Ohr. Da das Ohr nur einen eingeschränkten Dynamikbereich wahrnimmt, reichen 16 Bit, wie sie bei der CD verwendet werden, meistens aus. Die entstandenen Verzerrungen sind für ungeübte Ohren unhörbar und werden als Rauschen wahrgenommen. Dies gilt zumindest, wenn die Auflösung bezogen auf die Amplitude des Signals ausreicht.