Das menschliche Gehör als Messsystem – Grundlagen für die Beurteilung von Lärm
Ein Beitrag von Mika Wihanto, B.Sc.
Zeitlich wiederkehrende Vorgänge sind ein fundamentaler Bestandteil unserer Umwelt. Die Naturwissenschaften widmen sich deshalb deren Beschreibung und Verständnis, die sie als Schwingungen bezeichnen. Treten Schwingungen in elastischen, d. h. reversibel verformbaren Medien auf, spricht man von Schall.
Zu den elastischen Medien zählen sowohl Festkörper als auch Flüssigkeiten und Gase. Im Alltag und in Lärmschutzfragen spielt vor allem der Luftschall eine Rolle. Auf mikroskopischer Ebene finden die Schwingungen als Auslenkungen der Luftmoleküle (Stickstoff, Sauerstoff, Kohlendioxid, …) statt, die sich mit der ohnehin vorhandenen ungeordneten Wärmebewegung überlagern.
Technisch relevanter ist jedoch die makroskopische Betrachtungsweise: Hier beschreibt man Schall als Dichte‑ und Druckschwankungen um den Umgebungsdruck. Da sich diese Störung im Raum ausbreitet, hängt der Schalldruck sowohl vom Ort als auch von der Zeit ab. Eine sich räumlich ausbreitende Störung dieser Art bezeichnet man als Welle. Wellencharakteristika bilden die Grundlage der mathematisch-physikalischen Beschreibung von Schallphänomenen.
Eine zentrale physikalische Betrachtungsweise ist diejenige über Energie: Schall kann Energie transportieren, die im Medium und an Strukturen in andere Energieformen (z. B. Wärme oder mechanische Arbeit) umgewandelt wird. Die energetische Betrachtung von Schallfeldern ist wegen der gleichzeitigen räumlichen und zeitlichen Variation des Drucks komplex: Man unterscheidet zwischen der Schallleistung (Einheit
) und der Schallintensität
(Einheit
2).
Die Schallleistung ist die gesamte Schallenergie, die eine Quelle pro Zeiteinheit an das umgebende Medium abgibt, während die Schallintensität
diese Leistung auf eine Fläche bezieht und damit den lokalen Energiefluss pro Quadratmeter beschreibt. Für Quellen in großer Entfernung – man spricht dann vom Fernfeld – ist die Intensität näherungsweise proportional zum Quadrat des Schalldrucks
, der sich in der Praxis mit einem Mikrofon messen lässt.
Das Ohr ist das Sinnesorgan des Menschen, welches für das Messen von Schall zuständig ist. Anatomisch wird es in Außen-, Mittel- und Innenohr unterteilt (Abbildung 1). Die Ohrmuschel (lat. Pinna) hat eine charakteristische Form, die eine frequenz- und richtungsabhängige Verstärkung einfallender Schallwellen verursacht. Zusammen mit dem Gehörgang ergibt sich eine frequenzabhängige Verstärkungswirkung, die insbesondere im Sprachbereich von etwa 2–5 kHz deutlich ausgeprägt ist. Das Außenohr trägt damit wesentlich zur Richtungsbestimmung, zur frequenzabhängigen Verstärkung und zur Filterung des Schalls bei, noch bevor das Mittelohr und die Cochlea ins Spiel kommen.

Am Ende des äußeren Gehörgangs trifft der Schall auf das Trommelfell und wird dort in mechanische Schwingungen umgesetzt. Im Mittelohr werden diese Bewegungen über Hammer, Amboss und Steigbügel auf das ovale Fenster der Cochlea übertragen. Die Knöchelchenkette wirkt dabei wie ein Hebel- und Übersetzungssystem: Durch Hebelwirkung und das Flächenverhältnis zwischen Trommelfell und ovalem Fenster werden die Bewegungen auf eine kleinere Fläche konzentriert, sodass in der Innenohrflüssigkeit deutlich größere Druckschwankungen entstehen.
Physikalisch gesehen ist dies eine Kopplung zweier mechanischer Systeme. Das Mittelohr wirkt dabei als Impedanzanpassung zwischen Luft im Gehörgang und Flüssigkeit im Innenohr. Unter Impedanz versteht man in diesem Zusammenhang den „Schwingungswiderstand“ eines Systems, also wie stark es einer vorgegebenen Bewegung oder Kraft entgegenwirkt. Ohne sie würde ein Großteil der Schallenergie an der Grenzfläche reflektiert. Zusätzlich kann das Mittelohr bei sehr starken Anregungen die Übertragung etwas dämpfen (Stapedius- oder Mittelohrreflex). Damit entsteht bereits hier eine weitere leichte Nichtlinearität, bevor die deutlich stärkeren Effekte im Innenohr einsetzen.
In der mit Flüssigkeit gefüllten Cochlea verlaufen drei längliche Räume (Scala vestibuli, Scala media, Scala tympani), die durch Membranen voneinander getrennt sind (Abbildung 2). Auf der Basilarmembran zwischen Scala media und Scala tympani sitzt das Corti-Organ mit den inneren und äußeren Haarzellen – sie bilden zusammen das eigentliche Sinnesorgan für Schall. Die inneren Haarzellen wirken dabei als Messinstrument: Sie wandeln die mechanische Auslenkung der Basilarmembran in elektrische Nervenimpulse um und stellen damit die Energieumwandler von mechanischer in neuronale Information dar.
Die mechanischen Eigenschaften der Basilarmembran (Masse, Steifigkeit, Dämpfung) ändern sich kontinuierlich entlang der Cochlea: nahe der Basis ist sie schmal und steif, zum Apex hin breiter und weicher (Abbildung 3). Wird am ovalen Fenster angeregt, entsteht in der Innenohrflüssigkeit eine Wanderwelle, also eine laufende Verformung, die von der Basis zum Apex über die Basilarmembran hinwegzieht. Diese Welle erreicht je nach Frequenz an einem bestimmten Ort ein Maximum und bricht danach zusammen – so entstehen frequenzspezifische Bereiche maximaler Auslenkung, die man oft vereinfacht als „Resonanzstellen“ beschreibt. Insgesamt ergibt sich so eine tonotope Anordnung: hohe Frequenzen werden eher basal, tiefe eher apikal maximal wirksam. Funktionell verhält sich die Cochlea damit wie eine Filterbank mit vielen überlappenden Frequenzkanälen: Zunächst wird das eintreffende Signal vor allem nach Frequenzkomponenten aufgeteilt, unabhängig davon, wie stark die Anregung gerade ist.

Aus mathematischer Sicht ist dies bemerkenswert: Die Fourier-Transformation, ein zentrales Konzept aus dem 18. und 19. Jahrhundert, beschreibt, wie sich ein beliebiger zeitlicher Verlauf in eine Überlagerung von (Sinus- und Cosinus-)Schwingungen unterschiedlicher Frequenz zerlegen lässt. Die Cochlea realisiert genau dieses Prinzip in mechanischer Form. Statt eine Fourier-Transformation digital abstrakt durchzuführen, projiziert das Hörsystem das Schallsignal räumlich auf die Basilarmembran: An jeder Position „landet“ bevorzugt derjenige Frequenzbereich, für den die lokalen Eigenschaften der Membran resonant sind. Die Filterbankstruktur der Cochlea ist damit das biologische Gegenstück zur frequenzabhängigen Zerlegung eines Signals, wie sie in der technischen Signalverarbeitung mit Spektralanalysen und Filterbänken durchgeführt wird.
Die Basilarmembran bildet zusammen mit den Haarzellen ein gekoppeltes Schwingungssystem. Die Bewegung der Membran verbiegt die Härchen der Sinneszellen; die inneren Haarzellen wandeln diese Auslenkung in elektrische Rezeptorpotenziale und damit in neuronalen Output des Hörnervs um, während insbesondere die äußeren Haarzellen aktiv auf die Membran zurückwirken, indem sie ihre Länge verändern und so Energie in das System einspeisen. Schwache Schwingungen werden dadurch stark verstärkt, stärkere Anregungen dagegen nur noch vergleichsweise wenig. Eine Verdopplung der physikalischen Anregung führt daher nicht zu einer Verdopplung der inneren Antwort, sondern zu einem deutlich kleineren Zuwachs: Das System verhält sich ausgeprägt nichtlinear und zeigt eine kompressive Kennlinie, bei der Zuwächse der Eingangsgröße immer weniger zusätzlichen Zuwachs in der Ausgangsgröße bewirken.

Im Signal, das über den Hörnerv ans Gehirn weitergegeben wird, spiegelt sich dieses Verhalten wider: Bei sehr kleinen Anregungen ist die Aktivität gering, in einem mittleren Bereich führt eine Veränderung der Anregung zu deutlich unterschiedlichen Antwortmustern, und bei sehr starken Anregungen ändert sich die Aktivität nur noch wenig – man spricht von einer Sättigung des Systems. Zusätzlich wertet das Hörsystem nicht nur die Stärke, sondern auch den zeitlichen Verlauf des Signals aus. Dazu gehören auch feinere Nichtlinearitäten wie die Synchronisation von Nervenimpulsen mit der Schwingung bei tiefen Frequenzen (Phase-Locking) und die Empfindlichkeit für Amplitudenmodulationen. Ein Ergebnis all dieser Prozesse ist eine verdichtete, frequenz- und zeitabhängige interne Repräsentation des Schalls, die sich deutlich von einer einfachen linearen Abbildung des Schalldrucks unterscheidet.
Die in diesem Beitrag beschriebenen Eigenschaften des Gehörs – frequenzabhängige Filterung, anregungsabhängige Kompression und zeitliche Verarbeitung – werden in der messtechnischen Praxis nur näherungsweise abgebildet. Im Immissionsschutz geschieht dies im Kern über logarithmische Kennwerte mit definierter Frequenz- und Zeitbewertung. Ausgangspunkt ist der Schalldruckpegel , der den Effektivwert des Schalldrucks auf eine logarithmische Skala abbildet und damit – ähnlich wie die kompressive Kennlinie der Cochlea – einen sehr großen Dynamikbereich in handhabbare Zahlenwerte komprimiert. Durch Anwendung der A-Bewertung entsteht der A-bewertete Pegel
, dessen Frequenzgang in erster Näherung die frequenzabhängige Empfindlichkeit des Gehörs nachzeichnet (vgl. Abbildung 4). Die Zeitbewertung (z. B. „fast“, „slow“ oder „impulse“) führt zusätzlich eine definierte zeitliche Mittelung ein und modelliert so begrenzt die Integrationszeit und Trägheit der auditiven Verarbeitung.

Die TA Lärm verwendet als zentrale Kenngröße den A-bewerteten äquivalenten Dauerschallpegel also den energetisch gemittelten A-bewerteten Pegel über die Beurteilungszeit
. Ergänzt um Zuschläge für Tonhaltigkeit, Impulshaltigkeit und besondere Störwirkungen entsteht daraus der Beurteilungspegel, der für die rechtliche Bewertung herangezogen wird. In
gehen damit drei wesentliche Aspekte des Hörens ein: die logarithmische Pegelbildung (Pegelkompression), die frequenzabhängige Empfindlichkeit (A-Bewertung) und die zeitliche Integration (Mittelung über die Dauer
). Die DIN 45680 erweitert diesen Ansatz im tieffrequenten Bereich, indem sie Terzbandpegel zwischen etwa 10 Hz und 80 Hz betrachtet und diese mit frequenzabhängigen, tabellierten Hörschwellen vergleicht. Die Bewertung der einzelnen Terzbänder relativ zu diesen Schwellen knüpft unmittelbar an die frequenz- und pegelabhängige Hörschwelle an. A-Bewertung, Zeitbewertung, äquivalenter Dauerschallpegel
, Terzbänder und Beurteilungspegel sind damit bewusst vereinfachte, technisch gut handhabbare Projektionen der wesentlich komplexeren Signalverarbeitung des Gehörs (Abbildung 4).
In der Messtechnik wird allgemein angestrebt eine physikalische Messgröße (z. B. Druck ) möglichst objektiv darzustellen, d. h. linear, bewertungsfrei (z. B. über verschiedene Frequenzen) und reproduzierbar. Das Gehör hingegen liefert eine nichtlineare, evolutionär optimierte Signalverarbeitung in Form einer abstrakten Informationsrepräsentation. Im Gehirn wird dieser Informationsgehalt dann weiterverarbeitet und mit Erfahrungen, Erwartungen, Gefühlen, Affekten und anderen Faktoren integriert und formt somit die Wahrnehmung des Schalls. Es geht dabei also weniger um eine neutrale Abbildung der Außenwelt, sondern um die Erfassung handlungsrelevanter Informationen.
Dies führt zu einer für viele überraschenden Einsicht: Die größte Herausforderung im Schall- und Immissionsschutz liegt heute nicht mehr in der physikalischen Beschreibung des Schalls, diese ist in weiten Teilen gut verstanden, sondern im Menschen. Die komplexe Signalverarbeitung im Gehör und die weitere Verarbeitung im Gehirn führen zu einer hochgradig nichtlinearen, kontextabhängigen Wahrnehmung. Diese Wahrnehmung muss in technisch messbare und juristisch handhabbare Kenngrößen übersetzt und so quantifiziert werden, dass sich die Rechte und Freiheiten verschiedener Betroffener gegeneinander abwägen lassen.

Mika Wihanto, B.Sc., ist als selbstständiger Ingenieur für das Fachzentrum für akustische Messtechnik tätig. Er hat Mikrosystemtechnik an der Universität Freiburg studiert und absolviert derzeit ein Masterstudium mit dem Schwerpunkt Schaltungen und Systeme, insbesondere in den Bereichen System- und Regelungstechnik sowie Technische Akustik.
