Wie lange sind Sie schon bei der MMC und sind Sie dort als einer von drei technischen Leitern im Ressort „Technik“ unter Leitung von Martin Späth ausschließlich für den Ton verantwortlich?
Ich bin seit 1998 bei MMC. Wie meine beiden Kollegen Paco Aparicio und Jan Schubert bin ich im Ressort Technik unter Martin Späth sowohl für Bild wie Ton zuständig, allerdings mit dem Schwerpunkt Beschallung und Ton.
Haben Sie eine besondere Affinität zum Ton, auch von der Ausbildung her?
Ja, ich beschäftige mich persönlich sozusagen schon seit Ewigkeiten mit dem Thema Ton und habe an der SAE eine Ausbildung zum Audio Engineer absolviert…
Was ist das für eine Schule, die SAE?
Die SAE ist eine private Schule, die 1976 als School of Audio Engineering in Sydney, Australien gegründet wurde, mittlerweile weltweit – auch mit Studios in London – als Medien-Institut operiert und auch sechs Einrichtungen in Deutschland etabliert hat. Wenn man die Ausbildung ernst nimmt, erlangt man dort fundierte Grundkenntnisse für ein späteres Berufsleben. Der hohe Praxis-Anteil der Ausbildung spielt dabei eine wesentliche Rolle.
Welche Relevanz hat der Ton im Vergleich zum Bild hinsichtlich des Aufwands in den MMC-Studios, die im Bereich TV-Shows federführend in Deutschland sind?
Der Aufwand für Bild und Ton bei MMC ist prinzipiell miteinander vergleichbar. Alle unsere 19 Studios im Coloneum sind sowohl im Bild- wie auch im Tonbereich an unseren Regiekomplex angebunden. Aber wir machen Fernsehen. Da interessiert die Regisseure natürlich in erster Linie das Bild und wie es aussieht. Alles andere – auch der Ton – ist eher „Beiwerk“. Doch man darf den Ton nicht unterschätzen: Den Fernseher lässt der Zuschauer schon mal schnell aus den Augen, aber selten aus den Ohren…
In einer Vorinformation zu diesem Gespräch hat Ihr Kollege Jan Schubert in Bezug auf die Ausstattung der MMC-Studios mit Audiotechnik speziell für TV-Shows die grundsätzliche Unterscheidung zwischen Beschallungstechnik und Regietechnik gemacht. Vor welchem Hintergrund?
Wenn wir große Live- oder Live on Tape-Shows wie zum Beispiel die diesjährige Übertragung des Deutschen Fernsehpreises oder DSDS, „Deutschland sucht den Superstar“, für RTL realisieren, müssen wir strikt zwischen dem Sendeton für Zuhause und dem Beschallungston für das Publikum vor Ort im Studio unterscheiden und setzen dafür einen Tonregisseur und einen Beschallungsingenieur ein. Der Tonregisseur, der räumlich vom Studio getrennt ist, mischt unter idealen akustischen Bedingungen Tonquellen, die zum Beispiel von den Moderatoren-Mikrofonen stammen und die von den Atmo-Mikrofonen – etwa, wenn das Publikum klatscht oder ein Raunen durch das Publikum geht, so dass es auch der Fernsehzuschauer hört. Hinzu kommen weitere Tonquellen, von Einspielfilmen oder von Hintergrundmusiken. Der Beschallungsingenieur hingegen, der im Studio an einem Mischpult sitzt, hat zwar die gleichen Quellen aufliegen wie die Tonregie, aber andere Aufgaben. Zum Beispiel muss er ja keinen Applaus hinzuspielen, da das Publikum den Applaus ohnehin hört…
Vermutlich muss die optimale Beschallungstechnik für einen so guten Ton im Studio sorgen, so dass beim Publikum auch über den Ton Emotionen gelockt werden können?
Genau! Denn wenn das Publikum nicht richtig hören kann, dann wird es auch nicht wie gewünscht atmosphärisch reagieren können. Dann würde aber auch keine emotionale Stimmung beim Sendeton Zuhause rüberkommen. Man muss also mit bestmöglicher Sprachverständlichkeit und „sattem“ Ton die emotionale Reaktion hervorrufen, um sie dann via Fernsehen so adäquat wie möglich transportieren zu können. Man wird allerdings vor dem Fernseher nie genau das nachempfinden können, was vor Ort im Studio los ist. Aus dem einfachen Grunde, weil wir im Studio Tonnen von Lautsprechern einsetzen. Wenn da kräftige Bässe durchs Studio „wabern“, dann spürt man das natürlich auch im Magen. Das sind Effekte, die man Zuhause in der Regel nicht hat. Dafür hat man Zuhause den Vorteil, dass man optisch alles bestmöglich aufbereitet bekommt.
Ganz wichtig bei der TV-Tonproduktion für Shows: Die Besonderheit in der Zusammenarbeit zwischen den Kollegen der Tonregie und Beschallungstechnik liegt darin, dass man Rücksicht auf die Arbeit des anderen nimmt. Anders als der Toningenieur, hat der Beschallungsingenieur im Studio mit der Physik zu kämpfen. Jeder kennt den Effekt einer Rückkopplung, das unangenehme „Fiepen“, das wohl jeder schon mal gehört hat. Je mehr Mikrofone gleichzeitig „offen“ sind, desto geringer die Rückkopplungsgrenze. Um diesen Effekt zu vermeiden, werden die Beschallungssysteme im Studio im Vorfeld eingemessen, und besonders kritische Frequenzen werden unterdrückt. Diese Arbeit ist eine der Hauptaufgaben des Beschallungsingenieurs vor Ort.
Worauf kommt es denn bei „kleineren“, aufgezeichneten Shows an, um einen guten Ton hinzukriegen, zum Beispiel bei „Genial daneben“?
Gerade bei Formaten, wo es darum geht, dass gelacht wird, ist es unbedingt notwendig, dass das Publikum versteht, was die Künstler sagen. Umso wichtiger, weil bei „Genial daneben“ wie bei vielen anderen Comedy-Formaten, mehrere Menschen gleichzeitig durcheinander sprechen. Als Laie könnte man sich vorstellen, dass, wenn da vorne fünf, sechs, sieben Leute sitzen, die man alle hören können muss, man einfach alle entsprechenden Fader am Mischpult auf die gleiche Höhe schiebt, damit man alle hören kann. Dann wäre aber genau das Gegenteil der Fall. Es würde ganz fürchterlich klingen, man könnte kaum etwas verstehen. Denn dann würde jeder, der spricht, sowohl über sein eigenes Mikrofon und gleichzeitig jeweils ein bisschen auch über die Mikrofone aller anderen zu hören sein, mit sehr unerwünschten Geräuscheffekten.
Der Gesamtklang würde augenblicklich indirekt und „matschig“ wirken, weil die Umgebungsgeräusche ebenfalls enorm verstärkt würden. Um das zu vermeiden, müssen der jeweilige Ton- und Beschallungsingenieur die Finger immer an den Fadern haben und ständig „mitmischen“, vorausschauend sein, um auch einen kleinen Einwurf nicht zu verpassen. Sollte man doch mal einen wichtigen Einwurf verpassen, gibt es bei Aufzeichnungen Sicherungssysteme, um unerwünschte Effekte in der Postproduktion zu „reparieren“. Es werden einzelne Mikrofone dauerhaft aufgezeichnet, so dass man in der Postproduktion, sollte doch ein Wort verschluckt worden sein, es im Schnitt später auch kleine Fehler in einer Mischung wieder perfektionieren kann. Das hat alles mit ganz viel Fingerspitzengefühl zu tun.
Übernimmt die Postproduktion bei aufgezeichneten Sendungen mittlerweile auch zunehmend Aufgaben der Aufnahme, so dass man da nicht mehr so konzentriert aufpassen muss?
Nein, überhaupt nicht. Die Postproduktion hat natürlich einen hohen Stellenwert. Vor allem auch deshalb, weil selbst live ausgestrahlte Formate eine Zweit- oder Drittverwertung haben, so dass Teile der Produktion in Magazinen oder Backstage-Reports gezeigt werden oder man eine geschnittene Wiederholungsversion herstellt. Denn dass Sendungen nur ein einziges Mal live verwertet werden, das gibt es heute zumindest bei den privaten Sendern so gut wie gar nicht mehr.
Werden bei Show-Produktionen grundsätzlich höhere oder komplexere Anforderungen gestellt als bei scripted Formaten?
Prinzipiell spielt der Ton immer dann eine besonders große Rolle, wenn es darum geht, dass Menschen vor Ort mitgerissen werde sollen. Speziell bei Musikformaten wie DSDS hat der Ton einen extrem hohen Stellenwert. Da muss der Toningenieur ja auch permanent bewerten, wie jemand singt, ob die Stimme funktioniert und wie man sie möglichst unverfälscht überträgt. Der Aufwand beim Ton ist auch exorbitant höher, wenn eine Live-Band spielt und ein Sänger nicht wie in vielen Shows üblich zu einem Voll- oder Halbplayback mimt. Hinzu kommt bei Formaten wie DSDS der Punkt Sicherheit. Bei Livesendungen brauchen wir Rückfallsysteme. Wir versehen bei MMC – was eher unüblich ist – alle Mischpulte für Bild und Ton mit einem komplett getrennten Technik-Netz und zusätzlichen Strompuffern. Selbst bei einer Unterbrechung der Stromversorgung bleibt beispielsweise der Mischpultplatz der Beschallung noch acht Minuten stromversorgt. Genügend Zeit, um eine unplanmäßige Werbepause zu senden oder ein Problem zu lösen. Vergleichbare Sicherheiten gibt es in allen Bereichen.
Betrachten denn auch Ihre Kunden, TV-Produzenten und Sender, den Ton als ein wichtiges emotionales Element oder wird er eher als Stiefkind behandelt, weil man ihn ja nicht sehen kann?
Das kommt auf die Produktion an. Es gibt Produktionen, bei denen schlicht erwartet wird, dass der Ton reibungslos funktioniert und nicht störend ist. Nicht mehr, vor allem aber auch nicht weniger. Aber bei Projekten wie DSDS hat der Ton einen sehr hohen Stellenwert.
Ist der Kunde bereit, mehr zu zahlen für einen besonders guten Ton?
Wir sind mittlerweile in der glücklichen Situation, dass wir in der Vergangenheit bewiesen haben, dass unsere Konzeptionen funktionieren. Es besteht ein hohes Maß an Vertrauen zwischen unseren Kunden und uns. Wenn wir Empfehlungen aussprechen, die sich nicht allein am maximalen Profit orientieren, sondern an bestmöglicher Qualität fürs Endprodukt; werden aufgrund dieses Vertrauensverhältnisses Leistungen, die wir gesondert vorschlagen, auch gesondert bezahlt.
Zukunft Surround?
Produzieren Sie Shows wie DSDS in Surround, so dass dann der TV-Ton-Übertragungsstandard auch voll rüberkommen kann, wenn die TV-Zuschauer über eine entsprechende Ausstattung mit AV-Receivern verfügen?
Dass der Übertragungsstandard für Ton beim Fernsehen im Showbereich bereits Surround-Sound ist, stimmt so nicht. Der Standard beim Fernsehton ist heute immer noch Stereo. Denn so werden die allermeisten Formate nach wie vor aufgezeichnet und von den Sendern ausgestrahlt. Es gibt bisher nur vereinzelt Live-Sendungen, die mit Surround-Verfahren aufgezeichnet werden und sich an Zuschauer mit entsprechender Empfangsausstattung wenden.
Wird denn auch noch in Mono aufgezeichnet – und analog oder digital?
Das eine hat mit dem anderen nichts zu tun. Eine Aufnahme kann sowohl Mono, Stereo und dabei digital oder analog sein. Prinzipiell, das behaupte ich jetzt einfach mal, wird nicht mehr in Mono aufgezeichnet. Dennoch müssen die Signale Mono-kompatibel sein. Das ist sogar wichtig, weil beim Endverbraucher immer noch eine Reihe Fernsehgeräte stehen, die nur Mono hergeben. Deshalb wird das Stereo-Signal bei der Aufnahme ständig mit einem Korrelationsgradmesser am Regie-Pult überwacht, ob es auch Mono-kompatibel ist.
Mono mutet ja im Vergleich zum heutigen innovativen Stand im Audio-Equipment-Bereich wie ein Steinzeit-Angebot hinsichtlich der potenziell möglichen Hörqualität an, wozu unter anderem ein Angebot von mehr als 300 verschiedensten Mikrofonen gehört: eine überaus dynamische Entwicklung. Wohin geht denn Ihrer Meinung nach der Trend für die Optimierung des TV-Tons…?
Es gibt ständig Weiterentwicklungen. Unsere großen Show-Regien sind schon längst Surround-fähig, wir sind in der Lage auch in Surround zu produzieren…
… aber Sie machen es nicht!
Wir machen das, was der Kunde will! Im Moment daher eher nicht. Es gibt noch keine ernsthaften Bestrebungen seitens der Sender, Surround durchgängig auszustrahlen. Eine wesentliche Entwicklung beim Fernsehton ist die Verlagerung zur Digitaltechnik, die sich in den letzten Jahren immer mehr durchgesetzt hat. Diese Entwicklung ist nicht mehr aufzuhalten, und das ist eigentlich auch gut so. Der Vorteil liegt in der totalen Abspeicherbarkeit der Systeme. Man kann Mischpultkonfigurationen auf Knopfdruck wieder herstellen. Das sind im täglichen Arbeitsablauf sehr nützliche Werkzeuge, gerade bei einer großen Sendung wie DSDS, wo völlig unterschiedliche Sounds und Songs aufeinander folgen. Nehmen wir an, wir haben als Motto „Hits der 80er Jahre“. Da werden nächtelang Sounds programmiert, damit die Synthesizer sich wie im Original anhören.
Da gibt es bei jedem Song ein komplett anderes Mischungsverhältnis der Band. Analog müsste man theoretisch rund 100 Knöpfe von einem Song auf den nächsten bewegen, wobei man nur einundeinhalb Minuten Zeit hat, während der Moderator eine kurze Anmoderation macht. Am Digitalmischpult hingegen ist es nur ein Knopfdruck. Man ruft die beim Soundcheck erarbeitete Szene auf und schon stimmen alle Einstellungen für den nächst kommenden Song.
So wie sich die Digitaltechnik nicht aufhalten lässt, wird sich ja vermutlich auch der Surround-Sound als Hörerlebnis-Verbesserung auch beim Fernsehen nicht aufhalten lassen, zumal in Kombination mit HD. Dazu stehen viele verschiedene Begriffe für den Ton im Raum, TrueHD oder Dolby 7.1. Wie beurteilen Sie das?
Im Bereich Surround gibt es sehr viele verschiedene Formate: Dolby Digital, Extended-Formate wie 6.1, 7.1., DTS – und auch eine ganze Menge gefährliches Halbwissen, das darüber existiert. Persönlich bin ich überzeugt, dass bei einzelnen aufwändigen Formaten in Zukunft mit dem Thema „Audio follows Video“ experimentiert werden wird. Das heißt: In dem Moment, wo ein Kameraschnitt erfolgt oder eine Kameraposition wechselt, – oder um bei Superstar zu bleiben, – in dem Moment, wenn man einen Kandidaten sieht, bleibt bei diesem System der Kandidat auch im Ton vorne. In Surround produziert bedeutet das: Wenn man den Kandidaten von vorne sieht, würde dann auch das, was der Kandidat sagt oder singt, aus den vorderen Lautsprechern kommen. Wenn bei der gleichen Kameraeinstellung das Publikum anfängt zu applaudieren, dann würde sich das theoretisch im Rücken des Zuhörers befinden, so dass dann der Applaus auch aus den rückwärtigen Lautsprechern kommt. Bei einem Umschnitt ändert sich dann schlagartig die Bespielung der diversen Schallquellen.
Welche Systeme realisieren heute schon dieses Prinzip „Audio follows Video“?
Bei Formel 1-Übertragungen kann man so etwas schon beobachten. Hier hat man zu vielen Kamera-Einstellungen auch den zugehörigen Ton. Bei einem Showformat ist das etwas aufwändiger, und man muss sich sehr genau überlegen, was hier Sinn macht, damit es am Ende nicht zu einem akustischen Chaos kommt. Man muss erst einmal bei der Aufnahme im Studio die Mikrofone einsetzen, die genau das leisten können. Man muss im Tonkonzept vorab schon das abbilden, was man später in der Ton-Produktion realisieren möchte, und das ist – das ist wichtig – bei Live-Sendungen nicht mehr per Hand am Mischpult zu realisieren, weil der Toningenieur unmöglich so schnell wie ein Bildschnitt sein kann.
Für den Bildmischer ist ein Umschnitt nur ein Knopfdruck. Im Tonbereich hingegen müsste man die kompletten Mischungsverhältnisse, was die Zuordnung der einzelnen ausgebenden Lautsprecher angeht, verändern. An der Stelle wird es zwingend eine Automation geben. Das heißt: In dem Moment, in dem ein Bildmischer einen Knopf für eine andere Kameraperspektive drückt, muss das angesteuerte Tonmischpult auch die kompletten Einstellungen ändern und damit auch alle Mischungsverhältnisse. Das könnte ein Trend werden, wobei natürlich auch hier am Ende das Kosten/Nutzen-Verhältnis eine Rolle spielen wird. Bei szenischen Produktionen, wie Spielfilmen wird der Ton ja bereits heute entsprechend angelegt. Allerdings Szene für Szene im Tonstudio. Ob so etwas bei einer Live-Sendung am Ende zu angenehmen oder eher störenden Ergebnissen führt, werden praktische Tests zeigen. Bei aller Automation entscheidet am Ende zum Glück immer noch der Mensch.
Welche Relevanz haben solche automatisierten Systeme schon heute?
Es finden schon heute viele Dinge ganz automatisiert statt. Wenn jemand in einer Spielshow auf einen Buzzer haut, auf den Entscheidungsknopf drückt, in dem Moment verändert sich automatisch die Lichtstimmung, es wird automatisch ein Sound abgespielt, in dem Moment passieren teilweise sogar schon automatisch Kamera-Umschnitte. Fast alle Systeme werden in solchen Situationen via GPI oder Midi miteinander verkoppelt und bestimmte Einstellungen oder eine Folge von Funktionen werden automatisiert abgerufen.
Also wachsen Ton und Bild beim Fernsehen immer dichter auch atmosphärisch in der Technik zusammen?
Klar – nichts ist langweiliger als ein klatschendes Publikum, das man sieht; aber nicht hört, und auch der beste Kandidat perfekt geschminkt nutzt nichts, wenn man nicht hört, was er zu sagen oder singen hat.
Ton ist Geschmackssache
Wie würden Sie den guten Ton fürs Fernsehen grundsätzlich definieren?
Ton ist mit Sicherheit Geschmackssache. So wie Menschen einen unterschiedlichen Musikgeschmack haben, gibt es auch Unterschiede in Bezug auf das persönliche Empfinden, was den Klang angeht. Primär aber zeichnet sich der gute Ton dadurch aus, dass es keine Ausfälle gibt, das alles funktioniert. Zusätzlich geht es immer auch um sehr sensible Mischungsverhältnisse.
Es gibt den Trend, mit der Show on-Location zu gehen, raus aus dem Studio. Was halten Sie dagegen?
Moderne Studios, so wie MMC sie betreibt, haben den enormen Vorteil, dass die Infrastruktur, die man sich „on-Location“ erst mühsam erarbeiten muss, bereits installiert ist. Beispiel Strom: Das Coloneum verfügt über Stromreserven einer Kleinstadt bei voller Last. In den Studios gibt es fahrbare Traversensysteme, die sowohl für Licht, wie auch für Ton und Video bereits vorverkabelt sind. Man braucht also eine Lampe oder einen Lautsprecher nur einzuhängen, fährt den Zug unter die Decke und steckt das Signal dann bequem vom Boden aus. Das minimiert die Rüstzeiten und damit die Kosten. Auf diese Weise können wir maximal effizient arbeiten und die Umbauzeiten zwischen einzelnen Produktionen minimieren. Im Bereich Ton kommt dazu, dass das Coloneum aus akustischer Sicht optimal ausgestattet ist. Wir haben in unseren Studios in Größen bis weit über 2.400 Quadratmetern nur minimale Nachhallzeiten. Die erreichten Werte sind on-Location gar nicht möglich. Die akustischen Baumaßnahmen ermöglichen uns hier klangliche Ergebnisse, die man bei Mitbewerbern in dieser Form so gut wie nie hören wird.
Ausbildung und Erfahrung
Welche Qualifikationsanforderungen stellt MMC an die Mitarbeiter im Ton, auch hinsichtlich der Ausbildung? Ist auch noch die klassische schulische Ausbildung wichtig oder geht es mehr ums „reinwachsen“?
Weil sich speziell auf dem technischen Sektor die Dinge rasant weiterentwickeln, ist es ständig notwendig, dass unsere Mitarbeiter auf neues Equipment geschult werden, um es ideal einzusetzen. Wir setzen aber auch ganz klar auf Erfahrung. Wir machen fast alle Produktionen mit festen Mitarbeitern. Letztlich ist es am Ende die praktische Erfahrung, die zählt. Bei Tontechnikern geht es nicht nur um das reine Handwerk. Bei jemandem, der fünf Minuten vor der Live-Sendung einen nervösen Moderator verkabelt, spielt auch das zwischenmenschliche Geschick eine ganz große Rolle, auch seine Ruhe und Gelassenheit. Aber eine profunde theoretische Ausbildung schadet nie. Das kann man auf jeden Fall sagen, auch wenn die Praxis dann ganz anders aussieht. Die Kombination aus beidem ist gut. Wenn man eine gute Ausbildung macht und nebenher versucht, praktische Erfahrungen zu sammeln, dann ist das die goldene Kombination.
Da Sie ja auch über eine theoretische Ausbildung verfügen: Gibt es eigentlich wissenschaftliche oder psychoakustische Belege dafür, dass nicht nur die Musik, sondern auch der Ton an sich emotional – auch emotionaler als das Bild – beim Menschen wirkt?
(Lacht) Nein, solche wissenschaftlichen Analysen kenne ich nicht – aber Sie haben schon recht: Ton oder Musik ist Emotion. Das ist ein sehr wichtiger Aspekt. Gerade wenn man auf den Spielfilmsektor schaut: Die Spannungsszene ohne Ton ist nur noch halb so spannend. Musik und Ton verkauft Emotion. Eine Stimme kann angenehm oder unangenehm klingen. Wenn man das eine oder andere an Tönen im Fernsehen hört, ist man geneigt wegzuschalten, weil einem ein Ton oder eine Stimme nicht gefällt. Wenn eine Stimme krächzig ist, kann die Technik nicht alles ausbessern, aber man kann mit den heutigen Möglichkeiten schon vieles harmonischer gestalten. Wenn bei Kameraeinstellungen Fehler entstehen, kann der Zuschauer das auch als einen interessanten Bildeffekt wahrnehmen, weil es nicht weh tut. Wenn man mit dem Mikrofon vor einen Lautsprecher kommt und es quietscht, ist es augenblicklich eine schmerzliche Erfahrung für das Ohr als Sinnesorgan. Das Gehör ist wesentlich sensibler als das Auge, schon allein deshalb, weil man das Auge immer zumachen kann, wenn man etwas nicht sehen möchte. Das geht mit dem Ohr nicht.
Erika Butzek (MB 11/07)