L’esistenza dell’immagine sonora

Suono, Stereofonia, Set up ed acustica ambientale

Sull’esistenza dell’immagine sonora

Il principio non fu Stereofonico!

Il suono riprodotto, dalla sua nascita, fino agli anni ’60 del secolo scorso, ovvero per molte decadi, fu monofonico.  Un suono fatto per essere sentito dal solo diffusore presente in un apparecchio radiofonico, televisivo o su un giradischi dell’epoca. Sono monofoniche le registrazioni che hanno testimoniato la nascita del blues e del jazz, le esecuzioni sinfoniche di Toscanini, i grandi cantanti lirici della prima metà del novecento, ecc. ecc.

Il suono monofonico sopravvive oggi in alcuni devices che ci sono tanto cari come in molti smartphone, ma non solo.

Come quasi ogni cosa, anche la riproduzione sonora monofonica poteva dar luogo a risultati scadenti oppure, al contrario, molto buoni: dipendeva dalla qualità degli oggetti atti alla riproduzione.

Ma, per quanto fossero (o a tutt’oggi possano essere) buoni, la monofonia ha un limite invalicabile dal quale non si può svincolare.

Harry F. Olson in “Stereophonic Sound Reproduction in the Home”, nel 1958 afferma che per avere realismo nella riproduzione musicale bisogna cercare di soddisfare tre condizioni:

  1. l’estensione in frequenza di un apparato di riproduzione deve consentire l’equilibrata percezione di tutte le componenti udibili;
  2. il sistema di riproduzione deve essere in grado di offrire di un adeguato volume sonoro indistorto ed alta capacità dinamica;
  3. nel suono riprodotto devono essere preservate le sensazioni legate al riverbero e allo spazio del suono originario;

Francamente una buona registrazione monofonica ben riprodotta è in grado di soddisfare i punti 1 e 2. Anzi, in uno spazio domestico, con un solo diffusore, la probabilità di avere problemi di natura acustica e psico-acustica è ridotta di oltre la metà rispetto alla stereofonia o al multicanale. Il problema è che, per avere un certo grado di realismo, la registrazione del brano da riprodurre deve saper “raccontare” qualcosa dello spazio dove essa è stata realizzata.

E’questo che la colloca in una “realtà”, seppur virtuale. Alla ricerca della rappresentazione spaziale del suono, fu scoperta e sperimentata la stereofonia. Bell, precocemente, ci aveva ragionato intorno già alla fine dell’ottocento, ma i lavori sulla stereofonia divennero intensi e prolifici verso la metà del XX secolo, sfociando nella sua commercializzazione verso la fine degli anni ’50.

L’attenzione degli scienziati che studiarono i fenomeni psicoacustici legati alla stereofonia fu prevalentemente rivolta ai modi come la stereofonia ri-creava lo spazio presente nella registrazione e le fonti sonore al suo interno. Furono numerose le pubblicazioni riguardanti i diversi risultati psicoacustici in termini di spazialità del suono in relazione al variare della posizione dei diffusori e del punto d’ascolto o all’impiego di due diffusori o degli stessi con l’aggiunta di un’ulteriore diffusore disposto centralmente.

La ricostruzione dello spazio, soprattutto come eseguire il posizionamento dei microfoni e quanti usarne, divenne il punto centrale degli studi negli anni che hanno preceduto l’introduzione sul mercato di materiale sonoro registrato in stereofonia.

In  “Basis Principles of Stereophonic Sound (1953), W. B. Snow, distingue l’ascolto binaurale (due microfoni; i canali sx e dx giungono rispettivamente ed esclusivamente all’orecchio sx e dx) da quello stereofonico (due o più microfoni in fase di registrazione; ascolto da due o tre fonti di fronte l’ascoltatore  che li percepisce con entrambe i canali uditivi)  sostenendo che il primo trasporta gli strumenti dall’ascoltatore, mentre il secondo, creando una scena sonora “artificiale”  all’interno della quale l’ascoltatore riesce ad individuare dimensioni e direzioni dei suoni, trasporta l’evento sonoro a casa sua.

Insomma, ad un certo punto della sua storia, la riproduzione audio per antonomasia diviene quella stereofonica. Non vi poteva essere qualità senza poter avere la percezione di una certa ricostruzione spaziale!

Rileggendo i numeri di riviste audio successivi di 20-30 anni al varo commerciale della stereofonia, potremmo scoprire la notevole importanza che i più autorevoli recensori attribuivano all’immagine sonora: era uno dei principali parametri nel giudicare registrazioni, apparecchi e diffusori.

Si sosteneva ciò perché, per avere un ampio e proporzionato soundstage ed una accurata rappresentazione degli strumenti disposti al suo interno, un sistema deve riprodurre le basse inferiori e le altissime frequenze, possedere una risposta corretta in termini di coerenza di fase, trasmettere “trasparenza”, offrire una ottima dispersione ed altre positive caratteristiche sonore.

Inoltre, deve essere disposto attraverso un accurato set-up nell’ambiente d’ascolto onde mitigarne gli effetti negativi di natura acustica.

L’ambiente d’ascolto è straordinariamente importante ai fini di una valida ricostruzione dello spazio sonoro posseduto dalla registrazione. Lo è per molti versi, ma in sostanza lo è per i tempi di riverbero e per il controllo dell’energia legata alle riflessioni precoci che è in grado di offrire.

L’immagine sonora è stata per molti anni un parametro sonoro importante nella valutazione dei sistemi di riproduzione ma, consentitemelo, raramente e solo con i migliori sistemi e/o nei set-up più raffinati, ha dato luogo ad un’entusiasmante esperienza d’ascolto.

Leggendo i pareri degli esperti audio di oggi, a dire il vero più quelli sui forum che quelli della carta stampata, sembra di cogliere una decisa regressione di rango dell’immagine sonora nella gerarchia dei parametri d’ascolto e una certa pigrizia-difficoltà degli audiofili più giovani a ricercarla nel loro suono domestico.

Mi pare di individuare perfino una corrente di pensiero pronta a sostenerne la non esistenza: per alcuni audiofili la ricostruzione dell’immagine sonora, intesa come uno spazio sonoro dotato di larghezza, profondità ed altezza al cui interno si formano singole e salde figure sonore, non può essere un obiettivo del suono riprodotto, se il suono riprodotto ha come modello il suono vero, perché non c’è immagine sonora nel suono vero.

Vorrei discutere la questione e, per farlo, occorre ragionare sul suono, anzi, sui suoni dal vero, oggi. Poniamo il caso di un duo, violino e contrabbasso, che si esibisce in una chiesa. Vivendo questa esperienza d’ascolto, chiudendo gli occhi, eliminando cioè le afferenze visive, potrò percepire o meno la posizione e le dimensioni dei due strumenti e dello spazio riverberato che li accoglie: ciò dipende da dove ascolto.

Avrò chiare la posizione e la dimensione degli strumenti se starò nelle sedie disposte nelle loro vicinanze. Allontanandomi, man mano andrò sempre più perdendo la chiara definizione dei loro contorni sonori fino ad arrivare ad una distanza dove il suono dei due strumenti sarà …. ovunque.

Per chi rimasto seduto vicino agli esecutori, lì dove all’ascoltatore giunge prima il suono degli strumenti e poi quello riverberato dai muri della chiesa, ad occhi chiusi, sarà facile comprendere posizione e dimensioni dei due legni.

Per lui, quel suono vero è all’interno di un articolato palcoscenico sonoro fatto di suoni diretti immersi, ma distinti dal campo riverberato che li circonda.

Il ritardatario che ha potuto seguire il concerto dall’unica sedia libera dell’ultima fila, sosterrà invece che l’immagine sonora è una pia illusione: lui ha percepito esclusivamente musica della quale non saprebbe dire la provenienza perché ne era circondato, suoni riflessi dai muri della chiesa, con il suono diretto degli strumenti mascherato, infiacchito, diluito dalla distanza e dalla presenza del pubblico a lui innanzi.

Quale dei due suoni sarà stato più bello? Mah. Dipende dai gusti e dal tipo di musica, anche. Ma non stiamo discutendo circa l’estetica del suono, né della sua validità filologica. Stiamo ragionando sulla domanda se esiste o meno un certo tipo di palcoscenico sonoro. I due ipotetici ascoltatori avrebbero quindi risposto in modo opposto. Se lì ci fosse stato un bravo  ingegnere del suono, un purista, coi suoi due bei Neumann a valvole e con il suo Studer, avrebbe cercato di posizionare i microfoni in modo da rappresentare l’interezza  dell’energia sonora degli strumenti, energia sonora proveniente da due posti di uno spazio definito da certi tempi di riverbero, il quale, a sua volta,  dovrà poter essere “raccontato” dalla registrazione in modo che l’ascoltatore possa capirne le dimensioni e collocarvi al suo interno le due fonti sonore.

Egli si è dato l’obiettivo di registrare l’evento non in un modo qualunque, ma cercando di raccogliere il massimo di informazione musicale, di energia sonora, di trasparenza, di intelligibilità.

Lavorerà decisamente sul set-up microfonico: sulla loro posizione (spostamenti anche di poche decine di centimetri avvicinando o allontanando i microfoni dalle fonti sonore), sulla loro geometria di configurazione (il modo con il quale il campo d’azione dei microfoni utilizzati si “mescola”), sulla loro tipologia (a valvole o a stato solido, ne esistono numerosissime), sulla loro configurazione (cardioide, ipercardioide, figura ad 8, ecc.) e sul numero di microfoni da usare (non è nel caso del nostro esempio che è volutamente semplificato, ma è la condizione più frequente).

Ogni opzione da luogo ad un risultato sonoro differente, anche in termini di immagine sonora:

più o meno energia diretta, un differente rapporto spaziale fra gli strumenti, più o meno campo riverberato il quale può essere rappresentato in modo più o meno ampio, ecc.

L’ingegnere del suono dovrà operare una scelta che infine darà luogo alla sua “fotografia sonora” dell’evento, che verrà successivamente riprodotto….a partire dal suo punto di vista.

Ciò significa due cose:

  1. che la rappresentazione dell’evento sonoro nello spazio in cui è avvenuto soggiace alle scelte estetico-funzionali di chi ha effettuato la registrazione e che quindi non è assoluta, ma relativa, il frutto di una decisione “tecnico-artistica”;
  2. che, comunque sia, una registrazione stereofonica fatta con le finalità su-esposte, non può non contenere una rappresentazione spaziale dell’evento musicale registrato.

E se lo stesso apparato di registrazione fosse stato posto dietro l’ultima fila di sedie, distante decine di metri dagli esecutori?

Non so se vi sia mai capitato di ascoltare il risultato di riprese sonore effettuate lontano dai musicisti. Danno luogo ad un suono piccolo e povero non solo in termini di immagine sonora, ma anche del tutto insoddisfacente dal punto di vista dell’accuratezza in termini di informazioni, sensazioni, emozioni … musicali.

Mentre dal vero può essere interessante apprezzare alcuni generi musicali (la musica antica, ad esempio, certamente non il rock!) attraverso suoni immersi in un ambiente così riverberante da non comprendere dove siano collocate le fonti sonore, la musica riprodotta a partire da una registrazione fatta “da lontano” non riesce a raccoglie il fascino del suono riverberato, ma riduce la musica ad una confusa e striminzita poltiglia sonora. Non è un’opzione praticabile per chi vuol fare una registrazione stereofonica accurata e non un bootleg amatoriale.

Abbiamo parlato di un ipotetico evento musicale di tipo totalmente acustico, privo di sistemi amplificazione. Abbiamo raccontato il fatto che la parte più vicina degli ascoltatori può essere in grado di percepire la collocazione spaziale degli strumenti ed anche le loro dimensioni, mentre quella parte di platea posta più distante, soverchiata dal suono riflesso, non potrà farlo.

Voglio dire che, anche in una situazione …. favorevole all’immagine sonora, parte degli astanti non potrà coglierla e non ne farà esperienza.  Sono assai rare al giorno d’oggi le proposte di musica acustica non amplificata eseguita in luoghi acusticamente adeguati. Nei secoli passati erano invece la norma. Nell’ambito della musica non amplificata la proposta musicale più diffusa rimane forse l’opera lirica, il luogo per la quale è il teatro, nel quale domina l’aspetto della diffusione e quindi una percezione vaga di palcoscenico sonoro (in presenza di una potente informazione visiva).

La proposta musicale dal vivo oggi viene quasi esclusivamente offerta tramite la musica amplificata. Pensiamo ai grandi concerti rock all’aperto, a quello di Vasco a Modena, ai Rolling Stones a Lucca, dove tecnici del suono bravissimi hanno saputo “domare” amplificazioni e schiere di speakers per portare la musica a folle sterminate!

Ma pensiamo che anche la proposta di jazz, blues, rock, country, musica d’autore in spazi più piccoli, negli anfiteatri e nei teatri, nei club, viene amplificata!

L’obiettivo di chi appronta i grandi sistemi elettro-acustici per le folle degli stadi o per il pubblico dei teatri è “portare” la musica nella sua integrità dinamica e tonale ad ogni ascoltatore.

È un lavoro complicato, ricco di insidie.

Questi professionisti hanno l’arduo compito di far sentire bene il concerto ad ognuno degli acquirenti un biglietto d’entrata, sia a colui che sta sotto il palco come a quello che è a 50 metri, sia a quello che è in mezzo al teatro come a quello che sta là in fondo alla sala a ridosso della parete di destra o su un palchetto.

Per raggiungere il loro obiettivo devono risolvere molti problemi, tanti, tutti…..salvo uno: quello dell’immagine sonora.

A chi assiste ad un concerto amplificato, di percepire una rappresentazione sonora di ciò che accade sul palcoscenico non può fregare di meno!

Come per l’opera lirica, un importante concerto rock è un evento la cui portata visiva è almeno pari di quella uditiva.

Chi assiste ad un evento simile è immerso in una esperienza audio-video avvolgente, potente e totalizzante: non ha davvero bisogno di sentire che la chitarra elettrica è posta tre metri a destra del cantante, che il basso è invece alla sua sinistra e che la batteria e le coriste sono arretrate e più in alto. Li vede! Sono lì sul palco e sui maxi-schermi mentre amplificazioni poderose iniettano migliaia di Watt in torri di altoparlanti.

Al tempo del suono monofonico, il media più diffuso era l’apparecchio radiofonico.

I grandi concerti rock dal vivo non c’erano. Si suonava il jazz e il blues nei locali e spesso in modo non amplificato. Il melodramma era la più significativa esperienza audio-video che il melomane poteva fare.

Voglio dire che fino all’avvento della stereofonia e per qualche tempo dopo c’era molto più audio che video nel raccontare eventi musicali.

La stereofonia si pose l’obiettivo di dare loro anche una dimensione spaziale… per via psico-acustica. Poi è arrivata la Tv, i film con le colonne sonore importanti, i concerti rock sono diventati via via sempre più spettacolari, veri eventi audio-video, dove la scenografia l’ha fatta sempre più da padrona. Il nostro modo di vivere la musica è cambiato divenendo molto più… visivo.

La nostra cultura d’ascolto è cambiata.

Hanno quindi ragione coloro che sostengono l’inesistenza dell’immagine sonora?

Se la musica riprodotta avesse come punto di riferimento solamente la musica dal vero, beh, avrebbero qualche motivo fondato per sostenere questa tesi!

Non c’è palcoscenico sonoro nell’attuale offerta musicale di grandi e piccoli eventi musicali amplificati. Non ve ne è ragione!

E, come abbiamo visto, per quanto riguarda la musica acustica, solo parte della platea, quella più vicina agli esecutori, può essere in grado di percepire il suono della musica nella sua completezza e quindi avere la percezione di come il palcoscenico sia stato “apparecchiato”.

Nel campo della musica acustica…l’immagine sonora è un privilegio riservato ad una parte di ascoltatori. Fra di loro, ad esempio nel caso della musica sinfonica, c’è il direttore d’orchestra che sfrutta la percezione della disposizione spaziale degli strumenti che ha innanzi per dirigerli, per individuarli, per correggerli.

Per un direttore la sua orchestra ha una ben precisa dimensione all’interno del quale percepisce l’azione di ogni singolo strumento.

Si deve concludere che l’immagine sonora sia quindi prerogativa della musica acustica ?

È questo lo spartiacque? La riproduzione della musica acustica dovrà avere immagine sonora mentre ciò non è necessario per la musica amplificata?

Se la riproduzione musicale stereofonica fosse l’esatta copia della realtà, questa potrebbe essere la conclusione.

Ma non lo è! Può essere verosimile, alle volte, molte volte, ma rimane figlia di un trucco, di un inganno perpetrato “a favore” del nostro sistema orecchio-cervello: quello per il quale, quando due suoni arrivano all’ascoltatore in un lasso compreso entro 20-30 millisecondi, il cervello non li individua come differenti, ma li fonde, riconoscendoli come un suono unico e dislocandolo in un punto dello spazio compreso fra le due fonti in base alla differente intensità fra i due canali.

I nostri sistemi funzionano con i principi della stereofonia, come le registrazioni che dobbiamo utilizzare.

È conditio sine qua non che in esse ci debba essere una rappresentazione spaziale.

In una registrazione stereofonica, anche la musica amplificata, perfino quella elettronica, ha una sua, bella o brutta, logica o irrazionale, condivisibile o meno, rappresentazione spaziale posta davanti l’ascoltatore fra ed oltre i diffusori.

L’immagine sonora esiste, quindi, nel suono riprodotto in modo stereofonico o multicanale.

Ma il suo rapporto col referente reale è cambiato: è più un fatto legato alla riproduzione stereofonica dell’evento che alla realtà dello stesso.

Se ciò è vero, la rappresentazione spaziale di un evento musicale diviene meno vincolata e più interpretabile.

Se si assume questa tesi infatti, si dovrà dedurre che, almeno per quanto riguarda la musica amplificata, il nostro referente non può essere l’immagine sonora, ma altri parametri come la dinamica, il rispetto della ricchezza tonale e della complessità armonica, la fluidità e trasparenza sonora.

Il modo di ascoltare la musica dalla nascita della stereofonia ad oggi è cambiato.

Anche a me pare che sia giunto il tempo di rimettere in discussione il peso di alcuni criteri sonori che utilizziamo nel giudicare apparecchi, suoni e sistemi a partire da quello che stiamo qui discutendo.

Ad esempio, il concetto di rappresentazione spaziale degli strumenti, meramente intesa come individuazione della posizione delle fonti sonore, andrebbe sostituito con quello di densità sonora pulsante.

Questo concetto si contrappone a quello di suono piattamente “spalmato” sul fronte sonoro in modo impalpabile, inconsistente, ma anche ad una rappresentazione dell’immagine sonora fatta come un presepe.

La “densità pulsante” può ben raccontare il suono, ad esempio, dell’ampli della chitarra elettrica, trasformando …l’idea di sentire un suono di un mobile in legno nella percezione di un’area ad energia pulsante dai contorni che variano con la musica.  Dire di un determinato sistema audio che riproduce in modo davvero denso ed organico le sonorità di Jeff Beck del CD “Live in Tokio 99”, racconta di un suono ricco pulsante e armonicamente complesso più che il saperlo statico, immobile sulla destra del palcoscenico sonoro.

Un suono rappresentato come densità pulsante ha vivida energia centrale che si va rarefacendo andando verso la sua periferia fino a scomparire per lasciare spazio al riverbero ambientale o al silenzio (il nero infra-strumentale raccontato in altro modo).

Poniamo che questo concetto sia ritenuto migliore per descrivere suoni amplificati registrati.

Può esserlo anche per quelli della musica acustica? Si, a mio parere. Esistono numerose variabili “soggettive” anche nel modo di registrare un evento musicale esclusivamente acustico. Lo abbiamo già evidenziato: il risultato cambia in base al tipo ed al posizionamento dei microfoni utilizzati.

Noi, coi sistemi audio che abbiamo, riproduciamo una realtà già interpretata, già filtrata.

Esistono inoltre altre variabili …legate alle fonti, al modo col quale gli strumenti non amplificati diffondono il loro suono.

Nell’immagini che corredano questo articolo troverete come gli strumenti diffondono differentemente il loro suono al variare del tipo e della frequenza.

La loro riproduzione dovrebbe poter raccontare queste differenze, questa loro “vivacità”, che vanno ben oltre alla loro collocazione spaziale ed anche alle dimensioni fisiche dello strumento.

Tutto ciò a dire che la riproduzione di un evento sonoro acustico registrato in stereofonia è comunque … un’approssimazione, o, se si vuole, il tentativo di presentare una interpretazione, non esattamente una realtà. E’ una interpretazione che forse va re-interpretata.

Per questa ragione l’applicazione rigida del concetto di immagine sonora va superata anche nel caso della musica acustica per essere sostituito con quello di aree a densità sonora le quali sono comprensive dei concetti di energia e di accuratezza nella restituzione della complessità armonica.

A me pare che questo tipo di approccio, di ricerca sonora, possa più facilmente portare ad un suono coinvolgente dal punto di vista emozionale, maggiormente gratificante, forse, in un certo senso, addirittura più vicino alla fisica del suono vero, comunque senza sfociare nel My-Fi .

Poiché parliamo di stereofonia, chi ne nega l’esistenza, commette un errore.

Tuttavia, il modo di ascoltare la musica vera influenza quello della musica riprodotta, cambiandone l’approccio culturale ed estetico.

Non credo che l’approccio alla musica riprodotta dell’audiofilo degli anni ’60 sia lo stesso di quello dell’appassionato di oggi, con la sua diversa sensibilità determinata dai cambiamenti culturali e tecnologici nel frattempo intercorsi.

La revisione del concetto di immagine sonora in quello di “aree a densità pulsante” non rinnega i fenomeni psico-acustici legati alla stereofonia, ma, tentando di coglierne gli aspetti dinamici, darebbe luogo ad una rappresentazione più consona alle esperienze dei tempi correnti.

Forse. È una proposta.

Comunque e sempre buone note.

Italo Adami

Continua ad approfondire…