Riproduciamo nuovamente questo brano tratto da:
Giovanni Perotta, MIDI – COMPUTER – IMMAGINE E SUONO, Editore Jackson Libri.
… Fattore determinante della fedeltà di un segnale, è la limitazione della banda di frequenza che è in grado di riprodurre; per esempio, le frequenze basse rappresentano un problema per microfoni e altoparlanti, mentre quelle alte lo sono per i circuiti analogici che stabiliscono un limite alla frequenza più alta che li può attraversare. Una parziale soluzione a questi problemi può essere ottenuta mediante la trasformazione numerica, cioè digitale, delle forme d’onda che compongono un segnale sonoro.
Questo non aumenta i limiti imposti dalla larghezza di banda ridotta e determinata dall’attuale tecnologia dei trasduttori, ma consente, entro certi limiti, la ricostruzione di un segnale numerico pulito da uno deteriorato, annullandone per così dire l’invecchiamento, e soprattutto consente di utilizzarlo infinite volte senza per questo accrescerne il livello del rumore. Ma la garanzia maggiore che dà un segnale digitale, è quella di poterne fare tutte le copie che si vuole e operare su di esso in fase di montaggio, filtraggio e modifica con precisione assoluta senza perdita alcuna di qualità.
Si osservi quindi … cosa accade all’interno di un campionatore. Anche in questo caso l’onda sonora è ricevuta da un microfono che la trasduce in segnale elettrico che viene inviato a un filtro passabasso (LPF1); successivamente viene campionato da un circuito S&H (Sample & Hold) e inviato al convertitore analogico/digitale (ADC) che lo trasforma in valori numerici, cioè lo digitalizza; un microprocessore (CPU) si incarica poi di immagazzinarlo in memoria (RAM).
Durante la riproduzione, il microprocessore legge i dati residenti in memoria e li invia a un convertitore digitale/analogico (DAC) e successivamente a un circuito latch (Sample & Hold); infine raggiungono un filtro passabasso (LPF2) e di seguito un altoparlante. Un segnale digitale è sempre discreto e non continuo, cioè non può assumere tutta la gamma di valori tra un minimo e un massimo, valori che invece individuano sempre due gradini, cioè saltano senza continuità tra due punti dello spazio.
L’attività svolta in questo sistema è scandita da una specie di orologio interno (clock), che determina in quali istanti il sistema cambia stato, cioè in cui accade un evento che non può quindi essere in un momento qualsiasi come nei comuni sistemi analogici, ma solo in quelli dettati dal clock.
Quindi il segnale trasformato in numerico non può assumere con continuità tutti i valori possibili, ma solo quelli che il sistema è in grado di codificare. Di seguito si esaminerà nuovamente, ma in modo più dettagliato, il percorso fatto dal segnale all’interno di un sistema digitale. Il segnale analogico proveniente dal microfono, raggiunge il filtro passabasso (LPF1) che serve a eliminare dal segnale stesso tutte le frequenze troppo acute per il sistema di cui si dispone. Il teorema di Shannon garantisce che nell’operazione di campionamento non si abbia perdita di informazioni se la frequenza di campionamento Fc è almeno il doppio della frequenza più alta presente nel segnale da campionare.
Si può anche dire che la frequenza di campionamento deve essere un’ottava più acuta rispetto alla frequenza più elevata che si deve campionare, frequenza che non è riferita alla fondamentale (nota che si suona), ma alla frequenza più acuta presente nello spettro armonico. A questo punto il circuito Sample & Hold, nella maggior parte dei casi incluso nell’ADC, effettua il campionamento.
In pratica il clock di sistema fa in modo che ogni 1/Fc secondi questo circuito scatti tante fotografie, prese a intervalli rigorosamente regolari, detti periodi di campionamento (Tc=1/ Fc). Naturalmente più spesso si registrano i campioni, o meglio maggiore è la frequenza di campionamento Fc, e più sarà fedele la successiva riproduzione del segnale (teorema di Shannon).
ALIASING
Se al circuito S&H non si anteponesse il filtro passabasso LPF1, si potrebbe incorrere nel fenomeno dell’aliasing o foldover, cioè dell’introduzione nel campionamento di parziali non armoniche, che generano rumore ed effetti dissonanti tipo ring modulator. Per esempio, si supponga di dovere campionare un piatto splash, e di avere scelto come frequenza di campionamento Fc=50 kHz.
Con questi presupposti teoricamente, potremo campionare tutte le armoniche entro i 25 kHz, ma sicuramente, anche se il nostro udito non è in grado di percepirle (il campo dell’udibile va infatti da 16 Hz a 20 Khz), il piatto splash emetterà anche armoniche con frequenza superiore chiamate Fs. In questo caso viene a crearsi una frequenza immagine (alias) Fa=Fs-Fc/2. Questa frequenza Fa viene registrata in memoria come rumore che disturba la registrazione digitale. Al fine di eliminare questo fastidioso fenomeno, viene introdotto un filtro passabasso LPF1 la cui funzione è quella di impedire a tutte le armoniche superiori a Fc/2, ossia ai 25 kHz, di raggiungere il convertitore ADC. E’ difficile ottenere filtri che attenuino esattamente solo le frequenze indesiderate; in generale più la pendenza del filtro si avvicina a 90 gradi e più aumentano le possibilità di eliminare dette armoniche.
CONVERSIONE ANALOGICO-DIGITALE
… Il campionamento produce una discretizzazione sull’asse delle ascisse (tempo), per cui risulta che non tutti gli istanti sono significativi, ma effettivamente contano solo quelli in cui il sistema campiona. Il tempo di hold mantiene il segnale a livello costante mentre il convertitore ADC trasforma il segnale campionato da analogico a digitale.
Per fare questo esegue delle operazioni di quantizzazione convertendo un segnale elettrico in ingresso, quasi sempre una tensione, e restituendo in uscita una parola binaria formata da N bit. In pratica con N bit a disposizione per ogni parola, si possono definire 2N (N indica l’elevamento a potenza) diverse parole, che costituiscono i quanti o livelli di quantizzazione possibili. Per esempio una parola di 8 bit (N=8), darà origine a 28 livelli, cioè 256.
La quantizzazione da origine a una rappresentazione a scalini della forma d’onda campionata; la differenza tra un gradino e quello immediatamente successivo è detto LSB (Least Significant Bit, o bit meno significativo) ed equivale alla differenza tra il valore massimo e minimo all’interno di un intervallo di quantizzazione.
Per cui ne risulta che, maggiore è il numero dei livelli di quantizzazione, migliore è l’approssimazione tra il segnale scalinato e il corrispondente segnale analogico continuo. Da questo ne deriva che le parole in uscita dall’ADC differiscono tra loro di almeno un LSB e quindi non possono assumere tutti i possibili valori come nel caso dei segnali analogici; è pertanto necessario effettuare una sorta di approssimazione tra due livelli di quantizzazione adiacenti.
Questa approssimazione comporta un errore di quantizzazione che è man mano riducibile all’aumentare del numero di bit N a disposizione per parola. In generale se W è il campo, tra un minimo e un massimo nel quale varia l’ampiezza del segnale campionato, il gradino LSB vale W/N, cioè cala al crescere di N, mentre l’errore massimo di quantizzazione vale LSB/2. Per capire meglio il discorso si procederà con un esempio: si supponga di avere un segnale analogico compreso tra -3,5 e +3,5 volt con a disposizione un ADC a 3bit (N=3), che significa avere a disposizione 23=8 livelli di quantizzazione. … ogni gradino corrisponde un passo di 1 volt, che comporta un errore di quantizzazione massimo di 0,5 volt (LSB/2).
Infatti un qualunque campione del segnale analogico che cade all’interno di questo gradino, viene approssimato per difetto nel caso A, in eccesso nel caso C, oppure in modo indifferente nel caso U, in cui si registra la situazione di massimo scostamento tra due livelli, individuando la situazione di massimo errore.
Risulta evidente che i due casi A e C, determinano un errore minore di 0,5 volt e comunque tanto più piccolo quanto più i valori dei campioni corrispondenti saranno vicini ai rispettivi livelli di quantizzazione.
Anche se i campioni A, B, C hanno in realtà tre valori diversi, dopo il processo di quantizzazione, daranno origine solo a due valori del tipo: A=B=livello 1 e C=livello 2, oppure A=livello 1 e B=C=livello 2. Gli errori di quantizzazione producono delle evidenti difficoltà nella ricostruzione del segnale che risulterà tanto meno fedele quanto più questi saranno elevati. Da questo ne deriva che, più N è alto, cioè più livelli di quantizzazione si hanno per definire uno stesso segnale, e più risulta fedele la rappresentazione del segnale.
La dinamica è intesa come il rapporto tra i volumi più forte e più piano; una volta fissato il livello massimo di volume, questo rapporto cresce in funzione del minimo segnale percepibile, cioè del rumore. Diminuendo il rumore si abbassa la soglia rendendo udibili anche i minimi volumi di un suono.
Qualche volta si crea una certa confusione tra dinamica effettiva e rapporto S/N (segnale/rumore), anche perché gli stessi costruttori alla voce S/N indicano sempre la dinamica che in realtà è sempre migliore di almeno 10-15 dB.
La dinamica del segnale campionato dipende dal numero di bit utilizzati nella conversione; la dinamica ottenibile con un ADC viene espressa in dB e viene calcolata tramite la formula: (6 x N) + 1.8, con N che rappresenta i bit usati per parola. Con 8 bit è possibile ottenere una dinamica di (6 x 8) + 1.8 = 49.8 dB, appena accettabili per esigenze musicali non a livello professionale. Una riproduzione sonora decente deve avere almeno 60 dB di dinamica, questo tenendo in considerazione che chitarre, bassi elettrici, pianoforti e percussioni possono produrre picchi dinamici di 100 dB.
Il rumore e la dinamica sono strettamente correlati, infatti il minimo livello di volume percepibile è imposto dal rumore che funziona perciò come una soglia per i passaggi “pianissimo”.
Applicando la formula sopra descritta, un convertitore ADC a 16 bit è in grado di fornire una dinamica di (6 x 16) + 1.8 = 97,8dB, con costi abbastanza contenuti.
IMAGING, FILTRI ANALOGICI E DIGITALI
L’imaging nella conversione digitale analogico è il corrispondente dell’aliasing in quella analogico/digitale. Esso consiste nell’apparizione di frequenze indesiderate che non erano presenti nel segnale originale, ma sono state generate, per esempio, da rumore digitale, o da frequenze che avrebbero dovuto essere originariamente soppresse dal filtro passabasso LPF1 in ingresso. Il compito di eliminare, oppure, per lo meno tentare di eliminare, tutte le armoniche che possono disturbare la riproduzione del suono campionato, è del filtro ricostruttore LPF2 in uscita.
Infatti, se Fl è la frequenza di lettura, si conosce già che la frequenza più alta correttamente riproducibile è in teoria Fl/2, cioè la metà; d’altro canto è anche noto che al DAC arriva sempre una forma d’onda scalinata con uno spettro di frequenza periodico e non limitato, con frequenze anche superiori a Fl/2. I filtri analogici, che sono circuiti hardware che intervengono su di un segnale già convertito proveniente dal DAC, non sono perfetti, cioè non sono a pendenza infinita (90 gradi), e non sono in grado di eliminare tutte le armoniche indesiderate che disturbano l’ascolto finale del suono.
La realizzazione di filtri analogici con pendenze molto ripide, del tipo nono ordine, è molto complicata (per non parlare del costo), e la fase risulta non lineare; questo significa che le alte frequenze vengono sfasate rispetto alle basse, provocando distorsione.
A questo inconveniente si può ovviare utilizzando un filtro digitale, cioè un programma software che manipoli il segnale prima che questo giunga al DAC. In uscita dal convertitore è comunque sempre presente, seppur in quantità limitata, un po’ di rumore che può essere eliminato con un buon filtro ricostruttore LPF2. Il problema è che per ora i filtri digitali sono complicati da programmare ed hanno costi ancora elevati.