4.7. Esposizione e guadagno¶

Due parametri modificano la luminosità con cui ciascuna cella di pixel viene riportata al resto della pipeline:

Tempo di esposizione (chiamato anche tempo di integrazione): per quanto tempo al fotodiodo viene consentito di accumulare carica prima della lettura.
Guadagno analogico: il moltiplicatore applicato alla tensione di lettura da un amplificatore sul chip prima dell’ADC.

Entrambi i parametri rendono più luminosa l’immagine registrata, ma il modo in cui ci riescono è diverso e ognuno comporta il proprio costo.

4.7.1. Tempo di esposizione¶

Un’esposizione più lunga significa che ogni cella accumula più elettroni per frame, quindi il conteggio digitale risulta più alto per la stessa scena. Dimezzare l’esposizione dimezza all’incirca il conteggio; raddoppiarla lo raddoppia all’incirca. La relazione è lineare fino alla saturazione del pozzetto.

Il costo è il movimento. La cella registra la media della luce che vi arriva nell’intera finestra di integrazione, quindi qualunque oggetto che si sposti di una distanza apprezzabile durante tale finestra viene spalmato su più pixel: il motion blur. Una persona che cammina con un’esposizione di 1/30 s appare sfocata su diversi pixel; la stessa persona a 1/500 s appare nitida.

Un’esposizione lunga porta inoltre la cella più vicina alla saturazione, quindi nelle scene ben illuminate l’esposizione deve scendere anche se la luminosità va bene, altrimenti le alte luci vengono tagliate.

4.7.2. Guadagno analogico¶

Il guadagno analogico è un piccolo amplificatore tra la lettura del fotodiodo e l’ADC. La tensione del segnale viene moltiplicata per il guadagno prima di essere digitalizzata, quindi lo stesso numero di elettroni finisce per essere letto come un numero maggiore. Il guadagno viene solitamente espresso in decibel (dB); un raddoppio del guadagno corrisponde a +6 dB.

Il guadagno aiuta quando la luce è troppo scarsa per esporre ulteriormente, ovvero quando prolungare l’esposizione farebbe scendere il frame rate al di sotto delle esigenze dell’applicazione oppure introdurrebbe troppo motion blur. Il costo è il rumore. L’amplificatore moltiplica il livello di rumore insieme al segnale, quindi il rapporto segnale-rumore non migliora con un guadagno maggiore. Un guadagno elevato produce un’immagine più granulosa e rumorosa a parità di luminosità della scena rispetto a un guadagno basso.

Alcuni sensori espongono anche un parametro di guadagno digitale, che è un moltiplicatore intero applicato dopo l’ADC. Il guadagno digitale è ancora peggiore del guadagno analogico per quanto riguarda il rumore, perché amplifica anche il rumore di quantizzazione dell’ADC. Da usare solo come ultima risorsa.

4.7.3. Esposizione automatica e guadagno automatico¶

Le camere reali devono gestire scene che coprono un enorme intervallo di luminosità: una stanza interna poco illuminata e una finestra inondata di sole nello stesso campo visivo. Due anelli di controllo regolano i parametri in tempo reale:

Il controllo automatico dell’esposizione (AEC) misura il valore medio dei pixel nel frame recente (spesso pesato verso il centro, o pesato in modo da escludere i pixel più luminosi) e regola il tempo di esposizione per portare quella media verso un target.
Il controllo automatico del guadagno (AGC) fa lo stesso con il guadagno analogico, di solito come ripiego una volta che il tempo di esposizione è già stato spinto al suo massimo sicuro.

L’ordine conta. Regolare prima l’esposizione e poi il guadagno offre il miglior rapporto segnale-rumore per una data luminosità target, poiché l’esposizione raccoglie più segnale senza amplificare il rumore, mentre il guadagno amplifica entrambi. AEC e AGC lavorano quindi secondo una priorità: l’esposizione aumenta per prima per illuminare una scena buia, e il guadagno entra in gioco solo quando l’esposizione ha raggiunto il suo limite massimo (stabilito dal frame rate o da un budget esplicito di motion blur).

4.7.4. Alta gamma dinamica¶

AEC e AGC scelgono la giusta luminosità a singolo frame per la media della scena, ma ogni scena ha parti più luminose e più scure della media. Una singola esposizione può coprire solo una parte di quell’intervallo per volta: le esposizioni brevi preservano le alte luci ma seppelliscono le ombre nel rumore di lettura; le esposizioni lunghe risollevano le ombre ma tagliano le alte luci alla saturazione. La gamma dinamica del sensore – il rapporto tra il pixel più luminoso che può registrare senza tagliarlo e il più scuro che riesce a distinguere dal rumore – è fissata dalla capacità di pozzetto pieno del fotodiodo e dal livello del rumore di lettura, e molte scene hanno un intervallo più ampio di quello che il sensore può catturare in un solo frame. Una finestra inondata di sole in una stanza interna poco illuminata è l’esempio classico.

L’imaging ad alta gamma dinamica (HDR) aggira il limite combinando due o più esposizioni della stessa scena – come minimo una breve e una lunga, talvolta di più – in un unico frame di uscita. Le esposizioni brevi preservano le alte luci senza saturare; le esposizioni lunghe risollevano le ombre dal livello del rumore. L’immagine combinata prende le alte luci dai frame brevi e le ombre da quelli lunghi, ottenendo una gamma dinamica utilizzabile maggiore di quella che qualsiasi singolo ingresso potrebbe contenere da solo.

La combinazione può avvenire fuori dal chip, con il software che unisce una raffica di più frame, oppure sul chip, con il sensore che alterna righe a esposizione breve e lunga su linee di scansione alternate o che fa passare ogni pixel attraverso due percorsi di lettura a guadagni di conversione diversi. In entrambi i casi il risultato è un frame con più bit di gamma dinamica di quanti il fotodiodo potrebbe registrarne in un solo scatto.

Quel frame a gamma estesa non è direttamente visualizzabile. Il framebuffer e qualunque consumatore a valle di esso operano a una profondità di bit fissa (di solito 8 bit per canale), mentre il segnale HDR può arrivare a 12, 16 o più bit. Il tone mapping comprime i bit aggiuntivi riportandoli alla profondità di uscita applicando una curva non lineare che mantiene visibili sia i dettagli delle ombre sia quelli delle alte luci. Una scalatura puramente lineare del segnale HDR schiaccerebbe le regioni scure verso il nero oppure taglierebbe le regioni chiare verso il bianco; un buon tone map rinuncia a un po” di fedeltà nella luminosità assoluta per conservare i dettagli a entrambi gli estremi dell’intervallo, e il risultato appare molto più vicino a ciò che l’occhio vede realmente nella scena di quanto qualsiasi singola esposizione del sensore potrebbe mai fare.