4.7. Exposition et gain¶

Deux réglages modifient la luminosité avec laquelle chaque cellule de pixel est rapportée au reste du pipeline :

Le temps d’exposition (aussi appelé temps d’intégration) – la durée pendant laquelle la photodiode est autorisée à collecter de la charge avant la lecture.
Le gain analogique – le multiplicateur appliqué à la tension de lecture par un amplificateur intégré avant le ADC.

Les deux réglages rendent l’image enregistrée plus lumineuse, mais la manière dont ils y parviennent diffère et chacun comporte son propre coût.

4.7.1. Temps d’exposition¶

Une exposition plus longue signifie que chaque cellule collecte plus d’électrons par trame, de sorte que le comptage numérique ressort plus élevé pour la même scène. Diviser l’exposition par deux divise grosso modo le comptage par deux ; la doubler le double grosso modo. La relation est linéaire jusqu’à ce que le puits sature.

Le coût, c’est le mouvement. La cellule enregistre la lumière moyenne qui lui parvient sur toute la fenêtre d’intégration, de sorte que tout objet qui se déplace d’une distance notable pendant cette fenêtre se retrouve étalé sur plusieurs pixels – le flou de mouvement. Une personne qui marche, à 1/30 s d’exposition, devient floue sur plusieurs pixels ; la même personne à 1/500 s apparaît nette.

Une longue exposition rapproche aussi la cellule de la saturation, de sorte que dans les scènes bien éclairées l’exposition doit être réduite même si la luminosité est correcte – sinon les hautes lumières sont écrêtées.

4.7.2. Gain analogique¶

Le gain analogique est un petit amplificateur situé entre la lecture de la photodiode et le ADC. La tension du signal est multipliée par le gain avant d’être numérisée, de sorte que le même nombre d’électrons finit par se lire comme un nombre plus grand. Le gain est généralement exprimé en décibels (dB) ; un doublement du gain correspond à +6 dB.

Le gain est utile lorsque la lumière est trop faible pour exposer plus longtemps – là où prolonger l’exposition ferait soit chuter la fréquence d’images en dessous des besoins de l’application, soit introduirait trop de flou de mouvement. Le coût, c’est le bruit. L’amplificateur multiplie le plancher de bruit en même temps que le signal, de sorte que le rapport signal sur bruit ne s’améliore pas avec un gain plus élevé. Un gain élevé produit une image plus granuleuse et plus bruitée, à luminosité de scène égale, qu’un gain faible.

Certains capteurs exposent aussi un réglage de gain numérique, qui est un multiplicateur entier appliqué après le ADC. Le gain numérique est encore pire que le gain analogique pour le bruit, car il amplifie également le bruit de quantification du ADC. À n’utiliser qu’en dernier recours.

4.7.3. Exposition automatique et gain automatique¶

Les vraies caméras doivent gérer des scènes couvrant une énorme plage de luminosité – une pièce intérieure sombre et une fenêtre ensoleillée dans le même champ de vision. Deux boucles de contrôle ajustent les réglages en temps réel :

Le contrôle automatique de l’exposition (AEC) mesure la valeur moyenne des pixels dans la trame récente (souvent pondérée vers le centre, ou pondérée à l’écart des pixels les plus lumineux) et ajuste le temps d’exposition pour amener cette moyenne vers une cible.
Le contrôle automatique du gain (AGC) fait de même avec le gain analogique, généralement comme solution de repli une fois que le temps d’exposition a déjà été poussé à son maximum sûr.

L’ordre est important. Ajuster d’abord l’exposition puis le gain offre le meilleur rapport signal sur bruit pour une luminosité cible donnée, puisque l’exposition recueille davantage de signal sans amplifier le bruit, tandis que le gain amplifie les deux. L’AEC et l’AGC fonctionnent donc par priorité : l’exposition augmente d’abord pour éclaircir une scène sombre, et le gain n’intervient qu’une fois que l’exposition a atteint son plafond (fixé par la fréquence d’images ou par un budget explicite de flou de mouvement).

4.7.4. Plage dynamique élevée¶

L’AEC et l’AGC choisissent la bonne luminosité d’une trame unique pour la moyenne de la scène, mais chaque scène comporte des parties plus lumineuses et plus sombres que la moyenne. Une exposition unique ne peut couvrir qu’une partie de cette plage à la fois – les expositions courtes préservent les hautes lumières mais enfouissent les ombres dans le bruit de lecture ; les expositions longues font remonter les ombres mais écrêtent les hautes lumières à la saturation. La plage dynamique du capteur – le rapport entre le pixel le plus lumineux qu’il peut enregistrer sans écrêtage et le plus sombre qu’il peut distinguer du bruit – est fixée par la capacité de puits plein de la photodiode et par le plancher de bruit de lecture, et de nombreuses scènes présentent une plage plus large que ce que le capteur peut saisir en une seule trame. Une fenêtre ensoleillée dans une pièce intérieure sombre en est l’exemple classique.

L’imagerie à plage dynamique élevée (HDR) contourne cette limite en combinant deux expositions ou plus de la même scène – au minimum une courte et une longue, parfois davantage – en une seule trame de sortie. Les expositions courtes préservent les hautes lumières sans saturer ; les expositions longues font remonter les ombres hors du plancher de bruit. L’image combinée prend les hautes lumières des trames courtes et les ombres des trames longues, aboutissant à une plage dynamique exploitable plus large que ce qu’une seule entrée pourrait porter à elle seule.

La combinaison peut se faire hors puce, par un logiciel assemblant une rafale multi-trames, ou sur la puce, le capteur entrelaçant des lignes à exposition courte et longue sur des lignes de balayage alternées, ou faisant passer chaque pixel par deux chemins de lecture à des gains de conversion différents. Quoi qu’il en soit, le résultat est une trame avec plus de bits de plage dynamique que ce que la photodiode pouvait enregistrer en une seule prise.

Cette trame à plage étendue n’est pas directement affichable. Le tampon d’image et tout consommateur situé en aval fonctionnent à une profondeur de bits fixe (généralement 8 bits par canal), alors que le signal HDR peut atteindre 12, 16 bits ou plus. Le mappage tonal compresse les bits supplémentaires jusqu’à la profondeur de sortie en appliquant une courbe non linéaire qui maintient visibles les détails des ombres comme des hautes lumières. Une mise à l’échelle linéaire directe du signal HDR écraserait soit les régions sombres en noir, soit écrêterait les régions claires en blanc ; un bon mappage tonal sacrifie une certaine fidélité de luminosité absolue pour conserver les détails aux deux extrémités de la plage, et la sortie ressemble bien plus à ce que l’œil perçoit réellement dans la scène que n’importe quelle exposition unique du capteur ne pourrait le faire.