4.7. Ekspozycja i wzmocnienie¶

Dwa pokrętła zmieniają to, jak jasno każda komórka piksela jest raportowana do reszty potoku:

Czas ekspozycji (zwany też czasem integracji) – jak długo fotodioda może zbierać ładunek przed odczytem.
Wzmocnienie analogowe – mnożnik stosowany do napięcia odczytu przez wzmacniacz na chipie przed przetwornikiem ADC.

Oba pokrętła rozjaśniają zarejestrowany obraz, ale sposób, w jaki to osiągają, jest różny i każde niesie ze sobą własny koszt.

4.7.1. Czas ekspozycji¶

Dłuższa ekspozycja oznacza, że każda komórka zbiera więcej elektronów na ramkę, więc dla tej samej sceny wartość cyfrowa wychodzi wyższa. Skrócenie ekspozycji o połowę z grubsza zmniejsza wartość o połowę; podwojenie z grubsza ją podwaja. Zależność jest liniowa aż do nasycenia studni potencjału.

Kosztem jest ruch. Komórka rejestruje średnie światło docierające do niej przez całe okno integracji, więc każdy obiekt, który podczas tego okna przemieszcza się o zauważalną odległość, zostaje rozmazany na wielu pikselach – rozmycie ruchowe. Idąca osoba przy ekspozycji 1/30 s rozmywa się na kilku pikselach; ta sama osoba przy 1/500 s wydaje się ostra.

Długa ekspozycja zbliża też komórkę do nasycenia, więc w dobrze oświetlonych scenach ekspozycja musi być zmniejszona, mimo że jasność jest w porządku – inaczej najjaśniejsze obszary zostaną przesterowane.

4.7.2. Wzmocnienie analogowe¶

Wzmocnienie analogowe to mały wzmacniacz pomiędzy odczytem fotodiody a przetwornikiem ADC. Napięcie sygnału jest mnożone przez wzmocnienie przed digitalizacją, więc ta sama liczba elektronów odczytywana jest jako większa wartość. Wzmocnienie zwykle wyraża się w decybelach (dB); podwojenie wzmocnienia to +6 dB.

Wzmocnienie pomaga przy świetle zbyt słabym, by dłużej eksponować – gdzie wydłużenie ekspozycji albo obniżyłoby liczbę klatek poniżej potrzeb aplikacji, albo wprowadziłoby zbyt duże rozmycie ruchowe. Kosztem jest szum. Wzmacniacz mnoży poziom szumów razem z sygnałem, więc stosunek sygnału do szumu nie poprawia się wraz ze wzrostem wzmocnienia. Wysokie wzmocnienie daje bardziej ziarnisty, zaszumiony obraz przy tej samej jasności sceny co niskie wzmocnienie.

Niektóre sensory udostępniają również pokrętło wzmocnienia cyfrowego, które jest całkowitoliczbowym mnożnikiem stosowanym po przetworniku ADC. Wzmocnienie cyfrowe jest dla obrazu szumu jeszcze gorsze niż wzmocnienie analogowe, ponieważ wzmacnia także szum kwantyzacji z przetwornika ADC. Sięgaj po nie jako ostatnie.

4.7.3. Automatyczna ekspozycja i automatyczne wzmocnienie¶

Prawdziwe kamery muszą radzić sobie ze scenami obejmującymi ogromny zakres jasności – ciemne wnętrze pomieszczenia i nasłonecznione okno w tym samym polu widzenia. Dwie pętle sterujące regulują pokrętła w czasie rzeczywistym:

Automatyczne sterowanie ekspozycją (AEC) mierzy średnią wartość piksela w ostatniej ramce (często z większą wagą dla centrum lub z mniejszą wagą dla najjaśniejszych pikseli) i reguluje czas ekspozycji, aby doprowadzić tę średnią do wartości docelowej.
Automatyczne sterowanie wzmocnieniem (AGC) robi to samo z wzmocnieniem analogowym, zwykle jako rozwiązanie awaryjne, gdy czas ekspozycji został już dociśnięty do swojego bezpiecznego maksimum.

Kolejność ma znaczenie. Regulacja najpierw ekspozycji, a w drugiej kolejności wzmocnienia daje najlepszy stosunek sygnału do szumu przy danej jasności docelowej, ponieważ ekspozycja zbiera więcej sygnału bez wzmacniania szumu, podczas gdy wzmocnienie wzmacnia oba. AEC i AGC działają więc według priorytetu: ekspozycja rośnie najpierw, aby rozjaśnić ciemną scenę, a wzmocnienie włącza się dopiero wtedy, gdy ekspozycja osiągnie swój pułap (ustalony przez liczbę klatek lub przez jawny budżet rozmycia ruchowego).

4.7.4. Wysoki zakres dynamiczny¶

AEC i AGC dobierają właściwą jasność pojedynczej ramki dla średniej sceny, ale każda scena ma fragmenty jaśniejsze i ciemniejsze od średniej. Pojedyncza ekspozycja może objąć tylko część tego zakresu na raz – krótkie ekspozycje zachowują najjaśniejsze obszary, ale grzebią cienie w szumie odczytu; długie ekspozycje wydobywają cienie, ale przesterowują najjaśniejsze obszary przy nasyceniu. Zakres dynamiczny sensora – stosunek między najjaśniejszym pikselem, jaki może zarejestrować bez przesterowania, a najciemniejszym, jaki może odróżnić od szumu – jest ustalony przez pojemność pełnej studni fotodiody i poziom szumu odczytu, a wiele scen ma szerszy zakres, niż sensor może uchwycić w jednej ramce. Nasłonecznione okno w ciemnym wnętrzu pomieszczenia to klasyczny przykład.

Obrazowanie o wysokim zakresie dynamicznym (HDR) obchodzi to ograniczenie, łącząc dwie lub więcej ekspozycji tej samej sceny – co najmniej krótką i długą, czasem więcej – w jedną ramkę wyjściową. Krótkie ekspozycje zachowują najjaśniejsze obszary bez nasycenia; długie ekspozycje wydobywają cienie ponad poziom szumu. Połączony obraz bierze najjaśniejsze obszary z krótkich ramek, a cienie z długich, uzyskując ostatecznie większy użyteczny zakres dynamiczny, niż mogłoby przenieść samodzielnie którekolwiek z pojedynczych wejść.

Łączenie może odbywać się poza chipem, gdzie oprogramowanie zszywa serię wielu ramek, albo na chipie, gdzie sensor przeplata wiersze o krótkiej i długiej ekspozycji w naprzemiennych liniach skanowania lub przepuszcza każdy piksel przez dwie ścieżki odczytu o różnych wzmocnieniach konwersji. Tak czy inaczej wynikiem jest jedna ramka z większą liczbą bitów zakresu dynamicznego, niż fotodioda mogłaby zarejestrować w pojedynczym ujęciu.

Tej ramki o rozszerzonym zakresie nie da się wyświetlić bezpośrednio. Bufor ramki i każdy odbiorca dalej w potoku pracują na stałej głębi bitowej (zwykle 8 bitów na kanał), a sygnał HDR może sięgać 12, 16 lub więcej bitów. Mapowanie tonalne kompresuje dodatkowe bity z powrotem do głębi wyjściowej, stosując nieliniową krzywą, która utrzymuje widoczność szczegółów zarówno w cieniach, jak i w najjaśniejszych obszarach. Proste liniowe skalowanie sygnału HDR albo zgniotłoby ciemne obszary do czerni, albo przesterowałoby jasne obszary do bieli; dobre mapowanie tonalne rezygnuje z części wierności bezwzględnej jasności, aby zachować szczegóły na obu końcach zakresu, a wynik wygląda znacznie bliżej tego, co oko faktycznie widzi w scenie, niż mogłaby kiedykolwiek wyglądać jakakolwiek pojedyncza ekspozycja sensora.