4.7. Exposição e ganho¶

Dois parâmetros alteram o brilho com que cada célula de pixel é reportada ao resto do pipeline:

Tempo de exposição (também chamado tempo de integração) – quanto tempo o fotodíodo pode acumular carga antes da leitura.
Ganho analógico – o multiplicador aplicado à tensão de leitura por um amplificador integrado no chip antes do ADC.

Ambos os parâmetros tornam a imagem captada mais brilhante, mas fazem-no de formas distintas e cada um acarreta o seu próprio custo.

4.7.1. Tempo de exposição¶

Uma exposição mais longa significa que cada célula acumula mais eletrões por fotograma, pelo que a contagem digital resulta mais elevada para a mesma cena. Reduzir a exposição a metade reduz aproximadamente a contagem a metade; duplicá-la duplica-a aproximadamente. A relação é linear até o poço saturar.

O custo é o movimento. A célula regista a luz média que nela incide ao longo de toda a janela de integração, pelo que qualquer objeto que se mova uma distância apreciável durante essa janela fica distribuído por vários pixels – desfocagem de movimento. Uma pessoa a caminhar com 1/30 s de exposição fica desfocada ao longo de vários pixels; a mesma pessoa a 1/500 s aparece nítida.

Uma exposição longa também aproxima a célula da saturação, pelo que em cenas bem iluminadas a exposição tem de diminuir mesmo quando o brilho está adequado – caso contrário as altas luzes ficam recortadas.

4.7.2. Ganho analógico¶

O ganho analógico é um pequeno amplificador entre a leitura do fotodíodo e o ADC. A tensão do sinal é multiplicada pelo ganho antes de ser digitalizada, pelo que o mesmo número de eletrões resulta num valor numérico maior. O ganho é habitualmente expresso em decibéis (dB); duplicar o ganho equivale a +6 dB.

O ganho é útil com luz demasiado fraca para expor mais tempo – quando prolongar a exposição faria cair a taxa de fotogramas abaixo do necessário para a aplicação ou introduziria demasiada desfocagem de movimento. O custo é o ruído. O amplificador multiplica o nível de ruído juntamente com o sinal, pelo que a relação sinal-ruído não melhora com mais ganho. Um ganho elevado produz uma imagem mais granulada e ruidosa com o mesmo brilho de cena do que um ganho baixo.

Alguns sensores expõem também um parâmetro de ganho digital, que é um multiplicador inteiro pós-ADC. O ganho digital é ainda pior para a imagem de ruído do que o ganho analógico, pois amplifica também o ruído de quantização do ADC. Recorra a ele em último lugar.

4.7.3. Exposição automática e ganho automático¶

As câmaras reais precisam de lidar com cenas que abrangem uma enorme gama de brilhos – uma sala interior escura e uma janela ensolarada no mesmo campo de visão. Dois ciclos de controlo ajustam os parâmetros em tempo real:

Controlo de exposição automático (AEC) mede o valor médio de pixel no fotograma recente (muitas vezes ponderado para o centro, ou afastado dos pixels mais brilhantes) e ajusta o tempo de exposição para conduzir essa média a um valor alvo.
Controlo de ganho automático (AGC) faz o mesmo com o ganho analógico, geralmente como alternativa depois de o tempo de exposição já ter sido levado ao seu máximo seguro.

A ordem é importante. Ajustar primeiro a exposição e depois o ganho proporciona a melhor relação sinal-ruído para um dado brilho alvo, uma vez que a exposição recolhe mais sinal sem amplificar o ruído, enquanto o ganho amplifica ambos. AEC e AGC funcionam, portanto, por prioridade: a exposição aumenta primeiro para iluminar uma cena escura, e o ganho só entra em ação quando a exposição atingir o seu limite máximo (definido pela taxa de fotogramas ou por um orçamento explícito de desfocagem de movimento).

4.7.4. Gama dinâmica elevada¶

AEC e AGC escolhem o brilho correto para um único fotograma em função da média da cena, mas todas as cenas têm partes mais brilhantes e mais escuras do que a média. Uma única exposição só consegue cobrir uma parte dessa gama de cada vez – exposições curtas preservam as altas luzes mas enterram as sombras no ruído de leitura; exposições longas elevam as sombras mas recortam as altas luzes na saturação. A gama dinâmica do sensor – a razão entre o pixel mais brilhante que consegue registar sem recorte e o mais escuro que consegue distinguir do ruído – é fixada pela capacidade de poço cheio do fotodíodo e pelo nível de ruído de leitura, e muitas cenas têm uma gama mais ampla do que o sensor consegue capturar num único fotograma. Uma janela ensolarada numa sala interior escura é o exemplo clássico.

Imagem de gama dinâmica elevada (HDR) contorna este limite combinando duas ou mais exposições da mesma cena – no mínimo uma curta e uma longa, por vezes mais – num único fotograma de saída. As exposições curtas preservam as altas luzes sem saturar; as exposições longas elevam as sombras acima do nível de ruído. A imagem combinada toma as altas luzes dos fotogramas curtos e as sombras dos longos, obtendo uma gama dinâmica mais utilizável do que qualquer entrada individual poderia transportar por si só.

A combinação pode ocorrer fora do chip, com software a unir uma sequência de múltiplos fotogramas, ou no chip, com o sensor a intercalar linhas de exposição curta e longa em linhas de varrimento alternadas ou a processar cada pixel através de dois caminhos de leitura com ganhos de conversão diferentes. De qualquer forma, o resultado é um fotograma com mais bits de gama dinâmica do que o fotodíodo conseguiria registar numa única captura.

Esse fotograma de gama estendida não é diretamente visualizável. O framebuffer e qualquer consumidor a jusante funcionam com uma profundidade de bit fixa (geralmente 8 bits por canal), e o sinal HDR pode atingir 12, 16 ou mais. O mapeamento de tons comprime os bits extra de volta para a profundidade de saída aplicando uma curva não linear que mantém visíveis os detalhes tanto nas sombras como nas altas luzes. Uma escala linear direta do sinal HDR ou esmagaria as regiões escuras a preto ou recortaria as regiões brilhantes a branco; um bom mapeamento de tons cede alguma fidelidade de brilho absoluta para reter detalhe em ambos os extremos da gama, e a saída parece muito mais próxima do que o olho realmente vê na cena do que qualquer exposição única do sensor poderia alguma vez conseguir.