4.3. Campo de visão

Uma câmera enxerga um cone do mundo à sua frente; tudo o que está fora desse cone cai para fora das bordas do sensor. A largura angular desse cone é o campo de visão (FOV), e ela é determinada por dois números – o tamanho do sensor e a distância focal da lente.

4.3.1. A fórmula do FOV

A vertical lens with a sensor of width S behind it at distance f. Two rays leave the top and bottom edges of the sensor, pass through the centre of the lens, and diverge into the scene on the far side, defining a cone whose full angle is labelled FOV.

Um sensor de largura \(S\) a uma distância \(f\) atrás da lente define um cone de raios incidentes. O ângulo total desse cone é o campo de visão.

Um sensor de largura \(S\) fica a uma distância \(f\) atrás da lente, perpendicular ao eixo óptico. O modelo de lente fina diz que um raio que passa pelo centro da lente continua sem ser desviado, então trace um desses raios a partir de cada borda do sensor: cada um segue direto pelo centro da lente e para fora, em direção à cena do lado oposto. Juntos, eles delimitam o cone de luz que o sensor consegue captar, e o ângulo entre eles na lente é o campo de visão.

Metade desse cone é um triângulo retângulo. Um cateto é o eixo óptico, do centro da lente ao centro do sensor – de comprimento \(f\). O outro cateto é a metade do sensor, do centro do sensor até uma das bordas – de comprimento \(S / 2\). A hipotenusa é o próprio raio, que vai do centro da lente até a borda do sensor.

O teorema de Pitágoras relaciona os três comprimentos dos lados, mas Pitágoras não fornece ângulos, e o ângulo no vértice da lente é justamente o que buscamos. A trigonometria é a ponte das razões entre lados para os ângulos. Em qualquer triângulo retângulo, a tangente de um ângulo é definida como o cateto oposto sobre o cateto adjacente. Para o ângulo de meio FOV, o cateto oposto é a metade do sensor \(S / 2\) e o cateto adjacente é o cateto do eixo óptico \(f\), então

\[\tan(\text{half-FOV}) = \frac{S / 2}{f} = \frac{S}{2f}\]

O próprio ângulo é obtido aplicando-se a inversa da tangente – a função arco-tangente – a ambos os lados:

\[\text{half-FOV} = \arctan \! \left( \frac{S}{2f} \right)\]

O cone é simétrico em relação ao eixo, então o FOV total é o dobro do meio ângulo:

\[\text{FOV} = 2 \cdot \arctan \! \left( \frac{S}{2f} \right)\]

Duas consequências decorrem da fórmula:

  • A distância focal da lente determina o ângulo, não o tamanho absoluto. Uma lente “grande angular” é ampla porque sua distância focal é curta – quanto menor for \(f\), maior se torna a razão \(S / 2f\) e mais amplo fica o cone. Uma distância focal longa estreita o cone (uma lente “teleobjetiva”).

  • O tamanho do sensor também importa. Montar a mesma lente diante de um sensor menor recorta o cone – a mesma lente tem um campo de visão mais estreito em um sensor menor do que em um maior. É por isso que os valores de distância focal de câmeras diferentes não são diretamente comparáveis; o FOV depende tanto de \(f\) quanto de \(S\).

4.3.2. Três opções de lente

Considere um sensor de 4,8 mm × 3,6 mm (um tamanho comum de formato pequeno, aproximadamente correspondente ao que os sensores da OpenMV Cam oferecem) e três opções de lente.

distância focal

FOV diagonal

FOV horizontal

FOV vertical

descrição

2,8 mm

~94°

~81°

~66°

grande angular

4 mm

~74°

~62°

~48°

normal

8 mm

~41°

~33°

~25°

estreita / teleobjetiva

Todas as três colunas passam pela mesma fórmula. O FOV diagonal usa \(S\) igual à diagonal do sensor \(\sqrt{W^2 + H^2}\) (6 mm para este sensor); o FOV horizontal usa \(S = W = 4.8\) mm; o FOV vertical usa \(S = H = 3.6\) mm. Reduzir a distância focal pela metade quase dobra cada cone; dobrá-la quase os reduz pela metade.

As folhas de dados de lentes geralmente publicam o FOV diagonal como o único número de destaque, já que ele abrange o sensor de canto a canto. Os FOVs horizontal e vertical são mais diretamente úteis ao planejar o que vai caber no quadro, porque o quadro é retangular e uma área de trabalho retangular é delimitada na horizontal e na vertical, não na diagonal.

4.3.3. Escolhendo uma distância focal

O FOV de que a aplicação precisa é definido pelo tamanho da região que a câmera precisa enxergar e por quão distante a câmera estará. Se a câmera fica a 1 m acima de uma área de trabalho de 0,6 m × 0,6 m, o FOV angular necessário para cobrir uma das bordas é \(2 \cdot \arctan(0.3 / 1) \approx 33°\), e a lente de 8 mm acima chega perto.

Ir além do FOV de que a aplicação precisa torna os objetos menores no quadro, desperdiça pixels com o fundo e aumenta a distorção da lente. Ir aquém disso faz partes da cena caírem para fora das bordas do sensor. A lente certa é a de maior distância focal que ainda cubra a área de trabalho na distância pretendida da câmera.