4.3. Campo de visión

Una cámara ve un cono del mundo que tiene delante; todo lo que queda fuera de ese cono cae por los laterales del sensor. La amplitud angular de ese cono es el campo de visión (FOV) y está determinada por dos números: el tamaño del sensor y la distancia focal del objetivo.

4.3.1. La fórmula del FOV

Un objetivo vertical con un sensor de ancho S detrás a una distancia f. Dos rayos parten de los bordes superior e inferior del sensor, pasan por el centro del objetivo y divergen hacia la escena en el lado opuesto, definiendo un cono cuyo ángulo completo se etiqueta FOV.

Un sensor de ancho \(S\) situado a una distancia \(f\) detrás del objetivo define un cono de rayos entrantes. El ángulo completo de ese cono es el campo de visión.

Un sensor de ancho \(S\) se sitúa a una distancia \(f\) detrás del objetivo, perpendicular al eje óptico. El modelo de lente delgada indica que un rayo que pasa por el centro del objetivo continúa sin desviarse, así que tracemos uno de esos rayos desde cada borde del sensor: cada uno se dirige en línea recta a través del centro del objetivo y sale hacia la escena en el lado opuesto. Juntos delimitan el cono de luz que el sensor puede captar, y el ángulo entre ellos en el objetivo es el campo de visión.

La mitad de ese cono es un triángulo rectángulo. Un cateto es el eje óptico, desde el centro del objetivo hasta el centro del sensor, de longitud \(f\). El otro cateto es la mitad del sensor, desde el centro del sensor hasta uno de los bordes, de longitud \(S / 2\). La hipotenusa es el propio rayo, que va desde el centro del objetivo hasta el borde del sensor.

El teorema de Pitágoras relaciona las longitudes de los tres lados, pero Pitágoras no proporciona ángulos, y el ángulo en el vértice del objetivo es lo que buscamos. La trigonometría es el puente que va de las razones entre lados a los ángulos. En cualquier triángulo rectángulo, la tangente de un ángulo se define como su cateto opuesto dividido por su cateto adyacente. Para el ángulo de medio FOV, el cateto opuesto es la mitad del sensor \(S / 2\) y el cateto adyacente es el cateto del eje óptico \(f\), por lo que

\[\tan(\text{half-FOV}) = \frac{S / 2}{f} = \frac{S}{2f}\]

El ángulo en sí se obtiene aplicando la inversa de la tangente, la función arcotangente, a ambos lados:

\[\text{half-FOV} = \arctan \! \left( \frac{S}{2f} \right)\]

El cono es simétrico respecto al eje, por lo que el FOV completo es el doble del medio ángulo:

\[\text{FOV} = 2 \cdot \arctan \! \left( \frac{S}{2f} \right)\]

De la fórmula se desprenden dos consecuencias:

  • La distancia focal del objetivo fija el ángulo, no el tamaño absoluto. Un objetivo «gran angular» es amplio porque su distancia focal es corta: cuanto menor es \(f\), mayor se vuelve la razón \(S / 2f\) y más amplio es el cono. Una distancia focal larga estrecha el cono (un objetivo «teleobjetivo»).

  • El tamaño del sensor también importa. Montar el mismo objetivo delante de un sensor más pequeño recorta el cono: el mismo objetivo tiene un campo de visión más estrecho en un sensor pequeño que en uno grande. Por eso las cifras de distancia focal de distintas cámaras no son directamente comparables; el FOV depende tanto de \(f\) como de \(S\).

4.3.2. Tres opciones de objetivo

Tomemos un sensor de 4,8 mm × 3,6 mm (un tamaño habitual de formato pequeño que se aproxima a lo que ofrecen los sensores de la OpenMV Cam) y tres opciones de objetivo.

distancia focal

FOV diagonal

FOV horizontal

FOV vertical

descripción

2,8 mm

~94°

~81°

~66°

gran angular

4 mm

~74°

~62°

~48°

normal

8 mm

~41°

~33°

~25°

estrecho / teleobjetivo

Las tres columnas pasan por la misma fórmula. El FOV diagonal usa un \(S\) igual a la diagonal del sensor \(\sqrt{W^2 + H^2}\) (6 mm para este sensor); el FOV horizontal usa \(S = W = 4.8\) mm; el FOV vertical usa \(S = H = 3.6\) mm. Reducir la distancia focal a la mitad casi duplica cada cono; duplicarla casi los reduce a la mitad.

Las hojas de datos de los objetivos suelen publicar el FOV diagonal como única cifra destacada, ya que abarca el sensor de esquina a esquina. Los FOV horizontal y vertical resultan más directamente útiles al planificar lo que cabrá en el fotograma, porque el fotograma es rectangular y un área de trabajo rectangular está delimitada por la horizontal y la vertical, no por la diagonal.

4.3.3. Elegir una distancia focal

El FOV que necesita la aplicación lo determina el tamaño de la región que la cámara debe ver y la distancia a la que estará la cámara. Si la cámara se sitúa 1 m por encima de un área de trabajo de 0,6 m × 0,6 m, el FOV angular necesario para cubrir un borde es \(2 \cdot \arctan(0.3 / 1) \approx 33°\), y el objetivo de 8 mm anterior se aproxima.

Usar un ángulo más amplio del que la aplicación necesita hace que los objetos se vean más pequeños en el fotograma, desperdicia píxeles en el fondo y aumenta la distorsión del objetivo. Usar uno más estrecho deja partes de la escena fuera de los laterales del sensor. El objetivo adecuado es el de mayor distancia focal que aún cubra el área de trabajo a la distancia prevista de la cámara.