13.1.17. El editor de conjuntos de datos¶
Entrenar un clasificador personalizado empieza con un conjunto de datos etiquetado: cientos de imágenes de cada cosa que el modelo debe reconocer, capturadas por la cámara que lo va a ejecutar, ordenadas en una carpeta por clase. El editor de conjuntos de datos es el flujo de trabajo de captura del IDE para construir uno.
Tools → Dataset Editor → New Dataset pide una carpeta en la que construir el conjunto de datos – advirtiendo de que se eliminará el contenido de una carpeta no vacía – y la configura: un panel de explorador de archivos se acopla a la izquierda de la ventana principal, y un script de captura (dataset_capture_script.py) se abre en el editor. El script es un bucle de captura sencillo, y está pensado para editarse: aplica la misma corrección de lente, recorte o filtrado que usará la aplicación implementada, para que el modelo se entrene con las imágenes que realmente verá. Open Dataset vuelve a abrir más tarde una carpeta de conjunto de datos existente, y Close Dataset devuelve la ventana a la normalidad.
13.1.17.1. Captura¶
Mientras un conjunto de datos está abierto, dos botones se unen a la barra de herramientas en el borde izquierdo de la ventana, debajo de los controles de ejecución. New Class Folder (Ctrl+Shift+N) crea una clase – una por cada categoría que el modelo debe aprender, nombrada según la etiqueta. Con el script de captura en ejecución y una carpeta de clase seleccionada, Capture Data (Ctrl+Shift+S) guarda la imagen actual del búfer de fotogramas (frame buffer) en esa clase, y el panel de vista previa bajo el explorador de archivos muestra cada captura a medida que llega.
El ritmo de captura es: selecciona una clase, apunta la cámara a un ejemplo de ella, captura; mueve el objeto, varía el ángulo, la distancia, el fondo, la iluminación, captura de nuevo: la variación en el conjunto de datos es lo que aporta robustez al modelo. Repite por clase, incluida una clase de fondo con escenas que no contengan ninguno de los objetivos si la aplicación necesita saber cuándo no hay nada.
13.1.17.2. Exportar y entrenar¶
El submenú Export envía el conjunto de datos terminado al entrenamiento. Export Dataset to Zip File lo empaqueta en un archivo con nombres de archivo prefijados por clase: el formato neutral que aceptan todos los servicios y frameworks de entrenamiento. Para Edge Impulse, el IDE se integra directamente: inicia sesión en una cuenta de Edge Impulse desde el mismo submenú, y Upload to Edge Impulse Project envía el conjunto de datos directamente a un proyecto (existe una carga mediante clave de API para cuentas donde el inicio de sesión con correo y contraseña no es una opción). Entrena allí, exporta el modelo, y el conversor de NPU lo deja listo para la cámara cuando la placa lo necesita.
Ver también
El capítulo de aprendizaje automático para el flujo de trabajo de entrenamiento al que alimenta el conjunto de datos.