13.1.17. L’éditeur de jeux de données

L’entraînement d’un classificateur personnalisé commence par un jeu de données étiqueté – des centaines d’images de chaque élément que le modèle doit reconnaître, capturées par la caméra qui l’exécutera, triées en un dossier par classe. L’éditeur de jeux de données est le flux de travail de capture de l’IDE pour en construire un.

Tools → Dataset Editor → New Dataset demande un dossier dans lequel construire le jeu de données – en avertissant que le contenu d’un dossier non vide sera supprimé – et le configure : un panneau d’explorateur de fichiers s’ancre à gauche de la fenêtre principale, et un script de capture (dataset_capture_script.py) s’ouvre dans l’éditeur. Le script est une simple boucle de capture, et il est destiné à être modifié – appliquez la même correction d’objectif, le même recadrage ou le même filtrage que l’application déployée utilisera, afin que le modèle s’entraîne sur les images qu’il verra réellement. Open Dataset rouvre ultérieurement un dossier de jeu de données existant, et Close Dataset remet la fenêtre dans son état normal.

13.1.17.1. Capture

Lorsqu’un jeu de données est ouvert, deux boutons rejoignent la barre d’outils sur le bord gauche de la fenêtre, sous les contrôles d’exécution. New Class Folder (Ctrl+Shift+N) crée une classe – une par catégorie que le modèle doit apprendre, nommée d’après l’étiquette. Avec le script de capture en cours d’exécution et un dossier de classe sélectionné, Capture Data (Ctrl+Shift+S) enregistre l’image actuelle du tampon d’image dans cette classe, et le panneau d’aperçu sous l’explorateur de fichiers affiche chaque capture au fur et à mesure qu’elle arrive.

Le rythme de capture est le suivant : sélectionnez une classe, pointez la caméra vers un exemple de celle-ci, capturez ; déplacez l’objet, variez l’angle, la distance, l’arrière-plan, l’éclairage, capturez de nouveau – la variation dans le jeu de données est ce qui procure la robustesse au modèle. Répétez pour chaque classe, en incluant une classe d’arrière-plan composée de scènes ne contenant aucune des cibles si l’application a besoin de savoir quand rien n’est présent.

13.1.17.2. Exportation et entraînement

Le sous-menu Export envoie le jeu de données terminé à l’entraînement. Export Dataset to Zip File l’empaquette dans une archive avec des noms de fichiers préfixés par la classe – le format neutre que tout service et tout framework d’entraînement accepte. Pour Edge Impulse, l’IDE s’intègre directement : connectez-vous à un compte Edge Impulse depuis le même sous-menu, et Upload to Edge Impulse Project pousse le jeu de données directement dans un projet (un téléversement par clé API existe pour les comptes où la connexion par e-mail et mot de passe n’est pas une option). Entraînez-y, exportez le modèle, et le convertisseur NPU le rend prêt pour la caméra lorsque la carte en a besoin.

Voir aussi

Le chapitre sur l’apprentissage automatique pour le flux de travail d’entraînement alimenté par le jeu de données.