13.7.4. Entraîner le modèle¶
Avec un jeu de données étiqueté en main, l’entraînement est un parcours guidé sur la page Train : fixez une version du jeu de données, choisissez une architecture, et confiez l’exécution aux serveurs de Roboflow.
13.7.4.1. La version du jeu de données¶
Avant l’entraînement, Roboflow construit une version du jeu de données – un instantané figé des images plus deux transformations appliquées au passage :
Preprocessing redimensionne chaque image à la résolution à laquelle le modèle s’entraîne. Gardez cette résolution petite : la caméra exécute de petits modèles, et un détecteur entraîné à une résolution modeste tient dans la mémoire de la caméra et s’exécute rapidement.
Augmentation synthétise des images d’entraînement supplémentaires en perturbant les originales – retournements, variations de luminosité et d’exposition, flou, bruit. Chaque augmentation apprend au modèle à tolérer une variation réelle qu’il rencontrera sur la caméra, ce qui permet de tirer bien davantage parti d’un petit jeu de données capturé à la main.
Un aperçu d’augmentation : chaque option montre ce qu’elle fait à une image d’exemple avant de la valider dans la version.¶
Faites correspondre les augmentations aux variations que la caméra rencontrera réellement. La luminosité et l’exposition justifient leur place – l’éclairage change constamment. Écartez celles qui ne se produisent jamais dans votre configuration ; une caméra fixée en place ne voit jamais de retournement vertical, donc l’augmentation par retournement ne fait que diluer le jeu de données.
13.7.4.2. Choisir une architecture¶
Ensuite, choisissez l’architecture du modèle. Roboflow en propose plusieurs, chacune dotée d’un sélecteur de taille arbitrant entre précision et vitesse.
Les choix d’architecture – chacun avec un sélecteur de taille arbitrant entre précision et vitesse d’inférence.¶
Pour la caméra, choisissez Roboflow 3.0. Il s’agit de YOLOv8 sous le capot, et la caméra fournit un post-processeur YOLOv8 dans ml.postprocessing.ultralytics, de sorte que sa sortie se décode sans code supplémentaire de votre côté. Choisissez la taille Fast – elle tient dans la mémoire de la caméra et s’exécute à une cadence d’images utilisable.
13.7.4.3. Lancer l’entraînement¶
Démarrez l’exécution et l’entraînement se déroule sur les serveurs de Roboflow – généralement bien en dessous d’une heure pour un petit jeu de données, avec un e-mail à la fin. La page de la version affiche alors les graphiques d’entraînement et les métriques de précision : mAP, précision et rappel.
Le modèle entraîné avec ses métriques de précision. À partir d’ici, la page Visualize l’exécute également sur des images de test ou une webcam pour une vérification rapide.¶
Si les chiffres sont bons, le modèle est prêt à être déployé. Sinon, le remède consiste généralement à fournir davantage de données ou des données plus variées – capturez un autre clip, étiquetez-le et entraînez une nouvelle version.