13.7.4. Entraîner le modèle

Avec un jeu de données étiqueté en main, l’entraînement est un parcours guidé sur la page Train : fixez une version du jeu de données, choisissez une architecture, et confiez l’exécution aux serveurs de Roboflow.

13.7.4.1. La version du jeu de données

Avant l’entraînement, Roboflow construit une version du jeu de données – un instantané figé des images plus deux transformations appliquées au passage :

  • Preprocessing redimensionne chaque image à la résolution à laquelle le modèle s’entraîne. Gardez cette résolution petite : la caméra exécute de petits modèles, et un détecteur entraîné à une résolution modeste tient dans la mémoire de la caméra et s’exécute rapidement.

  • Augmentation synthétise des images d’entraînement supplémentaires en perturbant les originales – retournements, variations de luminosité et d’exposition, flou, bruit. Chaque augmentation apprend au modèle à tolérer une variation réelle qu’il rencontrera sur la caméra, ce qui permet de tirer bien davantage parti d’un petit jeu de données capturé à la main.

Les réglages d'augmentation de saturation de Roboflow, prévisualisant l'image originale aux côtés de versions à saturation réduite et augmentée

Un aperçu d’augmentation : chaque option montre ce qu’elle fait à une image d’exemple avant de la valider dans la version.

Faites correspondre les augmentations aux variations que la caméra rencontrera réellement. La luminosité et l’exposition justifient leur place – l’éclairage change constamment. Écartez celles qui ne se produisent jamais dans votre configuration ; une caméra fixée en place ne voit jamais de retournement vertical, donc l’augmentation par retournement ne fait que diluer le jeu de données.

13.7.4.2. Choisir une architecture

Ensuite, choisissez l’architecture du modèle. Roboflow en propose plusieurs, chacune dotée d’un sélecteur de taille arbitrant entre précision et vitesse.

La page Select Architecture de Roboflow avec les options Roboflow RF-DETR, YOLO26, Roboflow 3.0 et YOLOv11, chacune accompagnée d'un menu déroulant de taille de modèle

Les choix d’architecture – chacun avec un sélecteur de taille arbitrant entre précision et vitesse d’inférence.

Pour la caméra, choisissez Roboflow 3.0. Il s’agit de YOLOv8 sous le capot, et la caméra fournit un post-processeur YOLOv8 dans ml.postprocessing.ultralytics, de sorte que sa sortie se décode sans code supplémentaire de votre côté. Choisissez la taille Fast – elle tient dans la mémoire de la caméra et s’exécute à une cadence d’images utilisable.

13.7.4.3. Lancer l’entraînement

Démarrez l’exécution et l’entraînement se déroule sur les serveurs de Roboflow – généralement bien en dessous d’une heure pour un petit jeu de données, avec un e-mail à la fin. La page de la version affiche alors les graphiques d’entraînement et les métriques de précision : mAP, précision et rappel.

La page de version du modèle entraîné de Roboflow montrant le panneau de métriques avec mAP, précision, rappel et F1, au-dessus de la section Deploy Your Model

Le modèle entraîné avec ses métriques de précision. À partir d’ici, la page Visualize l’exécute également sur des images de test ou une webcam pour une vérification rapide.

Si les chiffres sont bons, le modèle est prêt à être déployé. Sinon, le remède consiste généralement à fournir davantage de données ou des données plus variées – capturez un autre clip, étiquetez-le et entraînez une nouvelle version.