13.7.4. Träna modellen¶
Med en etiketterad datamängd i handen är träningen ett guidat flöde på sidan Train: lås en datamängdsversion, välj en arkitektur, och lämna över körningen till Roboflows servrar.
13.7.4.1. Datamängdsversionen¶
Före träningen bygger Roboflow en datamängdsversion – en frusen ögonblicksbild av bilderna plus två transformationer som tillämpas på vägen in:
Preprocessing ändrar storleken på varje bild till den upplösning modellen tränar vid. Håll den upplösningen liten: kameran kör små modeller, och en detektor tränad vid en blygsam upplösning får plats i kamerans minne och kör snabbt.
Augmentation syntetiserar extra träningsbilder genom att störa originalen – speglingar, ljusstyrke- och exponeringsförskjutningar, oskärpa, brus. Varje augmentering lär modellen att tolerera en verklig variation den kommer att möta på kameran, vilket sträcker en liten handfångad datamängd mycket längre.
En förhandsvisning av augmentering: varje alternativ visar vad det gör med en exempelbild innan du tillämpar det på versionen.¶
Matcha augmenteringarna mot variationer som kameran faktiskt kommer att se. Ljusstyrka och exponering förtjänar sin plats – ljuset ändras hela tiden. Hoppa över sådana som aldrig inträffar i din uppställning; en kamera som är fastbultad ser aldrig en vertikal spegling, så speglingsaugmentering späder bara ut datamängden.
13.7.4.2. Välja en arkitektur¶
Välj sedan modellarkitektur. Roboflow erbjuder flera, var och en med en storleksväljare som avväger noggrannhet mot hastighet.
Arkitekturvalen – var och en med en storleksväljare som avväger noggrannhet mot inferenshastighet.¶
För kameran, välj Roboflow 3.0. Det är YOLOv8 under huven, och kameran levererar en YOLOv8-efterbehandlare i ml.postprocessing.ultralytics, så dess utdata avkodas utan extra kod från din sida. Välj storleken Fast – den får plats i kamerans minne och kör i en användbar bildhastighet.
13.7.4.3. Köra träningen¶
Starta körningen så sker träningen på Roboflows servrar – vanligtvis klart på god väg under en timme för en liten datamängd, med ett e-postmeddelande när det är klart. Versionssidan visar sedan träningsgraferna och noggrannhetsmåtten: mAP, precision och recall.
Den tränade modellen med dess noggrannhetsmått. Härifrån kör sidan Visualize den också på testbilder eller en webbkamera för en snabb rimlighetskontroll.¶
Om siffrorna är bra är modellen redo att distribueras. Om inte är lösningen vanligtvis mer eller mer varierad data – spela in ytterligare ett klipp, etikettera det och träna en ny version.