13.7.4. Trenowanie modelu

Mając w ręku oznaczony zbiór danych, trenowanie jest prowadzonym przepływem na stronie Train: zablokuj wersję zbioru danych, wybierz architekturę i przekaż uruchomienie serwerom Roboflow.

13.7.4.1. Wersja zbioru danych

Przed trenowaniem Roboflow buduje wersję zbioru danych – zamrożony zrzut obrazów wraz z dwiema transformacjami stosowanymi przy wejściu:

  • Preprocessing zmienia rozmiar każdego obrazu do rozdzielczości, przy której model jest trenowany. Utrzymuj tę rozdzielczość małą: kamera uruchamia małe modele, a detektor wytrenowany przy umiarkowanej rozdzielczości mieści się w pamięci kamery i działa szybko.

  • Augmentation syntetyzuje dodatkowe obrazy treningowe poprzez zaburzanie oryginałów – odbicia, zmiany jasności i ekspozycji, rozmycie, szum. Każda augmentacja uczy model tolerowania rzeczywistej zmienności, którą napotka na kamerze, co znacznie wydłuża zasięg małego, ręcznie przechwyconego zbioru danych.

Roboflow's saturation augmentation settings, previewing the original image alongside reduced and increased saturation versions

Podgląd augmentacji: każda opcja pokazuje, co robi z przykładowym obrazem, zanim zatwierdzisz ją do wersji.

Dopasuj augmentacje do zmienności, jaką kamera faktycznie zobaczy. Jasność i ekspozycja zasługują na swoje miejsce – oświetlenie zmienia się nieustannie. Pomiń te, które nigdy nie wystąpią w twoim ustawieniu; kamera przymocowana na stałe nigdy nie zobaczy pionowego odbicia, więc augmentacja odbicia jedynie rozcieńcza zbiór danych.

13.7.4.2. Wybór architektury

Następnie wybierz architekturę modelu. Roboflow oferuje kilka, każda z selektorem rozmiaru, który równoważy dokładność względem szybkości.

Roboflow's Select Architecture page with Roboflow RF-DETR, YOLO26, Roboflow 3.0, and YOLOv11 options, each with a model-size dropdown

Wybory architektury – każda z selektorem rozmiaru, który równoważy dokładność względem szybkości wnioskowania.

Dla kamery wybierz Roboflow 3.0. Pod maską jest to YOLOv8, a kamera dostarcza postprocesor YOLOv8 w ml.postprocessing.ultralytics, więc jego wyjście dekoduje się bez dodatkowego kodu z twojej strony. Wybierz rozmiar Fast – mieści się w pamięci kamery i działa z użyteczną liczbą klatek na sekundę.

13.7.4.3. Uruchamianie trenowania

Rozpocznij uruchomienie, a trenowanie odbywa się na serwerach Roboflow – zwykle znacznie poniżej godziny dla małego zbioru danych, z e-mailem po zakończeniu. Strona wersji pokazuje następnie wykresy trenowania oraz metryki dokładności: mAP, precyzję i czułość.

Roboflow's trained-model version page showing the metrics panel with mAP, precision, recall, and F1, above the Deploy Your Model section

Wytrenowany model wraz z jego metrykami dokładności. Stąd strona Visualize uruchamia go również na obrazach testowych lub kamerze internetowej w celu szybkiego sprawdzenia poprawności.

Jeśli liczby są dobre, model jest gotowy do wdrożenia. Jeśli nie, rozwiązaniem jest zwykle więcej lub bardziej zróżnicowanych danych – nagraj kolejny klip, oznacz go i wytrenuj nową wersję.