13.7.4. Treinar o modelo

Com um conjunto de dados etiquetado em mãos, o treino é um fluxo guiado na página Train: fixar uma versão do conjunto de dados, escolher uma arquitetura e entregar a execução aos servidores do Roboflow.

13.7.4.1. A versão do conjunto de dados

Antes do treino, o Roboflow cria uma versão do conjunto de dados – uma captura imutável das imagens mais dois transformações aplicadas na entrada:

  • Pré-processamento redimensiona cada imagem para a resolução a que o modelo treina. Mantenha essa resolução pequena: a câmara executa modelos pequenos, e um detetor treinado a uma resolução modesta cabe na memória da câmara e corre rapidamente.

  • Aumento de dados sintetiza imagens de treino adicionais perturbando as originais – inversões, alterações de brilho e exposição, desfoque, ruído. Cada aumento de dados ensina o modelo a tolerar uma variação real que irá encontrar na câmara, o que estende muito mais um pequeno conjunto de dados capturado manualmente.

Roboflow's saturation augmentation settings, previewing the original image alongside reduced and increased saturation versions

Uma pré-visualização de aumento de dados: cada opção mostra o que faz a uma imagem de amostra antes de a confirmar na versão.

Adapte os aumentos de dados às variações que a câmara irá efetivamente encontrar. O brilho e a exposição merecem o seu lugar – a iluminação muda constantemente. Salte os que nunca acontecem na sua configuração; uma câmara fixada no lugar nunca vê uma inversão vertical, por isso o aumento por inversão apenas dilui o conjunto de dados.

13.7.4.2. Escolher uma arquitetura

De seguida, escolha a arquitetura do modelo. O Roboflow oferece várias, cada uma com um seletor de tamanho que equilibra precisão e velocidade.

Roboflow's Select Architecture page with Roboflow RF-DETR, YOLO26, Roboflow 3.0, and YOLOv11 options, each with a model-size dropdown

As opções de arquitetura – cada uma com um seletor de tamanho que equilibra precisão e velocidade de inferência.

Para a câmara, escolha Roboflow 3.0. É YOLOv8 por baixo, e a câmara inclui um pós-processador YOLOv8 em ml.postprocessing.ultralytics, por isso a sua saída descodifica sem código extra do seu lado. Escolha o tamanho Fast – cabe na memória da câmara e corre a uma taxa de fotogramas utilizável.

13.7.4.3. Executar o treino

Inicie a execução e o treino decorre nos servidores do Roboflow – geralmente bem abaixo de uma hora para um conjunto de dados pequeno, com um e-mail quando terminar. A página da versão mostra depois os gráficos de treino e as métricas de precisão: mAP, precisão e revocação.

Roboflow's trained-model version page showing the metrics panel with mAP, precision, recall, and F1, above the Deploy Your Model section

O modelo treinado com as suas métricas de precisão. A partir daqui, a página Visualize também o executa em imagens de teste ou numa câmara web para uma verificação rápida.

Se os números forem bons, o modelo está pronto para implementar. Caso contrário, a solução é geralmente mais dados ou dados mais variados – capture mais imagens, etiquete-as e treine uma nova versão.