13.7.4. Treinar o modelo¶
Com um conjunto de dados etiquetado em mãos, o treino é um fluxo guiado na página Train: fixar uma versão do conjunto de dados, escolher uma arquitetura e entregar a execução aos servidores do Roboflow.
13.7.4.1. A versão do conjunto de dados¶
Antes do treino, o Roboflow cria uma versão do conjunto de dados – uma captura imutável das imagens mais dois transformações aplicadas na entrada:
Pré-processamento redimensiona cada imagem para a resolução a que o modelo treina. Mantenha essa resolução pequena: a câmara executa modelos pequenos, e um detetor treinado a uma resolução modesta cabe na memória da câmara e corre rapidamente.
Aumento de dados sintetiza imagens de treino adicionais perturbando as originais – inversões, alterações de brilho e exposição, desfoque, ruído. Cada aumento de dados ensina o modelo a tolerar uma variação real que irá encontrar na câmara, o que estende muito mais um pequeno conjunto de dados capturado manualmente.
Uma pré-visualização de aumento de dados: cada opção mostra o que faz a uma imagem de amostra antes de a confirmar na versão.¶
Adapte os aumentos de dados às variações que a câmara irá efetivamente encontrar. O brilho e a exposição merecem o seu lugar – a iluminação muda constantemente. Salte os que nunca acontecem na sua configuração; uma câmara fixada no lugar nunca vê uma inversão vertical, por isso o aumento por inversão apenas dilui o conjunto de dados.
13.7.4.2. Escolher uma arquitetura¶
De seguida, escolha a arquitetura do modelo. O Roboflow oferece várias, cada uma com um seletor de tamanho que equilibra precisão e velocidade.
As opções de arquitetura – cada uma com um seletor de tamanho que equilibra precisão e velocidade de inferência.¶
Para a câmara, escolha Roboflow 3.0. É YOLOv8 por baixo, e a câmara inclui um pós-processador YOLOv8 em ml.postprocessing.ultralytics, por isso a sua saída descodifica sem código extra do seu lado. Escolha o tamanho Fast – cabe na memória da câmara e corre a uma taxa de fotogramas utilizável.
13.7.4.3. Executar o treino¶
Inicie a execução e o treino decorre nos servidores do Roboflow – geralmente bem abaixo de uma hora para um conjunto de dados pequeno, com um e-mail quando terminar. A página da versão mostra depois os gráficos de treino e as métricas de precisão: mAP, precisão e revocação.
O modelo treinado com as suas métricas de precisão. A partir daqui, a página Visualize também o executa em imagens de teste ou numa câmara web para uma verificação rápida.¶
Se os números forem bons, o modelo está pronto para implementar. Caso contrário, a solução é geralmente mais dados ou dados mais variados – capture mais imagens, etiquete-as e treine uma nova versão.