13.1.17. De dataset-editor¶
Het trainen van een aangepaste classificator begint met een gelabelde dataset – honderden afbeeldingen van elk ding dat het model moet herkennen, vastgelegd met de camera die het zal uitvoeren, gesorteerd in één map per klasse. De dataset-editor is de vastlegworkflow van de IDE om er een te bouwen.
Tools → Dataset Editor → New Dataset vraagt om een map waarin de dataset wordt opgebouwd – met de waarschuwing dat de inhoud van een niet-lege map wordt verwijderd – en stelt deze in: een bestandsbrowserpaneel wordt links in het hoofdvenster gedockt, en een vastlegscript (dataset_capture_script.py) wordt geopend in de editor. Het script is een eenvoudige vastleglus en het is bedoeld om bewerkt te worden – pas dezelfde lenscorrectie, uitsnijding of filtering toe die de gedeployde applicatie zal gebruiken, zodat het model traint op de afbeeldingen die het daadwerkelijk zal zien. Open Dataset heropent later een bestaande datasetmap, en Close Dataset zet het venster weer normaal.
13.1.17.1. Vastleggen¶
Terwijl een dataset open is, komen er twee knoppen bij op de werkbalk aan de linkerrand van het venster, onder de uitvoerknoppen. New Class Folder (Ctrl+Shift+N) maakt een klasse aan – één per categorie die het model moet leren, genoemd naar het label. Met het vastlegscript draaiend en een klassemap geselecteerd, slaat Capture Data (Ctrl+Shift+S) de huidige framebuffer-afbeelding op in die klasse, en het previewpaneel onder de bestandsbrowser toont elke vastlegging zodra deze binnenkomt.
Het vastlegritme is: selecteer een klasse, richt de camera op een voorbeeld ervan, leg vast; verplaats het object, varieer de hoek, de afstand, de achtergrond, de belichting, leg opnieuw vast – variatie in de dataset is wat robuustheid in het model oplevert. Herhaal per klasse, inclusief een achtergrondklasse met scènes die geen van de doelen bevatten als de applicatie moet weten wanneer er niets aanwezig is.
13.1.17.2. Exporteren en trainen¶
Het Export-submenu stuurt de voltooide dataset naar de training. Export Dataset to Zip File verpakt deze in een archief met bestandsnamen voorzien van een klasse-prefix – het neutrale formaat dat elke trainingsdienst en elk framework accepteert. Voor Edge Impulse integreert de IDE rechtstreeks: log vanuit hetzelfde submenu in op een Edge Impulse-account, en Upload to Edge Impulse Project duwt de dataset rechtstreeks in een project (er bestaat een upload via API-sleutel voor accounts waarvoor de e-mail-en-wachtwoord-login geen optie is). Train daar, exporteer het model, en de NPU-converter maakt het cameraklaar wanneer het board dat nodig heeft.
Zie ook
Het hoofdstuk over machine learning voor de trainingsworkflow waarin de dataset terechtkomt.