13.1.17. L’editor di dataset¶

L’addestramento di un classificatore personalizzato parte da un dataset etichettato: centinaia di immagini di ogni elemento che il modello deve riconoscere, acquisite dalla camera che lo eseguirà, ordinate in una cartella per classe. L’editor di dataset è il flusso di lavoro di acquisizione dell’IDE per costruirne uno.

Tools → Dataset Editor → New Dataset chiede una cartella in cui costruire il dataset (avvertendo che il contenuto di una cartella non vuota verrà eliminato) e la prepara: un pannello del browser dei file si ancora a sinistra della finestra principale e uno script di acquisizione (dataset_capture_script.py) si apre nell’editor. Lo script è un semplice ciclo di acquisizione, ed è pensato per essere modificato: applica la stessa correzione dell’obiettivo, il ritaglio o il filtraggio che userà l’applicazione finale, così il modello viene addestrato sulle immagini che vedrà effettivamente. Open Dataset riapre in seguito una cartella di dataset esistente, mentre Close Dataset riporta la finestra alla normalità.

13.1.17.1. Acquisizione¶

Mentre un dataset è aperto, due pulsanti si aggiungono alla barra degli strumenti sul bordo sinistro della finestra, sotto i controlli di esecuzione. New Class Folder (Ctrl+Shift+N) crea una classe, una per ogni categoria che il modello deve apprendere, denominata in base all’etichetta. Con lo script di acquisizione in esecuzione e una cartella di classe selezionata, Capture Data (Ctrl+Shift+S) salva l’immagine corrente del frame buffer in quella classe, e il pannello di anteprima sotto il browser dei file mostra ogni acquisizione man mano che arriva.

Il ritmo di acquisizione è: seleziona una classe, punta la camera verso un suo esempio, acquisisci; sposta l’oggetto, varia l’angolazione, la distanza, lo sfondo, l’illuminazione, acquisisci di nuovo: la varietà nel dataset è ciò che garantisce robustezza al modello. Ripeti per ogni classe, inclusa una classe di sfondo con scene che non contengono nessuno dei target, se l’applicazione ha bisogno di sapere quando non c’è nulla.

13.1.17.2. Esportazione e addestramento¶

Il sottomenu Export invia il dataset finito all’addestramento. Export Dataset to Zip File lo impacchetta in un archivio con nomi di file preceduti dal prefisso della classe, il formato neutro accettato da ogni servizio e framework di addestramento. Per Edge Impulse, l’IDE si integra direttamente: accedi a un account Edge Impulse dallo stesso sottomenu, e Upload to Edge Impulse Project carica il dataset direttamente in un progetto (esiste anche un caricamento tramite chiave API per gli account in cui l’accesso con email e password non è disponibile). Addestra lì, esporta il modello e il convertitore per NPU lo rende pronto per la camera quando la scheda lo richiede.

Vedi anche

Il capitolo sul machine learning descrive il flusso di lavoro di addestramento a cui il dataset fa da base.