13.1.17. Edytor zbiorów danych¶
Trenowanie własnego klasyfikatora zaczyna się od etykietowanego zbioru danych – setek obrazów każdej rzeczy, którą model ma rozpoznawać, zarejestrowanych kamerą, która będzie go uruchamiać, posortowanych do jednego folderu na klasę. Edytor zbiorów danych to wbudowany w IDE proces przechwytywania służący do zbudowania takiego zbioru.
Tools → Dataset Editor → New Dataset prosi o wskazanie folderu, w którym ma powstać zbiór danych – ostrzegając, że zawartość niepustego folderu zostanie usunięta – i przygotowuje go: po lewej stronie głównego okna dokuje się panel przeglądarki plików, a w edytorze otwiera się skrypt przechwytywania (dataset_capture_script.py). Skrypt to zwykła pętla przechwytywania i jest przeznaczony do edycji – zastosuj tę samą korekcję obiektywu, kadrowanie czy filtrowanie, których użyje wdrożona aplikacja, aby model trenował na obrazach, które faktycznie zobaczy. Open Dataset ponownie otwiera istniejący folder zbioru danych później, a Close Dataset przywraca okno do normalnego stanu.
13.1.17.1. Przechwytywanie¶
Gdy zbiór danych jest otwarty, do paska narzędzi przy lewej krawędzi okna, pod elementami sterującymi uruchamianiem, dołączają dwa przyciski. New Class Folder (Ctrl+Shift+N) tworzy klasę – po jednej na każdą kategorię, której model ma się nauczyć, nazwaną według etykiety. Przy działającym skrypcie przechwytywania i zaznaczonym folderze klasy Capture Data (Ctrl+Shift+S) zapisuje bieżący obraz z bufora ramki do tej klasy, a panel podglądu pod przeglądarką plików pokazuje każde przechwycenie w chwili jego zapisania.
Rytm przechwytywania jest taki: zaznacz klasę, wyceluj kamerą w jej przykład, przechwyć; przesuń obiekt, zmień kąt, odległość, tło, oświetlenie i przechwyć ponownie – to zróżnicowanie w zbiorze danych zapewnia odporność modelu. Powtórz dla każdej klasy, włączając klasę tła ze scenami niezawierającymi żadnego z celów, jeśli aplikacja musi wiedzieć, kiedy nic tam nie ma.
13.1.17.2. Eksportowanie i trenowanie¶
Podmenu Export wysyła gotowy zbiór danych do trenowania. Export Dataset to Zip File pakuje go do archiwum z nazwami plików poprzedzonymi nazwą klasy – neutralny format akceptowany przez każdą usługę i każde środowisko treningowe. W przypadku Edge Impulse IDE integruje się bezpośrednio: zaloguj się do konta Edge Impulse z tego samego podmenu, a Upload to Edge Impulse Project prześle zbiór danych prosto do projektu (dla kont, w których logowanie przez e-mail i hasło nie jest możliwe, istnieje przesyłanie za pomocą klucza API). Wytrenuj tam model, wyeksportuj go, a konwerter NPU przygotuje go do działania na kamerze, gdy płytka tego wymaga.
Zobacz także
Rozdział o uczeniu maszynowym dotyczący procesu trenowania, który zasila zbiór danych.