13.1.17. Редактор наборов данных¶
Обучение пользовательского классификатора начинается с размеченного набора данных – сотен изображений каждого объекта, который модель должна распознавать, захваченных камерой, которая будет его запускать, и рассортированных по одной папке на класс. Редактор наборов данных – это рабочий процесс захвата в IDE для создания такого набора.
Tools → Dataset Editor → New Dataset запрашивает папку для построения набора данных в ней – предупреждая, что содержимое непустой папки будет удалено – и настраивает её: панель файлового браузера прикрепляется слева от главного окна, а скрипт захвата (dataset_capture_script.py) открывается в редакторе. Скрипт представляет собой простой цикл захвата, и он предназначен для редактирования – примените ту же коррекцию объектива, кадрирование или фильтрацию, которые будет использовать развёрнутое приложение, чтобы модель обучалась на тех изображениях, которые она действительно увидит. Open Dataset позже снова открывает существующую папку набора данных, а Close Dataset возвращает окно в обычный вид.
13.1.17.1. Захват¶
Пока набор данных открыт, к панели инструментов на левом крае окна, под элементами управления запуском, добавляются две кнопки. New Class Folder (Ctrl+Shift+N) создаёт класс – по одному на каждую категорию, которую модель должна выучить, названный по метке. Когда скрипт захвата работает и выбрана папка класса, Capture Data (Ctrl+Shift+S) сохраняет текущее изображение из буфера кадра в этот класс, а панель предпросмотра под файловым браузером показывает каждый захват по мере его поступления.
Ритм захвата таков: выберите класс, наведите камеру на пример этого класса, захватите; переместите объект, измените угол, расстояние, фон, освещение, захватите снова – именно вариативность в наборе данных обеспечивает устойчивость модели. Повторите для каждого класса, включая фоновый класс из сцен, не содержащих ни одной из целей, если приложению нужно знать, когда ничего нет.
13.1.17.2. Экспорт и обучение¶
Подменю Export отправляет готовый набор данных на обучение. Export Dataset to Zip File упаковывает его в архив с именами файлов, содержащими префикс класса – нейтральный формат, который принимает каждый сервис и фреймворк обучения. Для Edge Impulse IDE интегрируется напрямую: войдите в учётную запись Edge Impulse из того же подменю, и Upload to Edge Impulse Project отправит набор данных прямо в проект (для учётных записей, где вход по email и паролю невозможен, существует загрузка по API-ключу). Обучите модель там, экспортируйте её, и конвертер NPU подготовит её для камеры, когда плате это потребуется.
См. также
Глава о машинном обучении о рабочем процессе обучения, в который поступает набор данных.