ml.postprocessing.mediapipe — Google Mediapipe¶
Модуль ml.postprocessing.mediapipe содержит постпроцессоры для моделей Google Mediapipe.
class mediapipe_detection_postprocess – Универсальный детектор Mediapipe¶
Базовый класс, общий для BlazeFace и BlazePalm. Декодирует ограничивающие рамки и ключевые точки на основе опорных рамок, затем выполняет NMS.
- class ml.postprocessing.mediapipe.mediapipe_detection_postprocess(threshold: float = 0.6, anchors: ndarray | None = None, anchor_grid: list[tuple[int, int]] | None = None, scores: list[int] = [], cords: list[int] = [], nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Создаёт универсальный постпроцессор обнаружения Mediapipe.
thresholdПорог оценки, применяемый к необработанным логитам перед сигмоидой.anchorsНеобязательный заранее построенный массив опорных рамок формы(N, 2), содержащий центры(cx, cy), нормализованные к[0, 1]. ЕслиNone, опорные рамки генерируются изanchor_grid.anchor_gridСписок кортежей(grid_size, scales), используемых для генерации опорных рамок, когдаanchorsравноNone.scoresСписок индексов выходов модели, содержащих тензоры оценок.cordsСписок индексов выходов модели, содержащих тензоры рамок/ключевых точек.nms_thresholdПорог IoU для подавления немаксимумов.nms_sigmaСигма для затухания оценок soft-NMS.
class BlazeFace – Обнаружение лиц¶
Выполняет постобработку выхода модели BlazeFace.
- class ml.postprocessing.mediapipe.BlazeFace(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Создаёт постпроцессор BlazeFace. Использует сетку опорных рамок
[(16, 2), (8, 6)]с выходами оценок[1, 2]и выходами рамок[0, 3].thresholdПорог оценки для обнаружений.anchorsНеобязательный заранее построенный массив опорных рамок; генерируется автоматически, еслиNone.nms_thresholdПорог IoU для подавления немаксимумов.nms_sigmaСигма для затухания оценок soft-NMS.Возвращает список кортежей
((x, y, w, h), score, keypoints)из__call__, гдеkeypoints— это список точек(x, y).
class BlazePalm – Обнаружение ладоней¶
Выполняет постобработку выхода модели BlazePalm.
- class ml.postprocessing.mediapipe.BlazePalm(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Создаёт постпроцессор BlazePalm. Использует сетку опорных рамок
[(24, 2), (12, 6)]с выходами оценок[0]и выходами рамок[1].thresholdПорог оценки для обнаружений.anchorsНеобязательный заранее построенный массив опорных рамок; генерируется автоматически, еслиNone.nms_thresholdПорог IoU для подавления немаксимумов.nms_sigmaСигма для затухания оценок soft-NMS.Возвращает список кортежей
((x, y, w, h), score, keypoints)из__call__, гдеkeypoints— это список точек(x, y).
class FaceLandmarks – Точки лица¶
Выполняет постобработку выхода модели FaceLandmarks.
- class ml.postprocessing.mediapipe.FaceLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Создаёт постпроцессор FaceLandmarks.
thresholdПорог оценки (после сигмоиды) для принятия обнаружения.nms_thresholdПорог IoU для подавления немаксимумов.nms_sigmaСигма для затухания оценок soft-NMS.Возвращает список кортежей
((x, y, w, h), score, keypoints)из__call__, гдеkeypoints— это список точек(x, y, z).
class HandLandmarks – Точки руки¶
Выполняет постобработку выхода модели HandLandmarks.
- class ml.postprocessing.mediapipe.HandLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Создаёт постпроцессор HandLandmarks.
thresholdПорог оценки для принятия обнаружения.nms_thresholdПорог IoU для подавления немаксимумов.nms_sigmaСигма для затухания оценок soft-NMS.Возвращает
[[((x, y, w, h), score, keypoints)]]из__call__, с одним внутренним списком на каждый класс принадлежности руки (левая=0, правая=1).keypoints— это список точек(x, y, z). Пустые списки классов сохраняются, чтобы индекс каждого списка соответствовал индексу класса.
class MoveNet – Оценка позы¶
Выполняет постобработку выхода модели MoveNet single-pose.
- class ml.postprocessing.mediapipe.MoveNet(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Создаёт постпроцессор MoveNet.
thresholdПорог уверенности для каждой ключевой точки; ключевые точки ниже этого значения исключаются из ограничивающей рамки и средней оценки.nms_thresholdПорог IoU для подавления немаксимумов.nms_sigmaСигма для затухания оценок soft-NMS.Возвращает список кортежей
((x, y, w, h), score, keypoints)из__call__, гдеkeypoints— это список точек(x, y, score)в координатах пикселей входа.