ml.postprocessing.mediapipe — Google Mediapipe¶
Moduł ml.postprocessing.mediapipe zawiera post-procesory dla modeli Google Mediapipe.
klasa mediapipe_detection_postprocess – Ogólny detektor Mediapipe¶
Klasa bazowa współdzielona przez BlazeFace i BlazePalm. Dekoduje ramki ograniczające oparte na kotwicach oraz punkty kluczowe, a następnie wykonuje NMS.
- class ml.postprocessing.mediapipe.mediapipe_detection_postprocess(threshold: float = 0.6, anchors: ndarray | None = None, anchor_grid: list[tuple[int, int]] | None = None, scores: list[int] = [], cords: list[int] = [], nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Tworzy ogólny post-procesor wykrywania Mediapipe.
thresholdPróg wyniku stosowany do surowych logitów przed sigmoidą.anchorsOpcjonalna gotowa tablica kotwic o kształcie(N, 2)zawierająca środki(cx, cy)znormalizowane do[0, 1]. JeśliNone, kotwice są generowane zanchor_grid.anchor_gridLista krotek(grid_size, scales)używana do generowania kotwic, gdyanchorsma wartośćNone.scoresLista indeksów wyjść modelu zawierających tensory wyników.cordsLista indeksów wyjść modelu zawierających tensory ramek/punktów kluczowych.nms_thresholdPróg IoU dla tłumienia niemaksymalnego.nms_sigmaSigma dla zaniku wyniku soft-NMS.
klasa BlazeFace – Wykrywanie twarzy¶
Przetwarza końcowo wyjście modelu BlazeFace.
- class ml.postprocessing.mediapipe.BlazeFace(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Tworzy post-procesor BlazeFace. Używa siatki kotwic
[(16, 2), (8, 6)]z wyjściami wyników[1, 2]i wyjściami ramek[0, 3].thresholdPróg wyniku dla wykryć.anchorsOpcjonalna gotowa tablica kotwic; generowana automatycznie, jeśliNone.nms_thresholdPróg IoU dla tłumienia niemaksymalnego.nms_sigmaSigma dla zaniku wyniku soft-NMS.Zwraca listę krotek
((x, y, w, h), score, keypoints)z__call__, gdziekeypointsto lista punktów(x, y).
klasa BlazePalm – Wykrywanie dłoni¶
Przetwarza końcowo wyjście modelu BlazePalm.
- class ml.postprocessing.mediapipe.BlazePalm(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Tworzy post-procesor BlazePalm. Używa siatki kotwic
[(24, 2), (12, 6)]z wyjściami wyników[0]i wyjściami ramek[1].thresholdPróg wyniku dla wykryć.anchorsOpcjonalna gotowa tablica kotwic; generowana automatycznie, jeśliNone.nms_thresholdPróg IoU dla tłumienia niemaksymalnego.nms_sigmaSigma dla zaniku wyniku soft-NMS.Zwraca listę krotek
((x, y, w, h), score, keypoints)z__call__, gdziekeypointsto lista punktów(x, y).
klasa FaceLandmarks – Punkty charakterystyczne twarzy¶
Przetwarza końcowo wyjście modelu FaceLandmarks.
- class ml.postprocessing.mediapipe.FaceLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Tworzy post-procesor FaceLandmarks.
thresholdPróg wyniku (po sigmoidzie) dla zaakceptowania wykrycia.nms_thresholdPróg IoU dla tłumienia niemaksymalnego.nms_sigmaSigma dla zaniku wyniku soft-NMS.Zwraca listę krotek
((x, y, w, h), score, keypoints)z__call__, gdziekeypointsto lista punktów(x, y, z).
klasa HandLandmarks – Punkty charakterystyczne dłoni¶
Przetwarza końcowo wyjście modelu HandLandmarks.
- class ml.postprocessing.mediapipe.HandLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Tworzy post-procesor HandLandmarks.
thresholdPróg wyniku dla zaakceptowania wykrycia.nms_thresholdPróg IoU dla tłumienia niemaksymalnego.nms_sigmaSigma dla zaniku wyniku soft-NMS.Zwraca
[[((x, y, w, h), score, keypoints)]]z__call__, z jedną wewnętrzną listą na każdą klasę ręczności (lewa=0, prawa=1).keypointsto lista punktów(x, y, z). Puste listy klas są zachowywane, aby indeks każdej listy odpowiadał indeksowi klasy.
klasa MoveNet – Estymacja pozy¶
Przetwarza końcowo wyjście modelu MoveNet dla pojedynczej pozy.
- class ml.postprocessing.mediapipe.MoveNet(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Tworzy post-procesor MoveNet.
thresholdPróg pewności dla pojedynczego punktu kluczowego; punkty kluczowe poniżej tej wartości są wykluczane z ramki ograniczającej i ze średniego wyniku.nms_thresholdPróg IoU dla tłumienia niemaksymalnego.nms_sigmaSigma dla zaniku wyniku soft-NMS.Zwraca listę krotek
((x, y, w, h), score, keypoints)z__call__, gdziekeypointsto lista punktów(x, y, score)we współrzędnych pikseli wejściowych.