ml.postprocessing.mediapipe — Google Mediapipe¶
Modulul ml.postprocessing.mediapipe conține post-procesoare pentru modelele Google Mediapipe.
class mediapipe_detection_postprocess – Detector Mediapipe generic¶
Clasă de bază partajată de BlazeFace și BlazePalm. Decodează casetele de încadrare și punctele-cheie bazate pe ancore, apoi efectuează NMS.
- class ml.postprocessing.mediapipe.mediapipe_detection_postprocess(threshold: float = 0.6, anchors: ndarray | None = None, anchor_grid: list[tuple[int, int]] | None = None, scores: list[int] = [], cords: list[int] = [], nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Creează un post-procesor generic de detectare Mediapipe.
thresholdPragul de scor aplicat logiturilor brute înainte de sigmoid.anchorsTablou de ancore preconstruit opțional, de formă(N, 2), care conține centrele(cx, cy)normalizate la[0, 1]. Dacă esteNone, ancorele sunt generate dinanchor_grid.anchor_gridListă de tupluri(grid_size, scales)folosită pentru a genera ancore cândanchorsesteNone.scoresLista de indici de ieșire ai modelului care conțin tensori de scor.cordsLista de indici de ieșire ai modelului care conțin tensori de casetă/punct-cheie.nms_thresholdPragul IoU pentru suprimarea non-maximelor.nms_sigmaSigma pentru atenuarea scorului în soft-NMS.
class BlazeFace – Detectare facială¶
Post-procesează ieșirea modelului BlazeFace.
- class ml.postprocessing.mediapipe.BlazeFace(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Creează un post-procesor BlazeFace. Folosește o grilă de ancore
[(16, 2), (8, 6)]cu ieșiri de scor[1, 2]și ieșiri de casetă[0, 3].thresholdPragul de scor pentru detectări.anchorsTablou de ancore preconstruit opțional; generat automat dacă esteNone.nms_thresholdPragul IoU pentru suprimarea non-maximelor.nms_sigmaSigma pentru atenuarea scorului în soft-NMS.Returnează o listă de tupluri
((x, y, w, h), score, keypoints)din__call__, undekeypointseste o listă de puncte(x, y).
class BlazePalm – Detectare palmă¶
Post-procesează ieșirea modelului BlazePalm.
- class ml.postprocessing.mediapipe.BlazePalm(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Creează un post-procesor BlazePalm. Folosește o grilă de ancore
[(24, 2), (12, 6)]cu ieșiri de scor[0]și ieșiri de casetă[1].thresholdPragul de scor pentru detectări.anchorsTablou de ancore preconstruit opțional; generat automat dacă esteNone.nms_thresholdPragul IoU pentru suprimarea non-maximelor.nms_sigmaSigma pentru atenuarea scorului în soft-NMS.Returnează o listă de tupluri
((x, y, w, h), score, keypoints)din__call__, undekeypointseste o listă de puncte(x, y).
class FaceLandmarks – Repere faciale¶
Post-procesează ieșirea modelului FaceLandmarks.
- class ml.postprocessing.mediapipe.FaceLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Creează un post-procesor FaceLandmarks.
thresholdPragul de scor (după sigmoid) pentru acceptarea unei detectări.nms_thresholdPragul IoU pentru suprimarea non-maximelor.nms_sigmaSigma pentru atenuarea scorului în soft-NMS.Returnează o listă de tupluri
((x, y, w, h), score, keypoints)din__call__, undekeypointseste o listă de puncte(x, y, z).
class HandLandmarks – Repere ale mâinii¶
Post-procesează ieșirea modelului HandLandmarks.
- class ml.postprocessing.mediapipe.HandLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Creează un post-procesor HandLandmarks.
thresholdPragul de scor pentru acceptarea unei detectări.nms_thresholdPragul IoU pentru suprimarea non-maximelor.nms_sigmaSigma pentru atenuarea scorului în soft-NMS.Returnează
[[((x, y, w, h), score, keypoints)]]din__call__, cu o listă internă pentru fiecare clasă de lateralitate (stânga=0, dreapta=1).keypointseste o listă de puncte(x, y, z). Listele de clasă goale sunt păstrate astfel încât indicele fiecărei liste să corespundă indicelui de clasă.
class MoveNet – Estimarea posturii¶
Post-procesează ieșirea modelului MoveNet pentru o singură postură.
- class ml.postprocessing.mediapipe.MoveNet(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)¶
Creează un post-procesor MoveNet.
thresholdPragul de încredere per punct-cheie; punctele-cheie sub această valoare sunt excluse din caseta de încadrare și din scorul mediu.nms_thresholdPragul IoU pentru suprimarea non-maximelor.nms_sigmaSigma pentru atenuarea scorului în soft-NMS.Returnează o listă de tupluri
((x, y, w, h), score, keypoints)din__call__, undekeypointseste o listă de puncte(x, y, score)în coordonate de pixeli de intrare.