ml.postprocessing.mediapipe --- Google Mediapipe

Modul ml.postprocessing.mediapipe berisi pasca-prosesor untuk model Google Mediapipe.

class mediapipe_detection_postprocess -- Generic Mediapipe Detector

Kelas dasar yang digunakan bersama oleh BlazeFace dan BlazePalm. Mendekode kotak pembatas berbasis jangkar dan titik kunci, kemudian menjalankan NMS.

class ml.postprocessing.mediapipe.mediapipe_detection_postprocess(threshold: float = 0.6, anchors: ndarray | None = None, anchor_grid: list[tuple[int, int]] | None = None, scores: list[int] = [], cords: list[int] = [], nms_threshold: float = 0.1, nms_sigma: float = 0.1)

Membuat pasca-prosesor deteksi Mediapipe generik.

threshold Ambang batas skor yang diterapkan pada logit mentah sebelum sigmoid.

anchors Array jangkar pra-bangun opsional berbentuk (N, 2) yang berisi pusat (cx, cy) yang dinormalisasi ke [0, 1]. Jika None, jangkar dibuat dari anchor_grid.

anchor_grid Daftar tuple (grid_size, scales) yang digunakan untuk menghasilkan jangkar ketika anchors adalah None.

scores Daftar indeks output model yang berisi tensor skor.

cords Daftar indeks output model yang berisi tensor kotak/titik kunci.

nms_threshold Ambang batas IoU untuk non-maximum suppression.

nms_sigma Sigma untuk penurunan skor soft-NMS.

__call__(model: ml.Model, inputs: list, outputs: list) list

Jalankan pasca-pemrosesan pada output model dan kembalikan daftar tuple ((x, y, w, h), score, keypoints). Mengembalikan tuple kosong () ketika tidak ada deteksi yang melampaui ambang batas skor.

detection_post_process(ih: int, iw: int, nms: ml.utils.NMS, model: ml.Model, inputs: list, outputs: list, score_idx: int, cords_idx: int, t: float, anchors: ndarray) None

Dekode dan tambahkan kotak pembatas dari satu pasang output (score, cords) ke dalam akumulator NMS yang disediakan.

class BlazeFace -- Face Detection

Pasca-pemrosesan output model BlazeFace.

class ml.postprocessing.mediapipe.BlazeFace(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

Membuat pasca-prosesor BlazeFace. Menggunakan anchor grid [(16, 2), (8, 6)] dengan output skor [1, 2] dan output kotak [0, 3].

threshold Ambang batas skor untuk deteksi.

anchors Array jangkar pra-bangun opsional; dibuat secara otomatis jika None.

nms_threshold Ambang batas IoU untuk non-maximum suppression.

nms_sigma Sigma untuk penurunan skor soft-NMS.

Mengembalikan daftar tuple ((x, y, w, h), score, keypoints) dari __call__, di mana keypoints adalah daftar titik (x, y).

class BlazePalm -- Palm Detection

Pasca-pemrosesan output model BlazePalm.

class ml.postprocessing.mediapipe.BlazePalm(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

Membuat pasca-prosesor BlazePalm. Menggunakan anchor grid [(24, 2), (12, 6)] dengan output skor [0] dan output kotak [1].

threshold Ambang batas skor untuk deteksi.

anchors Array jangkar pra-bangun opsional; dibuat secara otomatis jika None.

nms_threshold Ambang batas IoU untuk non-maximum suppression.

nms_sigma Sigma untuk penurunan skor soft-NMS.

Mengembalikan daftar tuple ((x, y, w, h), score, keypoints) dari __call__, di mana keypoints adalah daftar titik (x, y).

class FaceLandmarks -- Face Landmarks

Pasca-pemrosesan output model FaceLandmarks.

class ml.postprocessing.mediapipe.FaceLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

Membuat pasca-prosesor FaceLandmarks.

threshold Ambang batas skor (setelah sigmoid) untuk menerima deteksi.

nms_threshold Ambang batas IoU untuk non-maximum suppression.

nms_sigma Sigma untuk penurunan skor soft-NMS.

Mengembalikan daftar tuple ((x, y, w, h), score, keypoints) dari __call__, di mana keypoints adalah daftar titik (x, y, z).

class HandLandmarks -- Hand Landmarks

Pasca-pemrosesan output model HandLandmarks.

class ml.postprocessing.mediapipe.HandLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

Membuat pasca-prosesor HandLandmarks.

threshold Ambang batas skor untuk menerima deteksi.

nms_threshold Ambang batas IoU untuk non-maximum suppression.

nms_sigma Sigma untuk penurunan skor soft-NMS.

Mengembalikan [[((x, y, w, h), score, keypoints)]] dari __call__, dengan satu daftar dalam per kelas tangan (kiri=0, kanan=1). keypoints adalah daftar titik (x, y, z). Daftar kelas yang kosong tetap disertakan agar indeks setiap daftar sesuai dengan indeks kelas.

class MoveNet -- Pose Estimation

Pasca-pemrosesan output model MoveNet single-pose.

class ml.postprocessing.mediapipe.MoveNet(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

Membuat pasca-prosesor MoveNet.

threshold Ambang batas keyakinan per-titik kunci; titik kunci di bawah nilai ini dikecualikan dari kotak pembatas dan skor rata-rata.

nms_threshold Ambang batas IoU untuk non-maximum suppression.

nms_sigma Sigma untuk penurunan skor soft-NMS.

Mengembalikan daftar tuple ((x, y, w, h), score, keypoints) dari __call__, di mana keypoints adalah daftar titik (x, y, score) dalam koordinat piksel input.