ml.postprocessing.mediapipe --- Google Mediapipe

تحتوي الوحدة ml.postprocessing.mediapipe على معالجات لاحقة لنماذج Google Mediapipe.

class mediapipe_detection_postprocess -- كاشف Mediapipe عام

فئة أساسية مشتركة بين BlazeFace وBlazePalm. تفك ترميز مربعات الإحاطة والنقاط المفتاحية المعتمدة على مربعات الإرساء، ثم تنفذ الكبح غير الأقصى (NMS).

class ml.postprocessing.mediapipe.mediapipe_detection_postprocess(threshold: float = 0.6, anchors: ndarray | None = None, anchor_grid: list[tuple[int, int]] | None = None, scores: list[int] = [], cords: list[int] = [], nms_threshold: float = 0.1, nms_sigma: float = 0.1)

إنشاء معالجة لاحقة عامة لكشف Mediapipe.

threshold عتبة الدرجة المطبَّقة على اللوغاريتمات الخام (logits) قبل دالة sigmoid.

anchors مصفوفة مربعات إرساء اختيارية مُجهَّزة مسبقًا بشكل (N, 2) تحتوي على المراكز (cx, cy) المُطبَّعة إلى [0, 1]. إذا كانت None، تُولَّد مربعات الإرساء من anchor_grid.

anchor_grid قائمة من الصفوف (grid_size, scales) تُستخدم لتوليد مربعات الإرساء عندما تكون anchors بقيمة None.

scores قائمة بفهارس إخراج النموذج التي تحتوي على موترات الدرجات.

cords قائمة بفهارس إخراج النموذج التي تحتوي على موترات المربعات/النقاط المفتاحية.

nms_threshold عتبة IoU للكبح غير الأقصى.

nms_sigma سيغما لاضمحلال درجة soft-NMS.

__call__(model: ml.Model, inputs: list, outputs: list) list

يجري المعالجة اللاحقة على مخرجات النموذج ويُرجع قائمة من الصفوف ((x, y, w, h), score, keypoints). يُرجع صفًا فارغًا () عندما لا يتجاوز أي كشف عتبة الدرجة.

detection_post_process(ih: int, iw: int, nms: ml.utils.NMS, model: ml.Model, inputs: list, outputs: list, score_idx: int, cords_idx: int, t: float, anchors: ndarray) None

يفك ترميز ويضيف مربعات الإحاطة من زوج إخراج واحد (score, cords) إلى مُجمِّع NMS المُوفَّر.

class BlazeFace -- كشف الوجه

يُجري المعالجة اللاحقة لمخرجات نموذج BlazeFace.

class ml.postprocessing.mediapipe.BlazeFace(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

إنشاء معالجة لاحقة لـ BlazeFace. تستخدم شبكة مربعات إرساء [(16, 2), (8, 6)] مع مخرجات درجات [1, 2] ومخرجات مربعات [0, 3].

threshold عتبة الدرجة للكشوفات.

anchors مصفوفة مربعات إرساء اختيارية مُجهَّزة مسبقًا؛ تُولَّد تلقائيًا إذا كانت None.

nms_threshold عتبة IoU للكبح غير الأقصى.

nms_sigma سيغما لاضمحلال درجة soft-NMS.

يُرجع قائمة من الصفوف ((x, y, w, h), score, keypoints) من __call__، حيث keypoints هي قائمة من نقاط (x, y).

class BlazePalm -- كشف الكف

يُجري المعالجة اللاحقة لمخرجات نموذج BlazePalm.

class ml.postprocessing.mediapipe.BlazePalm(threshold: float = 0.6, anchors: ndarray | None = None, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

إنشاء معالجة لاحقة لـ BlazePalm. تستخدم شبكة مربعات إرساء [(24, 2), (12, 6)] مع مخرجات درجات [0] ومخرجات مربعات [1].

threshold عتبة الدرجة للكشوفات.

anchors مصفوفة مربعات إرساء اختيارية مُجهَّزة مسبقًا؛ تُولَّد تلقائيًا إذا كانت None.

nms_threshold عتبة IoU للكبح غير الأقصى.

nms_sigma سيغما لاضمحلال درجة soft-NMS.

يُرجع قائمة من الصفوف ((x, y, w, h), score, keypoints) من __call__، حيث keypoints هي قائمة من نقاط (x, y).

class FaceLandmarks -- معالم الوجه

يُجري المعالجة اللاحقة لمخرجات نموذج FaceLandmarks.

class ml.postprocessing.mediapipe.FaceLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

إنشاء معالجة لاحقة لـ FaceLandmarks.

threshold عتبة الدرجة (بعد sigmoid) لقبول كشف ما.

nms_threshold عتبة IoU للكبح غير الأقصى.

nms_sigma سيغما لاضمحلال درجة soft-NMS.

يُرجع قائمة من الصفوف ((x, y, w, h), score, keypoints) من __call__، حيث keypoints هي قائمة من نقاط (x, y, z).

class HandLandmarks -- معالم اليد

يُجري المعالجة اللاحقة لمخرجات نموذج HandLandmarks.

class ml.postprocessing.mediapipe.HandLandmarks(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

إنشاء معالجة لاحقة لـ HandLandmarks.

threshold عتبة الدرجة لقبول كشف ما.

nms_threshold عتبة IoU للكبح غير الأقصى.

nms_sigma سيغما لاضمحلال درجة soft-NMS.

يُرجع [[((x, y, w, h), score, keypoints)]] من __call__، مع قائمة داخلية واحدة لكل فئة يَدَوِيّة (يسار=0، يمين=1). keypoints هي قائمة من نقاط (x, y, z). تُحفَظ قوائم الفئات الفارغة بحيث يطابق فهرس كل قائمة فهرس الفئة.

class MoveNet -- تقدير الوضعية

يُجري المعالجة اللاحقة لمخرجات نموذج MoveNet أحادي الوضعية.

class ml.postprocessing.mediapipe.MoveNet(threshold: float = 0.6, nms_threshold: float = 0.1, nms_sigma: float = 0.1)

إنشاء معالجة لاحقة لـ MoveNet.

threshold عتبة الثقة لكل نقطة مفتاحية؛ تُستبعد النقاط المفتاحية الأقل من هذه القيمة من مربع الإحاطة ومن الدرجة المتوسطة.

nms_threshold عتبة IoU للكبح غير الأقصى.

nms_sigma سيغما لاضمحلال درجة soft-NMS.

يُرجع قائمة من الصفوف ((x, y, w, h), score, keypoints) من __call__، حيث keypoints هي قائمة من نقاط (x, y, score) بإحداثيات بكسل الإدخال.