ml.apps — יישומי ML¶
המודול ml.apps מכיל מחלקות יישומי ML ברמה גבוהה הבנויות על גבי ml.Model.
class MicroSpeech – זיהוי דיבור¶
אובייקט ה-MicroSpeech מזהה מילים מדוברות פשוטות באמצעות מודל ה-MicroSpeech מ-TensorFlow Lite for Microcontrollers. מודל ברירת המחדל מזהה "Yes" ו-"No".
- class ml.apps.MicroSpeech(preprocessor: ml.Model = None, micro_speech: ml.Model = None, labels: list[str] = None, **kwargs)¶
יוצר אובייקט MicroSpeech.
preprocessorהוא ה-ml.Modelשל עיבוד-המקדים של השמע. אםNone, נטען/rom/audio_preprocessor.tflite.micro_speechהוא ה-ml.Modelשל זיהוי הדיבור. אםNone, נטען/rom/micro_speech.tflite.labelsהיא רשימת מחרוזות תוויות התואמות לקטגוריות הפלט של המודל. אםNone, התוויות נלקחות מ-micro_speech.labels.כל ארגומנט מילת-מפתח נוסף מועבר אל
audio.init()(ההתקן ההיקפי של השמע מאותחל עםchannels=1,frequency=16000, ו-samples=320).- audio_callback(buf: bytes) None¶
פונקציית callback פנימית להזרמת שמע. מצרפת דגימות חדשות מ-
bufאל חוצץ השמע המתגלגל, מעדכנת את הספקטרוגרמה על ידי הרצת מודל ה-preprocessorעל החלון העדכני ביותר, ומעדכנת את היסטוריית התחזיות על ידי הרצת מודל ה-micro_speechעל הספקטרוגרמה. בדרך כלל אינה נקראת ישירות.
- start_audio_streaming() None¶
מנקה את הספקטרוגרמה ואת היסטוריית התחזיות, ואז מתחיל הזרמת שמע עם
MicroSpeech.audio_callbackכ-callback. ללא פעולה אם ההזרמה כבר התחילה.
- listen(timeout: int = 0, callback: callable = None, threshold: float = 0.65, filter: list[str] = ['Yes', 'No']) tuple[str, numpy.ndarray]¶
מאזין למילה מדוברת ומחזיר רכיב צמד (tuple) של
(label, average_scores)ברגע שמזוהה תווית שהציון הממוצע שלה מעלthresholdוהיא כלולה ב-filter. קורא ל-MicroSpeech.start_audio_streamingאם עדיין אין הזרמה.timeoutהוא הזמן המרבי במילישניות להאזנה. אם0, מאזין ללא הגבלה עד לזיהוי מילה. אם-1, פועל במצב לא-חוסם ומחזיר מיד(None, average_scores)אם לא זוהתה מילה; הזרמת השמע נשארת פעילה. עבור כל ערך חיובי, מאזין למשך כמות זו של מילישניות ואז מחזיר(None, average_scores)בתום פרק הזמן.callbackהוא callable אופציונלי המופעל כ-callback(label, average_scores)כאשר מזוהה מילה במקום להחזיר. בשילוב עםtimeout=0, מאפשר זיהוי רציף.thresholdהוא הביטחון הממוצע המינימלי הנדרש כדי לקבל זיהוי.filterהיא רשימת מחרוזות התוויות לקבלה. זיהויים מחוץ לרשימה זו מתעלמים מהם.