7. Învățarea automată¶

Majoritatea detectoarelor din capitolul despre imagine au fost codate manual pentru o țintă specifică: intervale de culoare reglate manual pentru urmărirea blob-urilor, tipare de ponderi derivate manual pentru filtrele de muchii, presupuneri geometrice fixe pentru detectoarele de linii și cercuri. Fiecare algoritm acoperea un singur tip de sarcină, iar adăugarea unei noi ținte însemna scrierea unui nou algoritm. Învățarea automată schimbă fluxul de lucru. În loc de un algoritm pentru fiecare țintă, aplicația încarcă un model antrenat – o stivă de ponderi produsă în afara plăcii pe un desktop cu numeroase imagini exemplu – și îl rulează pe cameră. Același motor care rulează un detector de fețe rulează un estimator de poziție a mâinii, un urmăritor de poziție a corpului, un clasificator de obiecte sau orice altceva pentru care a fost antrenat un model.

Modulul ml este setul de instrumente. Fiecare operație se construiește pe un singur obiect Model care încarcă un fișier de model din memoria flash, gestionează tensorii săi cuantizați de intrare și ieșire, dirijează fiecare inferență către motorul potrivit de pe cameră și direcționează tensorii rezultați printr-un post-procesor opțional care îi convertește înapoi în forma de rezultat asupra căreia poate acționa aplicația – casete, puncte-cheie, clase sau orice altceva pentru care este destinat modelul.

Concepte

Modulul ml

Fluxul de lucru al inferenței

Motoare de inferență

Decodarea ieșirii

Încheiere

7.16. Recapitulare