Vision : Le framework de reconnaissance de CoreML

Qu’est-ce que Vision?

Vision est le nouveau framework d’iOS 11 et des autres plateformes Apple. Vision fait partie du framework Core ML. CoreML permet de confronter facilement des modèles machines learning  avec des données afin d’obtenir les prédictions.  Le framework Vision framework aide à alimenter les modèles machine learning qui traitent les images. Vision peut traiter en live le flux de la caméra et extraire les informations de chaque image en utilisant à la fois les modèles de machine learning embarqués et externes.

Ce que permet Vision

Vision offre un grand nombre de fonctionnalités :

  • Reconnaissance de visage
  • Reconnaissance partielle comme le nez, la bouche, l’oeil gauche, etc
  • Détection de l’horizon
  • Détection de rectangle
  • Tracking d’objets
  • Reconnaissance d’objets via des modèles machine learning externes

Tutoriel en Swift sur Vision

 

Un exemple de projet en Swift utilisant Vision :

https://github.com/jeffreybergier/Blog-Getting-Started-with-Vision