Le logiciel d’IA écrit et réécrit son propre code, devenant ainsi plus intelligent

Le logiciel d’IA écrit et réécrit son propre code, devenant ainsi plus intelligent

26 août 2021 0 Par Le Caiman
Une application développée par Gamalon reconnaît les choses après avoir vu quelques exemples. Un programme d’apprentissage identifie des concepts plus simples tels que les lignes et les rectangles.

L’apprentissage automatique devient petit à petit très puissant. Cependant, il nécessite d’énormes quantités de données.

Avec cette application, vous pouvez, par exemple, entraîner un algorithme de deep learning pour identifier un chat avec un niveau d' »expertise » félin, mais vous devrez le nourrir des dizaines, voire des centaines de milliers d’images de félins, avec une grande variété de taille, forme, texture, éclairage et orientation. Ce serait beaucoup plus efficace si un algorithme, comme un humain, pouvait développer une idée de ce qui fait un chat à partir de moins d’exemples.

Ainsi, startup basée à Boston Gamalon a développée une technologie qui permet aux ordinateurs de le faire dans certains cas, et a lancé mardi 24 aout deux produits basés sur cette approche.

Si la technique de base peut être appliquée à de nombreuses autres tâches, elle peut alors y avoir un impact important. La capacité d’apprendre à partir de moins de données pourrait permettre aux robots d’explorer et de comprendre de nouveaux environnements très rapidement, ou permettre aux ordinateurs de connaître vos préférences sans partager vos données.

Réseau et inférence bayésienne

Gamalon utilise une technique qu’il appelle la synthèse de programme bayésienne pour construire des algorithmes capables d’apprendre à partir de moins d’exemples. La probabilité bayésienne, du nom du mathématicien du XVIIIe siècle Thomas Bayes, fournit un cadre mathématique pour affiner les prédictions sur le monde basées sur l’expérience. Le système Gamalon utilise une programmation probabiliste – ou un code qui traite des probabilités plutôt que des variables spécifiques – pour construire un modèle prédictif qui explique un ensemble de données particulier.

À partir de quelques exemples, un programme de probabilité peut déterminer, par exemple, que les chats sont très susceptibles d’avoir des oreilles, des moustaches et des queues. Au fur et à mesure que des exemples supplémentaires sont fournis, le code derrière le modèle est réécrit et les probabilités sont modifiées. Cela fournit un moyen efficace d’apprendre les informations importantes à partir des données.

Les techniques de programmation probables existent depuis un certain temps. En 2015, par exemple, le personnel du MIT et de la NYU a utilisé des méthodes de probabilité pour que les ordinateurs apprennent à reconnaître des caractères et des objets écrits après avoir vu un exemple (voir «Cet algorithme d’IA apprend des tâches simples aussi vite que nous»). Mais l’approche était en grande partie la curiosité académique.

Les défis informatiques sont difficiles à surmonter, car le programme nécessite de nombreuses explications différentes qui peuvent être envisagées, dit Loch Brenden, membre de la recherche à NYU qui a dirigé les travaux de 2015.

Pourtant, en théorie, dit Lake, l’approche a un potentiel important. En effet elle peut automatiser certains aspects du développement de modèles d’apprentissage automatique.

« La programmation probable rendra l’apprentissage automatique beaucoup plus facile pour les chercheurs et les praticiens »

déclare-t-il et ajoute :

« Cette IA a la capacité de s’occuper des tâches difficiles de programmation de manière automatique. « 

Le deep learning ou apprentissage automatique d’aujourd’hui… et de demain

Il existe certainement des incitations importantes à développer des approches d’apprentissage automatique plus faciles à utiliser et moins gourmandes. De nos jours, l’apprentissage automatique consiste à obtenir un grand nombre de données brutes, puis à les étiqueter manuellement. L’apprentissage se déroule ensuite dans de grands centres de données, en utilisant de nombreux processeurs informatiques qui s’écrasent en parallèle pendant des heures ou des jours.

« Il n’y a que quelques très grandes entreprises qui peuvent se permettre de le faire »

déclare Ben Vigoda, cofondateur et PDG de Gamalon.

 

En théorie, l’approche de Gamalon pourrait également permettre à une personne de créer et d’affiner beaucoup plus facilement un modèle d’apprentissage automatique. La création d’un algorithme d’apprentissage en profondeur nécessite beaucoup d’expertise en mathématiques et en apprentissage automatique.

« C’est tout un art de mettre en place ces systèmes »,

dit Vigoda.

Avec l’approche de Gamalon, un programmeur pourrait entraîner un modèle en alimentant des échantillons significatifs.

Vigoda s’est présenté au fameux Examen de la technologie du MIT une démo avec une application de dessin qui utilise la technique. C’est similaire à celui publié par Google l’année dernière, qui utilise le deep learning (ou l’apprentissage en profondeur) pour identifier l’objet que l’on veut esquisser (voir «Vous voulez comprendre l’IA ? Essayez Duck Sketching pour un réseau neurologique»).

Mais alors que l’application de Google a besoin de voir un croquis qui correspond à ceux qu’elle a vus auparavant, la version Gamalon utilise un programme de probabilité pour identifier les principales caractéristiques d’un objet. Par exemple, un programme réalise qu’un triangle placé au sommet d’un carré est plus susceptible d’être une maison. Cela signifie que même si votre croquis est très différent de ce qu’il a vu auparavant, à condition qu’il présente ces caractéristiques, il devine juste.

 

Les Applications de cette IA

La technique pourrait également avoir d’importantes applications à court terme. Les premiers produits de la société utilisent la synthèse de programme bayésienne pour identifier les concepts dans le texte.

Un produit, appelé Gamalon Structure, peut extraire des concepts de matières premières plus efficacement qu’il n’est habituellement possible. Par exemple, il peut prendre la description du fabricant d’un téléviseur et déterminer quel produit est décrit, la marque, le nom du produit, la résolution, la taille et d’autres caractéristiques. Un autre produit, Gamalon Match, est utilisé pour catégoriser les produits et les prix dans l’inventaire du magasin. Dans tous les cas, même lorsque différents acronymes ou abréviations sont utilisés pour un produit ou une fonctionnalité, le système peut être rapidement formé pour les reconnaître.

Vigoda pense que la capacité d’apprentissage aura d’autres avantages pratiques. Un ordinateur pourrait connaître les intérêts d’un utilisateur sans avoir besoin d’une quantité pratique de données ou d’heures de formation. Il n’est peut-être pas nécessaire de partager des données personnelles avec de grandes entreprises, si l’apprentissage automatique peut être effectué efficacement sur le smartphone ou l’ordinateur portable d’un utilisateur. Et un robot ou une voiture autonome pourrait découvrir un nouvel obstacle sans vouloir voir des centaines de milliers d’exemples.