Voir plus
Voir moins

Un nouvel algorithme

Abdoulaye Banire Diallo et le stagiaire postdoctoral Wajdi Dhifli remportent un prix lors d’une conférence sur l’apprentissage automatique. 

Par Pierre-Etienne Caza

20 septembre 2016 à 12 h 09

Mis à jour le 7 juin 2022 à 10 h 23

Photo: iStock

Le professeur Abdoulaye Banire Diallo, du Département d’informatique, et le stagiaire postdoctoral Wajdi Dhifli ont remporté le Prix du meilleur article et de la meilleure présentation décerné dans le cadre de la conférence internationale en apprentissage automatique et fouille de données (International Conference on Machine Learning and Data Mining), qui avait lieu l’été dernier à New York. Leur article s’intitule «Toward an Efficient Multi-Class Classification in an Open Universe».

Abdoulaye Banire Diallo

«La classification est un problème central de l’apprentissage automatique (machine learning) et de l’intelligence artificielle», explique Abdoulaye Banire Diallo. Une règle de classification est un acte cognitif ou une procédure permettant d’affecter à un objet l’étiquette du groupe auquel il appartient, autrement dit de le reconnaître. C’est ainsi qu’un enfant apprend à classer les animaux domestiques en «chiens» ou  «chats», les plats en «salé» ou «sucré». De même, les ordinateurs sont capables, grâce à un programme d’apprentissage automatique qui leur permet d’apprendre des règles, de classer des sons ou des signaux biomédicaux, par exemple.

«Toutes les procédures qui simulent des fonctions perceptives doivent évidemment posséder des capacités de généralisation, c’est-à-dire être munies de la faculté d’induction, sans quoi elles ne seraient capables de reconnaître que les exemples qui ont servi à les entraîner», précise le chercheur.

Wajdi Dhifli

Les algorithmes de classification automatique existants doivent donc être en mesure «d’apprendre» à partir d’exemples représentant toutes les classes possibles. «C’est irréaliste dans les domaines où l’hypothèse d’un “ensemble fermé” de classes possibles est invalide, mentionne Abdoulaye Banire Diallo. En plus, grâce à l’augmentation phénoménale des volumes de données dans pratiquement tous les domaines, les exemples d’apprentissage qu’on est capable de fournir à ces algorithmes ne représentent qu’une fraction de l’univers des possibilités.»

Le professeur Diallo et son stagiaire ont proposé un nouvel algorithme de classification, nommé “Galaxy-X”, qui solutionne ces deux derniers problèmes. «Contrairement aux algorithmes de classification existants, Galaxy-X se base sur l’hypothèse d’un “ensemble ouvert”, dans lequel la présence de classes qui n’ont pas été vues durant l’apprentissage est possible, précise le chercheur. Notre approche représente chaque classe par une hypersphère. Par conséquent, l’espace de données d’apprentissage se transforme en une galaxie de classes dans un univers ouvert de possibilités, d’où le nom de l’approche.»

Cette représentation permet à leur méthode de reconnaître, durant l’application, les nouvelles observations qui appartiennent aux classes connues ainsi que celles relevant de classes non observées durant l’apprentissage. «L’efficacité de Galaxy-X a été démontrée dans plusieurs domaines d’application comme la reconnaissance faciale, l’écriture manuscrite et les classifications fonctionnelles de protéines en bioinformatique», conclut Abdoulaye Banire Diallo.