"ESI Miner 2.0" est une plateforme, Open Source, d'expérimentation et de tests d'algorithmes de data mining. C'est un projet réalisé à l'ESI, au sein du laboratoire LMCS. Simple et extensible, il est déstiné à l'initiation dans l'extraction des connaissances à partir des données et de manière spécifique à la recherche dans le domaine du data mining. Son approche générale consiste à : Importer les données à traiter, choisir les variables pertinentes et fixer les types de données. Comme la plupart des jeux de données contiennent des valeurs manquantes, nous leur avons prévu un traitement spécial ; Proposer une étape de pré-traitement pour les données chargées à travers différentes opérations ; Procéder à la fouille de données avec ses différentes tâches : le clustering, pour structurer les données en groupes homogènes, la classification, pour prédire le groupe d’une nouvelle donnée et les règles d’association pour extraire les éventuelles corrélations entre les variables ; Chaque tâche de data mining propose une multitude d’algorithmes selon plusieurs critères et spécialement le type de données traitées. Face au grand nombre d’algorithmes existants, nous avons implémenté quelques uns de ces algorithmes pour chacune de ces tâches, en prenant bien soin de couvrir tous les types de données. De plus, nous avons opté pour une architecture extensible de l’outil, permettant ainsi à l’utilisateur d’enrichir la plateforme selon ses besoins. Proposer, afin de mieux interpréter les résultats obtenus, différentes visualisations graphiques.
JASSS (2022)
Akopov Andranik