Esiminer: Extendebel Tool for Data Mining

By Kellou-menouer Kenza and Mokhtari Djalil
Working Paper (2011)

  • Kenza Kellou-menouer

    France

  • Djalil Mokhtari

    France

Created

January 29, 2014

Last update

January 29, 2014

Software

EXE

Ranking

93

Visits

1945

Downloads

65

Description

"ESI Miner 2.0" est une plateforme, Open Source, d'expérimentation et de tests d'algorithmes de data mining. C'est un projet réalisé à l'ESI, au sein du laboratoire LMCS. Simple et extensible, il est déstiné à l'initiation dans l'extraction des connaissances à partir des données et de manière spécifique à la recherche dans le domaine du data mining. Son approche générale consiste à : Importer les données à traiter, choisir les variables pertinentes et fixer les types de données. Comme la plupart des jeux de données contiennent des valeurs manquantes, nous leur avons prévu un traitement spécial ; Proposer une étape de pré-traitement pour les données chargées à travers différentes opérations ; Procéder à la fouille de données avec ses différentes tâches : le clustering, pour structurer les données en groupes homogènes, la classification, pour prédire le groupe d’une nouvelle donnée et les règles d’association pour extraire les éventuelles corrélations entre les variables ; Chaque tâche de data mining propose une multitude d’algorithmes selon plusieurs critères et spécialement le type de données traitées. Face au grand nombre d’algorithmes existants, nous avons implémenté quelques uns de ces algorithmes pour chacune de ces tâches, en prenant bien soin de couvrir tous les types de données. De plus, nous avons opté pour une architecture extensible de l’outil, permettant ainsi à l’utilisateur d’enrichir la plateforme selon ses besoins. Proposer, afin de mieux interpréter les résultats obtenus, différentes visualisations graphiques.

Review of data structures for computationally efficient nearest-neighbour entropy estimators for large systems with periodic boundary conditions

Journal of Computational Science (2017)

Brown Josh, Bossomaier Terry, and Barnett Lionel

Sustainability and Reproducibility via Containerized Computing

arXiv (2015)

Nagler Robert

Pathfinding and resource allocation with GHOST

HAL (2015)

FRADIN Julien

An Introduction to the Patstat Database with Example Queries

Australian Economic Review (2014)

de Rassenfosse Gaetan, Dernis Helene, and Boedt Geert

2014-03-27

Zip Archive

2K

52

228

A Unified Software Framework for Empirical Gramians

Journal of Mathematics (2013)

Himpe Christian and Ohlberger Mario

0 comment

Add comment

You need to log in to post a comment.