Classification automatique: Weka, Mahout
Classification avec Weka
Weka est un Logiciel libre disponible sous la Licence publique générale GNU. Il offre une panoplie d'algorithmes d'apprentissage et de classification. Il est également bien adapté pour le développement de nouveaux systèmes d'apprentissage machine. De plus, Weka offre des outils de prétraitement et de visualisation de données.
Visiter le site Web de Weka.
Classification avec Mahout
Mahout est un projet Apache qui offre des librairies d'apprentissage évolutives supportant des collections de données très larges.
Mahout supporte la classification de documents, la recommandation de contenus similaires et la catégorisation automatique des résultats.
Les algorithmes de Mahout pour le clustering, la classification et de filtrage collaboratif sont basés sur le paradigme map/reduce d'Apache Hadoop. Cependant, les algorithmes de Mahout s’exécutent aussi bien sur des clusters Hadoop que sur des clusters non Hadoop ou sur un seul serveur. Les bibliothèques de base de Mahout sont fortement optimisés pour assurer de bonnes performances même pour les algorithmes non-distribués.
Visiter le site Web de Mahout.