Java Data Mining Package
Eine Java Bibliothek für maschinelle Lernverfahren und Big Data Analyse

Das Java Data Mining Package (JDMP) ist eine Open Source Java Bibliothek für Datenanalyse und maschinelles Lernen.

Es erleichtert den Zugriff auf Datenquellen und Algorithmen zum Data Mining (z.b. Clustering, Regressionsanalyse, Muster-Klassifikation, Graphical Models, Optimierungsverfahren) und stellt eine Reihe von Visualisierungsmethoden zur Verfügung. JDMP enthält eine Matrix Bibliothek zum Speichern und Verarbeiten von Daten und bietet die Möglichkeit, auch sehr große Matrizen zu bearbeiten, selbst wenn sie nicht in den Hauptspeicher passen. Import und Export in verschiedene Dateiformate wie TXT, CSV, Excel, Matlab, Latex, MTX, HTML, WAV, BMP oder Verlinkung zu JDBC Datenbanken wird außerdem unterstützt. JDMP enthält eine Reihe von Algorithmen zur Datenanalyse, ermöglicht aber auch, andere Pakete für einzubinden (Weka, LibSVM, Mallet, Lucene, Octave).

Ein zentrales Element von JDMP ist eine konsistente Datenrepräsentation. So wie für Linux alles eine Datei ist, ist für JDMP jedes Objekt eine Matrix!

Mehr Informationen gibt es auf der englischen Homepage.

JDMP Dataset

Literatur