Data Science Toolbox
Die Data Science Toolbox ist eine auf Ubuntu basierende, freie (BSD-Lizenz), virtuelle Arbeitsumgebung mit über 80 Programmen für Datenwissenschaftler und solche, die es werden wollen. Sie kann entweder lokal (mit Hilfe von VirtualBox und Vagrant) installiert oder in der Cloud als Amazon EC2-Instanz betrieben werden. Sie besteht im Wesentlichen aus folgenden Komponenten:
- Python mit den Paketen IPython Notebook, NumPy, SciPy, der matplotlib, Pandas, scikit-learn und SymPy
- R mit den Paketen ggplot2, plyr, dplyr, lubridate, zoo, forecast und sqldf
- dst, ein Kommandozeilen-Tool um das Paket mit zusätzlichen Modulen zu ergänzen.
Initiator des Paketes ist Jeroen Janssens, der Autor des Buches Data Science at the Command Line.
Links
Sie sind hier: Start → Mathematik → datasciencetoolbox.txt