Datenanalyse mit Python
Einführung in die Benutzung des pandas-Pakets
Beim Umstieg zu Linux bietet sich zur Datenanalyse und -manipulation zunächst die Tabellenkalkulationskomponente Calc aus dem Office-Paket LibreOffice an. Für diejenigen mit etwas Python-Programmiererfahrung lohnt es sich jedoch, die Verwendung des pandas-Pakets in Betracht zu ziehen. Hiermit lassen sich Daten, die in den verschiedensten Formaten vorliegen können, in ein Python-Programm importieren und verarbeiten sowie graphisch darstellen. Damit stehen alle Möglichkeiten des Python-Universums offen, unter anderem die Datenanalyse in Jupyter-Notebooks. Der Vortrag wird am Beispiel der Analyse von Daten aus dem Open-Data-Portal der Deutschen Bahn AG eine Einführung in die Benutzung des pandas-Pakets geben und die explorative Analyse von Daten in einem Jupyter-Notebook demonstrieren.
Das Jupyter-Notebook zum Vortrag ist unter github.com/gertingold/lit2023 verfügbar.
Downloads: