: Jake VanderPlas
: Data Science mit Python Das Handbuch für den Einsatz von IPython, Jupyter, NumPy, Pandas, Matplotlib und Scikit-Learn
: MITP Verlags GmbH& Co. KG
: 9783958456969
: 1
: CHF 17.50
:
: Datenkommunikation, Netzwerke
: German
: 552
: kein Kopierschutz
: PC/MAC/eReader/Tablet
: PDF
Die wichtigsten Tools für die Datenanalyse und-bearbeitung im praktischen Einsatz Python effizient für datenintensive Berechnungen einsetzen mit IPython und Jupyter Laden, Speichern und Bearbeiten von Daten und numerischen Arrays mit NumPy und Pandas Visualisierung von Daten mit Matplotlib Python ist für viele die erste Wahl für Data Science, weil eine Vielzahl von Ressourcen und Bibliotheken zum Speichern, Bearbeiten und Auswerten von Daten verfügbar ist. In diesem Buch erläutert der Autor den Einsatz der wichtigsten Tools. Für Datenanalytiker und Wissenschaftler ist dieses umfassende Handbuch von unschätzbarem Wert für jede Art von Berechnung mit Python sowie bei der Erledigung alltäglicher Aufgaben. Dazu gehören das Bearbeiten, Umwandeln und Bereinigen von Daten, die Visualisierung verschiedener Datentypen und die Nutzung von Daten zum Erstellen von Statistiken oder Machine-Learning-Modellen. Dieses Handbuch erläutert die Verwendung der folgenden Tools: IPython und Jupyter für datenintensive Berechnungen NumPy und Pandas zum effizienten Speichern und Bearbeiten von Daten und Datenarrays in Python Matplotlib für vielfältige Möglichkeiten der Visualisierung von Daten Scikit-Learn zur effizienten und sauberen Implementierung der wichtigsten und am meisten verbreiteten Algorithmen des Machine Learnings Der Autor zeigt Ihnen, wie Sie die zum Betreiben von Data Science verfügbaren Pakete nutzen, um Daten effektiv zu speichern, zu handhaben und Einblick in diese Daten zu gewinnen. Grundlegende Kenntnisse in Python werden dabei vorausgesetzt. Leserstimme zum Buch: »Wenn Sie Data Science mit Python betreiben möchten, ist dieses Buch ein hervorragender Ausgangspunkt. Ich habe es sehr erfolgreich beim Unterrichten von Informatik- und Statistikstudenten eingesetzt. Jake geht weit über die Grundlagen der Open-Source-Tools hinaus und erläutert die grundlegenden Konzepte, Vorgehensweisen und Abstraktionen in klarer Sprache und mit verständlichen Erklärungen.« - Brian Granger, Physikprofessor, California Polytechnic State University, Mitbegründer des Jupyter-Projekts

Jake VanderPlas ist seit Langem User und Entwickler von SciPy. Derzeit ist er als interdisziplinärer Forschungsdirektor an der Universität Washington tätig, führt eigene astronomische Forschungsarbeiten durch und berät dort ansässige Wissenschaftler, die in vielen verschiedenen Fachgebieten arbeiten.
<
Cover1
Titel3
Impressum4
Inhaltsverzeichnis5
Einleitung13
Über den Autor18
Kapitel 1: Mehr als normales Python: IPython19
1.1 Shell oder Notebook?19
1.1.1 Die IPython-Shell starten20
1.1.2 Das Jupyter-Notebook starten20
1.2 Hilfe und Dokumentation in IPython21
1.2.1 Mit ? auf die Dokumentation zugreifen22
1.2.2 Mit ?? auf den Quellcode zugreifen23
1.2.3 Module mit der Tab-Vervollständigung erkunden24
1.3 Tastaturkürzel in der IPython-Shell26
1.3.1 Tastaturkürzel zum Navigieren27
1.3.2 Tastaturkürzel bei der Texteingabe27
1.3.3 Tastaturkürzel für den Befehlsverlauf28
1.3.4 Sonstige Tastaturkürzel29
1.4 Magische Befehle in IPython29
1.4.1 Einfügen von Codeblöcken mit %paste und %cpaste29
1.4.2 Externen Code ausführen mit %run31
1.4.3 Messung der Ausführungszeit von Code mit %timeit31
1.4.4 Hilfe für die magischen Funktionen anzeigen mit ?, %magic und %lsmagic32
1.5 Verlauf der Ein- und Ausgabe32
1.5.1 Die IPython-Objekte In und Out33
1.5.2 Der Unterstrich als Abkürzung und vorhergehende Ausgaben34
1.5.3 Ausgaben unterdrücken34
1.5.4 Weitere ähnliche magische Befehle35
1.6 IPython und Shell-Befehle35
1.6.1 Kurz vorgestellt: die Shell36
1.6.2 Shell-Befehle in IPython37
1.6.3 Werte mit der Shell austauschen37
1.7 Magische Befehle für die Shell38
1.8 Fehler und Debugging39
1.8.1 Exceptions handhaben: %xmode39
1.8.2 Debugging: Wenn das Lesen von Tracebacks nicht ausreicht41
1.9 Profiling und Timing von Code44
1.9.1 Timing von Codeschnipseln: %timeit und %time45
1.9.2 Profiling kompletter Skripte: %prun46
1.9.3 Zeilenweises Profiling mit %lprun47
1.9.4 Profiling des Speicherbedarfs: %memit und %mprun48
1.10 Weitere IPython-Ressourcen50
1.10.1 Quellen im Internet50
1.10.2 Bücher50
Kapitel 2: Einführung in NumPy51
2.1 Die Datentypen in Python52
2.1.1 Python-Integers sind mehr als nur ganzzahlige Werte53
2.1.2 Python-Listen sind mehr als nur einfache Listen54
2.1.3 Arrays feststehenden Typs in Python56
2.1.4 Arrays anhand von Listen erzeugen56
2.1.5 Neue Arrays erzeugen57
2.1.6 NumPys Standarddatentypen58
2.2 Grundlagen von NumPy-Arrays59
2.2.1 Attribute von NumPy-Arrays60
2.2.2 Indizierung von Arrays: Zugriff auf einzelne Elemente61
2.2.3 Slicing: Teilmengen eines Arrays auswählen62
2.2.4 Arrays umformen65
2.2.5 Arrays verketten und aufteilen66
2.3 Berechnungen mit NumPy-Arrays: universelle Funktionen68
2.3.1 Langsame Schleifen68
2.3.2 Kurz vorgestellt: UFuncs70
2.3.3 NumPys UFuncs im Detail70
2.3.4 UFunc-Features für Fortgeschrittene75
2.3.5 UFuncs: mehr erfahren77
2.4 Aggregationen: Minimum, Maximum und alles dazwischen77
2.4.1 Summieren der Werte eines Arrays77
2.4.2 Minimum und Maximum78
2.4.3 Beispiel: Durchschnittliche Größe der US-Präsidenten80
2.5 Berechnungen mit Arrays: Broadcasting82
2.5.1 Kurz vorgestellt: Broadcasting82
2.5.2 Für das Broadcasting geltende Regeln84
2.5.3 Broadcasting in der Praxis87
2.6 Vergleiche, Maskierungen und boolesche Logik88
2.6.1 Beispiel: Regentage zählen89
2.6.2 Vergleichsoperatoren als UFuncs90
2.6.3 Boolesche Arrays verwenden91
2.6.4 Boolesche Arrays als Maskierungen94
2.7 Fancy Indexing97
2.7.1 Fancy Indexing im Detail97
2.7.2 Kombinierte Indizierung98
2.7.3 Beispiel: Auswahl zufälliger Punkte99
2.7.4 Werte per Fancy Indexing modifizieren101
2.7.5 Beispiel: Daten gruppieren102
2.8 Arrays sortieren104
2.8.1 Schnelle Sortierung in NumPy: np.sort und np.argsort105
2.8.2 Teilsortierungen: Partitionierung107
2.8.3 Beispiel: k nächste Nachbarn107
2.9 Strukturierte Daten: NumPys strukturierte Arrays112
2.9.1 Strukturierte Arrays erzeugen113
2.9.2 Erweiterte zusammengesetzte Typen114
2.9.3 Record-Arrays: strukturierte Arrays mit Pfiff115
2.9.4 Weiter mit Pandas115
Kapitel 3: Datenbearbeitung mit Pandas117
3.1 Pandas installieren und verwenden117
3.2 Kurz vorgestellt: Pandas-Objekte118
3.2.1 Das Pandas-Series-Objekt118
3.2.2 Das Pandas-DataFrame-Objekt122
3.2.3 Das Pandas-Index-Objekt126
3.3 Daten indizieren und auswählen127
3.3.1 Series-Daten auswählen127
3.3.2 DataFrame-Daten auswählen131
3.4 Mit Pandas-Daten arbeiten135
3.4.1 UFuncs: Indexerhaltung136
3.4.2 UFuncs: Indexanpassung137
3.4.3 UFuncs: Operationen mit DataFrame und Series139
3.5 Handhabung fehlender Daten140
3.5.1 Überlegungen zu fehlenden Daten141
3.5.2 Fehlende Daten in Pandas141
3.5.3 Mit null-Werten arbeiten145
3.6 Hierarchische Indizierung149
3.6.1 Mehrfach indizierte Series149
3.6.2 Methoden zum Erzeugen eines MultiIndex153
3.6.3 Indizierung und Slicing eines MultiIndex156
3.6.4 Multi-Indizes umordnen