ebook ebooks e-book e-books downloaden bei MyEbooks.ch downloaden

Einführung in Machine Learning mit Python Praxiswissen Data Science

:	Andreas C. Müller, Sarah Guido
:	Einführung in Machine Learning mit Python Praxiswissen Data Science
:	O'Reilly Verlag
:	9783960101116
:	Animals
:	1
:	CHF 33.70
:

:	Programmiersprachen
:	German

:	378
:	Wasserzeichen/DRM
:	PC/MAC/eReader/Tablet
:	PDF

Machine Learning ist zu einem wichtigen Bestandteil vieler kommerzieller Anwendungen und Forschungsprojekte geworden, von der medizinischen Diagnostik bis hin zur Suche nach Freunden in sozialen Netzwerken. Um Machine-Learning-Anwendungen zu entwickeln, braucht es keine großen Expertenteams: Wenn Sie Python-Grundkenntnisse mitbringen, zeigt Ihnen dieses Praxisbuch, wie Sie Ihre eigenen Machine-Learning-Lösungen erstellen. Mit Python und der scikit-learn-Bibliothek erarbeiten Sie sich alle Schritte, die für eine erfolgreiche Machine-Learning-Anwendung notwendig sind. Die Autoren Andreas Müller und Sarah Guido konzentrieren sich bei der Verwendung von Machine-Learning-Algorithmen auf die praktischen Aspekte statt auf die Mathematik dahinter. Wenn Sie zusätzlich mit den Bibliotheken NumPy und matplotlib vertraut sind, hilft Ihnen dies, noch mehr aus diesem Tutorial herauszuholen. Das Buch zeigt Ihnen: - grundlegende Konzepte und Anwendungen von Machine Learning - Vor- und Nachteile weit verbreiteter maschineller Lernalgorithmen - wie sich die von Machine Learning verarbeiteten Daten repräsentieren lassen und auf welche Aspekte der Daten Sie sich konzentrieren sollten - fortgeschrittene Methoden zur Auswertung von Modellen und zum Optimieren von Parametern - das Konzept von Pipelines, mit denen Modelle verkettet und Arbeitsabläufe gekapselt werden - Arbeitsmethoden für Textdaten, insbesondere textspezifische Verarbeitungstechniken - Möglichkeiten zur Verbesserung Ihrer Fähigkeiten in den Bereichen Machine Learning und Data Science Dieses Buch ist eine fantastische, super praktische Informationsquelle für jeden, der mit Machine Learning in Python starten möchte - ich wünschte nur, es hätte schon existiert, als ich mit scikit-learn anfing! Hanna Wallach, Senior Researcher, Microsoft Research

Andreas C. Müller hat an der Universität Bonn in Machine Learning promoviert. Bei Amazon hat er an Anwendungen für rechnergestütztes Sehen gearbeitet, heute ist er am Center for Data Science an der New York University tätig. Er ist als Core Contributor an der Entwicklung und Wartung von scikit-learn beteiligt. Sarah Guido ist als Data Scientist tätig und hat viel für Start-ups gearbeitet, zuletzt als Lead Data Scientist bei Bitly. Sie ist eine erfahrene Konferenzrednerin und hat einen Master-Abschluss im Fach Information an der University of Michigan erworben.

	Inhalt	5
	Vorwort	9
	Kapitel 1: Einführung	15
	Warum Machine Learning?	15
	Welche Probleme kann Machine Learning lösen?	16
	Ihre Aufgabe und Ihre Daten kennen	19
	Warum Python?	19
	scikit-learn	20
	Installieren von scikit-learn	20
	Grundlegende Bibliotheken und Werkzeuge	21
	Jupyter Notebook	22
	NumPy	22
	SciPy	22
	matplotlib	24
	pandas	24
	mglearn	25
	Python 2 versus Python 3	26
	In diesem Buch verwendete Versionen	27
	Eine erste Anwendung: Klassifizieren von Iris-Spezies	28
	Die Daten kennenlernen	29
	Erfolg nachweisen: Trainings- und Testdaten	31
	Das Wichtigste zuerst: Sichten Sie Ihre Daten	33
	Ihr erstes Modell konstruieren: k-nächste-Nachbarn	35
	Vorhersagen treffen	36
	Evaluieren des Modells	37
	Zusammenfassung und Ausblick	37
	Kapitel 2: Überwachtes Lernen	41
	Klassifikation und Regression	41
	Verallgemeinerung, Overfitting und Underfitting	42
	Zusammenhang zwischen Modellkomplexität und Größe des Datensatzes	45
	Algorithmen zum überwachten Lernen	46
	Einige Beispieldatensätze	46
	k-nächste-Nachbarn	50
	Lineare Modelle	59
	Naive Bayes-Klassifikatoren	80
	Entscheidungsbäume	82
	Ensembles von Entscheidungsbäumen	94
	Support Vector Machines mit Kernel	102
	Neuronale Netze (Deep Learning)	113
	Schätzungen der Unsicherheit von Klassifikatoren	126
	Die Entscheidungsfunktion	127
	Vorhersagen von Wahrscheinlichkeiten	130
	Unsicherheit bei der Klassifikation mehrerer Kategorien	132
	Zusammenfassung und Ausblick	134
	Kapitel 3: Unüberwachtes Lernen und Vorverarbeitung	137
	Arten von unüberwachtem Lernen	137
	Herausforderungen beim unüberwachten Lernen	138
	Vorverarbeiten und Skalieren	138
	Unterschiedliche Möglichkeiten der Vorverarbeitung	139
	Anwenden von Datentransformationen	140
	Trainings- und Testdaten in gleicher Weise skalieren	142
	Die Auswirkungen der Vorverarbeitung auf überwachtes Lernen	144
	Dimensionsreduktion, Extraktion von Merkmalen und Manifold Learning	146
	Hauptkomponentenzerlegung (PCA)	146
	Nicht-negative-Matrix-Faktorisierung (NMF)	161
	Manifold Learning mit t-SNE	168
	Clusteranalyse	172
	k-Means-Clustering	172
	Agglomeratives Clustering	183
	DBSCAN	188
	Vergleichen und Auswerten von Clusteralgorithmen	192
	Zusammenfassung der Clustering-Methoden	206
	Zusammenfassung und Ausblick	207
	Kapitel 4: Repräsentation von Daten und Merkmalsgenerierung	209
	Kategorische Variablen	210
	One-Hot-Kodierung (Dummy-Variablen)	211
	Zahlen können kategorische Daten kodieren	216
	Binning, Diskretisierung, lineare Modelle und Bäume	218
	Interaktionen und Polynome	222
	Univariate nichtlineare Transformation	228
	Automatische Auswahl von Merkmalen	232
	Univariate Statistiken	232
	Modellbasierte Auswahl von Merkmalen	235
	Iterative Auswahl von Merkmalen	236
	Berücksichtigen von Expertenwissen	238
	Zusammenfassung und Ausblick	247
	Kapitel 5: Evaluierung und Verbesserung von Modellen	249
	Kreuzvalidierung	250
	Kreuzvalidierung in scikit-learn	251
	Vorteile der Kreuzvalidierung	252
	Stratifizierte k-fache Kreuzvalidierung und andere Strategien	252