: Chris Albon
: Machine Learning Kochbuch Praktische Lösungen mit Python: von der Vorverarbeitung der Daten bis zum Deep Learning
: O'Reilly Verlag
: 9783960103073
: 1
: CHF 33.40
:
: Programmiersprachen
: German
: 368
: Wasserzeichen
: PC/MAC/eReader/Tablet
: ePUB
Python-Programmier r finden in diesem Kochbuch nahezu 200 wertvolle und jeweils in sich abgeschlossene Anleitungen zu Aufgabenstellungen aus dem Bereich des Machine Learning, wie sie für die tägliche Arbeit typisch sind - von der Vorverarbeitung der Daten bis zum Deep Learning. Entwickler, die mit Python und seinen Bibliotheken einschließlich Pandas und Scikit-Learn vertraut sind, werden spezifische Probleme erfolgreich bewältigen - wie etwa Daten laden, Text und numerische Daten behandeln, Modelle auswählen, Dimensionalität reduzieren und vieles mehr. Jedes Rezept enthält Code, den Sie kopieren, zum Testen in eine kleine Beispieldatenmenge einfügen und dann anpassen können, um Ihre eigenen Anwendungen zu konstruieren. Darüber hinaus werden alle Lösungen diskutiert und wichtige Zusammenhänge hergestellt. Dieses Kochbuch unterstützt Sie dabei, den Schritt von der Theorie und den Konzepten hinein in die Praxis zu machen. Es liefert das praktische Rüstzeug, das Sie benötigen, um funktionierende Machine-Learning-Anwendungen zu entwickeln. In diesem Kochbuch finden Sie Rezepte für: - Vektoren, Matrizen und Arrays - den Umgang mit numerischen und kategorischen Daten, Texten, Bildern sowie Datum und Uhrzeit - das Reduzieren der Dimensionalität durch Merkmalsextraktion oder Merkmalsauswahl - Modellbewertung und -auswahl - lineare und logistische Regression, Bäume und Wälder und k-nächste Nachbarn - Support Vector Machine (SVM), naive Bayes, Clustering und neuronale Netze - das Speichern und Laden von trainierten Modellen

Chris Albon ist Data Scientist und Politikwissenschaftler mit einem Jahrzehnt Erfahrung in der Anwendung von statistischem Lernen, künstlicher Intelligenz und Software-Engineering in den Bereichen politischer, sozialer und humanitärer Bemühungen - von der Wahlbeobachtung bis zur Katastrophenhilfe. Derzeit ist Chris der Chief Data Scientist bei BRCK, einem kenianischen Start-up-Unternehmen, das ein robustes Netzwerk für Internetnutzer des Frontier-Markts entwickelt.

KAPITEL 1


Vektoren, Matrizen und Arrays


1.0Einführung


Die ProgrammbibliothekNumPy bildet die Grundlage des Python-Stapels für maschinelles Lernen (auch alsSciPy-Stapel bezeichnet).NumPy erlaubt effiziente Operationen auf Datenstrukturen, die in Projekten des maschinellen Lernens häufig vorkommen: Vektoren, Matrizen und Tensoren. Auch wennNumPy nicht im Mittelpunkt dieses Buchs steht, werden Sie in den folgenden Kapiteln häufig auf diese Bibliothek stoßen. Dieses Kapitel behandelt die gebräuchlichstenNumPy-Operationen, mit denen Sie es in Workflows des maschinellen Lernens höchstwahrscheinlich zu tun haben werden.

1.1Einen Vektor erzeugen


Problem

Sie müssen einenVektor erzeugen.

Lösung

Verwenden SieNumPy, um ein eindimensionales Array anzulegen:

# Bibliothek laden

import numpy as np

# Einen Vektor als Zeile erstellen

vector_row = np.array([1, 2, 3])

# Einen Vektor als Spalte erstellen

vector_column = np.array([[1],

[2],

[3]])

Diskussion

Die Hauptdatenstruktur vonNumPy ist das mehrdimensionale Array. Um einen Vektor zu erzeugen, legen wir einfach ein eindimensionales Array an. Vektoren lassen sich genau wie Arrays horizontal (d.h. als Zeilen) oder vertikal (d.h. als Spalten) darstellen.

Siehe auch

1.2Eine Matrix erstellen


Problem

Es muss eineMatrix erstellt werden.

Lösung

Verwenden SieNumPy, um ein zweidimensionales Array einzurichten:

# Bibliothek laden

import numpy as np

# Eine Matrix erstellen

matrix = np.array([[1, 2],

[1, 2],

[1, 2]])

Diskussion

Eine Matrix können Sie mit einem zweidimensionalenNumPy-Array erstellen. In der angegebenen Lösung enthält die Matrix drei Zeilen und zwei Spalten (eine Spalte mit Einsen und eine Spalte mit Zweien). Die BibliothekNumPy bringt aber auch