: Foster Provost, Tom Fawcett
: Data Science für Unternehmen Data Mining und datenanalytisches Denken praktisch anwenden
: MITP Verlags GmbH& Co. KG
: 9783958455474
: 1
: CHF 26.60
:
: Datenkommunikation, Netzwerke
: German
: 432
: kein Kopierschutz
: PC/MAC/eReader/Tablet
: PDF
Die grundlegenden Konzepte der Data Science verstehen, Wissen aus Daten ziehen und für Vorhersagen und Entscheidungen nutzen Die wichtigsten Data-Mining-Verfahren gezielt und gewinnbringend einsetzen Zahlreiche Praxisbeispiele zur Veranschaulichung Die anerkannten Data-Science-Experten Foster Provost und Tom Fawcett stellen in diesem Buch die grundlegenden Konzepte der Data Science vor, die für den effektiven Einsatz im Unternehmen von Bedeutung sind. Sie erläutern das datenanalytische Denken, das erforderlich ist, damit Sie aus Ihren gesammelten Daten nützliches Wissen und geschäftlichen Nutzen ziehen können. Sie erfahren detailliert, welche Methoden der Data Science zu hilfreichen Erkenntnissen führen, so dass auf dieser Grundlage wichtige Entscheidungsfindungen unterstützt werden können. Dieser Leitfaden hilft Ihnen dabei, die vielen zurzeit gebräuchlichen Data-Mining-Verfahren zu verstehen und gezielt und gewinnbringend anzuwenden. Sie lernen u.a., wie Sie: Data Science in Ihrem Unternehmen nutzen und damit Wettbewerbsvorteile erzielen Daten als ein strategisches Gut behandeln, in das investiert werden muss, um echten Nutzen daraus zu ziehen Geschäftliche Aufgaben datenanalytisch angehen und den Data-Mining-Prozess nutzen, um auf effiziente Weise sinnvolle Daten zu sammeln Das Buch beruht auf einem Kurs für Betriebswirtschaftler, den Provost seit rund zehn Jahren an der New York University unterrichtet, und nutzt viele Beispiele aus der Praxis, um die Konzepte zu veranschaulichen. Das Buch richtet sich an Führungskräfte und Projektmanager, die Data-Science-orientierte Projekte managen, an Entwickler, die Data-Science-Lösungen implementieren sowie an alle angehenden Data Scientists und Studenten. Aus dem Inhalt: Datenanalytisches Denken lernen Der Data-Mining-Prozess Überwachtes und unüberwachtes Data Mining Einführung in die Vorhersagemodellbildung: von der Korrelation zur überwachten Segmentierung Anhand der Daten optimale Modellparameter finden mit Verfahren wie lineare und logistische Regression sowie Support Vector Machines Prinzip und Berechnung der Ähnlichkeit Nächste-Nachbarn-Methoden und Clustering Entscheidungsanalyse I: Was ist ein gutes Modell Visualisierung der Leistung von Modellen Evidenz und Wahrscheinlichkeiten Texte repräsentieren und auswerten Entscheidungsanalyse II: Analytisches Engineering Data Science und Geschäftsstrategie

Foster Provost ist Professor an der New York University (NYU) Stern School of Business und lehrt u.a. Business Analytics und Data Science. In den letzten zehn Jahren hat Provost verschiedene erfolgreiche Unternehmen mitbegründet, die Data Science im Marketing einsetzen.

Tom Fawcett hat einen Doktortitel für Machine Learning und war mehr als zwei Jahrzehnte in verschiedenen Branchen wie GTE Laboratories, NYNEX/Verizon Labs, HP Labs in der Forschung und Entwicklung tätig. Die von ihm veröffentlichten Arbeiten zur Anwendung von Data Science (z.B. Erkennung von Betrugsfällen und Spamfilter) sind zu Standardwerken geworden.

Cover1
Titel3
Impressum4
Inhaltsverzeichnis5
Einleitung13
Über die Autoren21
Kapitel 1: Einführung: Datenanalytisches Denken23
1.1 Allgegenwärtige Datenerfassungsmöglichkeiten23
1.2 Beispiel: Hurrikan Frances25
1.3 Beispiel: Vorhersage der Kundenfluktuation26
1.4 Data Science, Engineering und datengestützte Entscheidungsfindung27
1.5 Datenverarbeitung und »Big Data«31
1.6 Von Big Data 1.0 zu Big Data 2.032
1.7 Daten und Data-Science-Fähigkeiten als strategisches Gut33
1.8 Datenanalytische Denkweise36
1.9 Dieses Buch38
1.10 Data Mining und Data Science39
1.11 In der Chemie geht es nicht um Reagenzgläser: Data Science vs. die Aufgabe des Data Scientists40
1.12 Zusammenfassung41
Kapitel 2: Geschäftliche Aufgaben und Data-Science-Lösungen43
2.1 Von geschäftlichen Aufgaben zum Data-Mining- Verfahren44
2.2 Überwachte vs. unüberwachte Verfahren49
2.3 Ergebnisse des Data Minings51
2.4 Der Data-Mining-Prozess52
2.4.1 Aufgabenverständnis53
2.4.2 Datenverständnis54
2.4.3 Datenaufbereitung56
2.4.4 Modellbildung57
2.4.5 Beurteilung57
2.4.6 Deployment59
2.5 Auswirkungen auf das Management des Data-Science-Teams61
2.6 Weitere Analyseverfahren und -Technologien62
2.6.1 Statistik63
2.6.2 Datenbankabfragen65
2.6.3 Data Warehouses66
2.6.4 Regressionsanalyse67
2.6.5 Machine Learning und Data Mining67
2.6.6 Geschäftliche Aufgaben durch diese Verfahren lösen68
2.7 Zusammenfassung70
Kapitel 3: Einführung in die Vorhersagemodellbildung: Von der Korrelation zur überwachten Segmentierung71
3.1 Modelle, Induktion und Vorhersage73
3.2 Überwachte Segmentierung77
3.2.1 Auswahl informativer Merkmale78
3.2.2 Beispiel: Merkmalsauswahl anhand des Informationsgewinns86
3.2.3 Überwachte Segmentierung mit Baumstrukturmodellen92
3.3 Segmentierungen visualisieren98
3.4 Bäume als Regelsätze100
3.5 Wahrscheinlichkeitsabschätzung101
3.6 Beispiel: Abwanderungsrate per Entscheidungsbaum ermitteln104
3.7 Zusammenfassung108
Kapitel 4: Ein Modell an Daten anpassen111
4.1 Klassifizierung via mathematischer Funktionen113
4.1.1 Lineare Diskriminanzfunktion115
4.1.2 Optimieren der Zielfunktion118
4.1.3 Beispiel: Extraktion einer linearen Diskriminanzfunktion aus Daten119
4.1.4 Lineare Diskriminanzfunktionen zur Beurteilung und zum Erstellen einer Rangfolge von Instanzen121
4.1.5 Support Vector Machines kompakt erklärt122
4.2 Regression via mathematischer Funktionen125
4.3 Wahrscheinlichkeitsabschätzung der Klassenzugehörigkeit und logistische »Regression«127
4.3.1 * Logistische Regression: Technische Details131
4.4 Beispiel: Logistische Regression vs. Entscheidungsbaumverfahren134
4.5 Nichtlineare Funktionen, Support Vector Mach