| Cover | 1 |
---|
| Titel | 3 |
---|
| Impressum | 4 |
---|
| Inhaltsverzeichnis | 5 |
---|
| Einleitung | 13 |
---|
| Über dieses Buch | 14 |
| Wer sollte dieses Buch lesen? | 14 |
| Überblick | 15 |
| Erforderliche Hard- und Software | 16 |
| Quellcode | 17 |
| Das Forum zum Buch | 17 |
| Über den Autor | 17 |
| Über den Fachkorrektor | 17 |
| Danksagungen | 18 |
| Teil I: Grundlagen des Deep Learnings | 19 |
---|
| Kapitel 1: Was ist Deep Learning? | 21 |
| 1.1 Künstliche Intelligenz, Machine Learning und Deep Learning | 21 |
| 1.1.1 Künstliche Intelligenz | 22 |
| 1.1.2 Machine Learning | 22 |
| 1.1.3 Die Repräsentation anhand der Daten erlernen | 24 |
| 1.1.4 Das »Deep« in Deep Learning | 27 |
| 1.1.5 Deep Learning in drei Diagrammen erklärt | 29 |
| 1.1.6 Was Deep Learning heute schon leisten kann | 31 |
| 1.1.7 Schenken Sie dem kurzfristigen Hype keinen Glauben | 32 |
| 1.1.8 Das Versprechen der KI | 33 |
| 1.2 Vor Deep Learning: eine kurze Geschichte des Machine Learnings | 35 |
| 1.2.1 Probabilistische Modellierung | 35 |
| 1.2.2 Die ersten neuronalen Netze | 36 |
| 1.2.3 Kernel-Methoden | 36 |
| 1.2.4 Entscheidungsbäume, Random Forests und Gradient Boosting Machines | 38 |
| 1.2.5 Zurück zu neuronalen Netzen | 39 |
| 1.2.6 Das Besondere am Deep Learning | 40 |
| 1.2.7 Der Stand des modernen Machine-Learnings | 42 |
| 1.3 Warum Deep Learning? Und warum jetzt? | 42 |
| 1.3.1 Hardware | 43 |
| 1.3.2 Daten | 44 |
| 1.3.3 Algorithmen | 45 |
| 1.3.4 Eine neue Investitionswelle | 46 |
| 1.3.5 Die Demokratisierung des Deep Learnings | 47 |
| 1.3.6 Bleibt es so? | 47 |
| Kapitel 2: Bevor es losgeht: die mathematischen Bausteine eines NNs | 49 |
| 2.1 Ein erster Blick auf ein NN | 49 |
| 2.2 Datenrepräsentationen | 54 |
| 2.2.1 Skalare (0-D-Tensoren) | 54 |
| 2.2.2 Vektoren (1-D-Tensoren) | 55 |
| 2.2.3 Matrizen (2-D-Tensoren) | 55 |
| 2.2.4 3-D-Tensoren und höherdimensionale Tensoren | 55 |
| 2.2.5 Die wichtigsten Attribute | 56 |
| 2.2.6 Bearbeiten von Tensoren mit Numpy | 58 |
| 2.2.7 Datenstapel | 58 |
| 2.2.8 Beispiele für Datentensoren aus der Praxis | 59 |
| 2.2.9 Vektordaten | 59 |
| 2.2.10 Zeitreihen oder sequenzielle Daten | 60 |
| 2.2.11 Bilddaten | 61 |
| 2.2.12 Videodaten | 62 |
| 2.3 Das Getriebe von NNs: Tensoroperationen | 62 |
| 2.3.1 Elementweise Operationen | 63 |
| 2.3.2 Broadcasting | 64 |
| 2.3.3 Tensorprodukt | 66 |
| 2.3.4 Tensoren umformen | 69 |
| 2.3.5 Geometrische Interpretation von Tensoroperationen | 70 |
| 2.3.6 Eine geometrische Interpretation des Deep Learnings | 72 |
| 2.4 Der Antrieb von NNs: gradientenbasierte Optimierung | 73 |
| 2.4.1 Was ist eine Ableitung? | 74 |
| 2.4.2 Ableitung einer Tensoroperation: der Gradient | 76 |
| 2.4.3 Stochastisches Gradientenabstiegsverfahren | 77 |
| 2.4.4 Ableitungen verketten: der Backpropagation-Algorithmus | 80 |
| 2.5 Zurück zum ersten Beispiel | 81 |
| 2.6 Zusammenfassung Kapitel 2 | 83 |
| Kapitel 3: Einführung in neuronale Netze | 85 |
| 3.1 Aufbau eines NNs | 86 |
| 3.1.1 Layer: Bausteine des Deep Learnings | 86 |
| 3.1.2 Modelle: vernetzte Layer | 88 |
| 3.1.3 Verlustfunktionen und Optimierer: Konfiguration des Lernvorgangs | 88 |
| 3.2 Einführung in Keras | 89 |
| 3.2.1 Keras, TensorFlow, Theano und CNTK | 91 |
| 3.2.2 Mit Keras entwickeln: eine kurze Übersicht | 92 |
| 3.3 Einrichtung eines Deep-Learning-Rechners | 93 |
| 3.3.1 Die bevorzugte Methode zum Ausführen von Deep-Learning- Experimenten: Jupyter-Notebooks | 94 |
| 3.3.2 Keras zum Laufen bringen: zwei Möglichkeiten | 95 |
| 3.3.3 Pro und Kontra: Deep Learning in der Cloud ausführen | 95 |
| 3.3.4 Für Deep Learning geeignete GPUs | 96 |
| 3.4 Klassifizierung von Filmbewertungen: ein Beispiel für eine Binärklassifizierung | 96 |
| 3.4.1 Die IMDb-Datensammlung | 96 |
| 3.4.2 Daten vorbereiten | 98 |
| 3.4.3 NN erzeugen | 99 |
| 3.4.4 Validierung des Ansatzes | 103 |
| 3.4.5 Vorhersagen über neue Daten mit einem trainierten NN treffen | 107 |
| 3.4.6 Weitere Experimente | 108 |
| 3.4.7 Zusammenfassung | 108 |
| 3.5 Ein Beispiel für eine Mehrfachklassifizierung: Klassifizierung von Nachrichtenmeldungen | 109 |
| 3.5.1 Die Reuters-Date
|