Maschinelles Lernen nutzt im Prinzip Algorithmen, um genauere Vorhersagen zu treffen. Diese Algorithmen können sein:
- - Verwendet Daten, um das Geschehene zu interpretieren
- - Verwendet Daten, um vorherzusehen, was stattfinden wird
- - Verwenden von Daten zum Vorschlagen von Aktionen
Die Algorithmen bestehen aus drei Teilen:
- Ein Entscheidungsprozess. Meistens werden Algorithmen des maschinellen Lernens verwendet, um eingehende Informationen vorherzusagen und zu organisieren. Basierend auf den bereitgestellten Daten erstellt der Algorithmus eine Vorhersage über ein Muster darin.
- Eine Fehlerfunktion. In diesem Teil des Algorithmus wird die Vorhersage des Modells bewertet. Sind bereits Beispiele untersucht worden, kann eine Fehlerfunktion einen Vergleich ermöglichen, um die Genauigkeit des Modells auszuwerten.
- Ein Modelloptimierungsprozess. Wenn sich das Modell leichter an die Datenpunkte im Trainings-Set anpassen kann, werden die Gewichtungen so angepasst, dass die Diskrepanz zwischen dem geprüften Beispiel und der Vorhersage des Modells minimiert wird. Der Algorithmus wiederholt diesen Prozess und aktualisiert die Gewichtungen, bis der Schwellenwert für die Genauigkeit erreicht ist.
Es gibt verschiedene Ansätze, wie diese Algorithmen gelehrt werden können, Daten zu nutzen. Sehen wir uns die vier Hauptansätze für maschinelles Lernen an.
Überwachtes Lernen.
Diese Unterkategorie des maschinellen Lernens verwendet gelabelte Datensätze zum Trainieren von Algorithmen und folgt Anweisungen auf Basis der bereitgestellten Informationen.
Maschinen werden mit Informationen aus gelabelten Datensätzen trainiert und werden befugt, auf Basis der bereitgestellten Anweisungen Outputs zu schätzen. Der gelabelte Datensatz legt die bereits dargestellten Eingabe- und Output-Parameter fest, und die Maschine wird anhand der Eingaben und dem zugehörigen Output trainiert.
Überwachtes Lernen wird in zwei große Kategorien unterteilt:
- Klassifizierung. Diese Algorithmen reagieren auf Klassifizierungsprobleme, bei denen die Output-Komponente kategorisch ist. Einige Beispiele hierfür sind „ja oder nein“ oder „wahr oder falsch“. Ein Beispiel für Klassifizierung im Alltag sind die Filterfunktionen in E-Mail-Programmen, die E-Mails in den primären Posteingang oder den Spam-Ordner sortieren. Zu den anerkannten Klassifizierungsalgorithmen gehören der Logistische Regressionsalgorithmus, der Support-Vektor-Maschinen-Algorithmus und der Random-Forest-Algorithmus.
- Regression. Diese Algorithmen lösen Regressionsprobleme, bei denen Eingabe- und Output-Komponenten eine lineare Beziehung haben. Sie prognostizieren, welche kontinuierlichen Output-Komponenten zu erwarten sind. Beispiele hierfür wären eine Markttendenzanalyse oder eine Wetterprognose. Zu den bekannten Regressionsalgorithmen zählen die einfache lineare Regression, die Lasso-Regression und die multivariate Regression.
Unüberwachtes Lernen.
Unüberwachtes Lernen wird eingesetzt, um nicht gelabelte Datensätze zu analysieren und zu gruppieren, um Muster ohne menschliche Intervention zu erkennen.
Ein unüberwachtes maschinelles Lernen-Programm durchsucht nicht gelabelte Daten und findet Muster, nach denen Menschen nicht gezielt suchen. Beispielsweise kann ein unbeaufsichtigtes maschinelles Lernen-Programm Hauptkundengruppen für einen Webstore identifizieren. Zu den bekannten Ansätzen des unüberwachten Lernens gehören das Nearest-Neighbor-Mapping und selbstorganisierende Karten.
Der Vorteil des unüberwachten Lernens besteht darin, Ähnlichkeiten und Unterschiede zwischen Gruppen ohne menschliches Zutun zu erkennen. Mit diesem Algorithmus können unsortierte Datensätze anhand von Mustern, Unterschieden und Ähnlichkeiten gruppiert werden.
Unüberwachtes Lernen hat auch einige Unterklassifizierungen:
- Gruppierung (Clustering). Dieser Ansatz gruppiert Objekte zu Clustern basierend auf Kriterien wie Unterschieden oder Ähnlichkeiten zwischen ihnen. Gruppierung von Kunden nach den Artikeln, die sie kaufen.
- Assoziation. Diese Technik identifiziert Standardbeziehungen zwischen den Variablen in einem großen Datensatz. Es bestimmt die Abhängigkeiten zwischen Datenelementen und stellt die zugehörigen Variablen dar.
Halbüberwachtes Lernen.
Wie der Name schon sagt, fusioniert dieser Ansatz Aspekte des überwachten und unüberwachten maschinellen Lernens.
Halbüberwachtes Lernen liest gelabelte und ungelabelte Datensätze, um seine Algorithmen zu trainieren. Die Kombination beider Datensätze beseitigt die Probleme, die bei der Einzelverwendung auftreten. Darüber hinaus verwendet der halbüberwachte Lernansatz kleinere gelabelte Datensätze, um größere ungelabelte Datensätze anzuleiten und zu verwalten. Die Datensätze werden üblicherweise so gruppiert, weil ungelabelte Datensätze weniger Aufwand erfordern und kostengünstiger zu beschaffen sind.
Stellt euch vor, ein Schüler lernt von einem Lehrer. Wenn ein Schüler Informationen von einem Lehrer erhält, spricht man von überwachtem Lernen. Beim selbstständigen Lernen zu Hause lernt der Schüler die Informationen ohne Überwachung durch einen Lehrer. Wenn der Schüler die Informationen, nachdem er sie selbstständig gelernt hat, anschließend in der Klasse mit dem Lehrer bespricht, entspricht das dem semi-überwachten Lernen.
Ein Beispiel für semi-überwachtes maschinelles Lernen im Alltag wäre eine Webcam, die Gesichter identifiziert.
Verstärkendes Lernen.
Verstärkendes Lernen trainiert über Belohnungssysteme. Es lernt nach dem Prinzip von Versuch und Irrtum, wobei erfolgreiche Ergebnisse die Empfehlungen verstärken. Verstärkendes Lernen verfügt nicht über gelabelte Daten wie die überwachte Lerntechnik. Diese Art des maschinellen Lernens funktioniert über einen Feedback-Prozess von Aktionen und lernt durch Erlebnisse.
Reinforcement Learning wählt die geeignetsten Aktionen, indem es aus Erfahrungen lernt und sein Verhalten entsprechend anpasst. Für korrekte Aktionen gibt es Belohnungen, falsche werden bestraft. So lernt das System, die richtigen Aktionen zu wählen.
Reinforcement Learning kommt häufig in Videospielen, der Robotik und der Navigation zum Einsatz. In Videospielen zum Beispiel definiert das Spiel die Umgebung, und jede Bewegung des Reinforcement-Learning-Agenten bestimmt den aktuellen Zustand des Agenten. Der Agent erhält Feedback durch Belohnungen und Strafen, die die Spielpunktzahl beeinflussen.
Es gibt zwei Arten von Reinforcement-Learning-Algorithmen:
- Positiv verstärkendes Lernen. Bei dieser Art des verstärkenden Lernens wird nach Ausführung eines bestimmten Verhaltens durch den Agenten ein positiver Reiz hinzugefügt, wodurch die Wahrscheinlichkeit steigt, dass dieses Verhalten in Zukunft erneut auftritt.
- Negativ verstärkendes Lernen. Diese Art der Verstärkung beinhaltet die Entfernung einer negativen Bedingung, um die Wahrscheinlichkeit zu erhöhen, dass ein bestimmtes Verhalten erneut auftritt, oder die Stärkung eines bestimmten Verhaltens, um ein negatives Ergebnis zu vermeiden.