Künstliche Intelligenz
Technische Grundlagen
Anwendungsbereiche des Maschinellen Lernens
Die Anwendungsbereiche des maschinellen Lernens bestehen in spezifischen Technologien, die aus den Lernmethoden hervorgehen. Während die Lernmethoden die grundlegenden Ansätze zum Lernen aus Daten definieren, stellen die Technologien die Anwendung dieser Methoden dar, um konkrete Probleme in der Praxis zu lösen.
Neuronale Netze
Neuronale Netze sind inspiriert von der Funktionsweise des menschlichen Gehirns und bestehen aus einer Vielzahl von miteinander verbundenen Knoten, den sogenannten Neuronen. Diese Neuronen sind in unterschiedlichen Schichten organisiert: der Eingabeschicht, einer oder mehreren verborgenen Schichten und der Ausgabeschicht.
Abbildung: Einfaches Neuronales Netzwerk in Anlehnung an Kreutzer, R.T. (2023)1
Bei der Eingabeschicht werden die Daten in das Netzwerk eingeführt, sodass jedes Neuron dieser Schicht ein Merkmal der Eingabedaten repräsentiert.
In der verdeckten Schicht werden die Eingabedaten durch gewichtete Summen und Aktivierungsfunktionen verarbeitet, um komplexe Muster zu erkennen. Diese Schicht ist entscheidend für das Lernen und die Modellierung nichtlinearer Zusammenhänge zwischen den Ein- und Ausgaben.
Bei der Ausgabeschicht erzeugt das Netzwerk die endgültige Ausgabe, die je nach Problemstellung eine Klassifikation, eine Vorhersage oder eine andere Form von Ergebnis sein kann.
Der Lernprozess eines neuronalen Netzes erfolgt typischerweise durch einen Algorithmus namens Backpropagation. Dabei werden die Gewichte der Verbindungen zwischen den Neuronen angepasst, um die Differenz zwischen der vorhergesagten Ausgabe und der tatsächlichen Ausgabe zu minimieren. Dies geschieht durch den Einsatz von Optimierungsverfahren wie dem Gradientenabstieg, der die Gewichte schrittweise anpasst, um Fehler zu reduzieren.2
Deep Learning
Deep Learning ist ein Anwendungsbereich des Maschinellen Lernens, der sich auf die Analyse großer Datenmengen spezialisiert, um Muster zu erkennen und präzise Vorhersagen zu treffen. Im Kern basiert Deep Learning auf mehrschichtigen neuronalen Netzen, die es ermöglichen, komplexe Merkmale und Zusammenhänge in Daten zu erfassen. Deep Learning-Modelle können sowohl im supervised als auch im unsupervised Learning eingesetzt werden, wobei sie je nach Aufgabe unterschiedliche Ansätze zur Mustererkennung nutzen.
Technisch gesehen arbeitet Deep Learning durch den Einsatz von Aktivierungsfunktionen, die in jedem Neuron bestimmen, wie es auf die eingehenden Daten reagiert und ob das Neuron „aktiviert“ wird, also ob es ein Signal an die nächste Schicht weitergibt. Zusätzlich kommen Optimierungsalgorithmen zum Einsatz, die die Neuronenverbindungen so anpassen, dass die Vorhersagen des Modells immer genauer werden.
Der Begriff Deep (Tiefe) im Deep Learning bezieht sich auf die Anzahl der Schichten in einem neuronalen Netzwerk. Je mehr Schichten das Netzwerk hat, desto komplexer können die Muster sein, die es erkennen kann. Nach der Trainingsphase können die Modelle Aufgaben automatisch ausführen, meist ohne weiteres menschliches Eingreifen.3
Abbildung: Mehrschichtiges Neuronales Netzwerk in Anlehnung an2
Literaturnachweise
[1] Ralf T. Kreuzer und Marie Sirrenberg, „Was versteht man unter Künstlicher Intelligenz und wie kann man sie nutzen?“. in: Künstliche Intelligenz verstehen, Springer Gabler 2019.
[2] Mingfeng Li, „Comprehensive Review of Backpropagation Neural Networks“, in: Academic Journal of Science and Technology 9, 2024.
[3] Yann LeCun, Yoshua Bengio und Geoffrey Hinton, „Deep learning“, in: Nature 521, 2015.
