Was ist Deep Learning? Alles, was Sie wissen müssen

Was ist Deep Learning?
(Bildnachweis: Shutterstock)

Obwohl die Technologie in den letzten Jahren einen gewaltigen Sprung nach vorn gemacht hat, nicht zuletzt im Hinblick auf die ungeheure Leistungsfähigkeit und die Ressourcen, die durch Cloud-Computing-Dienste zur Verfügung stehen, ganz zu schweigen von den riesigen Datenmengen, die den Cloud-Speichern zugeordnet werden können, können Computer und Maschinen immer noch nicht mit der Leistungsfähigkeit des menschlichen Gehirns mithalten.

Was uns Menschen so einzigartig macht, ist, dass wir aus unseren Erinnerungen und Erfahrungen lernen können. Das bedeutet, dass wir Daten aus der Welt um uns herum aufnehmen und Ideen darüber entwickeln können, wie wir Aufgaben optimal erfüllen oder neue Informationen verarbeiten können.

Das tiefe Lernen, ein Zweig der künstlichen Intelligenz, zielt darauf ab, die menschliche Fähigkeit, zu lernen und sich zu entwickeln, in Maschinen nachzubilden. Letztendlich ermöglicht es das tiefe Lernen, dass Computer neue Informationen aufnehmen, interpretieren und verarbeiten können, ohne dass der Mensch in den Prozess einbezogen werden muss. Das hätte enorme Auswirkungen auf die Technologien der Zukunft, einschließlich selbstfahrende Fahrzeuge, Gesichtserkennungssoftware, personalisierte Medizin und vieles mehr.

Computern das Finden von Mustern beibringen

Das Endziel des tiefen Lernens ist es, dem Computer beizubringen, wie er aus einer Menge unstrukturierter Daten Muster erkennen kann. Ein einfaches Beispiel für unstrukturierte Daten ist ein Bild einer realen Szene, in der Dinge wie der Himmel, Bäume und Menschen nicht von einem menschlichen Beobachter für den Computer markiert werden. Ein durch tiefes Lernen trainierter Algorithmus sollte in der Lage sein, diese einzelnen Komponenten zu identifizieren. Das heißt, er sollte in der Lage sein, zu erkennen, welche Pixel im Bild eine Person, welche einen Baum und welche einen Teil des Himmels bilden.

Im weiteren Sinne kann diese Fähigkeit zur Mustererkennung auf fast alles angewendet werden. In einem selbstfahrenden Auto zum Beispiel sollte der Computer in der Lage sein, ein Stoppschild zu erkennen und das Auto dann entsprechend zu stoppen. In der Medizin sollte ein tief lernender Algorithmus in der Lage sein, ein Mikroskopbild von Zellen zu betrachten und zu entscheiden, ob diese Zellen krebsartig sind oder nicht.

Das tiefe Lernen hat im Wesentlichen das gleiche Ziel wie das maschinelle Lernen, das in der modernen Technik eine immer größere Rolle spielt. Allerdings ist das maschinelle Lernen in seiner Datenmenge begrenzt. Es kann zum Beispiel bei der Erkennung von Merkmalen in einer Reihe von Bildern gut sein, aber maschinelles Lernen hat nicht die Fähigkeit, sich an eine 3-dimensionale Szene anzupassen, wie es ein selbstfahrendes Auto tun muss.

Tiefes Lernen hingegen bietet eine nahezu unbegrenzte Lernkapazität, die theoretisch eines Tages die Kapazität des menschlichen Gehirns übersteigen könnte. Das liegt an der Gruppe von Algorithmen, die dem tiefen Lernen zugrunde liegen, die als neuronale Netze bezeichnet werden.

Kopieren der Hirn-Verbindungen

Neuronale Netze werden so genannt, weil sie im Wesentlichen die Funktion von Nervenzellen im menschlichen Gehirn nachahmen sollen. Diese Netze bestehen aus drei Schichten digitaler Neuronen: der Eingangsschicht, der Zwischenschicht und der Ausgabeschicht.

Die Eingangsschicht ist eine Reihe von digitalen Neuronen, die die Informationen, die der Computer erhält, "sehen". Ein Neuron kann z.B. feuern, wenn die Farbe Grün in einem Bild vorhanden ist, während ein anderes feuern kann, wenn eine bestimmte Form vorhanden ist. Es kann Tausende von Eingangsschicht-Neuronen geben, von denen jedes feuert, wenn es eine bestimmte Eigenschaft in den Daten sieht.

Die Ausgangsschicht sagt dem Computer, was er als Reaktion auf die Eingabedaten tun soll. In einem selbstfahrenden Auto wären dies die digitalen Neuronen, die dem Computer schließlich sagen, dass er beschleunigen, bremsen oder abbiegen soll.

Die eigentliche Magie eines neuronalen Netzes geschieht in der Zwischenschicht. Diese Schicht nimmt die Neuronenfeuer von der Eingangsschicht und leitet sie um, um die entsprechenden Neuronen der Ausgangsschicht zu feuern. Die verborgene Schicht besteht aus Tausenden oder Millionen einzelner Reihen von Neuronen, von denen jede mit allen ihren Nachbarn innerhalb des Netzwerks verbunden ist.

Beim Training eines tief lernenden Modells wird das Modell mit einem Bild, Muster oder einer Situation gefüttert, für die die gewünschte Modellausgabe bereits bekannt ist. Während des Trainings wird jede Verbindung von einem Neuron zum anderen verstärkt oder abgeschwächt, je nachdem, wie nahe der tatsächliche Output des Netzwerks am gewünschten Output liegt. Wenn es sehr eng war - unser selbstfahrendes Auto hat am Stoppschild angehalten - könnten sich die Verbindungen gar nicht so stark verändern. Ist das Modellergebnis jedoch weit vom beabsichtigten Ergebnis entfernt, werden die Verbindungen zwischen den Neuronen leicht angepasst.

Wenn man dies millionenfach macht, kann das Netzwerk Verbindungen verstärken, welche die gewünschte Modellleistung gut erbringen, und Verbindungen schwächen, die das Modellergebnis verfälschen. Das endgültige Modell hat also gelernt, wie man neue Daten aufnimmt, Muster erkennt und auf der Grundlage dieser Muster ohne menschliche Aufsicht das gewünschte Ergebnis produziert.

Zukunftstechnologie und tiefes Lernen 

Tiefes Lernen verspricht viel für neue automatisierte Technologien. Selbstfahrende Autos sind vielleicht die prominenteste potenzielle Anwendung von Algorithmen für tiefes Lernen, aber es gibt weit mehr Anwendungen in der Geschäftswelt und darüber hinaus.

Zum Beispiel könnte das tiefe Lernen große Auswirkungen auf die Finanzindustrie haben. Banken könnten tiefgehendes Lernen zum Schutz Ihrer Online-Konten nutzen, indem sie ein Modell lehren, um festzustellen, ob Ihr letzter Anmeldeversuch Ihren üblichen Anmeldungen ähnelt. Oder Banken können Algorithmen für tiefes Lernen anwenden, um betrügerische Aktivitäten wie Geldwäsche besser aufzudecken. Eine weitere Möglichkeit besteht darin, dass Banken und Investmentfirmen tiefgehendes Lernen anwenden, um vorherzusagen, wann die Aktienkurse steigen oder fallen werden.

Eine weitere Anwendung der Tiefenlerntechnologie ist die Gesichtserkennung. Damit die Gesichtserkennung auf breiter Ebene funktioniert, muss der Computer in der Lage sein, Sie zu erkennen, egal ob Sie sich die Haare schneiden, bräunen oder sich schminken lassen. Ein Algorithmus für tiefes Lernen, der an Bildern Ihres Gesichts trainiert wird, würde es einer Gesichtserkennungssoftware ermöglichen, Sie zu erkennen, egal wie Sie an einem bestimmten Tag aussehen, während andere nicht auf Ihre Accounts zugreifen können.

Interessanterweise kann tiefes Lernen auch Wissenschaftlern helfen, Erdbeben und andere Naturkatastrophen vorherzusagen. In erdbebengefährdeten Gebieten zittert der Boden fast immer ein wenig. Mit Hilfe von Modellen zum tiefen Lernen kann man trainieren, welche Art von Beben in der Vergangenheit vor Erdbeben aufgetreten sind - und dann Alarm schlagen, wenn dieselben Muster in der Zukunft entdeckt werden.

Da sich die Technologie für das tiefe Lernen immer weiter verbessert, wird die Liste der möglichen Anwendungen wahrscheinlich nur noch länger und beeindruckender werden. Wir können Computern vielleicht beibringen, Muster zu erkennen, aber die menschliche Kreativität wird entscheidend sein, um herauszufinden, wie das tiefe Lernen am besten für die Gesellschaft eingesetzt werden kann.

Michael Graw

Michael Graw is a freelance journalist and photographer based in Bellingham, Washington. His interests span a wide range from business technology to finance to creative media, with a focus on new technology and emerging trends. Michael's work has been published in TechRadar, Tom's Guide, Business Insider, Fast Company, Salon, and Harvard Business Review.