Bücher

Natural Language Processing mit PyTorch
Keine Kommentare

Systeme wie Alexa oder Siri haben das Konzept des Natural Language Processing (NLP) in den Mittelpunkt der Aufmerksamkeit gerückt – wenig bekannt ist übrigens, dass es dazu in der Vergangenheit schon Versuche gab. Bei O’Reilly ist nun ein deutschsprachiges Lehrbuch erschienen, das Quereinsteigern das Natural Language Processing nahebringen will.

Schon in der Einleitung versprechen die Autoren, dass sich das mit 250 Seiten nicht allzu dicke Buch nicht übermäßig mit Mathematik befasst – stattdessen soll es mit Hilfe der PyTorch-Bibliothek Anfängern beim schnellen Erreichen erster Ergebnisse helfen. Im ersten Kapitel werden Tensoren behandelt, wobei die Erklärung nicht allzu anspruchsvoll ausfällt. Im zweiten Kapitel geht es dann um Begriffe wie Lemmata, Trigramme und Tokens – Termini, denen man in der Welt des NLP immer wieder begegnet.

Der O’Reilly-Verlag lieferte mit „AI for Game Developers“ vor einigen Jahren ein Lehrbuch aus, das neuronale Netzwerke quasi nebenbei auf eine so klare Art und Weise erklärte, dass sich Entwickler bis heute daran erinnern. Das dritte Kapitel des neuen Buchs gibt eine ähnlich detaillierte Einführung in die hinter NLP stehenden Theorien. Danach wird ein erstes Experiment mit einer Vokabularklasse durchgeführt. Es folgen Experimente mit Feed-Forward-Netzen, die durch die Verknüpfung mehrerer Netzwerkebenen bei der Lösung komplizierter Probleme (und der berühmt-berüchtigten Xor-Funktion) helfen.

Eine alte Weisheit besagt, dass ein besseres Verständnis der Problemdomäne immer auch – direkt oder indirekt – zu besseren Programmergebnissen führt. Das fünfte Kapitel setzt sich deshalb mit der Einbettung von Wörtern und Typen auseinander. Die drei darauffolgenden Kapitel zeigen die Sequenzmodellierung zur weiteren Verbesserung der Verarbeitung von eingehenden Textinformationen. Um Missverständnissen vorzubeugen, sei angemerkt, dass sich Natural Language Processing mit PyTorch auf die Auswertung von im Stringformat vorliegenden Texten konzentriert – wer gesprochene Sprache à la Dragon transkribieren möchte, ist hier falsch.

Besonders interessant ist das achte Kapitel, das eine sehr einfache erste Version eines maschinellen Übersetzungsprogramms für natürliche Sprache realisiert. Hier findet sich auch der einzige wirkliche Übersetzungsschnitzer – einer der Untertitel ist auf Englisch stehen geblieben.

Das Buch endet mit einem rund zehn Seiten langen Kapitel, das dem Einsteiger den weiteren Weg demonstriert. Am Ende dieses Kapitels finden sich – wie in fast allen anderen Kapiteln auch – Literaturhinweise, die bei der Vertiefung des erlernten Wissens helfen können. Wenn Sie eine schnelle und doch umfangreiche Einführung in die Welt der Verarbeitung der natürlichen Sprache suchen, machen Sie mit „Natural Language Processing mit PyTorch“ nichts falsch. Dass man auf 250 Seiten nicht tief in die zugrunde liegende Mathematik einsteigen kann, ist klar. Dank der gelungenen Übersetzung des englischen Originals müssen Sie sich nicht einmal Gedanken über die Sprache machen – unterm Strich ein durchaus empfehlenswerter Kauf.

Delip Rao und Brian McMahan

Natural Language Processing mit PyTorch

Intelligente Sprachanwendungen mit Deep Learning erstellen

250 Seiten, 36,90 EuroO’Reilly, 2019ISBN 978-3-96009-118-9

Unsere Redaktion empfiehlt:

Relevante Beiträge

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu:
X
- Gib Deinen Standort ein -
- or -