Google hat mit seinen Forschungen rund um die künstliche Intelligenz die Entwicklung von Applikationen, die menschliche Sprache verstehen, verändert. Man denke nur an die KI AlphaGo, die den weltbesten menschlichen Go-Spieler besiegte, oder die Thought Vectors, die die Maschine-zu-Mensch-Kommunikation verbessern sollen. Zwei weitere Resultate dieser Bemühungen sind jetzt frei verfügbar: SyntaxNet und der Parser Parsey McParseface. Das Release der Spracherkennungssoftware beinhaltet dabei alles, was Entwickler für das Training von SyntaxNet-Modellen mit ihren eigenen Datensets benötigen.
Google: Spracherkennung wird Open Source
Das präziseste Spracherkennungstool von Google, SyntaxNet, steht ab sofort Open Source zur Verfügung. Bei SyntaxNet handelt es sich um ein in TensorFlow eingebettetes neurales Netzwerk-Framework, das die Grundlage für Natural-Language-Understanding-Systeme (NLU) bietet. Das Framework hilft dabei, die grammatischen Bestandteile von Sätzen zu identifizieren. So können nahezu fehlerfrei etwa Subjekt, Objekt und Prädikat bestimmt werden, was den künstlichen Intelligenzen wiederum ermöglicht, die Bedeutung von Sätzen und das Verhältnis der Wörter zueinander zu verstehen.

Satzstruktur, Quelle: http://googleresearch.blogspot.de/2016/05/announcing-syntaxnet-worlds-most.html
Vor allem bei längeren Sätzen und mehrdeutigem Satzbau haben Computer Schwierigkeiten, die genaue Bedeutung zu erfassen. So hat bereits der relativ simple Satz „Alice drove down the street in her car“ für den Menschen nur eine logische Bedeutung, für eine Maschine aber mindestens zwei: So ist für uns klar, dass Alice in ihren Auto die Straße entlang gefahren ist. Ein Computer könnte aber auf den Gedanken kommen, dass sich eine Straße in Alice’ Auto befindet. Wie Google Senior Staff Research Scientist Slav Petrov erklärt, wird ein Satz von SyntaxNet von links nach rechts analysiert. Mit jedem Schritt werden wiederum Bezüge oder Abhängigkeiten der Wörter untereinander hergestellt.

Satzanalyse, Quelle: http://googleresearch.blogspot.de/2016/05/announcing-syntaxnet-worlds-most.html
Das neurale Netzwerk überprüft in Folge seine eigenen Ergebnisse auf Plausibilität und nutzt dafür einen Algorithmus namens Beam Search. Klingt kompliziert? Ist es auch. Laut Google handelt es sich dabei um eines der komplexesten Modelle, die bislang mit TensorFlow trainiert wurden.
Weiterführende Informationen zur Funktionsweise von SyntaxNet finden sich auch in der Forschungsarbeit von Google.
Parsey McParseface, der Sprachversteher
Zu dem Release-Paket gehört auch der Parser Parsey McParseface, dessen Name auf die Online-Abstimmung zur Benennung eines Schiffs anspielt. Mit überwältigender Mehrheit sollte das britische Forschungsschiff laut Netzgemeinde Boaty McBoatface heißen, was den Verantwortlichen dann aber doch nicht so ganz in den Kram passte.
Parsey McParseface jedenfalls ist ein bereits vortrainierter Parser, der zur Analyse von englischen Texten genutzt werden kann. Er basiert auf mächtigen Machine-Learning-Algorithmen, die die linguistische Struktur eines Satzes analysieren und die funktionale Rolle jedes Wortes erklären können. Parsey McParseface gilt als präzisestes Analyse-Tool für die englische Sprache und kann Sprache mit einer Genauigkeit von über 94 Prozent verstehen. Ausgebildete Linguisten erreichen bei solchen Standard-Benchmarks Werte von 96-97 Prozent. Gibt man dem Parser zufällig ausgewählte Texte zu „lesen“, liegt seine Genauigkeit immer noch bei knapp über 90 Prozent.
Ausführliche Informationen zu SyntaxNet und Parsey McParseface finden sich im zugehörigen Blogpost im Google-Research-Blog. Von dort können der SyntaxNet-Code und das Parser-Modell auch heruntergeladen werden.
Efficient Transformers
Christoph Henkelmann, DIVISIO
Enhancing Page Visits by Topic Prediction
Dieter Jordens, Continuum Consulting NV
Machine Learning on Edge using TensorFlow
Håkan Silfvernagel, Miles AS
Aufmacherbild: Speech recognition smartphone von Shutterstock / Urheberrecht: kiko_kiko