SyntaxNet und Parsey McParseface helfen bei H2M-Kommunikation

Google stellt Spracherkennungssoftware Open Source
Kommentare

Die menschliche Sprache zu verstehen, ist für Computer noch immer eine der komplexesten Aufgaben. Google hat auf dem Gebiet der künstlichen Intelligenz bereits einiges geleistet und stellt jetzt zwei weitere Tools quelloffen zur Verfügung, die beim Verständnis von Sprache helfen sollen: das neurale Netzwerk-Framework SyntaxNet und der Parser Parsey McParseface.

Google hat mit seinen Forschungen rund um die künstliche Intelligenz die Entwicklung von Applikationen, die menschliche Sprache verstehen, verändert. Man denke nur an die KI AlphaGo, die den weltbesten menschlichen Go-Spieler besiegte, oder die Thought Vectors, die die Maschine-zu-Mensch-Kommunikation verbessern sollen. Zwei weitere Resultate dieser Bemühungen  sind jetzt frei verfügbar: SyntaxNet und der Parser Parsey McParseface. Das Release der Spracherkennungssoftware beinhaltet dabei alles, was Entwickler für das Training von SyntaxNet-Modellen mit ihren eigenen Datensets benötigen.

Google: Spracherkennung wird Open Source

Das präziseste Spracherkennungstool von Google, SyntaxNet, steht ab sofort Open Source zur Verfügung. Bei SyntaxNet handelt es sich um ein in TensorFlow eingebettetes neurales Netzwerk-Framework, das die Grundlage für Natural-Language-Understanding-Systeme (NLU) bietet. Das Framework hilft dabei, die grammatischen Bestandteile von Sätzen zu identifizieren. So können nahezu fehlerfrei etwa Subjekt, Objekt und Prädikat bestimmt werden, was den künstlichen Intelligenzen wiederum ermöglicht, die Bedeutung von Sätzen und das Verhältnis der Wörter zueinander zu verstehen.

Satzstruktur, Quelle: http://googleresearch.blogspot.de/2016/05/announcing-syntaxnet-worlds-most.html

Satzstruktur, Quelle: http://googleresearch.blogspot.de/2016/05/announcing-syntaxnet-worlds-most.html

Vor allem bei längeren Sätzen und mehrdeutigem Satzbau haben Computer Schwierigkeiten, die genaue Bedeutung zu erfassen. So hat bereits der relativ simple Satz „Alice drove down the street in her car“ für den Menschen nur eine logische Bedeutung, für eine Maschine aber mindestens zwei: So ist für uns klar, dass Alice in ihren Auto die Straße entlang gefahren ist. Ein Computer könnte aber auf den Gedanken kommen, dass sich eine Straße in Alice’ Auto befindet. Wie Google Senior Staff Research Scientist Slav Petrov erklärt, wird ein Satz von SyntaxNet von links nach rechts analysiert. Mit jedem Schritt werden wiederum Bezüge oder Abhängigkeiten der Wörter untereinander hergestellt.

Satzanalyse, Quelle: http://googleresearch.blogspot.de/2016/05/announcing-syntaxnet-worlds-most.html

Satzanalyse, Quelle: http://googleresearch.blogspot.de/2016/05/announcing-syntaxnet-worlds-most.html

Das neurale Netzwerk überprüft in Folge seine eigenen Ergebnisse auf Plausibilität und nutzt dafür einen Algorithmus namens Beam Search. Klingt kompliziert? Ist es auch. Laut Google handelt es sich dabei um eines der komplexesten Modelle, die bislang mit TensorFlow trainiert wurden.

Weiterführende Informationen zur Funktionsweise von SyntaxNet finden sich auch in der Forschungsarbeit von Google.

Parsey McParseface, der Sprachversteher

Zu dem Release-Paket gehört auch der Parser Parsey McParseface, dessen Name auf die Online-Abstimmung zur Benennung eines Schiffs anspielt. Mit überwältigender Mehrheit sollte das britische Forschungsschiff laut Netzgemeinde Boaty McBoatface heißen, was den Verantwortlichen dann aber doch nicht so ganz in den Kram passte.

Parsey McParseface jedenfalls ist ein bereits vortrainierter Parser, der zur Analyse von englischen Texten genutzt werden kann. Er basiert auf mächtigen Machine-Learning-Algorithmen, die die linguistische Struktur eines Satzes analysieren und die funktionale Rolle jedes Wortes erklären können. Parsey McParseface gilt als präzisestes Analyse-Tool für die englische Sprache und kann Sprache mit einer Genauigkeit von über 94 Prozent verstehen. Ausgebildete Linguisten erreichen bei solchen Standard-Benchmarks Werte von 96-97 Prozent. Gibt man dem Parser zufällig ausgewählte Texte zu „lesen“, liegt seine Genauigkeit immer noch bei knapp über 90 Prozent.

Ausführliche Informationen zu SyntaxNet und Parsey McParseface finden sich im zugehörigen Blogpost im Google-Research-Blog. Von dort können der SyntaxNet-Code und das Parser-Modell auch heruntergeladen werden.

Aufmacherbild: Speech recognition smartphone von Shutterstock / Urheberrecht: kiko_kiko

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -