Schon mit dem Open-Source-Tool Computational Network Toolkit (CNTK) wollte Microsoft das Feld der künstlichen Intelligenz für eine breitere Gruppe von Entwicklern zugänglich machen.
Dazu wurde das Deep-Learning-Tool im Januar 2016 unter MIT-Lizenz auf GitHub bereitgestellt. Das Entwickeln eigener KI-Anwendungen mit dem CNTK war allerdings bislang nicht besonders einfach. Aus diesem Grund hat Microsoft nun eine aktualisierte Version des Toolkits veröffentlicht.
Microsoft Cognitive Toolkit unterstützt KI-Entwickler
Das bislang als Computational Network Toolkit (CNTK) bekannte Deep-Learning-Tool hat mit seinem Update auch einen neuen Namen spendiert bekommen: Ab sofort läuft das Tool unter dem Namen Microsoft Cognitive Toolkit. Das Deep-Learning-System soll vor allem im Bereich Sprach- und Bilderkennung sowie zum Erstellen von Such-Indizes auf CPUs und NVIDIA GPUs zum Einsatz kommen.
In seiner aktuellen Version enthält das Microsoft Cognitive Toolkit einige neue Funktionalitäten, die eine Nutzung von Python- und C++-Programmiersprachen ermöglichen. Zudem können Entwickler auch eine weitere Art von künstlicher Intelligenz nutzen, das sogenannte Reinforcement Learning. Zudem liefert das Toolkit eine wesentlich bessere Performance als die Vorgängerversionen und andere Toolkits – besonders bei der Arbeit an großen Datenbeständen über verschiedene Maschinen hinweg.
Genau diese Fähigkeit ist laut Microsoft der entscheidende Vorteil gegenüber anderen Deep-Learning-Toolkits, die auf Performance- und Genauigkeitsprobleme bei der Arbeit über mehrere Server hinweg stoßen. Um solchen Verschlechterungen in der Berechnung vorzubeugen, greift das Microsoft Cognitive Toolkit auf integrierte Algorithmen zurück.
One key reason to use Microsoft Cognitive Toolkit is its ability to scale efficiently across multiple GPUs and multiple machines on massive data sets.
KI bringt Fortschritte in Spracherkennung
Des Weiteren ist das Deep-Learning-Toolkit auch Grundlage für den Durchbruch im Bereich der Maschine-Mensch-Interaktion: Forscher bei Microsoft haben vor kurzem ein Spracherkennungssystem vorgestellt, das genau so viele oder sogar weniger Fehler macht wie professionelle Transkribierer. Dabei konnte eine Wort-Fehler-Quote von 5,9 Prozent erzielt werden. Diese Quote entspricht etwa der von Menschen, die dieselbe Konversation niederschrieben, und ist gleichzeitig die geringste jemals gegen den Industriestandard Switchboard Speech Recognition Task gemessene WER. Somit kann ein Computer erstmals gesprochene Sprache genauso gut erkennen wie ein Mensch.
Entwickelt wurde das Toolkit ursprünglich aus der Not heraus: Forscher bei Microsoft brauchten eine effiziente Lösung, um die Fähigkeit von Computern, Sprache zu erkennen, schneller voranzutreiben. Die zur Verfügung stehenden Tools genügten den Ansprüchen nicht – eine hauseigene Software sollte darum Abhilfe leisten. Der Erfolg von CNTK war dann schnell so groß, dass das Toolkit produktiv eingesetzt wurde.
Ausführliche Informationen zum Microsoft Cognitive Toolkit finden sich im zugehörigen Blogpost.