So crawlt und indexiert Google JavaScript-Funktionen
Kommentare

Schaut man sich die diversen Tipplisten zur Suchmaschinenoptimierung an, findet man auch immer wieder den Hinweis, dem Googlebot das Crawlen von externen Dateien – und insbesondere JavaScript – zu ermöglichen.

Tatsächlich glauben noch immer viele Webdesigner, dass Googles Algorithmus nicht richtig mit JavaScript umgehen kann, dabei ist Google fähig, JavaScript mit einer Vielzahl von Implementierungen auszuführen und zu indexieren. Wie Google JavaScript-Funktionen crawlt, zeigen die Ergebnisse einer Testreihe von Merkle | RKG, die Adam Audette zusammenfasst.

JavaScript-Links, Redirects und der Googlebot

Schon seit 2008 kann Google JavaScript erfolgreich crawlen – wenn auch zu Beginn noch eingeschränkt. Mittlerweile hat Google allerdings signifikante Fortschritte gemacht, was das Crawlen und die Indexierung von JavaScript angeht. Und nicht nur das: die Testergebnisse der von Merkle durchgeführten Tests zeigen, dass auch dynamisch generierter Content indexiert wird. Möglich wird das, indem Google den DOM ausliest und so nicht nur JavaScript-Code ausführt, sondern auch Content und Signale interpretiert, die dynamisch eingebunden wurden, zum Beispiel Title- oder Heading-Tags sowie Meta-Anmerkungen.

Interessant ist auch, wie Google sich bei JavaScript-Redirects verhält. Meist wird davon abgeraten, solche Redirects in einer Website zu nutzen. Die Tests zeigen allerdings, dass Google sie als 301-Meldungen indexiert, also die End-State-URL mit der umgeleiteten URL ersetzt und so das Suchmaschinenranking nicht negativ beeinflusst.

Auch JavaScript-Links, die auf verschiedene Arten geschrieben wurden, waren Teil der Tests. Gerade in Dropdown-Menüs hatten Suchmaschinen in der Vergangenheit oft Probleme, den Links zu folgen, sodass meist dazu geraten wird, sie zu Plain-Text zu ändern. Tatsächlich werden verschiedene Arten von JavaScript-Links vom Googlebot zuverlässig gecrawlt und verfolgt.

Dynamisch eingebundener Content wird problemlos indexiert

Websites werden heutzutage immer dynamischer, vor allem, wenn es um die Einbindung von Text, Bildern, Links und der Navigation geht. Die Tests zeigen, dass dynamisch eingebundener Content sowohl gecrawlt und indexiert wird, wenn sich der entsprechende Content in der HTML-Quelle der Seite befindet, als auch, wenn darauf aus einer externen JavaScript-Datei zugegriffen wird. Genau aus diesem Grund ist es wichtig, dass dem Googlebot Zugriff auf externe Dateien erlaubt wird.

Bilder oder Text ist allerdings nicht das Einzige, das dynamisch eingebunden werden kann. Auch Metadaten und Seitenelemente, die für die Suchmaschinenoptimierung wichtig sind, können im DOM eingebunden werden, etwa Title-Elemente, Meta-Beschreibungen oder Canonical Tags. Sie werden vom Googlebot wie normale HTML-Elemente im Quellcode behandelt und entsprechend gecrawlt und indexiert.

Auch nofollow-Links im Quellcode werden vom Googlebot erwartungsgemäß behandelt – also nicht verfolgt. Setzt man jedoch im DOM einen Link auf nofollow, ignoriert Google das Attribut, verfolgt den Link und indexiert die neue Seite, weil die Modifizierung des a href-Elements im DOM zu spät erfolgt. Erst wenn das gesamte a href-Element plus dem nofollow-Attribut in den DOM eingebunden wird, erkennt Google das Attribut zur gleichen Zeit wie den Link und setzt es entsprechend um.

Die Tests zeigen also vor allem eins: das Google einen großen Schritt voran bei der Art und Weise, wie der Googlebot Websites indexiert, gemacht hat. Frühere Empfehlungen, so viel Content wie möglich als Plain Text darzustellen, muss – und sollte – nicht mehr die Norm sein, denn es wird deutlich, dass Google gerade JavaScript fast problemlos crawlen und indexieren kann. Für die Suchmaschinenoptimierung bedeutet das auch, sich den DOM zu Nutze zu machen und externe JavaScript-Dateien zugänglich zu machen, denn, so erklärt Adam Audette:

If you don’t take the DOM into consideration, you may be missing half of the picture.

Aufmacherbild: Programming code abstract screen of software developer. Computer script. von Shutterstock / Urheberrecht: McIek

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -