Die Sache mit dem Encoding
Kommentare

Zum Einstieg nach dem langen Osterwochenende möchten wir Ihnen ein zwar altes aber noch immer aktuelles Problem ins Gedächtnis rufen: das Character Encoding. James Cohen hat dazu in How to Avoid Character

Zum Einstieg nach dem langen Osterwochenende möchten wir Ihnen ein zwar altes aber noch immer aktuelles Problem ins Gedächtnis rufen: das Character Encoding. James Cohen hat dazu in How to Avoid Character Encoding Problems in PHP mit ein paar Anhaltspunkten und Tipps zusammengeschrieben, die man beim Umstieg auf UTF-8 beachten sollte.

Doch warum eigentlich die Mühe; und wo treten Encoding-Probleme eigentlich auf? Natürlich bei der Erstellung von PHP/HTML-Seiten, beim Anwender, der die Seiten in seinem Browser betrachtet, in der Datenbank und überhaupt in jedem Read/Write-Vorgang. Da ist es natürlich naheliegend, dass an drei Stellen Hand angelegt werden muss:

  1. Die IDE konfigurieren: Die IDE sollte so konfiguriert werden, dass sie die Daten als UTF-8-kodiert speichert. An FTP- und andere Clients muss nicht Hand angelegt werden.
  2. Dem Browser des Users Bescheid geben: Ganz klar, HTML- und PHP-Dateien sollen den entsprechenden Content-Type im Header stehen haben.
  3. MySQL umstellen: Mit einfachen Befehlen sollte man Tabellen auf UTF-8 umstellen.

Drei Schwachpunkte, die mit drei kleinen Handgriffen ausgemerzt werden können. Fehlt zu guter letzt nur noch der Hinweis, dass die Funktion strlen() die Anzahl der Bytes zurückgibt – nicht mehr die Anzahl der Zeichen. Wer noch mehr Informationen haben möchte, sollte einen Blick in Bettina Ramms Artikel UTF-8 für alle werfen.

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -