Doch warum eigentlich die Mühe; und wo treten Encoding-Probleme eigentlich auf? Natürlich bei der Erstellung von PHP/HTML-Seiten, beim Anwender, der die Seiten in seinem Browser betrachtet, in der Datenbank und überhaupt in jedem Read/Write-Vorgang. Da ist es natürlich naheliegend, dass an drei Stellen Hand angelegt werden muss:
- Die IDE konfigurieren: Die IDE sollte so konfiguriert werden, dass sie die Daten als UTF-8-kodiert speichert. An FTP- und andere Clients muss nicht Hand angelegt werden.
- Dem Browser des Users Bescheid geben: Ganz klar, HTML- und PHP-Dateien sollen den entsprechenden Content-Type im Header stehen haben.
- MySQL umstellen: Mit einfachen Befehlen sollte man Tabellen auf UTF-8 umstellen.
Drei Schwachpunkte, die mit drei kleinen Handgriffen ausgemerzt werden können. Fehlt zu guter letzt nur noch der Hinweis, dass die Funktion strlen() die Anzahl der Bytes zurückgibt – nicht mehr die Anzahl der Zeichen. Wer noch mehr Informationen haben möchte, sollte einen Blick in Bettina Ramms Artikel UTF-8 für alle werfen.