Wenn der Browser nur Zeichensalat datenbankt…
Gregor Ottmann | November 6, 2006 on 4:06 pm | In Know-How |Man stelle sich eine Webapplikation vor, so eine mit einem Formular. Des weiteren sei an unserem Gedankenspiel ein Benutzer beteiligt, der Daten in dieses Formular einträgt, beispielsweise seinen Nachnamen. Das hypothetische Szenario wird so lange niemanden beunruhigen, wie alle erfassten Daten harmloser Natur sind, aber was wäre, wenn der Benutzer mit Nachnamen “Müller” hieße? Wenn alle Beteiligten Systeme zufällig Latin-1 sprechen, ist die Welt in Ordnung, aber wehe, wenn irgendwo UTF-8 verwendet wird. In diesem Fall ist eine sofortige Explosion der Großhirnrinde bei dem Entwickler zu befürchten, der sich um die Supportanfrage wegen der komischen Sonderzeichen kümmern muss, die plötzlich auf der Website auftauchen.
Meine bisherigen Erfahrungen haben mir gezeigt, dass es in den meisten Fällen erstaunlich wenig gibt, was man in so einem Fall tun kann - außer vielleicht, nach Jamaica auszuwandern und keine Adresse zu hinterlassen. Um aber wenigstens genau zu verstehen, was einem den Tag mal wieder versaut hat, sollte man sich mal den Artikel über die Zeichensatzspielereien zwischen Browser und Datenbank ansehen, von dem mir PFuchs berichtet hat. Wie gesagt: Retten wird einen das nicht, aber man hat dann wenigstens etwas, worüber man am Jamaicanischen Strand nachdenken kann, während man seinem alten Leben in der IT keine Träne nachweint und stattdessen den Rum zu sich nimmt, den man im Arbeitsleben immer dann gerne gehabt hätte, wenn jemand sowas wie “wir haben ein Encoding-Problem” gesagt hat.
1 Kommentar »
RSS-Feed für Kommentare zu diesem Beitrag.
Eintrag vornehmen
You must be LOGGED IN um einen Kommentar zu erstellen.
Entries and comments feeds.
Valid XHTML and CSS. ^Top^
:RSS2-Feed
Ich war dort, und ich bin lebend (wenn auch innerlich verändert) zurückgekehrt: Man kann UTF-8 machen, ohne tagtäglich in die Tischkante zu beißen.
Aber es gibt nur Einen Wahren Weg: Alles oder nichts. Jede Seite, jede Datei, jedes DB Feld, jedes Template, einfach alles alles alles muss man in völliger, absoluter Konsequenz UTF-8 machen. Sonst kann man es direkt bleiben lassen.
Kommentar von Manuel Kiessling — November 7, 2006 #