UTF-8 Encoding
Posted: Fri 07.May.2010 17:56
Um die Anwendung auf anderen Sprachen laufen zu lassen, ist bei einigen Sprachen (aktuell Thai, Portugiesisch, Türkisch) eine andere Zeichenkodierung nötig. Gegenwärtig unterstützt die Seite den westlichen Zeichensatz ISO-88591-1. Damit andere Zeichen und möglicherweise auch gemischte Zeichensätze dargestellt werden können, muss die Ausgabe auf UTF-8 umgestellt werden.
Hier gibt es im Grunde vier Baustellen:
1. Die Ausgabe der Webseiten durch die Anwendung. Hier sind wohl einige Eingriffe bei der Ausgabe und beim Aufbau der Webseite notwendig. Das ist größtenteils jetzt schon durch die Erweiterung der Label-Implementierung für verschieden Sprachen vorgeleistet.
2. Umstellung der Schnittstelle zur Datenbank: Der Zeichensatz für das Abspeichern der Daten in der Datenbank muss auf UTF-8 angepasst werden. Das ist alles etwas heikler, weil auch unter Umständen die Einträge in der Datenbank konvertiert werden müssen.
3. Auch die Erstellung der PDF Dateien muss mit verschiedenen Zeichensätzen stattfinden. Das Programm, das die PDF Dateien erstellt unterstützt wohl erst mal kein UTF-8 aber ich habe eine Beispiel Implementierung gefunden, die mit mehreren Zeichensätzen in einem Set arbeitet und dann aus UTF-8 Rohtext automatisch den richtigen Text ausgibt. Das sah nicht besonders kompliziert aus und ich werde die Implementierung einfach übernehmen. Ich muss mir halt nur die verschiedenen Fonts als Dateien besorgen und die dann für die Anwendung irgendwo speichern. Dieser Punkt dürfte kein Problem sein.
4. Die Frage des Encodings dürfte sich auf für die Seiten stellen, welche über das CMS ausgegeben werden. Ich habe aber keine Ahnung, ob Etomite das unterstützt. Hier müssten sich eigentlich Gerald oder Martin darum kümmern.
Hier gibt es im Grunde vier Baustellen:
1. Die Ausgabe der Webseiten durch die Anwendung. Hier sind wohl einige Eingriffe bei der Ausgabe und beim Aufbau der Webseite notwendig. Das ist größtenteils jetzt schon durch die Erweiterung der Label-Implementierung für verschieden Sprachen vorgeleistet.
2. Umstellung der Schnittstelle zur Datenbank: Der Zeichensatz für das Abspeichern der Daten in der Datenbank muss auf UTF-8 angepasst werden. Das ist alles etwas heikler, weil auch unter Umständen die Einträge in der Datenbank konvertiert werden müssen.
3. Auch die Erstellung der PDF Dateien muss mit verschiedenen Zeichensätzen stattfinden. Das Programm, das die PDF Dateien erstellt unterstützt wohl erst mal kein UTF-8 aber ich habe eine Beispiel Implementierung gefunden, die mit mehreren Zeichensätzen in einem Set arbeitet und dann aus UTF-8 Rohtext automatisch den richtigen Text ausgibt. Das sah nicht besonders kompliziert aus und ich werde die Implementierung einfach übernehmen. Ich muss mir halt nur die verschiedenen Fonts als Dateien besorgen und die dann für die Anwendung irgendwo speichern. Dieser Punkt dürfte kein Problem sein.
4. Die Frage des Encodings dürfte sich auf für die Seiten stellen, welche über das CMS ausgegeben werden. Ich habe aber keine Ahnung, ob Etomite das unterstützt. Hier müssten sich eigentlich Gerald oder Martin darum kümmern.