Boardunity & Video Forum

Boardunity & Video Forum (https://boardunity.de/)
-   Programmierung und Datenbanken (https://boardunity.de/programmierung-datenbanken-f23.html)
-   -   UTF8 und Websites - Wer hat es gewagt? (https://boardunity.de/utf8-websites-hat-gewagt-t2857.html)

TRS 22.02.2005 09:58

UTF8 und Websites - Wer hat es gewagt?
 
Seit ich MySQL 4.1 nutze und dort gezwungen war mich mit dem Thema Charsets auseinander zu setzen und musste feststellen, dass es nicht ganz einfach ist umzusetzen.

Mach einem Artikel über UTF-8 auf Websites (http://annevankesteren.nl/archives/2004/06/utf-8) spiele ich nun mit dem Gedanken selber meine Website auf UTF-8 umzustellen, aber zuvor würde ich gerne mal eure Erfahrungen zu dem Thema wissen.

Hat jemand schon mal den Schritt gewagt und wie ist es ausgegangen?

Gruß
Reimer

Frederic Schneider 22.02.2005 11:38

http://fredericschneider.stuckwork.de
Durchgehend UTF-8. Aber ich bin kein Fan von dem Zeichensatz. Umlaute sind sehr störend. Ich hab da ein Phänomen bei GamePorts. Nutzt auch durchgehen UTF-8. Die Administration ist nun ISO, weil es einfach Probleme macht und eine Lösung noch nicht findbar ist.

Hast du statische Internetseiten ist UTF-8 nutzbar, bei dynamischen musst du aufpassen.

Viele Grüße aus der Firma (Praktikum).

TRS 22.02.2005 12:16

Die Website ist dynamisch und daher müßte ich alle bestehenden Datensatz konvertieren. Dazu noch in MySQL auf UTF-8 trimmen, aber seit 4.1 existieren da so viele verschiedene Möglichkeiten, dass ich mich erstmal einarbeiten muss.

Gast 22.02.2005 13:11

Dieser ganze Komplex ist ein schreckliches Thema wenn ihr mich fragt.

th 22.02.2005 13:40

UTF-8 bei dynamischen Seiten ist schon ein bisschen kompliziert. Wenn du willst, kannst dir ja mal den Code vom Unclassified Newsboard anschauen, dort wird Unicode (UTF-8) unterstützt.

PS: Na Reimer, können wir mit einem Umstieg auf UTF-8 im IRC rechnen? ;)

TRS 22.02.2005 15:30

Zitat:

Zitat von DolbY2k
UTF-8 bei dynamischen Seiten ist schon ein bisschen kompliziert. Wenn du willst, kannst dir ja mal den Code vom Unclassified Newsboard anschauen, dort wird Unicode (UTF-8) unterstützt.

Ich werde mal einen Blick drauf werfen und schauen, wie es umgesetzt worden ist. Vermutlich werde ich erst einmal auf UTF verzichten um zu einem späteren Moment umzusteigen, wenn etwas mehr Bewegung in die Sache gekommen ist. UTF wäre in meinem Fall eher eine Spielerei und daher kommt erst die Arbeit ;)

Zitat:

Zitat von DolbY2k
PS: Na Reimer, können wir mit einem Umstieg auf UTF-8 im IRC rechnen? ;)

#boardunity ist wie die Matrix und würden ich UTF-8 verwenden, dann würde für die ahnungslosen Mitchatter die Realität zusammenbrechen. In ihrer Welt ist iso und wird es immer bleiben :D

Philipp Gérard 10.03.2005 15:25

http://www.xmentor.de ist komplett UTF-8. Gleiches gilt für http://www.politopia.de. Überhaupt mache ich alle neuen Seite nur noch in UTF-8, spricht einfach nichts dagegen.

MrNase 10.03.2005 15:39

Off-Topic:

Bei Politopia legst du den Charset aber nicht im Quelltext fest?!

Jan Stöver 10.03.2005 16:01

Off-Topic:

<?xml version="1.0" encoding="UTF-8"?>
Ist doch alles da ... ?

Zwirni 10.03.2005 19:48

Bei cityscout.de wird auch UTF-8 verwendet - aber primär wegen den derzeit 6 verschiedenen Sprachen. Diese unter einen Hut zu bekommen geht einfach nur mit utf8 ordentlich. Im statischen wie im dynamischen Web btw. Bei einsprachigen Webs sehe ich es als nicht so dringend an, kommt drauf an ob man sich als Programmierer die Mühe machen will ;)

LonelyPixel 10.03.2005 23:02

Ich hatte mit UTF-8 bisher eigentlich keine Probleme, die nicht sehr schnell lösbar gewesen wären. Ich finde diesen Zeichensatz interessant, gerade wegen der us-ascii Kompatibilität, die sich z.B. auf PHP- oder HTML-Quelltext auswirkt, und der vollen Unicode-Fähigkeit. Problematisch wird's allerdings wegen der variablen Zeichenlänge. Dafür hab ich im UNB ein paar Funktionen eingefügt, die strlen, substr usw. UTF-8-ready machen, falls verfügbar mit iconv-Unterstützung.

Mit MySQL 4.1 hab ich dagegen noch so meine Probleme. Ich hab einmal versucht, das vernünftig zum Laufen zu kriegen, das ist allerdings daran gescheitert, dass ich noch nichtmal den Client-Zeichensatz angeben konnte in diesen verrückten MySQL-Tools. Und solange das nicht geht, brauch ich mir um den Rest keine Gedanken zu machen, weil ich dann nie sicher weiß, was denn nun da steht. Mal sehen, ob ich es noch rausfinde, die Mailingliste wusste es scheinbar auch nicht.

Naja, neue Webseiten fange ich alle mit UTF-8 an, die vorhandenen werden auf XHTML+Unicode umgestellt, sobald ich Zeit dafür finde. Die Browser verstehen es mittlerweile wohl alle, und auf PCs mit nicht-europäischem Standardzeichensatz hab ich weniger Probleme mit UTF-8 (also eigentlich keine) als mit latin1 festgestellt. Leider versteht PHP das Unicode-Cookie (aka BOM) nicht, aber ansonsten beschränkt sich die Umstellung tatsächlich auf wenige Header-Einträge (plus natürlich die anzuzeigenden Daten).

Philipp Gérard 11.03.2005 16:59

Zitat:

Zitat von MrNase
Off-Topic:

Bei Politopia legst du den Charset aber nicht im Quelltext fest?!

PHP-Code:

header("Content-Type: text/html; charset=utf-8"); 


TRS 11.03.2005 17:18

Mehr zum Thema und auch im Bezug zu MySQL gibt es hier: http://dev.mysql.com/tech-resources/...1/unicode.html


Alle Zeitangaben in WEZ +1. Es ist jetzt 06:50 Uhr.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25