Boardunity & Video Forum

Boardunity & Video Forum (https://boardunity.de/)
-   Programmierung und Datenbanken (https://boardunity.de/programmierung-datenbanken-f23.html)
-   -   RSS-Feeds - kodierung? (https://boardunity.de/rss-feeds-kodierung-t4421.html)

nocte 07.10.2006 23:25

RSS-Feeds - kodierung?
 
Hallo,

Wie muss eigentlich der Inhalt von <descriptiton> in einem RSS 2.0. Feed kodiert werden?

Ich kodiere momentan mit htmlspecialchars mit ENT_QUOTES.

Was wäre korrekt? Keine Codierung? Nur '<' und '>' kodieren?

Gruß,
nocte

codethief 09.10.2006 03:15

Das kommt AFAIK auf den Zeichensatz an (ich lasse mich gerne eines besseren belehren), da bei UTF-8 ja eigentlich alle Zeichen verfügbar sind, musst du dort nur <, > und & (damit es nicht als Entity behandelt wird) maskieren.
Mach's dir einfacher und benutz <![CDATA[ blubber&<#%$>§!"!?ß\][~´@ ]]> :)

LonelyPixel 10.10.2006 15:13

Wie du deine Daten kodierst, hängt davon ab, welche Kodierung du angibst. RSS ist ein XML-Dokument. Wenn du ganz oben sowas wie <?xml version="1.0" encoding="utf-8"?> hast, dann ist es natürlich UTF-8. Dort keine Kodierung anzugeben, ist nicht gut, weil es dann tatsächlich undefiniert und damit dem Client überlassen ist.

Ähm, ja, < > und & müssen natürlich entsprechend den Regeln für XML umschrieben werden, wenn sie im Text auftauchen sollen. Bei ATOM ist an der Stelle noch zwischen HTML- und XHTML-Content zu unterscheiden, da XHTML ohne Verschleierung direkt in den XML-Baum eingebettet werden kann, HTML dagegen nicht, und deshalb umschrieben werden muss.

nocte 18.10.2006 21:48

Danke für eure Postings!

ich habe als Zeichensatz ISO-8859-1 angegeben. CDATA habe ich nun auch kapiert.

Aber: Darf ich überhaupt html-Zeichen (z.B. &uuml;) verwenden? Das soll ja teilw. zu Problemen führen (z.B. beim Import über das vBulletin RSS System)

LonelyPixel 20.10.2006 16:33

Off-Topic:
Das führt in erster Linie zu Problemen in der Darstellung dieses Forums. :D

Karsten Achterrath 20.10.2006 21:13

Zitat:

Zitat von nocte (Beitrag 37253)
Danke für eure Postings!

ich habe als Zeichensatz ISO-8859-1 angegeben. CDATA habe ich nun auch kapiert.

Aber: Darf ich überhaupt html-Zeichen (z.B. &uuml;) verwenden? Das soll ja teilw. zu Problemen führen (z.B. beim Import über das vBulletin RSS System)

Das ist so eine Sache.
Bei dem RSS, welches bei meinem News erstellt wird, kommt es zu Problemen. Ich könnte zwar vom wysiwyg editor alle &oumls usw. umwandeln, aber dann haben andere wieder probleme, aber da versuch ich sowie so was zufinden.

Als erste sei gesagt, überhall wo du html einbaust, solltest du <![cdata[]]> nutzen


Alle Zeitangaben in WEZ +1. Es ist jetzt 14:11 Uhr.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25