Boardunity & Video Forum

Boardunity & Video Forum (https://boardunity.de/)
-   Boardunity-Talk (https://boardunity.de/boardunity-talk-f8.html)
-   -   barrierefreie, in korrektem Deutsch verfasste und XHTML valide Texte möglich?! (https://boardunity.de/barrierefreie-korrektem-deutsch-verfasste-xhtml-valide-texte-m-glich-t4323.html)

BB-BF-BM 10.09.2006 09:16

barrierefreie, in korrektem Deutsch verfasste und XHTML valide Texte möglich?!
 
Guten Morgen!

Wenn ich mir Artikel wie praegnanz.de: Ein (Sonder-)Zeichen setzen oder WAI Austria - Tipps / Kennzeichnung von Sprachwechsel (1) durchlese, frage ich mich, ob es überhaupt eine Möglichkeitfür Communitys gibt.

Allein dadurch, dass unser heutiges Deutsch bereits eine Vielzahl an mehr oder weniger englischen Begriffen enthält und man jedes einzelne fremdsprachige Wort kennzeichnen muss, wird Communitys ein Hindernis in den Weg gestellt. Wenn ich dann noch zwischen Apostroph, An- und Abführungszeichen, Minutenzeichen, Zollzeichen und diversen Akzenten unterscheiden muss, von denen ich nicht einmal auf Anhieb weiß, wie man sie auf herkömmlichem Wege schreibt, ist doch das Chaos vollendet!

Wie handhabt ihr das?
Achtet ihr überhaupt auf solche "Feinheiten"
a) in Comunitys?
b) in reinen (X)HTML - Dokumenten?

TRS 10.09.2006 11:23

Zitat:

Zitat von BB-BF-BM (Beitrag 36460)
a) in Comunitys?
b) in reinen (X)HTML - Dokumenten?

In Communitys dürfte dies nahezu unmöglich sein, wobei ich zumindest in XHTML Dokumenten die Verwendung von Sonderzeichen (jedoch nicht Umlauten) beachte. Die Auszeichnung von fremdsprachigen Texten ist mir neu und die Beispiele sind eindeutig, aber der Aufwand ist mir zumindest im Moment zu groß (wobei es interessant wäre so etwas zu automatisieren).

Rene 10.09.2006 11:35

beim erstellen von seiten achte ich auf sowas, ist bei ue durch die entsprechenden tags auch einfach zu machen. grundlegend sollte sowas auch von scripten in foren umgesetzt werden können, oder eben als automatismus, denn welcher von den usern will sich beim text schreiben mit sowas befassen. 99% würde da wahrscheinlich ein *häh* entfahren. *g*

http://www.forennews.de/bilder/umlau..._einsetzen.jpg

BB-BF-BM 10.09.2006 13:28

nunja, das Automatische Ersetzen von Umlauten, ß, & o.ä nach ä , ö , etc. erfolgt ja meist schon.

Aber wie willst du bspw bei
Zitat:

13cm x 0,5m x 41cm
das x durch ein Malzeichen ( × [?]) ersetzen lassen?
Das Herausfiltern von solchen mathematischen Ausdrücken ist wahrscheinlich sehr komplex.
Das mit der Sprachänderungs-Kennzeichnung kann zum Teil automatisch erfolgen, wahrscheinlich aber nur mit Hilfe von Listen, in denen häufig benutzte fremdsprachige Wörter eingetragen sind (Board, Community, Boardunity ;) )

wurstbrot 10.09.2006 15:35

Also im strohhalm.org | Strohhalm - Die Webworker Community achten wir bis auf die Language-Punkte auf Standardkomformität. Die Language-Erkennung ist recht schwierig (vor allem, weil das Forum ja technisch ist), weshalb sie noch nicht umgesetzt ist. Letztes Jahr haben wir damit am Biene-Award teilgenommen und sind auch recht weit gekommen.

Dieses Jahr haben wir nicht teilgenommen, weil noch nicht alle Punkte verbessert werden konnten. Nächstes Jahr ziel ich es aber wieder an.

Es geht aber auf jeden Fall, aber nicht mit der Standard-Software, weshalb wir auch eine eigene Lösung verwenden.

Wurstbrot

wurstbrot 10.09.2006 15:39

Zitat:

Das mit der Sprachänderungs-Kennzeichnung kann zum Teil automatisch erfolgen, wahrscheinlich aber nur mit Hilfe von Listen, in denen häufig benutzte fremdsprachige Wörter eingetragen sind (Board, Community, Boardunity )
Es kann mit Listen gemacht werden, das ist aber recht aufwendig, weil du eine gute Liste brauchst. Es geht auch mit Tokens, meist 3 Buchstaben. Jede Sprache hat typische Buchstaben-Folgen, weshalb hier eine Erkennung recht zuverlässig funktionieren soll. Der Vorteil von Tokens: Du brauchst keine Liste. Die ist nämlich domänenabhängig. Heißt, dass du in einem Forum mit technischen Themen eine andere Liste brauchst, als in einem Forum für Babywindeln :)

Der Nachteil an Tokens: Eine Unterscheidung zwischen bestimmten Sprachen ist nicht immer 100%. So ist italienisch recht ähnlich zu spanisch, Esperanto wird noch ein viel größerer Spaß. Aber es geht mit entsprechender Trainingsmenge.

Am besten soll eine Kombination aus beidem funktionieren (war ja klar :)

Wurstbrot

BB-BF-BM 10.09.2006 16:23

Zitat:

Zitat von wurstbrot (Beitrag 36474)
Es kann mit Listen gemacht werden, das ist aber recht aufwendig, weil du eine gute Liste brauchst. Es geht auch mit Tokens, meist 3 Buchstaben. Jede Sprache hat typische Buchstaben-Folgen, weshalb hier eine Erkennung recht zuverlässig funktionieren soll. Der Vorteil von Tokens: Du brauchst keine Liste. Die ist nämlich domänenabhängig. Heißt, dass du in einem Forum mit technischen Themen eine andere Liste brauchst, als in einem Forum für Babywindeln :)

Der Nachteil an Tokens: Eine Unterscheidung zwischen bestimmten Sprachen ist nicht immer 100%. So ist italienisch recht ähnlich zu spanisch, Esperanto wird noch ein viel größerer Spaß. Aber es geht mit entsprechender Trainingsmenge.

Am besten soll eine Kombination aus beidem funktionieren (war ja klar :)

Wurstbrot

Das klingt ganz interessant.
Aber hast du irgendwo ein Beispiel?
Ich bin leider kein Sprachwissenschaftler ;)

Ich kann mir nämlich (noch) nicht vorstellen, dass diese Tokens auch für einzelne Wörter zutreffen. Es geht hier ja weniger um ganze Artikel als um einzelne, verstreute Wörter.

wurstbrot 10.09.2006 16:38

Du kannst es mal in Winword ausprobieren. Da kannst du sehen, wie schnell die Erkennung funktioniert (natürlich nicht bei jedem Wort). Je nach Text-Korpus kannst du die Sprache schon nach 5 Buchstaben erkennen.

Wurstbrot

Rene 10.09.2006 19:40

Grundlegend ist es in den meisste Foren so, das nur wenige webfähige Schriftarten zur Verfügung stehen. arial, times new, courier, century und verdana. Heisst, es müssten für diese Schriftarten - und alle anderen die vllt. eingebaut werden, so denn sich das technisch da grad realisieren lässt, ist aber halt eine andere Baustelle - entsprechende ersetzungslisten bereit liegen. Ähnlich herkömmlicher Badwordlist Funktionen - Ich mag das Wort Ajax kaum nutzen *g* aber letztendlich wären es halt Javascripts der aktuellen Generation - die das in Echtzeit durchaus leisten könnten.


Alle Zeitangaben in WEZ +1. Es ist jetzt 20:17 Uhr.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25