![]() |
Wörter die in einer Suche ignoriert werden. Hallo, welche wörter sollen in einer suche ignoriert werden. es gibt ja einige hundert davon, wie z.b. die pronomen, wörter die einfach sehr oft vorkommen usw. gibt es wirgendwo eine liste? |
Wörter die ausgenommen werden sollten sind solche die in einer hohen Prozentzahl der Beiträge vorkommen, also keinen besonderen semantischen Wert haben wie z.B. der/die/das/jeder/jeden/ich/du/er/sie/es usw. Stopwordlisten sind bei praktisch allen Boardsoftwares, die eine eigene Suchroutine implementieren, dabei. Beim phpBB gibt es im jeweiligen Languageverzeichniss eine Datei namens 'search_stopwords.txt' in der die Stopwords für die jeweilige Sprache stehen. Wenn du eine eigene Suchroutine (die MySQL Volltext-Suche filtert Stopwords beispielsweise automatisch) programmieren willst würde ich die Stopwords dynamisch verzeichnen. Da du bei einer eigenen Suchfunktion ja einen eigenen Suchindex anlegen musst kannst du einfach beim eintragen weiterer Suchbegriffe das prozentuale Vorkommnis eines Worts feststellen und bei einer Prozentzahl von beispielsweise über 50% das Wort als Stopword markieren. Dieser Artikel hier ist vielleicht ganz interessant für dich: http://zez.org/article/view/83/ |
|
danke für den link exe. ich werde es mir ansehen. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 20:40 Uhr. |