#1
| ||||
| ||||
Wörter die in einer Suche ignoriert werden.Hallo, welche wörter sollen in einer suche ignoriert werden. es gibt ja einige hundert davon, wie z.b. die pronomen, wörter die einfach sehr oft vorkommen usw. gibt es wirgendwo eine liste? |
#2
| ||||
| ||||
Wörter die ausgenommen werden sollten sind solche die in einer hohen Prozentzahl der Beiträge vorkommen, also keinen besonderen semantischen Wert haben wie z.B. der/die/das/jeder/jeden/ich/du/er/sie/es usw. Stopwordlisten sind bei praktisch allen Boardsoftwares, die eine eigene Suchroutine implementieren, dabei. Beim phpBB gibt es im jeweiligen Languageverzeichniss eine Datei namens 'search_stopwords.txt' in der die Stopwords für die jeweilige Sprache stehen. Wenn du eine eigene Suchroutine (die MySQL Volltext-Suche filtert Stopwords beispielsweise automatisch) programmieren willst würde ich die Stopwords dynamisch verzeichnen. Da du bei einer eigenen Suchfunktion ja einen eigenen Suchindex anlegen musst kannst du einfach beim eintragen weiterer Suchbegriffe das prozentuale Vorkommnis eines Worts feststellen und bei einer Prozentzahl von beispielsweise über 50% das Wort als Stopword markieren. Dieser Artikel hier ist vielleicht ganz interessant für dich: http://zez.org/article/view/83/ __________________ Johannes Klose Calitrix Wiki - Wiki auf Basis von PHP und MySQL |
#3
| |||
| |||
|
#4
| ||||
| ||||
danke für den link exe. ich werde es mir ansehen. |
Stichworte |
- |
Ähnliche Themen | ||||
Thema | Autor | Forum | Antworten | Letzter Beitrag |
Suche noch Supporter bzw. Moderatoren | krogoth | Community Management, Administration und Moderation | 9 | 01.05.2010 21:19 |
Suche gute Foren zum Thema... | metalive | Projektvorstellung und Bewertung | 9 | 10.03.2008 19:45 |
Auf der Suche nach einem CMS | Noeder | Blog, CMS, Wiki und Sonstige | 5 | 26.08.2004 12:01 |
Suche Moderatoren und fleißige Helfer | rekrut | Community Management, Administration und Moderation | 0 | 10.04.2004 01:19 |
Suche Mithelfer | GOR | Community Management, Administration und Moderation | 0 | 13.06.2003 18:10 |