#176
| ||||
| ||||
Darauf möchte ich mal lieber nicht eingehen, sonst endet unsere Diskussion noch sonstwo. |
#177
| |||
| |||
Womit wollen wir dann arbeiten? Eclipse für Php? Texteditor? Wer programmiert was? Was wird überhaupt gebraucht? |
#178
| ||||
| ||||
Eclipse hört gut an, zumal die Integration mit Mercurial dann sehr, sehr einfach wäre. Wir brauchen also: - Eine IDE (Eclipse) - Eine Versionsverwaltungssoftware (Mercurial) - Eine Datenbanksoftware (MySQL scheint mir für den Anfang am geeignetsten zu sein) Habe ich etwas vergessen? |
#179
| |||
| |||
Hast alles erwähnt, ich dachte aber eigentlich eher an die benötigten Funktionen:
|
#180
| ||||
| ||||
Wie ich bereits sagte: Sich gleich von Anfang an Sorgen um Caching und Plugins zu machen, ist nicht sinnvoll, denn im Zentrum unserer Entwicklungsarbeit steht am Anfang die Engine, die die Ergebnisse überhaupt generiert. So oder so kommen wir spätestens jetzt nicht mehr weiter, ohne ausreichend Zeit in dieses Projekt zu investieren. Sprich, die Diskussion hier im Forum alleine führt uns jetzt nicht weiter. Wir müssen unseren Worten auch Taten folgen lassen. Das Problem ist nur, dass ich kurz vor dem Abitur stehe und ich daher überhaupt keine Zeit mehr habe, so gerne ich jetzt auch sofort mit der Programmierarbeit anfangen würde. Wir könnten allerdings versuchen, die Funktionsweise unserer beiden Ansätze (d.h. zum Einen über die Anzahl der übereinstimmenden Stichworte, zum Anderen über das Netz) gemeinsam bis ins Detail zu modellieren (vielleicht über ein UML-ähnliches Schema), um später nur noch herunterzuschreiben. Dann bestünde vielleicht eher die Möglichkeit trotz Zeit- und Personalmangels Stück für Stück gemeinsam vorzugehen. Eine entsprechende Testumgebung kann dann ja noch im Nachhinein eingerichtet werden. Es wäre nur lieb, wenn wir erst einmal mit der Modellierung des Netzkonzepts anfangen könnten (weil sich da bereits während der Modellierung herausstellen dürfte, ob es machbar ist oder nicht). Ich werde Luki mal bitten im BUN-Forum ein neues Unterforum einzurichten, damit ich die alten Diskussionen dorthin verschieben kann. PS: Wurstbrot, wie kommt's, dass du dich in deiner Doktorarbeit mit dem Thema beschäftigst? |
#181
| |||
| |||
Wenn du im Augenblick solche Zeitprobleme hast, würde ich einfach mal mit der Verarbeitung des Beitrages zu Stichpunkten anfangen. Es ist natürlich selbstverständlich das Abitur vorgeht. Edit: Darf man hier Texte zum testen kopieren? Oder muss das vom Admin abgesegnet werden? |
#182
| ||||
| ||||
Welche Texte meinst du? Und wohin kopieren? |
#183
| |||
| |||
Die Beiträge von anderen Usern um zu schauen ob der Algo, der aus den Beiträgen, die ans BUN gesendet werden, die passenden Stichworte hinaussucht. |
#184
| ||||
| ||||
Naja, du veröffentlichst die Texte ja nicht. Ich sehe da jetzt keine Urheberrechtsverletzung, zumal es ja auch nicht nachgewiesen werden könnte. (Ohne Gewähr ) |
#185
| |||
| |||
Ich hab mal was zusamengebastelt: PHP-Code: PHP-Code: |
#186
| |||
| |||
Ich dachte mir noch: Kann man die User dazu bringen, dass sie selbst Stichworte angeben? Das wäre natürlich die beste Option, der Mensch ist in sowas noch besser. Desweiteren gibt es ja auch hier in der Boardunity unterhalb eines Themas ein Feld mit dazu passenden Stichworten. Wie ist das hier gelöst? |
#187
| ||||
| ||||
Das Problem, welches ich sehe, ist nur, dass du bei diesem Verfahren die Blacklist immer weiter anpassen musst. Im Übrigen: Wieso lässt du zum Schluss noch mal array_unique über das Array drüberlaufen? Wenn ein Stichwort besonders oft vorkommt, ist das doch ein Zeichen dafür, dass es in diesem Thema besonders um dieses Wort geht. Zitat:
|
#188
| |||
| |||
Das es schwierig ist die User dazu zu bringen Stichworte anzugeben ist logisch. Weißt du hierzu was? Zitat:
|
#189
| ||||
| ||||
Welches Feld meinst du? |
#190
| |||
| |||
hier, unter dem letzten Beitrag und über "Direkt antworten" |
#191
| ||||
| ||||
Ah richtig, das hab ich ganz übersehen. Ich glaube, das wir uns aber in die falsche Richtung bewegen. Die Foren dazu zu bringen, Stichwörter für die Themen festzulegen, ist unmöglich, also sollten wir uns nicht weiter damit aufhalten? |
#192
| |||
| |||
kein Problem, wollte nur wissen, ob das möglich gewesen wäre, würde uns ja viel arbeit ersparen. |
#193
| |||
| |||
Hi, nachdem hier noch schon länger nichts passiert ist versuche ich es noch mal mit einem Konzept. Alle Zahlen, Werte und Ähnliches sind natürlich absolut variabel. Jedes Forum bekommt einen 32stelligen Code, der das Forum eindeutig kennzeichnet. Wird nun in diesem Forum ein neuer Beitrag geschrieben, wird das dem BUN Server gemeldet. Dabei wird der Thementitel, eine eindeutige ID (für das Forum, nicht für das gesamte BUN) und der Code übergeben. Der BUN Server speichert diese in einer Datenbank. Des Weiteren gibt es auf dem Server für jedes Forum einen Ordner mit dessen Code als Namen. Darin befindet sich für jedes Thema eine XML Datei die 10 ähnliche Themen, nach Relevanz geordnet, enthält. z.B.:
z.B.: http://bun.boardunity.de/fh478hfwhf7...h84fhz4/id_542 Damit erreichen wir meiner Meinung nach eine geringere Last auf dem Server, als wenn für jede Anfrage eine wie auch immer geartete Scriptsprache benutzt wird. Allerdings sind wir natürlich auch nicht so aktuell wie es möglich wäre. Diese Dateien müssen natürlich auch erstellt und aktualisiert werden. Dazu wird in einem weiteren Script match() benutzt. Dieses Script muss nicht auf dem eigentlichen BUN Server laufen, sondern kann sonst wo arbeiten, muss halt nur eine lokale Kopie der Datenbank zur Verfügung haben. Des Weiteren müssen die Dateien auch noch aktuell gehalten werden. Es bietet sich natürlich an auf einem Privaten PC immer alles neu zu erstellen und anschließend hochzuladen. Einen Teil der Arbeit kann man sich aber meiner Meinung nach sparen. Zum Beispiel erstellt Apache ein Zugriffslog. Darin steht auch welche Dateien von dem Forum öfters angefordert werden und somit indirekt auch das Interesse an dem Thema (Besucht keiner das Thema, fordert das Forum nicht die passende Datei an und die Datei taucht nicht im Log auf) Somit lässt sich festzustellen welche Themen noch gelesen werden und somit für diese eine aktuelle Datei wünschenswert wäre. Alte Themen, die schon seit Jahren niemand mehr angesehen hat brauchen schließlich keine tagesaktuellen Dateien. Ich hoffe mal ich habe keinen verwirrt und bitte um Meinungen. Ist so ein Aufbau sinnvoll und logisch? Viele Grüße, jendrik |
#194
| ||||
| ||||
Ich finde, Caching wäre hier eher angebracht. So würden die ähnlichen Themen für wenig frequentierte Themen auf Anfrage aktualisiert werden, die für beliebte in festgelegten Abständen (sodass es zu keiner Überlastung kommt). Denn: Gerade wenn ein Thema uralt ist und sich dann doch mal ein Besucher darauf verirrt, ist es doch interessant, ob sich die Diskussion nicht vielleicht woanders weiterentwickelt hat, ob es neue Erkenntnisse gibt o.ä. Von der Idee, die Daten in Ordnern mit endlos vielen Dateien zu speichern, halte ich auch wenig. Bei Dateisystemen gibt es in der Regel ein Maximum in Bezug auf die Dateien pro Ordner, oberhalb dessen ein Dateizugriff zunehmend langsamer wird. Datenbanken können mit solchen Datenmengen inzwischen um einiges besser umgehen. |
#195
| |||
| |||
Gegen Caching habe ich prinzipiell auch nichts, das ganze aber nicht über ein Programm laufen zu lassen ist mein Anliegen. Es müssen natürlich nicht alle Dateien in einen Ordner vorhanden sein. Eine Unterteilung nach Forum, erste ID-Stelle, zweite ID-Stelle, dritte ID-Stelle, vierte ID-Stelle, ... ist natürlich möglich. Aber ich möchte nur mal auf heise.de verweisen, bei denen sieht es zumindest so aus als würden alle Einträge in einem Ordner liegen. Und desweiteren habe ich mich vieleicht missverständlich ausgedrückt: Auch ältere Themen sollten regelmäßig aktualisiert werden, aber nur in größeren Abständen, wöchentlich zum Beispiel. |
#196
| ||||
| ||||
Zitat:
|
#197
| |||
| |||
Ok, mag ja so sein, dennoch möchte ich noch auf den Rest meines letzten Beitrages verweisen. Zitat:
|
#198
| ||||
| ||||
Zitat:
Aber wo siehst du da den Vorteil gegenüber meiner Idee? Bei mir wird nur dann aktualisiert, wenn es auch wirklich nötig ist. Aber wenn es nötig ist (= ein einsamer Besucher verirrt sich auf ein uraltes Thema), wird auch wirklich aktualisiert und nicht gewartet, bis das wöchentliche Update dran ist. |
#199
| |||
| |||
Zitat:
Zitat:
Zitat:
Und wie warscheinlich ist es das sich für ein 3 Jahre altes Thema innerhalb einer Woche eine Masse an neuen Informationen ansammelt und dabei nur ein oder zwei mal das alte Thema geöffnet wird? Denn bei mehr zugriffen wird die Datei ja auch früher als in dem Wochenrhythmus aktualisiert. |
#200
| ||||
| ||||
Zitat:
* Spontan fällt mir allerdings ein interessanter Anwendungsfall ein, den ich gerne auch mal selber in Angriff nehmen würde. Ist aber psst! geheim. Das ist inzwischen nicht mehr erforderlich. Der Interpreter kann inzwischen auch dauerhaft im Hintergrund laufen und auf Anfragen warten, ohne dass jedes mal ein neuer Prozess erstellt und wieder geschlossen werden müsste. Die Bearbeitungsdauer für eine winzige Anfrage ist dann fast gleich Null. |
Stichworte |
-1 or 2+538-538-1=0+0+0+1, -1 or 3*2<(0+5+538-538), -1 or 3+538-538-1=0+0+0+1, 1*17, foren, jxlzhcfx, network, seo |
Ähnliche Themen | ||||
Thema | Autor | Forum | Antworten | Letzter Beitrag |
Mitmachen: Die schönsten Foren | MrNase | Web Design und Grafik | 70 | 09.09.2007 11:33 |