Zur Boardunity Forenstartseite

Zurück   Boardunity & Video Forum » Projekt Foren » Projekt Forum

Antwort
 
LinkBack Themen-Optionen Bewertung: Bewertung: 7 Stimmen, 4,71 durchschnittlich.
  #176  
Alt 27.01.2009, 18:36
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Darauf möchte ich mal lieber nicht eingehen, sonst endet unsere Diskussion noch sonstwo.

  #177  
Alt 27.01.2009, 18:56
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Womit wollen wir dann arbeiten? Eclipse für Php? Texteditor?
Wer programmiert was? Was wird überhaupt gebraucht?

  #178  
Alt 27.01.2009, 19:04
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Eclipse hört gut an, zumal die Integration mit Mercurial dann sehr, sehr einfach wäre.
Wir brauchen also:
- Eine IDE (Eclipse)
- Eine Versionsverwaltungssoftware (Mercurial)
- Eine Datenbanksoftware (MySQL scheint mir für den Anfang am geeignetsten zu sein)
Habe ich etwas vergessen?

  #179  
Alt 27.01.2009, 19:21
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Hast alles erwähnt, ich dachte aber eigentlich eher an die benötigten Funktionen:
  • Text zu Stichworte
  • Stichworte in Db
  • Link in Db
  • Plugins für Foren
  • Caching auf dem Server
  • Caching im Forum

  #180  
Alt 27.01.2009, 21:16
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Wie ich bereits sagte: Sich gleich von Anfang an Sorgen um Caching und Plugins zu machen, ist nicht sinnvoll, denn im Zentrum unserer Entwicklungsarbeit steht am Anfang die Engine, die die Ergebnisse überhaupt generiert.

So oder so kommen wir spätestens jetzt nicht mehr weiter, ohne ausreichend Zeit in dieses Projekt zu investieren. Sprich, die Diskussion hier im Forum alleine führt uns jetzt nicht weiter. Wir müssen unseren Worten auch Taten folgen lassen.
Das Problem ist nur, dass ich kurz vor dem Abitur stehe und ich daher überhaupt keine Zeit mehr habe, so gerne ich jetzt auch sofort mit der Programmierarbeit anfangen würde. Wir könnten allerdings versuchen, die Funktionsweise unserer beiden Ansätze (d.h. zum Einen über die Anzahl der übereinstimmenden Stichworte, zum Anderen über das Netz) gemeinsam bis ins Detail zu modellieren (vielleicht über ein UML-ähnliches Schema), um später nur noch herunterzuschreiben. Dann bestünde vielleicht eher die Möglichkeit trotz Zeit- und Personalmangels Stück für Stück gemeinsam vorzugehen. Eine entsprechende Testumgebung kann dann ja noch im Nachhinein eingerichtet werden.
Es wäre nur lieb, wenn wir erst einmal mit der Modellierung des Netzkonzepts anfangen könnten (weil sich da bereits während der Modellierung herausstellen dürfte, ob es machbar ist oder nicht).

Ich werde Luki mal bitten im BUN-Forum ein neues Unterforum einzurichten, damit ich die alten Diskussionen dorthin verschieben kann.


PS: Wurstbrot, wie kommt's, dass du dich in deiner Doktorarbeit mit dem Thema beschäftigst?

  #181  
Alt 28.01.2009, 15:39
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Wenn du im Augenblick solche Zeitprobleme hast, würde ich einfach mal mit der Verarbeitung des Beitrages zu Stichpunkten anfangen.
Es ist natürlich selbstverständlich das Abitur vorgeht.

Edit: Darf man hier Texte zum testen kopieren? Oder muss das vom Admin abgesegnet werden?

  #182  
Alt 28.01.2009, 17:44
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Zitat:
Zitat von Jendrik Beitrag anzeigen
Edit: Darf man hier Texte zum testen kopieren? Oder muss das vom Admin abgesegnet werden?
Welche Texte meinst du? Und wohin kopieren?

  #183  
Alt 28.01.2009, 18:10
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Die Beiträge von anderen Usern um zu schauen ob der Algo, der aus den Beiträgen, die ans BUN gesendet werden, die passenden Stichworte hinaussucht.

  #184  
Alt 28.01.2009, 18:16
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Naja, du veröffentlichst die Texte ja nicht. Ich sehe da jetzt keine Urheberrechtsverletzung, zumal es ja auch nicht nachgewiesen werden könnte. (Ohne Gewähr )

  #185  
Alt 29.01.2009, 19:39
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Ich hab mal was zusamengebastelt:

PHP-Code:
function text_zu_stichpunkte($input$blacklist = array( 'der''die''das' ), $delimeter " :;,()/\n?![]*."$min_length )
{
    
$min_count floorbcsqrtbcsqrtbcdivstr_word_count$input ) - 502) , ), ) );
// Minimale Anzahl der Wörter um zurückgegeben zu werden. Ist nur eine Schätzung was sinnvoll ist!
    
    
$token strtok$input$delimeter );
    while( 
$token !== false )
    {
        
$t strtolower$token );
        if( !empty( 
$t ) && !in_array$t $blacklist ) && !(strlen($t) < $min_length) && ( $token{0} === strtoupper($token{0}) ) ) 
        { 
// Überprüfen ob: String nicht leer ist, in der Blacklist vorkommt, zu kurz ist und großgeschrieben ist
            
$input_array[] = strtr$t, array( '-' => '' ) );
        }
        
$token strtok$delimeter );
    }
    
    foreach(
$input_array as $value// Einträge zählen, unter $min_count wird er nicht weitergegeben
    
{
        foreach (
$input_array as $v)
        {
            if(
$v == $value)
            {
                
$values += 1;
            }
        }
        if( 
$values >= $min_count )
        {
            
$array[] = $value;
        }
        
$values 0;
    }
    
$array array_unique($array); // Doppelte Einträge entfernen
    
return $array;

Aufruf:
PHP-Code:
$text 'blablabla';
// Keine HTML-Tags!

$array text_zu_stichpunkte$text );

echo 
implode"<br>\n"$array ); 
Getestet mit Link und Link

  #186  
Alt 01.02.2009, 00:03
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Ich dachte mir noch:
Kann man die User dazu bringen, dass sie selbst Stichworte angeben?
Das wäre natürlich die beste Option, der Mensch ist in sowas noch besser.

Desweiteren gibt es ja auch hier in der Boardunity unterhalb eines Themas ein Feld mit dazu passenden Stichworten. Wie ist das hier gelöst?

  #187  
Alt 01.02.2009, 17:58
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Das Problem, welches ich sehe, ist nur, dass du bei diesem Verfahren die Blacklist immer weiter anpassen musst.
Im Übrigen: Wieso lässt du zum Schluss noch mal array_unique über das Array drüberlaufen? Wenn ein Stichwort besonders oft vorkommt, ist das doch ein Zeichen dafür, dass es in diesem Thema besonders um dieses Wort geht.

Zitat:
Kann man die User dazu bringen, dass sie selbst Stichworte angeben?
Das wäre natürlich die beste Option, der Mensch ist in sowas noch besser.
Dann müsste man ja die Communities der teilnehmenden Foren dazu zwingen, für jedes Thema Stichwörter festzulegen. Glaub mir, das geht schief.

  #188  
Alt 01.02.2009, 20:44
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Das es schwierig ist die User dazu zu bringen Stichworte anzugeben ist logisch.
Weißt du hierzu was?
Zitat:
Desweiteren gibt es ja auch hier in der Boardunity unterhalb eines Themas ein Feld mit dazu passenden Stichworten. Wie ist das hier gelöst?

  #189  
Alt 02.02.2009, 16:20
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Welches Feld meinst du?

  #190  
Alt 02.02.2009, 18:29
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
hier, unter dem letzten Beitrag und über "Direkt antworten"

  #191  
Alt 02.02.2009, 19:22
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Ah richtig, das hab ich ganz übersehen.
Ich glaube, das wir uns aber in die falsche Richtung bewegen. Die Foren dazu zu bringen, Stichwörter für die Themen festzulegen, ist unmöglich, also sollten wir uns nicht weiter damit aufhalten?

  #192  
Alt 02.02.2009, 19:53
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
kein Problem, wollte nur wissen, ob das möglich gewesen wäre, würde uns ja viel arbeit ersparen.

  #193  
Alt 19.11.2009, 15:57
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Hi,
nachdem hier noch schon länger nichts passiert ist versuche ich es noch mal mit einem Konzept.
Alle Zahlen, Werte und Ähnliches sind natürlich absolut variabel.

Jedes Forum bekommt einen 32stelligen Code, der das Forum eindeutig kennzeichnet. Wird nun in diesem Forum ein neuer Beitrag geschrieben, wird das dem BUN Server gemeldet.
Dabei wird der Thementitel, eine eindeutige ID (für das Forum, nicht für das gesamte BUN) und der Code übergeben. Der BUN Server speichert diese in einer Datenbank.

Des Weiteren gibt es auf dem Server für jedes Forum einen Ordner mit dessen Code als Namen. Darin befindet sich für jedes Thema eine XML Datei die 10 ähnliche Themen, nach Relevanz geordnet, enthält.
z.B.:
  • Forum: fhauiehr732hr78seh7th7w8thw47ht78hwtuih4w78
    • Thema: id_25953
    • Thema: id_542
    • Thema: id_532
  • Forum: fh478hfwhf74hf4wf98hz4w89fh894hwfiosh84fhz4
    • Thema: id_542
    • Thema: id_3247
    • Thema: id_357
Das Forum ruft jedes mal (oder höchstens jede Stunde oder …) wenn sich ein Benutzer das Thema ansieht, die dazu passende Datei auf:
z.B.: http://bun.boardunity.de/fh478hfwhf7...h84fhz4/id_542

Damit erreichen wir meiner Meinung nach eine geringere Last auf dem Server, als wenn für jede Anfrage eine wie auch immer geartete Scriptsprache benutzt wird. Allerdings sind wir natürlich auch nicht so aktuell wie es möglich wäre.

Diese Dateien müssen natürlich auch erstellt und aktualisiert werden. Dazu wird in einem weiteren Script match() benutzt. Dieses Script muss nicht auf dem eigentlichen BUN Server laufen, sondern kann sonst wo arbeiten, muss halt nur eine lokale Kopie der Datenbank zur Verfügung haben. Des Weiteren müssen die Dateien auch noch aktuell gehalten werden. Es bietet sich natürlich an auf einem Privaten PC immer alles neu zu erstellen und anschließend hochzuladen. Einen Teil der Arbeit kann man sich aber meiner Meinung nach sparen. Zum Beispiel erstellt Apache ein Zugriffslog. Darin steht auch welche Dateien von dem Forum öfters angefordert werden und somit indirekt auch das Interesse an dem Thema (Besucht keiner das Thema, fordert das Forum nicht die passende Datei an und die Datei taucht nicht im Log auf)
Somit lässt sich festzustellen welche Themen noch gelesen werden und somit für diese eine aktuelle Datei wünschenswert wäre. Alte Themen, die schon seit Jahren niemand mehr angesehen hat brauchen schließlich keine tagesaktuellen Dateien.

Ich hoffe mal ich habe keinen verwirrt und bitte um Meinungen.
Ist so ein Aufbau sinnvoll und logisch?

Viele Grüße,
jendrik

  #194  
Alt 19.11.2009, 20:30
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Ich finde, Caching wäre hier eher angebracht. So würden die ähnlichen Themen für wenig frequentierte Themen auf Anfrage aktualisiert werden, die für beliebte in festgelegten Abständen (sodass es zu keiner Überlastung kommt).
Denn: Gerade wenn ein Thema uralt ist und sich dann doch mal ein Besucher darauf verirrt, ist es doch interessant, ob sich die Diskussion nicht vielleicht woanders weiterentwickelt hat, ob es neue Erkenntnisse gibt o.ä.

Von der Idee, die Daten in Ordnern mit endlos vielen Dateien zu speichern, halte ich auch wenig. Bei Dateisystemen gibt es in der Regel ein Maximum in Bezug auf die Dateien pro Ordner, oberhalb dessen ein Dateizugriff zunehmend langsamer wird. Datenbanken können mit solchen Datenmengen inzwischen um einiges besser umgehen.

  #195  
Alt 19.11.2009, 21:39
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Gegen Caching habe ich prinzipiell auch nichts, das ganze aber nicht über ein Programm laufen zu lassen ist mein Anliegen.

Es müssen natürlich nicht alle Dateien in einen Ordner vorhanden sein. Eine Unterteilung nach Forum, erste ID-Stelle, zweite ID-Stelle, dritte ID-Stelle, vierte ID-Stelle, ... ist natürlich möglich.
Aber ich möchte nur mal auf heise.de verweisen, bei denen sieht es zumindest so aus als würden alle Einträge in einem Ordner liegen.

Und desweiteren habe ich mich vieleicht missverständlich ausgedrückt: Auch ältere Themen sollten regelmäßig aktualisiert werden, aber nur in größeren Abständen, wöchentlich zum Beispiel.

  #196  
Alt 19.11.2009, 23:09
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Zitat:
Zitat von Jendrik Beitrag anzeigen
Aber ich möchte nur mal auf heise.de verweisen, bei denen sieht es zumindest so aus als würden alle Einträge in einem Ordner liegen.
Ja, und es sieht auch wirklich nur so aus. Die Technik dahinter nennt sich mod_rewrite.

  #197  
Alt 20.11.2009, 12:23
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Ok, mag ja so sein, dennoch möchte ich noch auf den Rest meines letzten Beitrages verweisen.
Zitat:
Zitat von Jendrik Beitrag anzeigen
Gegen Caching habe ich prinzipiell auch nichts, das ganze aber nicht über ein Programm laufen zu lassen ist mein Anliegen.

Es müssen natürlich nicht alle Dateien in einen Ordner vorhanden sein. Eine Unterteilung nach Forum, erste ID-Stelle, zweite ID-Stelle, dritte ID-Stelle, vierte ID-Stelle, ... ist natürlich möglich.
...

Und desweiteren habe ich mich vieleicht missverständlich ausgedrückt: Auch ältere Themen sollten regelmäßig aktualisiert werden, aber nur in größeren Abständen, wöchentlich zum Beispiel.

  #198  
Alt 20.11.2009, 22:18
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Zitat:
Zitat von Jendrik Beitrag anzeigen
Gegen Caching habe ich prinzipiell auch nichts, das ganze aber nicht über ein Programm laufen zu lassen ist mein Anliegen.
Habe ich das richtig verstanden? Die Foren holen sich ihre ähnlichen Themen einfach über die Ordnerstruktur? Was ist allerdings, wenn der BUN-Server umstrukturiert werden muss und sich die Ordnerstruktur ändert? Müssen dann auch alle Plugins für die Foren aktualisiert werden? Und reicht bloße Security through obscurity ? Wikipedia aus?

Zitat:
Zitat von Jendrik Beitrag anzeigen
Auch ältere Themen sollten regelmäßig aktualisiert werden, aber nur in größeren Abständen, wöchentlich zum Beispiel.
Aber wo siehst du da den Vorteil gegenüber meiner Idee? Bei mir wird nur dann aktualisiert, wenn es auch wirklich nötig ist. Aber wenn es nötig ist (= ein einsamer Besucher verirrt sich auf ein uraltes Thema), wird auch wirklich aktualisiert und nicht gewartet, bis das wöchentliche Update dran ist.

  #199  
Alt 21.11.2009, 12:19
Mitglied
 
Registriert seit: 11.2008
Beiträge: 56
Zitat:
Zitat von codethief Beitrag anzeigen
Habe ich das richtig verstanden? Die Foren holen sich ihre ähnlichen Themen einfach über die Ordnerstruktur? Was ist allerdings, wenn der BUN-Server umstrukturiert werden muss und sich die Ordnerstruktur ändert? Müssen dann auch alle Plugins für die Foren aktualisiert werden?
Das ist allerdings eine Schwachstelle. Idealerweise lässt sich so eine kleine Änderung einfach übertragen, jeder Admin sollte in der Lage sein, ein oder zwei Zeilen in einer config-Datei zu ändern. Allerdings gibt es bei dir das selbe Problem, falls das Script verschoben werden muss.
Zitat:
Zitat von codethief Beitrag anzeigen
Wozu Security? Was bringt es mir als Forum A, die für Forum B maßgeschneiderten Dateien auszulesen? Indexiere ich alle Themen von Forum B und vergleiche deren Titel mit meinen? Eher unwahrscheinlich.
Zitat:
Zitat von codethief Beitrag anzeigen
Aber wo siehst du da den Vorteil gegenüber meiner Idee? Bei mir wird nur dann aktualisiert, wenn es auch wirklich nötig ist. Aber wenn es nötig ist (= ein einsamer Besucher verirrt sich auf ein uraltes Thema), wird auch wirklich aktualisiert und nicht gewartet, bis das wöchentliche Update dran ist.
Der größte Vorteil ist m.E. die geringe Serverlast. Es muss nicht bei jeder Anfrage ein Php- oder sonstiges Interpreter gestartet werden.
Und wie warscheinlich ist es das sich für ein 3 Jahre altes Thema innerhalb einer Woche eine Masse an neuen Informationen ansammelt und dabei nur ein oder zwei mal das alte Thema geöffnet wird? Denn bei mehr zugriffen wird die Datei ja auch früher als in dem Wochenrhythmus aktualisiert.

  #200  
Alt 21.11.2009, 17:59
Benutzerbild von codethief
Visionär
 
Registriert seit: 09.2003
Beiträge: 811
Zitat:
Zitat von Jendrik Beitrag anzeigen
Wozu Security? Was bringt es mir als Forum A, die für Forum B maßgeschneiderten Dateien auszulesen? Indexiere ich alle Themen von Forum B und vergleiche deren Titel mit meinen? Eher unwahrscheinlich.
Wie sieht's mit passwortgeschützten Foren, die ihre Daten (Thementitel) zwar dem BUN, aber doch nicht jedem mitteilen wollen? Unwahrscheinlich vielleicht*, aber wieso sollten wir die ausschließen?

* Spontan fällt mir allerdings ein interessanter Anwendungsfall ein, den ich gerne auch mal selber in Angriff nehmen würde. Ist aber psst! geheim.

Zitat:
Zitat von Jendrik Beitrag anzeigen
Der größte Vorteil ist m.E. die geringe Serverlast. Es muss nicht bei jeder Anfrage ein Php- oder sonstiges Interpreter gestartet werden.
Das ist inzwischen nicht mehr erforderlich. Der Interpreter kann inzwischen auch dauerhaft im Hintergrund laufen und auf Anfragen warten, ohne dass jedes mal ein neuer Prozess erstellt und wieder geschlossen werden müsste. Die Bearbeitungsdauer für eine winzige Anfrage ist dann fast gleich Null.

Antwort


Stichworte
-1 or 2+538-538-1=0+0+0+1, -1 or 3*2<(0+5+538-538), -1 or 3+538-538-1=0+0+0+1, 1*17, foren, jxlzhcfx, network, seo

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.
Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Mitmachen: Die schönsten Foren MrNase Web Design und Grafik 70 09.09.2007 11:33






1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25