Boardunity & Video Forum

Boardunity & Video Forum (https://boardunity.de/)
-   Programmierung und Datenbanken (https://boardunity.de/programmierung-datenbanken-f23.html)
-   -   Meta-Suche technisch realisieren (https://boardunity.de/meta-suche-technisch-realisieren-t2783.html)

Gast 29.01.2005 14:21

Meta-Suche technisch realisieren
 
Hi,

ich plane für mein videotutorials-Projekt als Teilbereich eine Metasuche bei verschiedenen Seiten. Wie wird so was überhaupt technisch realisiert?

Gruß
archibald

MrNase 02.02.2005 15:38

Ich treib das Thema mal nach oben da es mich auch mal interessieren würde :)

Jan Stöver 02.02.2005 16:44

Verstehe ich das richtig?

Du willst eine Meta Suche anbieten, die nur explizit von dir eingetragene und idexierte Seiten durchsucht?

Ein Beispiel: Die Suche nach kostenlosen Schriften und du trägst die Font Archive ein und indexierst diese?

Meta Suma Scripte gibt es ja einige ... allerdings greifen diese - meiner Meinung nach - alle auf vorhandene SuMa Datenbanken zurück. (Meta Suche bei den gängigen SuMa´s halt)

An einer Lösung, wo man selbst definieren kann, welche Seiten durchsucht werden hätte ich auch Interesse.

Gast 02.02.2005 17:07

Jo...ich will selber die Quellen definieren. Nur dass es keine Fonts sind ;)

MrNase 02.02.2005 17:13

.. sondern Bilder ;)

Ich hab mal bei phpclasses.org gesucht, aber etwas was man nehmen könnte um was neues zu basteln habe ich nicht gefunden :(

Jan Stöver 02.02.2005 17:19

Wenn es lediglich um Fotoarchive geht, dann könnte man doch den eingegebenen Suchstring in die Suche der Seiten selbst einfügen. Ist nicht sehr elegant - aber möglich.

exe 02.02.2005 23:30

Ich hatte schonmal eine Idee die in eine ähnliche Richtung ging. Ich hab mich noch nie besonders mit SuMaprogrammierung beschäftigt, aber mein Gedanke war folgendermaßen: man schreib ein Script welches selbstständig die Quellen durchsurft und die HTML-Quelltexte runterlädt. Das Script soll das HTML dann parsen und daraus ein Array erstellen, in dem alle Elemente in ihrer Reihenfolge und mit ihren Eigenschaften verzeichnet sind. Dieses Array könnte dann durchlaufen werden. Textelemente werden in Wörter aufgespalten welche in einen Suchindex eingetragen werden. Wörter, die in Überschriften auftauchen oder durch CSS-Formatierungen hervorgehoben werden, würden eine höhere Gewichtung bekommen.

Allerdings ist das eine ziemlich aufwändige Sache. Alleine ein Script welches Seiten durchsurfen und mit Sessions in Cookies und URLs umgehen kann ist nicht ganz einfach. Das wäre auf jeden Fall keine Aufgabe die schnell an einem Wochenende erledigt ist.

Ich kann mir allerdings nicht vorstellen das es nicht schon irgendwo Softwareprojekte gibt wo Suchspider entwickelt werden. Sowas muss es doch geben?


Alle Zeitangaben in WEZ +1. Es ist jetzt 23:52 Uhr.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25