Boardunity & Video Forum

Boardunity & Video Forum (https://boardunity.de/)
-   Blog, CMS, Wiki und Sonstige (https://boardunity.de/blog-cms-wiki-sonstige-f75.html)
-   -   Webanwendung, die PDF verwaltet (Volltextsuche, Tagging) (https://boardunity.de/webanwendung-pdf-verwaltet-volltextsuche-tagging-t5389.html)

shob 31.10.2007 21:22

Webanwendung, die PDF verwaltet (Volltextsuche, Tagging)
 
Ich suche eine Webanwendung (FOSS; auf all-inkl Privat oder all-inkl Privat Plus lauffähig), die eine Vielzahl von PDF-Dateien verwalten soll. Ich werde der einzige Benutzer sein, es sollte also nichts öffentlich sein.

Erforderliche Features
  • Ordner- bzw. Baumstruktur
  • der Inhalt der PDFs soll indiziert werden, um eine Volltextsuche zu ermöglichen
Wäre-toll-wenn-Features
  • Export einzelner PDFs in andere Formate (text, html, what ever)
  • Metadaten angeben können ("tagging", ala: Autor, Titel, Inhalt, Erscheinungsjahr, Quelle)
  • mehrere PDF auswählen, die dann als ein Archiv (.zip) heruntergeladen werden können
  • kein Ajax-Overkill
  • Upload nicht nur lokal, sondern auch über URL
Ich hätte auch nichts dagegen, wenn die Anwendung zusätzlich (Open-) Office-Dokumente oder andere Dateien akzeptiert.

Ghost11 31.10.2007 23:31

Hallo!
Hm, würde mich jetzt interessieren, was du dir da konkret vorstellst.

Für mich klingt es so, dass für dein Vorhaben die Installation einer Forensoftware so oder so nicht gerade verkehrt wäre. Ich denke dabei alleine an phpBB3, welches ich mir im Laufe der letzten Wochen mal genauer unter die Lupe genommen habe:
Mit der Software kannst du sofort nahezu AAAALLE File-Formate hochladen, anzeigen und auch abspielen lassen (Videos etc), die es nur gibt. Darüber hinaus gibt's auch einen speziellen Download-Mod. Außerdem kannst du dann mit einer Foren-Software alles schön dann strukturieren, kategoriesieren und thematisieren - und vieleicht willst ja dann doch irgendwann mal nicht nur "alleine für dich" die Sache haben (Zutrittsrechte etc).

Ich denke, flexibler wärst du für so ein Vorhaben ohnehin mit einer Foren-Software, welche ohnehin alle möglichen Datei-Formate uploden (nicht nur einbinden) lässt.

Grüße!

gfc 01.11.2007 07:40

Ghost: Kleiner Tipp: Les den Beitrag genau ;) Als einziger Benutzer der Lösung braucht er wohl kaum ein Forum ;)

Ich habe zwar nicht gerade eine Lösung parat, aber eigentlich tönen die Anforderungen recht vernünftig. Ich glaub hier dürftest du fündig werdern: Hot Scripts :: PHP :: Scripts and Programs :: File Manipulation :: File Management

Ghost11 01.11.2007 08:36

Zitat:

Zitat von gfc (Beitrag 42869)
Ghost: Kleiner Tipp: Les den Beitrag genau ;) Als einziger Benutzer der Lösung braucht er wohl kaum ein Forum ;)

Großer Tipp: Lass das alles einfach immer die Anfrager künftig selbst entscheiden - was gut oder schlecht für sie ist. ;)
Nächster Tipp: Ob jemand besser lesen sollte oder nicht - auch das lass bitte allgemein die Sorge anderer Leute sein. ;)
Nächster Tipp: Es heißt nicht "les", sondern "lies" - und im Übrigen solltest vielleicht du mein Posting etwas genauer lesen. ;)

Jens* 01.11.2007 15:22

Ich find Relay: Ajax Directory Manager nett.

Und wenns etwas mehr sein darf: Alfresco - Open Source Enterprise Content Management (CMS) including Web Content Management

Eine Forensoftware sollte die allerletzte Lösung sein. Eine Wiki würde sich auch sehr gut eignen. WikiMatrix - Compare them all

Best regards,

Jens

MaMo 01.11.2007 15:31

Seit wann kann man mit normalen Wikis, Foren und CMS-Systemen PDF-Dateien indizieren?
Bisher hab ich aber auch nur eine kostenpflichtige Suchmaschine gefunden: AST@NET - Web Solutions for your Business

Jens* 01.11.2007 16:10

Confluence kann das z.B. Confluence - Enterprise Wiki Software

shob 03.11.2007 21:57

Zitat:

Zitat von Ghost11 (Beitrag 42864)
Hallo!
Hm, würde mich jetzt interessieren, was du dir da konkret vorstellst.

Nun, eigentlich nicht mehr, als was die Beschreibung im Eingangsposting hergibt.
Das Wichtigste ist einfach, dass der Inhalt der PDF-Dateien indiziert wird, um eine Volltextsuche durchführen zu können. Und die Dateien sollen möglichst nicht im leeren Raum schweben, sondern kategorisiert werden können.


Zitat:

Ich denke, flexibler wärst du für so ein Vorhaben ohnehin mit einer Foren-Software, welche ohnehin alle möglichen Datei-Formate uploden (nicht nur einbinden) lässt.
Gibt es (FOSS) Foren, die den Inhalt von PDF-Dateien erfassen können?


Zitat:

Zitat von gfc (Beitrag 42869)

Schau ich mich mal um, danke.

Zitat:

Zitat von Jens* (Beitrag 42877)

Ja, über diese Anwendung bin ich auch gestolpert. Für meinen Geschmack zu viel Ajax. Aber daran soll es nicht scheitern, wenn es keine Alternativen gibt. Aber was mir gerade auffällt: steht da irgendwo, dass der Inhalt von PDF-Dateien indiziert wird? Habe gerade mal getestet: Stichwörter aus der hochgeladenen PDF-Datei findet die Suche nicht ...

Schau ich mir an, danke.

Zitat:

Eine Forensoftware sollte die allerletzte Lösung sein. Eine Wiki würde sich auch sehr gut eignen. WikiMatrix - Compare them all
Dagegen habe ich absolut nichts einzuwenden, eher im Gegenteil: ein Wiki käme mir sogar entgegen. Aber gibt es da freie Wikis, die PDFs durchsuchen können?

shob 19.11.2007 22:22

Zitat:

Zitat von Jens* (Beitrag 42879)

Wow, also was ich darüber gelesen habe, begeistert mich. Die Sache hat nur zwei Haken: 1. nicht FOSS (wäre trotzdem eine Überlegung wert...) und 2. es benötigt Java, oder? Und soweit ich weiß, wird das von den oben genannten all-inkl-Accounts nicht unterstützt.

Gleiches Spiel bei Alfresco: basiert auch auf Java.

Oder gibt es doch eine Möglichkeit, das bei all-inkl.com-shared hosting zum Laufen zu bringen?

MaMo 19.11.2007 22:29

Java haste auf all-inkl keine Chance, habs auch mal probiert =/

LonelyPixel 19.11.2007 23:55

Gibt's sowas? PDF in Text konvertieren für eine Suchindizierung. Klingt interessant, könnt ich auch gebrauchen. Allerdings nur als einzelne Komponente zum Einbau in ein anderes System.

LonelyPixel 19.01.2008 17:48

Nicht? Wär blöd. Ich hätte jetzt schon eine zweite (wichtigere) Anwendung, die sowas tun müsste.

LonelyPixel 20.01.2008 19:09

Wie es aussieht, gibt es insbesondere für PHP haufenweise (FOSS) Code, der PDF-Dateien erzeugen kann. Lesen kann man sie aber nicht mehr. Die User Contributed Notes enthalten nur schlecht bis gar nicht funktionierende (selbst getestet) Codebrösel. Einzig das XPDF-Programm pdftohtml scheint zu funktionieren (für Windows und Linux verfügbar), muss aber extern aufgerufen werden. Mit PHP wird man hier also kaum weiterkommen.

PHP: PDF - Manual

MaMo 21.01.2008 11:29

Hi,

wie sieht es mit Perl aus? Dort gibt es im CPAN u.A. Module wie File::Extract::PDF, PDF::OCR::Thorough ... Wenn Du Glück hast kannst Du die dann auch zur Laufzeit einbinden.

MfG MaMo

LonelyPixel 22.01.2008 13:11

Von Perl hab ich leider fast keine Ahnung. Und ob ich nun ein natives Programm oder ein Perl-Skript extern aufrufe, ist fast schon egal.

MaMo 22.01.2008 15:03

Nun ja, auf all-inkl.com kannst du auch direkt Perl-Scripte ausführen, die brauchst du nicht "extern" aufrufen, außer du willst auf JEDEN Fall mit PHP arbeiten...


Alle Zeitangaben in WEZ +1. Es ist jetzt 14:17 Uhr.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25