Difference between revisions of "DesktopSuchmaschine"

From Dietrich Blog (Strato)
Jump to: navigation, search
(Meine Anforderungen)
(Replaced content with "Has been moved to: http://blog.kr8.de/wiki-desktop-suchmaschine/")
 
(5 intermediate revisions by the same user not shown)
Line 1: Line 1:
{{TOCright}}
+
Has been moved to: http://blog.kr8.de/wiki-desktop-suchmaschine/
Siehe auch: [[CopernicDesktopSearch]], [[YahooDesktopSearch]], [[Google]], [[Metadaten]], [[SuchMaschinen]]
 
== Meine Anforderungen ==
 
Die wichtigste Funktion meines Wissensmanagements (KnowledgeManagement) ist, Dinge wiederaufzufinden, die ich schon irgendwo (auf meinem PC (oder in Papierablagen) habe.
 
<br />Ich möchte möchte nun aber ganz schlicht und ergreifend in allen meinen Dateien auf meinem Notebook-Computer suchen. Für diesen Fall muss ein Index aufgebaut werden, der dann als Basis für Suchanfragen dient.
 
* Lauffähig auf [[Windows XP]], [[Windows Vista]] und [[Windows 7]]
 
* Fundstellen-Anzeige mit Ordner und Dateiname sowie Preview (Viewer Funktion)
 
* Unterstützung (Indizierung) der wichtigen Dateitypen (ZIP, PDF, Office, E-Mail ([[Outlook]] und [[Thunderbird]]), [[HTML]], [[Metadaten]] bei [[MP3]], [[JPG]] und [[AVI]]).
 
 
 
=== Short List Desktop Search ===
 
;Copernic:Produkt "Copernic Desktop Search 1.0"  http://www.copernic.com/en/products/desktop-search Windows-Oberfläche, Dateien: TXT/RTF DOC XLS, PPT, Outlook-Mail, PDF, Music, Video, Pictures  (ZIP?????)
 
;Google:Produkt "Google Desktop Search" http://desktop.google.com Dateien: TXT, DOC, XLS, PPT, Outlook-Mail  ('''PDF nicht''')
 
;Filehand:Produkt "FilehandSearch 2.0"  http://www.filehand.com  Oberfläche: Windows, Dateien: TXT, DOC, XLS, PPT, PDF, MP3 (ZIP???)
 
;X1&nbsp;Technologies:Produkt "[[X1Search]]" http://www.x1.com Oberfläche: Windows, ....
 
;X-Dot:Produkt "x-friend 0.2" http://www.x-friend.de  Browser-Oberfläche, Java-basiert, verwendet Apache-Lucene, Dateien: TXT, DOC, XLS, PPT, PDF, IMAP E-Mail, MP3 ID3 Tag, Bilder, ZIP-Archive,...
 
;Yahoo&nbsp;Desktop&nbsp;Search:Yahoo hat sich mit X1Search zusammen getan und eine bessere Oberfläche geschaffen. Überragender Pluspunkt bleibt die Viewer-Technologie von X1Search (ex Magellan) YahooDesktopSearch
 
 
 
==Meine Bewertung ==
 
 
 
{|class=wikitable
 
|-
 
| '''Produkt/Klasse''' || '''Pro''' || '''Contra'''
 
|-
 
| [[CopernicDesktopSearch]] 1.0 <br />Desktop-Indexer || Dokumenten-Preview <br />On-the-fly indexing<br />Kleiner Index (Beispiel: 662MB/34MB) || E-Mail nur Outlook, nicht IMAP/POP3 <br /> Indiziert nicht den Inhalt von ZIP-Archiven!!!
 
|-
 
| Filehand 2.0 || Windows-Oberfläche || Inhalte von ZIP-Archiven werden nicht indiziert 
 
|-
 
| Google || Google Desktop Search || PDF nicht indiziert<br />Nocht nicht fertig (Beta) ||
 
|-
 
| [[X1Search|X1Search]] 04.09 <br />Desktop-Indexer || Inhalte von ZIP-Archiven werden indiziert<br />Dokument-Preview integriert<br />Guter PowerPoint-Preview || teuer: $99 <br /> Thunderbird-Email wird nicht indiziert<br />Im PPT-Preview wird nicht mit Autoscroll auf "first occurance" positioniert
 
|-
 
| x-friend 0.2<br />Desktop-Indexer || Plattformunabhägig durch Java <br />Beliebiger WebBrowser <br />Gut passend zur meiner Architektur ([[Java|Java]], WebBrowser, <br />Apache Lucene, IMAP...) <br />E-Mail IMAP<br />Selbsttragende CD-Indizierung || Inhalte von ZIP-Archiven werden nicht indiziert<br /> '''PowerPoint PPT wird nicht indiziert''' <br /> POP3-Email wird nicht indiziert <br />Preview von der Ansichsgrösse nicht einstellbar <br />Sehr schlichter PPT Preview
 
 
 
|}
 
 
 
== Meine Lösungsauswahl ==
 
'''Copernic oder X1Search'''
 
 
 
Copernic bestechen durch seine sehr elegante Windows-Oberfläche. Allerdings ist die Funktionalität von Copernic nicht ausreichend. Es bleibt [[X1Search|X1Search]], das zwar nicht so elegant aussieht, aber durch solide Funktionalität überzeugt.
 
 
 
-----------------------
 
 
 
=== Indizieren: Was soll, was soll nicht indiziert werden ===
 
Da das aufbauen und Aktualisieren eines solchen Index erstens Zeit kostet und zweitens Platz kostet, loht es sich zu überlegen, welche Datei-Typen man wirklich indizieren will und welche man nicht indizieren will.
 
 
 
==== Postiv (sollen indiziert werden) ====
 
Zur Konfiguration von Indexern (Teil einer Suchmaschinen-Archtektur) benötigt man  MIME-Types und Parser für jeden MIME-Type:
 
 
 
{| border="1"
 
|-
 
| Extension || MIME Type || Parser
 
|-
 
| .dbf || application/dbase<br />application/x-dbase || ?
 
|-
 
| .doc || application/msword || catdoc aus: http://freshmeat.net/projects/catdoc/
 
|-
 
| .pdf || application/pdf || pdftotext.exe aus XPDF: http://www.foolabs.com/xpdf/
 
|-
 
| .rtf || application/rtf || ?
 
|-
 
| .xls || application/vnd.ms-excel || catdoc aus: http://freshmeat.net/projects/catdoc/ ||
 
|-
 
| .ppt || application/vnd.ms-powerpoint || ?
 
|-
 
| .html || text/html || OK
 
|-
 
| .htm || text/htm || OK
 
|-
 
| .svg || image/svg+xml || ?
 
|-
 
| .txt || text/plain || OK
 
|-
 
| .vsd || application/vnd.visio || Visio
 
|-
 
| .xml || text/xml<br />application/XML || ?
 
|-
 
| .xsl || ? || ?
 
|-
 
| .zip || application/zip || ?
 
|}
 
 
 
 
 
==== Negativ (sollen nicht indiziert werden) ====
 
* *.bak
 
* *.dbs
 
* *.dl_
 
* *.do_
 
* *.dsk
 
* *.ex_
 
* *.e2_
 
* *.ndx
 
* *.ffx (löschen)
 
* *.ffo (löschen)
 
* *.ffl   (löschen)
 
* *.ffa (löschen)
 
* *.pqi
 
* *.z
 
 
 
 
 
-- [[User:Dkracht|Dkracht]] 21:47, 3 July 2011 (CEST)
 

Latest revision as of 10:24, 25 April 2020

Has been moved to: http://blog.kr8.de/wiki-desktop-suchmaschine/