Funktionalitäten eines "echten" Wissensmanagements

Inhalte wirklich finden

Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.

Ein CI-Dokument ist ein digital erstelltes Dokument, das durch Zeichensätze kodiert ist und von Programmen direkt ausgewertet werden kann. Typische CI-Dokumente sind mit einen Textverarbeitungsprogramm erstellte Briefe oder Tabellen. Durch Techniken wie OCR lassen sich aber NCI-Dokumente in CI-Dokumente überführen.

Warnung vor dem "Google-Effekt"

In CI-Dokumenten ist im Unterschied zu NCI-Dokumenten eine Volltextrecherche möglich. Bei einer Volltextsuche muss allerdings mit dem üblichen "Google-Effekt" gerechnet werden - man bekommt viele irrelevante Dokumente gelistet. Das Einsparpotenzial, das sich für den Zeitaufwand bei der Recherche durch ein DM-System ergeben soll, ist dann schnell verpufft.

Exakte Verschlagwortung bildet deshalb beim digitalen Archiv die zentrale Grundlage von späteren Sucherfolgen. Diese ist bei NCI-Dokumenten auch die einzige Möglichkeit, bestimmte Dateien wiederzufinden, da das Dokument nur als Pixelbild gespeichert wird.

In der Praxis wird oft die Indexsuche auf Basis von Schlagworten eingesetzt. Für die Indexsuche müssen einem Dokument Suchmerkmale wie Autor, Titel, Erstellungsdatum und vor allem inhaltlich relevante Begriffe zugeordnet sein. Diese Schlagworte oder Attribute werden bei der Aufnahme eines Dokuments in ein DM-System erfasst - ein Vorgang, der als Indexierung, gelegentlich auch als Indizierung, bezeichnet wird.

Zur Startseite