Bibtex

@InCollection{,
  Year    = "2019", 
  Title    = "Information Retrieval", 
  Author    = "Lackes, Prof. Dr. RichardSiepermann, Prof. Dr. Habil. Markus", 
  Booktitle    = "Gronau, Norbert ; Becker, Jörg ; Kliewer, Natalia ; Leimeister, Jan Marco ; Overhage, Sven (Herausgeber): Enzyklopädie der Wirtschaftsinformatik – Online-Lexikon",
  Publisher    = "Berlin : GITO",
  Url    = "https://wi-lex.de/index.php/lexikon/informations-daten-und-wissensmanagement/datenmanagement/daten/information-retrieval/", 
  Note    = "[Online; Stand 21. November 2024]",
}

Information Retrieval

Richard LackesMarkus Siepermann


Viele Datenbestände liegen heutzutage in elektronischer Form vor, sind jedoch informationstechnisch aufgrund fehlender Strukturierung der einzelnen Informationsobjekte nur schwer handhabbar. Aufgabe des Information Retrieval ist, unstrukturierte Datenbestände geeignet zu indexieren, um darauf aufbauend eine effiziente Suche bereitstellen zu können.

Definition Information Retrieval

Information Retrieval ist eine Teildisziplin der Informatik und befasst sich mit der Suche von Informationen in schlecht bzw. unstrukturierten Datensammlungen, wobei die Suchanfrage selbst ebenfalls nur vage formuliert sein kann. [Salton/McGill 1983, S. 1 f.]

Problem der Unstrukturiertheit

Die mangelnde Strukturierung ergibt sich zumeist aus den im Informationssystem abzubildenden Informationsobjekten wie beispielsweise Volltexte, Bilder, Videos und Musik, deren inhaltliche Erschließung durch beschreibende Schlagworte bzw. Indexierung erfolgt. [Fuhr 1996] Während diese Indexierung bei Volltexten noch größtenteils aus den vorliegenden „Rohbausteinen“, nämlich Wörtern, vorgenommen werden kann, ist dies bei Bildern oder Videos nicht mehr unmittelbar möglich. Selbst bei einer funktionierenden Bilderkennung müssten die graphischen Objekte erst identifiziert und dann mittels Schlagworten beschrieben werden. Auch ist die Interpretation inhaltlicher Zusammenhänge in einzelnen Informationsobjekten wie auch untereinander noch schwieriger zu realisieren als bei Volltexten. Fehler in der Indexierung oder unzureichende Begriffsassoziationen führen zu einem schlechten Retrievalergebnis, das sich in die Zielkriterien Recall und Precision differenzieren lässt. Die Maßgröße Recall beschreibt dabei den Abdeckungsgrad des Suchergebnisses, also die Anzahl erhaltener, relevanter Informationsobjekte im Verhältnis zu den im Datenbestand vorhandenen relevanten Informationsobjekten. Die Maßgröße Precision beschreibt die Relevanz des Ergebnisses, also die Anzahl erhaltener, relevanter Objekte im Verhältnis zu den gesamten erhaltenen Objekten. [Salton/McGill 1983, S. 55]

Unscharfe Suchanfragen

Die Suche selbst kann vage vorliegen, weil Suchkriterien nur unscharf formuliert sind, so dass hinsichtlich des Suchergebnisses Informationsobjekte nicht eindeutig identifiziert werden können, sondern lediglich als mehr oder weniger auf die Suchanfrage passend eingestuft werden können. Oder aber die Suchanfrage kann erst im Verlauf einer Suche genauer spezifiziert werden. [Salton/McGill 1983, S. 2]

Zu beachten ist, dass Suchanfragen auf der Indexierung der Informationsobjekte arbeiten und nicht auf den Informationsobjekten selber, da diese wegen ihrer Unstrukturiertheit für eine effiziente Suche nicht geeignet sind.


Literatur

Fuhr, Norbert: Fachgruppe Information Retrieval in der Gesellschaft für Informatik (GI). 1996. Quelle: http://www.uni-hildesheim.de/fgir/index.php?option=com_content&task=view&id=14&Itemid=41

Salton, Gerard; McGill, Michael J.: Introduction to modern Information Retrieval. New York et al. 1983.

 

Hier weiterverbreiten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert