>> Ressourcen > Theses > Richter, Wolfga[..] > thesis-final > Information Fil[..]

next up previous contents
Nächste Seite: Wissensauffindung bei Virtual Communities Aufwärts: Wissensauffindung aus der Sicht Vorherige Seite: Information Retrieval   Inhalt

Information Filtering

Wie schon erwähnt ist die Grundlage von Information Filtering (IF) ein fortwährendes Interesse eines Users an einem bestimmten Thema. Das Information Filtering-System muß in der Lage sein, aus einem dynamisch erzeugten Datenstrom die Daten zu selektieren, die dem Informationsbedürfnis des Users genügen. Die Datenbeschaffung ist ein eigener Punkt, der im Information Filtering-System nicht enthalten ist und im Kapitel 5.2.1 beschrieben wird. Das Information Filtering-System dient ausschließlich dazu, Daten zu selektieren. [Sackmann1997]


Abbildung: Die Elemente eines Information-Filtering-Systems. Die Abbildung beinhaltet auch die Schritte für ein Information Retrieval System. Man sieht dabei den Unterschied zwischen einem langfristigen Interesse eines Users an einem bestimmten Thema und einem kurzfristigen Informationsbedarf.
\includegraphics[scale=0.7]{pictures/sif1.ps}

Grundsätzlich können drei Arten von Information Filtering unterschieden werden [Sackmann1997]:

  • Cognitive- oder Content-based IF: Texte werden auf ihren buchstäb- lichen Inhalt untersucht und mit einem Interessenprofil (die Interessen des Users) verglichen. Durch Verwendung von booleschen Operanden und bzw. oder unterschiedlicher Gewichtung lassen sich komplexe Interessenprofile beschreiben.
  • Economic IF: Hier sind verschiedene Arten von Kosten-Nutzen-Kalküle die Grundlage. Informationen werden als Gut eines mikroökonomischen Marktmodells angesehen. Preismechanismen gewährleisten, dass die Informationsmenge gefunden wird, in dem sich die Kosten der Informationen und der erwartete Nutzen entsprechen.
  • Social IF5.23: Hier werden zwischenmenschliche Beziehungen, zum Beispiel zwischen Sender und Empfänger des Textes, genutzt, um Informationen anhand des Interessenprofils zu filtern. Damit ist gemeint, dass Empfehlungen aufgrund von ähnlichen Interessen von Usern abgegeben werden und diese Empfehlungen in Zusammenhang mit den Interessensprofilen der User gesetzt werden.

Da von einem fortwährenden Interesse des Users ausgegangen wird, ist es sinnvoll, ein automatisiertes Konzept für Information Filtering anzuwenden. Welche Punkte dabei berücksichtigt werden müssen, wird in Abbildung 5.2 dargestellt. In einem nicht automatisierten System findet die Filterung im Kopf des Users statt und ist eine Kombination verschiedener Filtertechniken. Die Herausforderung eines automatisierten Information Filtering-Systems besteht darin, ein komplexes Interessenprofil auf eine boolesche Operation zu reduzieren. Damit das möglich ist, müssen die Daten eine qualitative Eigenschaft besitzen, die sie als nützliche Information auszeichnen oder als unnütze Information kennzeichnen und ausgefiltert werden. Eine solche Eigenschaft kann quantitativ (Vorhandensein eines Schlüsselwortes, Länge eines Textes, Anzahl von Schlüsselworten im Text) oder qualitativ (Niveau, Schönheit, Sinn, Bezug auf andere Informationen oder Zusammenhang, etc.) sein. Ein automatisierter Filter kann nur aufgrund definierter Merkmale der Daten durch das Interessenprofil seine Entscheidungen treffen. Die Merkmale müssen, damit sie durch Computer verarbeitbar sind, quantifizierbar oder zumindest in eine Reihenfolge einordenbar sein. [Sackmann1997]


Qualitative Merkmale sind für die Verarbeitung durch Computer eher ungeeignet und müssen erst in ,,pseudo-quantitative`` transformiert werden. Quantitative Merkmale sind die Grundlage für die Automatisierung eines Information Filtering-Systems. Für einen sinnvollen Einsatz eines automatisierten Information Filtering-Systems ist es aber notwendig, dass sowohl qualitative, als auch quantitative Merkmale verarbeitet werden können. Obwohl die Transformation von qualitativen Merkmalen in quantitative immer unvollkommen und unvollständig erfolgt, ist es die einzige Möglichkeit, beide Merkmalgruppen von Filtern berücksichtigen zu lassen. [Sackmann1997]



next up previous contents
Nächste Seite: Wissensauffindung bei Virtual Communities Aufwärts: Wissensauffindung aus der Sicht Vorherige Seite: Information Retrieval   Inhalt
root 2001-10-01