Intelligente Dienste für Behörden

Das Finden von Dokumenten ausgehend von einer Suchanfrage ist allen Computeranwendern wohl vertraut, und es existieren unzählige Suchmaschinen, welche unter Angabe von Schlüsseltermen den effizienten Zugriff auf zu diesen Termen relevante Dokumente und das in diesen Dokumenten enthaltene Wissen erlauben.

Oft sind aber Dokumente über verschiedene Datenträger oder Informationssysteme verstreut (Quellenheterogenität), und eine spezifische Suche muss vom Nutzer manuell in den verschiedenen Systemen ausgeführt werden. Bei der Formulierung der Suchanfrage muss der Nutzer die Suchmöglichkeiten des jeweiligen Systems beachten sowie Wissen über den dem System bekannten Wortschatz besitzen (Suchsyntax und -vokabular), und Dokumente sind oft nur bei entsprechender Berechtigung zugreifbar (Rechteverwaltung). Hinzu kommt, dass der Nutzer den Suchprozess aktiv initiieren muss, d.h. nach ihm nicht bekannten Themen auch nicht suchen wird. Ein weiterer wichtiger Aspekt ist, die herkömmlichen wortbasierten „Such“-maschinen in „Wissens“-maschinen auszubauen, die die Semantik sowohl der Dokumenteninhalte als auch der Suchanfrage verstehen, und somit die Fähigkeit besitzen, nicht nur Dokumente (aus denen sich der Nutzer dann selbst die Informationen heraussuchen muss), sondern Wissen bereit zu stellen.

Ein persönlicher Informationsassistent, der in der Lage ist, automatisch über mehrere heterogene Quellen zu suchen, und dabei den Kontext des Nutzers zu beachten, stellt eine Möglichkeit dar, diese Probleme effizient zu lösen. Dazu gehören die  Anpassung der Suchanfrage an das Format der jeweiligen Quelle (Query Reforming), die Verwendung eines personalisierten Nutzermodells (User Modeling) zum Verständnis der Intention der Suchanfrage, und die proaktive Informationsversorgung z.B. durch einen Newsletter/Zeitung. Darauf aufbauend werden dann die vorhandenen Dokumente automatisiert mit semantischen Metadaten angereichert, um aus der intelligenten Suchmaschine eine intelligente Wissensmaschine zu machen.

Die Arbeit im Rahmen dieses Forschungsbereichs sollen dazu dienen, neue und effiziente Methoden zu entwickeln, die die Informationsversorgung eines Nutzers vereinfachen. Basierend auf der Erzeugung semantischer Metadaten und deren Verknüpfung, einem semantischen Nutzermodell, sowie der Verwendung verschiedenen Verfahren zur Filterung, Personalisierung, und Aggregation von Informationen können somit Nutzer gezielt mit Informationen versorgt werden, bzw. erhalten auf ihre Suchanfragen relevante und personalisierte Suchergebnisse aus verschiedensten Quellen. Ein solches System deckt somit verschiedene Aspekte sowohl der unternehmensinternen als auch der unternehmensexternen Informationsversorgung ab.

Eine weitere sinnvolle Anwendung eines solchen persönlichen Informationsassistenten ist die Unterstützung bei der Suche über die eigenen Dokumente des Nutzers, oder über mit anderen Nutzern gemeinsam zu bearbeitenden Dokumente (Secure Private Spaces). Diese selbst erstellten Dokumente werden von herkömmlichen Suchsystemen oft nicht unterstützt, bzw. es muss eine weitere Lösung in die Softwarelandschaft des Unternehmens integriert werden, und eine Schulung der Mitarbeiter erfolgen. In den persönlichen Informationsassistenten kann eine „lokale“ Suche nahtlos eingebettet werden, die über eine feingranulare Rechteverwaltung die Möglichkeit bietet, eigene, unternehmensinterne bzw. frei verfügbare Dokumente über eine zentrale Schnittstelle für die beschriebenen Aufgaben zu nutzen. Dabei ist auch denkbar, eine derartige Suchfunktionalität offline, z.B. auf mobilen Endgeräten im Außendienst, zu ermöglichen, und offline erstellte Dokumente automatisch in einen zentralen Suchdienst zu integrieren, sobald das mobile Endgerät mit einem zentralen Server synchronisiert wird. Dadurch können Dokumente und Inhalte mobiler Endgeräte auch bei nicht ständig vorhandener Konnektivität anderen Nutzern durchsuchbar gemacht werden und gegebenenfalls zur Verfügung gestellt werden.

Weitere Aspekte der Realisierung eines persönlichen Informationsassistenten können unter andererem die Definition von Interessenprofilen und deren Nutzung für automatisierte Suchen, die Nutzung von kollaborativen Empfehlungsdiensten, die Entwicklung einer intuitiven und einfachen Bedienoberfläche, sowie die Entwicklung strukturierter und aussagekräftiger Sichten auf die relevanten Informationen sein (alternative Visualisierungen wie z.B. TagClouds, thematische Subkategorien, Auswertungsdiagramme).

Folgende Forschungsthemen stehen mit diesem Ansatz in Verbindung:

1.     Verfahren zur Analyse textueller und multimedialer Inhalte.

2.     Verfahren zur Erkennung und Identifikation benannter Entitäten in Texten, damit Informationen zu gleichen oder verwandten Entitäten miteinander verknüpft werden können.

3.     Verfahren zur Benutzermodellierung basierend auf expliziten Präferenzen und der Interaktion.

4.     Verfahren zur Generierung von Empfehlungen basierend auf dem Benutzermodell und verfügbaren Informationen, die auch zeitliche Aspekte berücksichtigen.

5.     Verfahren zur Aufbereitung der Informationen, z.B. durch interessenorientierte, personalisierte Zusammenfassung eines langen Textes oder zusammengehöriger Informationen.

6.     Verfahren zur automatischen Gestaltung anspruchsvoller, personalisierter Newsletter.