Momentane Entwicklungen im Bereich des pervasive/ubiquitous computing
erfordern eine neue Infrastruktur im Kontext der individuellen Informationsversorgung.
Aufgrund der losen Kopplung von mobilen Geräten in Kombination mit
hoher Dynamik auf Seiten der Informationsproduzenten erscheint der übliche Weg einer
Interaktion von eng gekoppelten Systemen auf Basis des request/response-Mechnismus
nicht mehr adäquat. Neue Technologien basierend auf dem Publish/Subscribe-Paradigma
sehen einen robuste und flexiblen Mechanismus für eine omnipräsente
Informationsversorgung vor. Bei dieser Technologie subskribieren sich die Informationskonsumenten
für bestimmte Informationen unter bestimmten Bedingungen (bspw. Wetterinformation in San Jose jeden
morgen um 8AM). Ein Subskriptionssystem erhält die Informationen von mehreren Produzenten
(Publishern) und verteilt sie individuell und gefiltert an die korresponierenden Subskribenten.
PubScribe - Was ist das überhaupt?
Die Informationspropagierung von vielen Produzenten zu einer großen Menge von
potenziellen Konsumenten wird gewöhnlich durch ein Notifikationssystem durchgeführt.
Der Subskribent spezifiziert zunächst die Filterbedingungen. Die effiziente Evaluierung
wird dann dem Notifikationssystem überlassen. Bekannte Systeme sind
Elvin,
Gryphon,
and Siena.
Die Anforderungen an eine personalisierte Informationsversorgung sind weitaus mehr
als einfache, inhaltsbasierte Filterungen und proaktive Notfikationen. Vielmehr erfordert es
eine Kombination von Daten von vielen Datenquellen und Transformationsmöglichkeiten
bezüglich höherer Operationen als Projektion, Gruppierung, etc. Der Aufbau eines
solchen Frameworks ist Bestandteil von PubScribe.
PubScribe - Teilprojekte
Da das PubScribe-Framework mehrere Problemkreise gleichzeitig adressiert,
erfolgt eine Aufsplittung des Projekts wie folgt:
Web-Extraktion: PubScribe benutzt XML-strukturierte Dokumente für die interne Verarbeitung,
d.s. Kombination, Filterung und Transformation. Da viele Datenquellen reguläre Webseiten sind,
ist mittels des XWeb-Ansatzes eine regelbasierte Schnittstelle für Webseitentransformation in
gültiges XML vorgesehen.
Data Integration: Aus Benutzersicht sollte die Kombination von vielen Datenquellen in einem
konsistenten, globalen Zustand enden, der dann als gemeinsame Basis für eine individielle
Datenversorgung entsprechend den Subskriptionsregeln dient. Jedoch ist in der hochdynamischen
und flexiblen Welt der Informationsversorgung die Definition von strikter Konsistenz zu überdenken
und eher semikonsistente Zustände einzuführen. Letzteres steht in engem Zusammenhang mit
dem SCINTRA Projekt.
Data Propagierung: Nach der Generierung eines semikonsistenten Zustandes der eintreffenden Nachrichten
sind die Subskriptionen der Benutzer effizient auszuwerten. PubScribe basiert auf einem inkrementellen
Ansatz, der nur Informationsänderungen propagiert. Einzelne Änderungsströme für
individuelle Subskriptionen werden zusammengefasst und Redundanzen in einem zweiten Optimierungsschritt
entfernt.
Hybrides Datenversorgungsmodell: PubScribe basiert auf einem hybriden Datenmodell,
das die mengenorientierte Idee von relationalen Datenbanken mit dem sequenzorienten
Ansatz von Nachrichtensystemen zusammenführt