Dokumente anreichern und strukturieren Informationsflüsse managen

CEP ist eine offene und komponentenbasierte Lösungsplattform für die inhaltliche Anreicherung und Strukturierung von Dokumenten in Informationsflüssen sowie deren Steuerung. Das System basiert auf neuesten Technologien und bietet eine große Bandbreite erweiterbarer Erschließungsfunktionen. Diese lassen sich über bewährte Schnittstellen problemlos in bestehende Applikationsumgebungen integrieren.

Informationsflut beherrschen – Wissen strukturieren

Eine ständig wachsende Informationsflut beeinträchtigt längst nicht mehr nur die Nutzbarkeit des Internets. Auch in Unternehmen, Behörden und anderen Organisationen steht die IT zunehmend vor der Herausforderung, wichtige Dokumente im Bedarfsfall schnell auffindbar zu machen und Anwender gezielt mit relevanten Informationen zu versorgen. Viele Ansätze zur automatisierten Inhaltserschließung sind applikationsspezifisch implementiert. Das verhindert, dass generiertes Wissen übergreifend genutzt wird.

CEP, die Content Enrichment Platform von Werum, ist eine offene Lösungsplattform, die sowohl Informationsflüsse feinkörnig steuert als auch Dokumente inhaltlich anreichert und strukturiert. CEP bietet eine große Bandbreite einfach zu erweiternder Erschließungsfunktionen, beispielsweise eine automatische Vergabe von Kategorien. Diese Funktionen können mittels CEP über bewährte Integrationsschnittstellen in bestehende Informationsflüsse und Applikationen eingebunden werden. Ein ausgereifter Webcrawler, eine technisch führende Retrieval-Engine und an CEP angebundene Endapplikationen im Umfeld des Enterprise Content Management ergänzen das Lösungsangebot.

Die Plattform ist vielseitig einsetzbar: CEP bereitet Dokumente zum Beispiel für eine intelligente Suche auf, ermöglicht dem Anwender, personalisierte Newsletter aus unterschiedlichen Quellen zu erstellen, liefert automatisch als relevant erkannte Dokumente zur Wettbewerbsbeobachtung und Reichweitenanalyse oder identifiziert neue Trends und Themen für das Issue Management.

Applikationen im Bereich von Dokumenten- und Content- Management werden durch eine Anbindung von CEP aufgewertet: Mit seinen Erschließungsfunktionen verbessert CEP dort Recherche, Filterung, Navigation und Distribution von Dokumenten und Informationen.

Kernfunktionen

  • Erfassen von Dokumenten und Normalisierung
  • Kategorisierung von Inhalten
  • Filterung und Bereinigung
  • Erkennen von Themen
  • Bündelung von Dokumenten
  • Gewichtung von Dokumenten
  • Steuerung von Informationsflüssen
  • Monitoring und Statistik

Komponentenbasierte Lösungsplattform

Sämtliche CEP-Komponenten fußen auf aktuellsten Technologien und Industriestandards: Basierend auf einer JEE-Architektur (Java Enterprise Edition), zum Beispiel mit einem JBoss Application Server und Tomcat Webserver verfügt CEP bereits out-of-the-box über Eigenschaften wie Persistenz-, Transaktions- und Sicherheitsdienste. Serviceorientierte Architekturen gewährleisten darüber hinaus größtmögliche Flexibilität hinsichtlich der Anbindung an bestehende Infrastrukturen und Applikationen. CEP ist damit zukunftssicher und garantiert den Kunden einen hohen Investitionsschutz.

CEP-WF:

Die Workflow-Komponente integriert sämtliche CEP-Komponenten und steuert den Informationsfluss. CEP-WF enthält normierte Kontrollstrukturen und wird über Regeln konfiguriert. So ist beispielsweise der Workflow dahingehend parametrierbar, ob und wie ein eingehendes Dokument erschlossen wird und welche Exporte anschließend erfolgen sollen.

CEP-DA

Die Komponente Datenakquisition validiert eingehende Dateien, zerlegt sie gegebenenfalls in Einzelobjekte, transformiert diese in ein internes XML-Format und übergibt sie so normiert an den Workflow. CEP-DA realisiert den Input über zahlreiche Schnittstellen wie beispielsweise das Filesystem, FTP-Dienste, einen projektierbaren Web Service oder projektspezifische Anbindungen an bestehende Endapplikationen, Die Komponente ist für diverse namhafte Content Provider, Agenturen und ECM-Systeme vorkonfiguriert.

CEP-CO

Die Core-Komponente stellt Funktionen im Umfeld eines zentralen Dokumenten-Repositories sowie der Stammdaten- und Benutzerverwaltung zur Verfügung.

Dazu gehören formale und anwendungsspezifisch eingebrachte Prüfungen und die Speicherung notwendiger Daten für statistische Auswertungen des Informationsflusses. Die Administrationsoberfläche erlaubt darüber hinaus, Dokumente im Repository gezielt zu selektieren und im Gesamtsystem zu bearbeiten – beispielsweise um spezifische Dokumentmengen erneut zu kategorisieren und/oder zu verteilen.

CEP-EX

Eine dedizierte Exportkomponente liefert Dokumente an die Content-Konsumenten. CEP-EX transformiert Dokumente aus dem internen in das gewünschte Export-format (zum Beispiel XML, HTML oder txt) und stellt sie applikationsspezifisch zur Verfügung. Die Übergabe kann über einen Webservice, auf FTP- und Filesystem-Ebene parametriert oder spezifisch ausprogrammiert werden. Optional ist eine Regelauswertung auf Workflow-Ebene für eine feinkörnige Exportsteuerung möglich.

CEP-CE

Diese Komponente basiert auf dem Produkt ICE (Intelligent Content Engineering). Sie zeichnet sich durch eine große Bandbreite von intelligenten und lernfähigen Erschließungsfunktionen, wie Sprach- und Dublettenerkennung, Informationsextraktion, verschiedenen Kategorisierungsmodi oder Clustering aus, die komfortabel in den CEP-Workflow eingebunden werden können.

Im Unterschied zu anderen, proprietären Ansätzen lassen sich diese Funktionen in ICE – genau wie die zugrunde liegenden Softwaremodule – dialoggestützt in Erschließungs-Workflows projektieren. Inhaltlich verschiedene Datenströme wie Agenturmeldungen, Patentinformationen oder wissenschaftliche Quellen können so unterschiedlich behandelt werden.

ICE

basiert auf einem Serveransatz und trennt die bequem administrierbaren, versionierten Wissensmodelle logisch von den einzelnen Verarbeitungsmodulen. Die Architektur von ICE gestattet dabei eine parallelle und verteilte Verarbeitung aller Versionen von Wissensmodellen in verschiedenen Instanzen und Servern.

Für die Entwicklung, Modifikation und Verwaltung der Modelle bietet ICE ausgefeilte Tools und Werkzeuge. Alle relevanten Verarbeitungsschritte können mit Hilfe von Evaluierungs- und Benchmarking-Funktionen detailliert ausgewertet werden. ICE nutzt als interne Basis Funktionen der IBM / UIMA (Unstructured Information Management Architecture).

Zusatzkomponenten vervollständigen das Lösungsangebot

Webcrawler: Ein komfortabel projektierbarer Crawler kann die an CEP angebundenen Applikationen automatisiert mit zusätzlichen Inhalten versorgen. Diese können über den Crawler von beliebigen Websites extrahiert werden, wie zum Beispiel aus dem Intranet sowie öffentlichen oder geschützten Informationsportalen. Die dialog- und datenbankgestützte Administration umfasst die Tiefe der Linkverfolgung, feinkörnige Regeln für die (Nicht-) Übernahme von Seiten sowie den Crawl-Zyklus. Werbung oder Navigationsinhalte werden durch intelligente Filter erkannt.

Retrieval-Engine, andere Applikationen:Für effizientes News Management und intelligente Retrieval-Funktionen ist der InformationMinder von Xtramind als eigenständige Applikation ‚CEP-ready’ angebunden. Das Informationsmanagement weist die volle Bandbreite von Suchfunktionen, wie z.B. semantische oder unscharfe Suche, auf.

Darüber hinaus wurde CEP an weitere Endapplikationen im Bereich des Enterprise Content Management angebunden, zum Beispiel an den Hyperwave Information Server oder an das CMS contentXXL.

Abgestuftes Lösungsangebot

Das Lösungsangebot passt sich flexibel den Bedürfnissen des Kunden an. Das Spektrum von Werum und seinen Partnern reicht von der Bereitstellung isolierter Erschließungskomponenten über die Installation eines ICE-Servers mit einer Anbindung an CEP, der Organisation zusätzlicher Inhalte bis hin zur Lieferung von Gesamtsystemen im Umfeld des Enterprise Content Managements. Kundenprojekte belegen, dass der Einsatz von CEP auch bereits für die reine Informationsfluss-Steuerung wesentliche Vorteile mit sich bringt. Die Content-Erschließung kann dank der service-orientierten CEP-Architektur bei Bedarf leicht ergänzt werden.

Durch seine modulare Komponentenstruktur auf Basis aktueller Technologien und Industriestandards kann CEP mit den Anforderungen wachsen und in vielfältigen Anwendungsfeldern zum Einsatz kommen

Anwendungsgebiete

  • News Management
  • Wettbewerbsbeobachtung
  • Issue Management
  • Reichweitenanalyse
  • Enterprise Content Management
  • Dokumentenmanagement
  • Content Management
  • Retrieval
  • Intranet
  • Archivierung

Referenzkunden

  • BASF
  • Deutsche Bahn Systemtechnik
  • Deutsches Zentrum für Luft- und Raumfahrt
  • Deutsche Welle

Weitere Referenzen und Kunden auf Anfrage.

Benefits

  • Kostenersparnis beim Informationsmanagement
  • Wertsteigerung der Informationsflüsse
  • Automatisierte Wissensgenerierung
  • Qualitätsverbesserung durch zentrale Pflege
  • Einfache Integration von Erschließungsfunktionen
  • Einsatz in evolutionären Szenarien

Entwicklungspartner

CEP und seine Zusatzkomponenten sind das Ergebnis partnerschaftlicher Entwicklung von:

DNC Dr. Netter Consulting GmbH

Rebel Creations AG

Werum Software & Systems AG