Home  Unternehmen News & Events Jobs & Karriere   Kontakt     Suche  
STATISTIC workflow
eGovernment im Statistischen Bundesamt

 download Projektbericht
(pdf, 239 KB)


Electronic Workflow in der amtlichen Statistik
 Electronic Workflow
 DatML
 TabML
 Link zu Statspez





























Online-Erhebung über w3stat

w3stat ist ein System zur Übermittlung von statistischen Meldungen über das Internet. Es wurde für die Intrahandelsstatistik, die den bilateralen Warenverkehr zwischen Deutschland und den anderen EU-Staaten erfasst und darstellt, erstmals eingesetzt. Zurzeit nehmen über 11.000 Melder am w3stat-Verfahren des Intrahandels teil. Diese übermitteln monatlich über 13.000 Formular-/Dateimeldungen an das Statistische Bundesamt. Das w3stat-Angebot wird derzeit auf weitere Statistiken ausgedehnt.

Die eingehenden Daten werden einer automatisierten, formularspezifischen Plausibilitätsprüfung (PL) unterzogen. Fehlerfreie Daten werden über generierte Konversionstabellen innerhalb des elektronischen Workflow in die zur Auswertung benötigten Datenformate umgesetzt und gespeichert.

Zur Unterstützung des elektronischen Workflow werden XML-basierte Datenformate zur Beschreibung von Daten (DatML - Data Markup Language) und Ergebnistabellen im Matrix- und Layoutformat (TabML - Table Markup Language) entwickelt. Auf diesen XML-Formaten setzen metadatengestützt sowohl Prozesse zur Datenanalyse und -aufbereitung, als auch die unterschiedlichsten Werkzeuge zur Präsentation statistischer Ergebnisse auf.


Datenaufbereitung, Datenanalyse und Datenablage

Eine wichtige Säule im statistischen Aufbereitungsprozess stellt die tabellarische Auswertung und Aufbereitung der Daten dar. Zur Unterstützung dieses Prozesses wurde STATSPEZ entwickelt, eine Sammlung von grafisch unterstützten Werkzeugen zur Spezifikation und Erzeugung von Tabellen über die Auswertung der Erhebungsdaten auf dem PC des Fachbereichs.

Außerdem wurde als Auswertungswerkzeug die Software SAS eingeführt. SAS dient primär als Werkzeug für Anwender in den Fachabteilungen. Es werden sowohl die Komponenten zur Durchführung von Datenmanagement und Datentransformationen als auch die Module für Matrizenoperationen, Grafik-Erzeugung und zu Analysezwecken die statistischen SAS-Prozeduren eingesetzt.

Ergebnisse werden metadatengestützt im GENESIS-Informationssystem vorgehalten und sind sowohl den Fachbereichen als auch der Öffentlichkeit über unterschiedliche Schnittstellen zugänglich (z.B. GENESIS-Online).


Präsentation der Ergebnisse

Das Statistische Bundesamt als größter Informationsdienstleister Deutschlands bietet über seine Internet-Plattform Zugang zu den vom Statistischen Bundesamt angebotenen Informationen.

Für öffentliche Nutzer entwickelt das Statistische Bundesamt ein auskunftsorientiertes Web-Angebot für den Zugang zu GENESIS-Informationen über eine HTML-Schnittstelle (GENESIS-Online).

Der Shop als etablierte Vertriebsplattform im Web bietet Zugriffe auf Ergebnisse des statistischen Aufbereitungsprozesses auf den unterschiedlichsten Veröffentlichungsmedien, einschließlich dem direkten Zugriff auf aktuelle Ergebnisse über Download-Funktionen des Web.
DatML - Data Markup Language
 zum Seitenanfang
Eine Auszeichnungssprache zur Beschreibung statistischer Daten

Unter dem Begriff DatML entsteht zurzeit eine Familie XML-basierter Dokumenttypen für die konsistente, plattformunabhängige und medienbruchfreie Beschreibung statistischer Daten von der Datenerhebung über die Plausibilisierung und Auswertung bis zur Archivierung.

Diese neuen Dokumenttypen bieten die Möglichkeit, statistische Metadaten und Beschreibungsobjekte, ausgehend von der Entwurfsphase, konsistent durch den gesamten Produktionsprozess zu transportieren und Anwendungen verfügbar zu machen.

Wichtige Ziele hierbei sind Anwendungs- und Datenintegration, Sicherung und Steigerung von Qualität und Effizienz des Produktionsprozesses. Zur Datenintegration zählt auch die einfache Verknüpfung von Daten und Ergebnistabellen.

Neben Beschreibungskomponenten für Daten stellt DatML Komponenten für die technische Unterstützung des Produktionsprozesses (z.B. Mapping-Informationen), die Plausibilisierung (z.B. Spezifikationen, Prüfkodes, usw.) und die Beschreibung von Fragebögen bereit. Die Komponenten sind modular definiert und leicht wiederverwendbar.

Die Dokumenttypen im Einzelnen:
  • DatML/RAW für die Lieferung von Rohdaten
  • DatML/MAP für das Mappen von Fragebögen und Datensätzen
  • DatML/ASK für die Beschreibung von Fragebögen
  • DatML/SET für statistische Datenbestände einschl. Archivierung
  • DatML/SSP für statistische Spezifikationen
  • DatML/EDT für Plausibilitätsprüfungen
TabML - Table Markup Language
 zum Seitenanfang
Eine Auszeichnungssprache zur Beschreibung von Ergebnistabellen

Unterschieden wird hier zwischen dem Layoutformat einer druckfertig aufbereiteten Tabelle und dem Matrixformat, einem Format, das alle bei der Auswertung relevanten Informationen als Metadaten beinhaltet.

Das Matrixformat enthält neben den Werten der Tabellenmatrix Metadaten über den Erstellungsprozess. So ist z.B. zu jedem Wert der Tabellenmatrix nachvollziehbar, welche Felder des Datensatzes ausgewertet wurden, über welchen arithmetischen Ausdruck ein Wert der Tabellenmatrix berechnet wurde und welche Tabellenfelder bei Summenbildungen einbezogen wurden. Das Matrixformat dient als Grundlage für nachfolgende, automatisierte Funktionen wie Aggregatbildung, Geheimhaltung, usw.

Es erschließt darüber hinaus Analysefunktionen des SAS-Systems für Ergebnistabellen und unterstützt so den medienbruchfreien Workflow im Prozess der statistischen Aufbereitung von Erhebungsdaten.

Das Layoutformat mit den Informationen zur Druckaufbereitung der fertigen Tabelle dient der zentralen Ergebnisablage aus dem statistischen Aufbereitungsprozess und bietet die Möglichkeit, mit speziell entwickelten Konvertern diese Ergebnistabellen in die unterschiedlichsten Aufbereitungsformate zu wandeln.

Unterstützt wird im Augenblick die Möglichkeit, solche Tabellen über das RTF-Format in Anwendungen zur Textverarbeitung und Seitengestaltung wie z.B. MS WORD, AdobePageMaker‚ und WordPerfect‚ zu laden. Darüber hinaus können Ergebnistabellen in das HTML-Format konvertiert werden und es gibt einen Konverter zum Laden der Ergebnistabellen in MS EXCEL.
Direkter Link
 www.statspez.de
© Werum Software & Systems AG 2012 Impressum Sitemap Seite drucken