Datenvisualisierung mittels WordCloud

veröffentlicht in Communication,Consulting am 29. Nov. 2013

Herausforderung

Eine zentrale Herausforderung in vielen Unternehmen und Organisationen ist große Mengen an Daten zu aggregieren bzw. wie das im Neudeutsch heißt “managementkompatibel” aufzubereiten.Gerade im Kontext des kaum begreifbaren Datenwachtums das der IT-Analyst IDC für die kommenden Jahre voraussagt (es werden laut deren Analyse 2015 weltweit  knapp 8 Zetabytes oder 8 Trillionen Gigabyte Daten sein, siehe [1]) wird es immer wichtiger werden effiziente Mittel zu finden, strukturierte, semi-strukturierte und unstrukturierte Daten zu visualisieren und Sinnvolles darin zu finden. Aber selbst scheinbar überschaubare Datenmengen wie zum Beispiel der gerade veröffentlichte 185 Seiten starke Koalitionsvertrag der CDU / CDU und SPD stellt die Konzentration eines Managers vor eine unlösbare Aussage, wenn er sich in wenigen Minuten einen groben Überblick über das Inhaltsprofil verschaffen will.
Es sei denn der Manager ist Nummer 5 ‘-) [5].

Lösungsansatz

Eine triviales Beispiel so einer Datenaggregation soll anhand eben diese Koalitionsvertrages demonstriert werden. Hierzu kann mittels ein paar einfacher Shell-Befehle  (siehe [1]) zunächst ein PDF-Dokument in eine ASCII Repräsentation verwandelt  werden. Diese sollte im Anschluss um nicht druckbare Zeichen und Stop-Wörter in der Sprache des Textes (z.B. und, aber, weil) bereinigt werden. Danach lässt sich die Liste zum Beispiel alphabetisch sortieren oder Worthäufigkeiten berechnen. Für unser Beispiel wird sie letztlich mittels eines Wordcloud Generator (siehe [2]) in eine entsprechend visualisierte Form gebracht. Natürlich ist theoretisch auch eine entsprechenden API und eine vollständige Integration in ein Dokumentenmanagementsystem möglich.

Ergebnisinterpretation

Das Ergebnis auf die 50 häufigsten Wörter hochaggregiert sieht wie folgt aus:

Wordcloud

Beim Betrachten des Resultats für den Entwurf des Koalitionsvertrages kann man nun auf einen Blick erkennen, was die wesentlichen Schwerpunkte des Quelldokumentes sind. In unserem Beispiel liegt ein sehr hohes Gewicht der Koalitionäre auf  Deutschland (167 Nennungen), den Menschen (126 Nennungen), Europa (113 Nennungen) sowie der Sicherheit (96 Nennungen).  Die Gesellschaft (95 Nennungen) und Unternehmen (83 Nennungen) folgen.  Arbeit (79 Nennungen) , Innovation (75 Nennungen), Entwicklung (75 Nennungen) und Bildung (67 Nennungen) als Schlüssel für Wohlstand (72 Nennungen) sind da schon weniger häufig vertreten. Bleibt zu hoffen dass es nicht bei einem ähnlich vehementen Gefälle von Generischer Zielformulierung zu letztlicher Umsetzung bleibt. Eine politische Analyse des Inhaltes soll aber hier ebenfalls Fachleuten überlassen werden.

Referenzen

[1] J. Gantz and D. Reinsel, Extracting Value from Chaos, IDC Iview, Juni 2011

[2] http://skipperkongen.dk/2011/09/07/creating-a-word-cloud-from-pdf-documents/

[3] http://www.wordle.net/

[4] https://docs.google.com/file/d/0B9F6ub8wD7gqOWtMa29LVGoyZ2s/edit

[5] http://de.wikipedia.org/wiki/Nummer_5_lebt!

Über Frederik Kramer

Technischer Geschäftführer der initOS GmbH & Co. KG und Doktorand am Magdeburg Research and Competence Cluster (MRCC) der Otto-von-Guericke-Universität Magdeburg ist Ihr Experte im Bereich der Strategischer Nutzung von Open Source Software im Unternehmen.

MantisBT Dashboard Plugin

veröffentlicht in Communication,Software Engineering am 29. Jul. 2013 Tags: , ,

Um unsere Arbeit mit unserem beliebten Tool MantisBT zu vereinfachen, haben wir ein Plugin entwickelt.

einzelne Box mit Icons zum Bearbeiten und Verschieben

einzelne Box mit Icons zum Bearbeiten und Verschieben

Das Plugin ermöglicht, dass sich jeder Nutzer ein Dashboard mit kleinen Boxen anlegen kann, in denen er sich anstehende Tasks, Bugs, also Aufgaben, anzeigen lassen kann und diese dann individuell konfigurierbar sind. Dies löst die 6 starren Boxen von der Mantis Übersichts-Seite ab und bietet eine flexiblere Funktionalität. Um eine Auswahl von Tasks zu treffen greift das Plugin auf die wichtige Filterfunktion von Mantis zurück.

Popup zum Anlegen einer neuen Box und Wahl des Filters

Popup zum Anlegen einer neuen Box und Wahl des Filters

Jeder kann sich individuell die Boxen anzeigen lassen und diese per Drag&Drop an die entsprechende Stelle verschieben.
Dies ermöglicht unseren Mitarbeitern und Kunden sich einen besser Überblick über die aktuellen Aufgaben und Herausforderung zu verschaffen. Zum Beispiel lässt sich so eine einfache Box für jeden Entwickler im Team erstellen, um zu sehen an welcher Aufgabe er gerade arbeitet. Dies geht sonst nur mit manueller Durchforstung der Task-Liste und einzelnem Anwählen der Filter.

Ihr findet den Code für das Plugin auf Github:

https://github.com/initOS/MantisBT-Dashboard

Über Markus Schneider

Als Analytiker und Informatiker ist Markus Schneider Experte für Shop- und ERP-Systeme. Dabei setzt er sein fundiertes Wissen insbesondere im Bereich der Open Source Software ein und kann verschiedene
Anwendungssysteme, z.B. Oxid eSales, OTRS, und Solr Suche, darin integrieren. Auch mit der Onlineshopsoftware Magento kennt sich Herr Schneider bestens aus. Zudem greift er auf gesammelte Erfahrungen unterschiedlicher Systeme wie Sage, SAP und speziell OpenERP zurück.

Kommentare deaktiviert

Import von Logistikdaten in Magento nach VDA 4921

Magento bietet die Möglichkeit, dass man bei einer Bestellung die Sendungen hinterlegt. Dies können auch Mehrere sein und man kann genau angeben, welche Artikel im Paket vorhanden sein sollen. Es lassen sich auch Tracking-Daten hinterlegen, z.B. die Sendungsverfolgungsnummer von DHL. Das ermöglicht Kunden den Versand ihres Pakets zu verfolgen. Meistens werden diese Nummern per E-Mail an den Kunden verschickt. Ein besserer Service ist es natürlich, wenn die Daten schon bei der Bestellung im Shop hinterlegt werden.
Ein zusätzlicher Vorteil ist, dass für die Service-Mitarbeiter des Shop-Betreibers bei Rückfragen des Kunden über Telefon oder E-Mail einfach über das Magento Admin Interface alle relevanten Daten vorhanden sind und sie so schneller und einfacher die Fragen des Kunden bearbeiten können.

Um diese Tracking-Daten in Magento zu importieren gibt es verschiedene Wege, z.B. über die Schnittstelle vom Versanddienstleister direkt aus dem ERP-System, der über den Connector den Shop befüllt, wenn dort die Daten vorhanden sind.
In manchen Fällen wird aber der Versand von einem externen Partner übernommen, so dass man keinen Zugriff auf die Daten hat. In einem Fall bei einem Kunden konnte aber der Dienstleister die entsprechenden Daten als Datei zur Verfügung stellen. Diese Datei entspricht dem Standard nach VDA 4921. Dies ist ein Standard der vom Verband der Automobilindustrie festgeschrieben wurde. In der Datei ist die Lieferscheinnummer und die Sendungverfolgungsnummer enthalten. InitOS hat ein Modul entwickelt, um diese Daten in Magento zu importieren.

Technisch funktioniert das so: Die Dateien werden per FTP abgeholt, dann liest ein von uns entwickelter Parser die Daten aus den Dateien aus, das ERP-System wird angefragt um der Lieferscheinnummer eine Bestellung zuzuordnen und darauf hin wird die Informationen in Magento hinterlegt.

Haben sie ein ähnliches Problem? Brauchen Sie Hilfe mit der Integration ihrer Prozesse in ihrem Shop oder haben sie Intresse an einer PHP Lib mit der sie VDA 4921 Daten verarbeiten können? Dann treten Sie einfach mit uns in Kontakt.

Über Markus Schneider

Als Analytiker und Informatiker ist Markus Schneider Experte für Shop- und ERP-Systeme. Dabei setzt er sein fundiertes Wissen insbesondere im Bereich der Open Source Software ein und kann verschiedene
Anwendungssysteme, z.B. Oxid eSales, OTRS, und Solr Suche, darin integrieren. Auch mit der Onlineshopsoftware Magento kennt sich Herr Schneider bestens aus. Zudem greift er auf gesammelte Erfahrungen unterschiedlicher Systeme wie Sage, SAP und speziell OpenERP zurück.

Kommentare deaktiviert
Nächste Seite »