Open Data Institute (ODI): Open Data in a Day

Big Ben in London

Auf Einladung des UK Open Data Institutes (ODI) war ich in London und habe an der Schulung Open Data in a Day teilgenommen. Weil die Materialien auch offen sind, will ich hier darüber berichten und auf das Material verlinken: die Vorträge, die Übungen, die verwendete Open Source Software. Gesondert werden die besprochenen Cases aufgeführt, weil sie zeigen, was alles möglich ist, wenn man nur will. Das ODI ist auch günstig gelegen, so dass man sich in Deutschland auch überlegen kann, für einen Tag in die Londoner City zu fahren.

(Am Rande: der Fachmann sieht, dass Big Ben ein neogotisches Bauwerk aus dem 19. Jahrhundert ist, rechts im Hintergrund auf dem Bild aber eine gotische Kathedrale um Aufmerksamkeit bittet: Westminister Abbey. Das wird wohl ein eigener Artikel 🙂 ).

Das Open Data Institute ist als Non-Profit-Organisation von der britischen Regierung im Dezember 2012 gegründet worden, um die Open Data Kultur zu katalysieren. Das Visionstatement findet man in Wikipedia: „The ODI is catalysing the evolution of open data culture to create economic, environmental, and social value. It helps unlock supply, generates demand, creates and disseminates knowledge to address local and global issues.“

Als Präsident fungiert Sir Tim Berners-Lee (Erfinder des World Wide Web).  Als Chairman und wie Berners-Lee Mitgründer konnte Sir Nigel Shadbolt (Professor der Universität Southhampton) gewonnen werden.

Die britische Regierung, hier speziell das Cabinet Office, verantwortet eine Vielzahl von Maßnahmen, die das Regierungshandeln effektiver und effizienter machen sollen. Bekannter in Deutschland sind ITIL für das IT-Management und PRINCE2 für das Projektmanagement, die auch auf Betreiben der britischen Regierung das Licht der Welt erblickt haben. Für das Open Data Institute hat das Cabinet Office ab 2012 für fünf Jahre 10 Millionen £ bereit gestellt. Hier der Implementation Plan. Mittlerweile ist das ODI weltweit führend, obwohl es auch in anderen Ländern von den dortigen Regierungen ODI’s gibt, z.B. ODI Kanada oder ODI USA. Geplant ist es, die Erfolge des britischen ODI’s durch ein organisatorisches Netzwerk weltweit zu verbreiten.

Kurse

Schon heute werden die Erfahrungen vom ODI in mehreren Kursen unterschiedlicher Dauer verbreitet:
Eintägige Kurse

Fünftägige Kurse

Der eintägige Kurs Open Data in a Day ist dabei als Einstieg anzusehen, der in anderen Kursen vertieft werden kann. Das Programm von „Open Data in a Day“ ist online zu finden. Es umfasst drei Vorlesungen und zwei Übungsbereiche. Im Folgenden sind die Präsentationen, die Übungen, die Übungsdaten und ein Analysewerkzeug verlinkt. Es werden auch lokale Kopien verlinkt, für den Fall, dass sich die Struk´tur des ODI-Webservers ändert.

Die Teilnehmer des besuchten Kursus waren international zusammen gesetzt. Sie kamen aus Sierra Leone (4 Personen), United Kingdom, Deutschland, Schweden, Singapur.

Vorlesungen/Präsentationen

Zu Beginn führen Präsentationen in das Thema ein, die dann in Übungen vertieft werden.

ODI Introducing Open Data | lokal: Introducing_Open_Data
ODI Law and Licensing | lokal: law_and_licensing
ODI Stars and Certifications Presentation | lokal: Ensuring_Data_Quality
Unter anderem werden die 5 Sterne Open Data Taxonomie besprochen (siehe Bild) und die ODI-Zertifikate.

Die Präsentationen werden auf einem verstehbaren Level dargeboten.

5 Sterne Open Data Stufen

Die 5 Sterne Open Data Stufen waren ein erster Versuch von Tim Berners-Lee, zu einer Taxonomie von Open Data Aktivitäten zu kommen. Die ODI-Zertifikate (siehe Stars and Certifications Presentation) beziehen mehr Dimensionen in die Bewertung des Reifegrades ein wie einen allgemeinen, rechtlichen, praktischen, technischen und sozialen Kontext. Damit kommt man näher an Reifegradmodelle, wie man sie von CMMI kennt oder wie ich es für die Reifegradmodelle für PRINCE2 beschrieben habe.

Übungen

Die Übungen sind zweistufig: Zunächst werden Daten zu Fuß angesehen, dann mit einem Werkzeug (Open Refine). Die Übungen werden in Teamwork mit Unterstützung des Trainers durchgeführt.

Übungen I: Daten entdecken – Discovering data exercise

ODI Discovering Data exercise | Lokal Discovering_Open_Data_Exercise
Diese Übung] sieht sich die Praxis von Veröffentlichungen von Open Data im Web an und stellt einige wenige, scheinbar einfache Fragen. Zwei Hauptdatensätze werden für diese Übung gebraucht:

Datensatz 1: Spend over £25,000 in the Foreign and Commonwealth Office (viele CSV-Datensätze)
Datensatz 2: Land Registry Monthly Property Transaction Data (viele CSV-Datensätze)

Übungen II: Daten säubern und validieren – Data Cleaning and Validation Exercise

Diese Übung Cleaning Exercise [lokale Kopie: Cleaning_Exercise] stellt Open Refine (Früher: Google Refine) vor als Tool zum Reinigen schmutziger Daten und die Arbeit damit. Für diese Übung werden die folgenden Datensätze benötigt:

Datensatz 1: Louisiana Secretary of State Officials [Source] | [Download] | [lokale Kopie: ElectedOfficials ]
Datensatz 2: Projects Dataset [Source] | [Download] | [lokale Kopie: Projects_Modified]
Datensatz 3: UK GP Earnings [Source] | [Download] | [lokale Kopie: gp_info]

Cases

Zum plastischen Verständnis des Nutzen von Open Data sind natürlich Beispiele/Cases immer sehr anschaulich. Einerseits hält das ODI auch Case Studies online vor (siehe case-studies und stories). Anderseits flossen auch einige interessante Beispiele in die Veranstaltung ein. Hier sollen einige hervorgehoben werden.

Burkina Fasa: Karte mit Schulen

Das drittärmste Land der Welt, Burkina Fasa, ein kleines Land mitten in Afrika, hat ein Open-Data-Projekt mit dem ODI und der Weltbank gemacht: Burkina Open Data Initiative (BODI). In einem kleinen Film wird gezeigt, wie Daten des Erziehungsministeriums über Schulen auf eine Karte mit Markern abgebildet werden. Vom Marker aus sind weitere Informationen zugänglich über die Schule: Foto, Qualitätsmerkmal. Ziel ist es, den Eltern eine Informationmöglichkeit zu geben, auf welche Schule sie ihre Kinder schicken können. (Ein Szenario, das ich auch beschrieben hatte).

Schulen in Burkina Fasa, Afrika

Impact der Schließung von Feuerwehrwachen in London

Als 10 Feuerwehrstationen der Londoner Feuerwehr schließen sollten, wurde der Impact auf das Service Level simuliert. Normalerweise möchte man an jedem Brandherd in weniger als 7 Minuten sein. Der Durchschnitt liegt in London bei etwas mehr als 5 Minuten. Um dem Risiko einen Gewichtungsfaktor zu geben (Schadenausmaß), wurden nicht die Wohnungen und deren Bewohner in London herangezogen, sondern die zu einem bestimmten Zeitpunkt sich in der Nähe eines potenziellen Brandherdes aufhaltenden Personen. Dazu wurden Handyortungsdaten von Telefonica verwendet. Mit Hilfe dieser Daten kann dann auf einer Karte die Veränderung des Risiko nach Wegfall der 10 Feuerwachen interaktiv visualisiert werden:

Feuerwachen in London City

(Die interaktive Karte findet man unter http://london-fire.labs.theodi.org/explore/)

Verschreibungen von Generika vs. Originalpräparaten innerhalb des NHS in England und Wales

Für den National Health Service (NHS – Staatliches Gesundheitssystem in UK) wurde untersucht, wo in UK Generika (Nachahmer) und wo überwiegend Originalpräparate von Ärzten verschrieben wurden. Wenn wirkstoffgleiche Generika verschrieben werden, ist die Krankenkasse in der Lage, viele Millionen £ zu sparen. Um nicht nur die Patientendaten zu anonymisieren, sondern auch die der verschreibenden Ärzte, wurden Zellen mit mindestens 20.000 Verschreibungen gebildet. Das Ergebnis der der sehr unterschiedlichen Verteilung sieht man auf der folgenden Abbildung und kann auch im Internet interaktiv analysiert  werden (http://www.prescribinganalytics.com/).

Transport API

Transport API von der Firma Placr sammelt Daten des öffentlichen Personenverkehrs (Bahn, Busse, Underground etc.). Dabei geht es nicht nur um Fahrplandaten (die absurderweise in Zentraleuropa von öffentlichen Betreibern als Privateigentum betrachtet werden), sondern auch um Livedaten. Diese Daten werden per API zur Verfügung gestellt. Auf die APIS kann dann von Anwendungen in Echtzeit zugegriffen werden. Die ersten 30.000 Abrufe sind kostenlos, danach werden Gebühren erhoben. Die aktuellen Daten werden dann von App-Entwicklern in Echtzeitanwendungen eingebunden wie Routenplanern.

Ausgaben (Expenses) des Foreign and Commonwealth Office (Außenministerium)

In der Übung I, Dataset 1 werden Ausgaben des Aussenministeriums vorgesichtet. Das Aussenministerium hat nun schon viele Datensätze auf Monatsbasis bereitgestellt. Bei der manuellen Analyse soll dann ein erster Eindruck erarbeitet werden, ob oder mit wieviel Aufwand die Datensätze genutzt werden können. So fallen in den CSV-Datensätzen auf, dass

  • z.T. die Datenformate gewechselt wurden (beim Datum: Minus statt Schrägstrich),
  • die Zehnerpotenzen gewechselt wurde, 1000er Datensätzen statt 1er,
  • aber auch, dass offenbar Splittungen von Zahlungen vorgenommen wurden (um Limits zu unterschreiten?),
  • die Kostenarten nicht eindeutig zuordnenbar waren (z.B. bei dem IT-Dienstleister: wurden PCs oder Server geliefert, werlche Dienstleistungen erbracht wurde).

In der Gruppenarbeit wurde dann schnell klar, dass die auf den ersten Blick sehr schönen Datensätze nur mit erheblicher Mühe maschinell verarbeitbar sind.

Location/Anreise

Das ODI befindet sich am Rande der Londoner City. Für Ausländer ist die Anreise mit dem Flugzeug die schnellste Art, so dass man in Eile auch in einem Tag fertig werden kann:

  • Anflug über Stansted Airport (110 € von Berlin mit Ryanair und zurück),
  • mit dem Stansted Express (32 £ Hin- und Rückfahrt) zum Bahnhof Liverpool Station. (Endbahnhof),
  • zu Fuß von Liverpool Station zum ODI, 65 Clifton Street, London EC2A 4JE,
  • Essen und Getränke werden gestellt,
  • der Kurs kostet 240 £.

Die Adresse des Open Data Institute ist Open Data Institute, 3rd floor, Quickhouse, 65 Clifton St, London, EC2A 4JE:

65 Clifton Street, London

Fazit

Die Veranstaltung gibt einen hervorragenden Überblick, was man mit Open Data machen kann und wie man es macht (mit besonderem statistischen Schwerpunkt). Das ODI ist einen internationale Drehscheibe für Open Data Projekte, wodurch man die nationale Enge überwinden kann. Ich kann nur jedem aus der Open Data Szene empfehlen, darüber nachzudenken, auch mit dem ODI in Kontakt zu treten und sich das Angebot anzusehen..

That’s all Folks!

Weitere Informationen:

http://theodi.org/
http://wk-blog.wolfgang-ksoll.de/2013/01/07/open-data-die-nachste-runde/

Bildnachweise:
Alle Bilder sind vom ODI, ausser: Das Foto von Big Ben ist von Wolfgang Ksoll

Dieser Beitrag wurde unter E-Government, Internet, IT, Open Data, Uncategorized veröffentlicht. Setze ein Lesezeichen auf den Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.