Was ist Open Data?
Entscheidend für die Weiternutzung ist die rechtliche und technische Kompatibilität der Daten mit anderen Datenquellen. Der Zugang, die Weiterverarbeitung und die Weiterverbreitung soll jedermann und zu jeglichem Zweck, auch kommerziellem, ohne Einschränkungen, Diskriminierung und ohne Zahlung von Gebühren möglich sein.
Sind alle im Internet verfügbaren Daten auch Open Data?
Warum ist Open Data wichtig?
Offene Daten bergen auch enormes Potential für Innovationen. Liegen Behördendaten als offene Daten vor, können sie von Bürgern, Hochschulen und Firmen genutzt, weiterverarbeitet, veredelt und weiterverbreitet werden. So können neue Auswertungen und Analysen, Anwendungen, Produkte und Dienstleistungen, Geschäftsmodelle und Produktionsketten entstehen.
Welche Daten sind gemeint?
Meint Open Data nur Behördendaten?
Wie stelle ich Daten als Open Data bereit?
* Im Veröffentlichungsleitfaden für den Apps4Deutschland-Wettbewerb.
* Im Open Data Manual. Eine teilweise deutsche Übersetzung gibt es unter http://opendatamanual.org/de, allgemeine Hinweise zur Mitarbeit am Manual unter http://wiki.okfn.org/Open_Data_Manual.
Wann sind Daten maschinenlesbar?
Wichtig dafür ist nicht die Nutzung eines bestimmten Formats, sondern dessen Angemessenheit: tabellarische Informationen sollten nicht in Textdokumenten oder Druckvorstufen versteckt sein, Informationen zu Prozessen werden strukturiert vorgelegt, Metadaten von den eigentlichen Daten getrennt. Für Kartendaten sollten Formate verwendet werden, die die zugrundeliegenden Koordinaten enthalten, anstatt Karten z.B. als Bilder auszugeben.
Im Allgemeinen gilt: das beste Format ist oft das Format, welches in der datenhaltenden Behörde intern Verwendung findet. Die meisten Fachsysteme sind zudem in der Lage, einen Export in ein Format wie CSV oder XML durchzuführen. Daten sollten nicht im PDF-Format vorgelegt werden.
Warum sind Metadaten wichtig? Welche?
Besonders wichtige Metadaten aus einer Nutzerperspektive sind:
* Lizenzinformationen und besondere Nutzungsbestimmungen
* Eine grobe Beschreibung des Inhalts der Daten, insbesondere ein thematischer, zeitlicher und geographischer Bezugsrahmen.
* Angaben zum Format und einzelnen Feldern, besonders wenn die Daten Teil eines exotischen Fachsystems sind.
* Code-Sheets und Masterdaten (z.B. Kategorisierungsschemata, Gebietscodes etc.) zur Erweiterung eines Kerndatensatzes.
Dazu kommen Metadaten die für eine einwandfreie Deutung der Informationen notwendig sind:
* Informationen zur Quelle, Erhebungsmethode, Befragungsinstrument etc.
* Bekannte Fehler in den Daten
* Bisher angewandte Verfeinerungen, Filter, Erweiterungen
* Verweise etwa auf andere, verbindbare Datenbestände
* Angaben zur Veröffentlichungsfrequenz und -modalität
Mehr Informationen:
* Data Catalog Vocabulary – ein Vokabular für Datenkatalog-Metadaten.
* Dokumente der GDI-DE inklusive dt. Geo-Metadatenmodell.
Was sind APIs?
APIs machen hauptsächlich für solche Daten Sinn, die sich regelmäßig und schnell aktualisieren (z.B. Live-Nahverkehrsdaten, Wetterinformationen) – für statische Datensätze wie etwa einen Kartensatz oder eine jährliche Statistik sind APIs dagegen ein unnötiger Aufwand. In keinem Fall sollte eine API als Ersatz für die Veröffentlichung eines Rohdatensatzes verstanden werden: die Nutzer müssen immer die Möglichkeit haben, den gesamten Datensatz zu beziehen.
* Beispiel: Deutschland-API mit Daten aus dem Parlament.
* Beispiel: API Leipzig
* GENESIS-API des Statistischen Bundesamts; hier wären statische Dateien vermutlich ebenso hilfreich.
* REST (Wikipedia) – Metapher für viele Web-APIs.
* OData - ein Microsoft-Protokoll für Daten-APIs.
Was ist screen-scraping?
Wie kann man Daten scrapen?
Was ist Linked Open Data?
Während Linked Data im Zusammenhang von Forschung und Enterprise-IT als Format einige Aufmerksamkeit erregt, steht die Nutzung durch normale Entwickler weitestgehend noch aus: RDF ist wesentlich aufwändiger zu nutzen als etwa CSV, XML oder JSON-Daten.
Datenquellen
Gibt es ein offizielles deutsches Datenportal?
Weiterhin bleibt fraglich, ob das Datenportal des Bundes nur für die Daten von Bundesbehörden dienen soll (Modell: daten.bund.de) oder ob Daten aller unterschiedlichen Verwaltungsebenen Eingang finden werden (Modell: daten.deutschland.de). Aus einer Nutzersicht ist dabei natürlich das letztere Modell wünschenswerter.
Wo finde ich Daten-Übersichten?
* http://offenedaten.de ist ein von Aktiven betriebener Katalog von deutschen Datenquellen, zu dem jeder eigene Datensätze hinzufügen
* Dolce Data ist eine andere Übersicht in einem Google-Spreadsheet.
* http://publicdata.eu sammelt verfügbare Datensätze auf europäischer Ebene.
Welche statistischen Daten sind verfügbar?
Zum Abruf der Daten gibt es auch eine API. Die Nutzung dieser API ist jedoch kostenpflichtig.
Die Landesämter für Statistik pflegen eine gemeinsame Datenbank unter ähnlichen Bedingungen wie DeStatis: https://www.regionalstatistik.de/genesis/online/
International stehen eine Vielzahl an statistischen Datenquellen als Open Data zur http://data.worldbank.org/ – Datenportal der
http://data.un.org/ – Datenportal der Vereinten Nationen
Welche Geodaten sind verfügbar?
Der Geodaten-Shop des BKG ist ein gutes Beispiel für das Gegenteil von Open Data: ein Einkaufsladen für Datenbestände, die in der Regel in OpenStreetMap mit höherer Qualität vorliegen.
Welche Daten zu Bildung und Forschung sind verfügbar?
Wo finde ich Daten zu Finanzen und Haushalt?
Eine weitere interessante Quelle ist die Übersicht der Europäischen Kommission zu den Subventions- und Fördergelderverwaltenden Stellen in Deutschland: http://ec.europa.eu/regional_policy/country/commu/beneficiaries/germany/index_en.htm
Wo finde ich Daten zur Umwelt?
Gruppen und Organisationen
Welche Vereine / NGOs beschäftigen sich mit Open Data?
Die Open Knowledge Foundation Deutschland ist eine Ausgründung der britischen Open Knowledge Foundation. Der Schwerpunkt der OKFN liegt auf der Arbeit an konkreten Projekten und der Förderung einer aktiven Gemeinschaft aller, die sich für freies Wissen interessieren. Die deutsche Mailingliste ist ein erster Anlaufpunkt für Interessierte. Die OKFN ist zwar als Verein organisiert, eine Teilnahme erfolgt jedoch in der Regel ohne Mitgliedschaft.
Andere Organisationen wie das Government 2.0 Netzwerk Deutschland, die Digitale Gesellschaft und das Internet & Gesellschaft Collaboratory befassen sich mit Open Data als Teilaspekt ihrer Arbeit.
Wie stehen die Parteien zu Open Data?
CDU: Plädoyer von Thomas Jarzombek für Open Data in The European.
SPD: Wahlprüfsteine für die AGW Berlin 2011
B90/Grüne: Positionspapier Informationsfreiheit 2.0 – Die Grünen haben mit diesem Papier bisher die substantiellste Position zu Open Data, plädieren dabei allerdings für eine umstrittene Vermischung des Themas mit der Informationsfreiheit (im Sinne des IFG/UIG/VIG).
Andere Auswertungen:
In der ZEIT fasst Lorenz Matzat die Positionen der Berliner Parteien zusammen.
Wie steht die Regierung zu Open Data?
Informationen zur Umsetzung des Regierungsprogramms finden sich hier
Welche Journalisten und Medien arbeiten mit Open Data?
Die Journalistin Christiane Schultzki-Haddouti schreibt unter http://blog.kooptech.de/ und in anderen Medien über und auf der Basis von Daten.
Eine Gruppe von Datenjournalisten trifft sich regelmäßig in Berlin: http://www.meetup.com/Datenjournalismus-Berlin/
Welche Firmen nutzen Open Data?
Die Agentur Compuccino entwickelt Anwendungen wie petition24.de, wahl.de und die Deutschland-API auf der Basis von
Die Agentur init veranstaltet Events zu Open Data und ist an der Umsetzung von Behördenprojekten beteiligt.
Welche Universitäten erforschen Open Data?
Uni Leipzig: die Agile Knowledge Engineering and Semantic Web (AKSW) arbeitet and Linked Open Data-Technolgien.
FU Berlin I: die Forschugsgruppe von Prof. Bizer arbeitet an Linked Open Data Technologien.
FU Berlin II: das Softwareprojekt OGD versucht eine Open Data-Anwendung zu Berliner Schulen zu entwicklen.
Aus Sicht der Politik- und Verwaltungswissenschaften:
IFIB Bremen: das IFIB berät die Stadt Bremen bei ihrer Informationsfreiheitspolitik.
Zeppelin University: Jörn von Lucke und Christian Geiger erforschen Open Government und Open Data.
Bisher gibt es wenige akademische Konferenzen und Journale zum Thema.
CeDEM 2012 – Call for
CeDEM 2011 – Proceedings (PDF)
Projekte
Open Data Projekte
Open Data Showroom
Zunächst eine Meta-Seite: der Open Data Showroom fasst viele spannende Projekte zusammen.
AbgeordnetenWatch
http://www.abgeordnetenwatch.de/
Bundestagger
http://www.bundestagger.de/
Bundestube
Insbesondere ermöglicht Bundestube das Nachverfolgen von Bundestagsreden in Bild, Ton und Text. Mit Bundestube lassen sich veröffentlichte Bundestagsreden anhand von Suchbegriffen aus dem Volltext und den dazugehörigen Metadaten (Redner, Fraktion, Datum usw.) auffinden und darstellen.
Bundestube nutzt hierfür die vom Deutschen Bundestag jeweils einzeln veröffentlichten Plenarprotokolle und Videomitschnitte.
http://bundestube.de/
Offener Haushalt
So möchten wir mehr Transparenz darüber schaffen wie der Staat die Mittel seiner Bürger einsetzt. Wir sind uns sicher, den Bundeshaushalt damit leichter verständlich zu machen. Dadurch möchten wir einen Beitrag dazu leisten, Regierungshandeln transparenter und nachvollziebarer zu machen.
http://bund.offenerhaushalt.de/
Offene Daten
http://offenedaten.de/
wahl.de / Deutschland-API
Wir versuchen in den nächsten Schritten, weitere Informationszweige einzubinden, um Akteuere und Aktivität der Politik auf Bundesebene abbildbar zu machen.
Unser Ziel ist dabei v.a. andere Ideen zu unterstützen, die auf Basis der Deutschland API viele spannende Projekteeinfacher umsetzen können.
http://www.deutschland-api.de/Hauptseite
Petition24.de
http://petition24.de/
Datenvisualisierung / vis4 Labs
http://driven-by-data.net/about/german-party-donations/
The map shows the estimated additional income of all the German Bundestag. Each Member is represented by a circle at the location of his home constituency.
http://driven-by-data.net/about/incomes-of-parliament-members/
The map shows equivalente continuous sound level and maximum sound level of a noise simulation of the planned flight routes at Berlin Schoenefeld. Residents can calculate the projected volume at their residence. Published in partnership with OpenDataCity on behalf of the taz.
http://driven-by-data.net/about/airportnoisemap/
This visualizations investigates how many people live within a changable radius around active nuclear power reactors. Created for ZEIT ONLINE.
http://driven-by-data.net/about/nuclear-reactors/
ÖPNV: Öffi und Mapnificent
http://www.mapnificent.net/
https://market.android.com/details?id=de.schildbach.oeffi
Open Data in deiner Region
Berlin
Mailingliste
Zudem gibt es einen Entwurf für ein E-Government-Gesetz. Darin findet sich der
§ 6 – Elektronische Bereitstellung allgemein zugänglicher Datenbestände und Datenkataloge
(1) Allgemein zugängliche Datenbestände und Datenkataloge der Berliner Verwaltung sollen, soweit möglich, in elektronischer Form bereitgestellt werden und über eine zentrale Plattform abrufbar sein.
(2) Die Bereitstellung soll in für die Öffentlichkeit verständlicher Darstellung, interoperabel und in leicht zugänglichen Formaten erfolgen.
(3) Die zuständige Senatsverwaltung wird ermächtigt, Rechtsverordnungen zur Regelung von Nutzungsgebühren zu erlassen.
Das ist knapp (und in den Ansätzen lobenswert), aber dank Abs. 3 dennoch kräftig am Ziel vorbeigeschossen.
München
Daten-Wunschliste des ODN zu Anfang des Projekts.
Bremen
Informationsregister der Stadt mit proaktiv bereit gestellten Dokumenten.
Präsentation von Claas Hanken zu Open Data in Bremen
Die Bremer Erklärung zu Open Government Data ist ein Bekenntnis der Finanzverwaltung zu OGD. Pressemitteilung zur Erläuterung.