Offene Lizenzen für Daten und Dokumente der Deutschen Verwaltung

    Too-Many-Silos

    Im folgenden findet ihr die Kritik der Open Knowledge Foundation Deutschland am Datenangebot sowie der technischen und rechtlichen Ausgestaltung des gemeinsamen Datenportals von Bund und Ländern – govdata.de.

    Umfang, Qualität und Relevanz der bisher auf dem Portal veröffentlichten Daten sowie die Umsetzung der Plattform und die veröffentlichten Lizenzmodelle zeigen einen Ansatz, der weder offen im Sinne der weltweit anerkannten Standards, wie etwa die Open Definition, ist noch zeitgemäß oder effektiv im Hinblick auf Umsetzung, Usability und Sicherheit. Auch ist bisher nicht ersichtlich, wie man gedenkt, eine Nachnutzung der Daten aktiv zu fördern und so eine Community rund um das Datenangebot zur Nachnutzung zu motivieren. Es besteht noch enormer Handlungsbedarf auf verschiedenen Ebenen.

    Der wichtigste Kritikpunkt betrifft Umfang, Qualität und Relevanz der über das Portal bereitgestellten Daten. Dieser bleibt weit hinter allen Erwartungen zurück und ist - zurückhaltend gesagt, erbärmlich. Der Erfolg der Plattform und der Open-Government-Data-Strategie von Bund und Ländern hängt maßgeblich davon ab, dass Datensätze zugänglich gemacht werden, die für potentielle Nachnutzer interessant und relevant sind. Bis heute sind in Deutschland viele relevante Datensätze gar nicht oder nicht als offene Daten zugänglich. Es fehlt nach wie vor die politische Unterstützung die notwendig wäre, um die Öffentliche Verwaltung auf allen Föderalen Ebenen (Bund, Länder, Kommunen) endlich zur umfangreichen Freigabe ihrer Daten und Dokumente für die Nachnutzung zu bewegen. Diese politische Unterstützung ist, trotz aller Lippenbekenntnisse, nicht in Sicht.

    Neben der Kritik an der Tatsache, dass wichtige und relevante Datensätze nach wie vor nicht für die Nachnutzung bereitstehen, halten wir die Ausgestaltung der Lizenzen, welche die Nachnutzung regeln, für ungeeignet, weil diese nicht mit international anerkannten und gut eingeführten Lizenzen für offene Daten kompatibel sind und daher die Interoperabilität der Daten erheblich eingeschränkt wird. Der folgende Text fasst erklärt unsere Kritik im Detail.

    Kurz nach der Veröffentlichung der für das Datenportal als Standardlizenzen vorgesehenen Lizenztexte auf GitHub wurden dort von Mitgliedern der interessierten Öffentlichkeit Kommentare, Kritik und konkrete Vorschläge zu den Lizenztexten gemacht. Zunächst müssen wir klarstellen, dass die “Datenlizenz Deutschland – Namensnennung – nicht kommerziell – Version 1.0”, wie alle Lizenzen die eine kommerzielle Nachnutzung ausschliessen, für offene Verwaltungsdaten grundsätzlich ungeeignet ist.

    Doch auch die als einfache Attributionslizenz gedachte “Datenlizenz Deutschland – Namensnennung – Version 1.0” kann in der derzeitigen Fassung NICHT als offene Lizenz, im Sinne der Open Definition, gelten, weil sie aufgrund von uneindeutigen Formulierungen zu Rechtsunsicherheit führt und so die Nachnutzung erheblich beeinträchtigen kann.

    Am 23. Januar 2013 haben Vertreter von Wikimedia, Creative Commons und der Open Knowledge Foundation die Kritik an den Lizenzentwürfen in einem direkten Gespräch mit dem BMI dargelegt. Grundannahmen sind:

    1. Grundsätzlich sei darauf hingewiesen, dass wir den, vom Lorenz-von-Stein-Institut im Rahmen der Open Government Studie vorgeschlagenen, Weg einer verwaltungsrechtlichen Nutzungserlaubnis für problematisch halten. Es wird dadurch ein deutscher Sonderweg beschritten, ein Content-Silo gebildet, dessen Inhalte mit keinem der etablierten zivilrechtlichen Lizenzsysteme problemfrei kombinierbar sind.

    2. Wichtig ist zunächst eine saubere Lösung für Dokumente und Daten zu etablieren, welche nach geltendem Recht keinen urheberrechtlichen Schutz genießen, also etwa nach §5 Urheberrecht Gemeinfrei sind. Diese gemeinfreien Amtlichen Werke unter eine Lizenz zu veröffentlichen stellt eine unrechtmäßige Schutzrechtsberühmung dar.

    3. Grundsätzlich empfehlen wir die Nutzung von international eingeführten und etablierten Standardlizenzen (wie CC-0 oder CC-BY) aus den bekannten Gründen der Interoperabilität. Besonders CC-0 ist für Daten zu empfehlen, wobei CC-BY für viele Dokumente eine gute Wahl darstellt. Creative Commons wird im laufe des Jahres 2013 die Version 4.0 der Lizenzen veröffentlichen, die dann erstmals auch für Daten und insbesondere auch für Datenbankwerke geeignet sind.

    4. Wenn schon nationale Lizenzen eingeführt werden, müssen diese für Rechtssicherheit bei der Nachnutzung sorgen und diese möglichst wenig einschränken. Beides ist in der aktuellen Fassung der Lizenztexte nicht gegeben. Konkret sehen wir folgende Punkte im aktuellen Text als problematisch an:

    • Es ist derzeit ungeklärt, ob die Lizenz wirksam Dritten die zeitlich und räumlich unbeschränkten Nutzungsrechte für beliebige Zwecke einräumt.

    • Einerseits fordert die Lizenz zwar eine Attributierung, wie diese aber Vorzunehmen ist bleibt so wenig konkret, dass sie niemandem die Nachnutzung aufbereiteter Daten erleichtert.

    • Jede Nutzung mit Attributierung steht unter einem fortwährend andauernden Genehmigungsvorbehalt, der jederzeit im Verbot der Attributierung münden kann, wenn der Datenbereitsteller dies wünscht. Dies bricht mit allen Konventionen über gute redaktionelle und wissenschaftliche Arbeit.

    Das Hauptproblem ist dieser Satz im Lizenztext:

     

    “Veränderungen, Bearbeitungen, neue Gestaltungen oder sonstige Abwandlungen sind mit einem Veränderungshinweis im Quellenvermerk zu versehen oder der Quellenvermerk ist zu löschen, sofern die Datenhaltedestelle dies verlangt.”

     

    Nach unserer Auffassung ist die hier vorgesehene Verpflichtung zur nachträglichen Entfernung der Attribution (quasi auf Zuruf der Datenhaltendenstelle) nicht nur unüblich für Attributionslizenzen, sondern auch schlicht nicht praktikabel.

    Zu einem ganz ähnlichen Ergebnis kommt auch das Advisory Council der Open Definition. Am 22. Januar 2013 übersandte das Bundesinnenministerium die englischsprachige Fassung der beiden “Datenlizenzen Deutschland” mit der Bitte um Prüfung der Konformität mit der Open Definition, eine Liste von elf Kriterien an Lizenzregime. Ein Werk kann als Offen gelten, wenn seine Verbreitung unter Bedingungen erfolgt, die diesen elf Kriterien genügen. Das Resultat der Prüfung ist als Mitteilung der OKFN an das Innenministerium vom 25. März 2013 nachlesbar.

    Die OKFN schlägt dem Ministerium eine Überarbeitung, insbesondere Konkretisierung der Regelungen im Umgang mit (grundsätzlich erlaubten) Veränderungen der Werke vor. Bis dahin kann von der Datenlizenz Deutschland Namensnennung nicht von einer freien bzw. offenen Lizenz gesprochen werden.

    Darüber hinaus weist die OKFN darauf hin, dass je nach Konkretisierung der Datenlizenz Deutschland bezüglich der Formulierung zur Attribution eine gemeinsame Nutzung von Werken unterschiedlicher Lizenzen wie Creative Commons CC-by oder Open Data Commons ODC-BY unzulässig ist. Eine fehlende Interoperabilität zu diesen Lizenzen wäre aus praktischer Sicht ein lizenzrechtlicher Totalschaden für jeden Dienst, der Daten aus mehreren Quellen legal nachnutzen möchte.

    In der Folge des Gesprächs mit dem BMI vom 23. Januar wurde von Vertretern von Wikimedia, Creative Commons und der Open Knowledge Foundation ein Vorschlag gemacht, wie man die oben genannten Punkte adressieren könnte. Dieser ist auf der GitHub als konkrete Verbesserungsvorschläge eingestellt. In der Mail von John Weizmann von Creative Commons an das BMI heisst es:

     

    Sehr geehrte Frau Dr. Groß,

    auf Anregung einiger Teilnehmer unserer Runde neulich bei Ihnen erhalten Sie unten zwei Formulierungsvorschläge, in denen die Anmerkungen von Wikimedia, OKFN und CC DE weitestgehend berücksichtigt sind. Vielleicht können Sie die Vorschläge ja noch berücksichtigen, ggf. in einer Art reduzierter Abstimmung mit der Bund-Länder-Arbeitsgruppe.

    Dennoch sei an dieser Stelle noch einmal darauf hingewiesen, dass ich den Weg einer verwaltungsrechtlichen Nutzungserlaubnis für den falschen halte. Es wird dadurch ein deutscher Sonderweg beschritten, ein Content-Silo gebildet, dessen Inhalte mit keinem der etablierten zivlirechtlichen Lizenzsysteme problemfrei kombinierbar sind. Im Einzelnen:

    • Ich habe bewusst das Wort “Datensatz” vermieden, weil es doppeldeutig gebraucht wird (für ein einzelnes Datum genauso wie für eine Gruppe von Daten, die zu einer bestimmten Einheit gehören).
    • Die etwas veränderte Formulierung zur Ergänzung des Quellenvermerks um einen Hinweis auf eine erfolgte Veränderung folgt den bekannten Share-Alike-Ansätzen.
    • Die vorgeschlagene Definition von “nicht kommerziell” soll sicherstellen, dass es nicht auch auf den Typus des Handelnden ankommt (Privatperson, Einrichtung, Unternehmen), sondern allein auf die in der Handlung selbst steckende Gewinnerzielungsabsicht.

    Mit freundlichen Grüßen, John H. Weitzmann CC DE Legal Project Lead

     

    Hier die beiden Formulierungsvorschläge für die beiden Lizenzen, wie wir sie auch auf GitHub eingestellt haben:

    Vorschlag zur Formulierung der Datenlizenz Deutschland – Namensnennung – Version 1.0

    Der Bereitsteller der Daten trifft im Wege der Allgemeinverfügung folgende Regelung:

    Jede Nutzung mit Quellenvermerk ist zulässig unter den Bedingungen dieser “Datenlizenz Deutschland - Namensnennung” in der vorliegenden oder der zum Nutzungszeitpunkt aktuellen Version. Der Quellenvermerk muss wenigstens die URL der Daten, die Bezeichnung und URL dieser Datenlizenz und die Bezeichnung des Bereitstellers enthalten, soweit dieser die vorgenannten Quellenangaben zur Verfügung stellt. Auf die Durchsetzung etwaiger die Daten betreffender zivilrechtlicher Ansprüche verzichtet der Bereitsteller dauerhaft.

    Im Anschluss an Veränderungen, Bearbeitungen, neue Gestaltungen oder sonstige Abwandlungen ist der Quellenvermerk um einen Veränderungshinweis zu ergänzen, aus dem das Vorliegen und die Art der Veränderung hervorgeht.

    Der Bereitsteller stellt die Daten, Inhalte und Dienste mit der zur Erfüllung seiner öffentlichen Aufgaben erforderlichen Sorgfalt zur Verfügung. Für die Daten, Inhalte und Dienste gelten in Bezug auf deren Verfügbarkeit und deren Qualität die durch den Bereitsteller in den Metadaten oder sonstigen Beschreibungen zugewiesenen Spezifikationen und Qualitätsmerkmale. Der Bereitsteller übernimmt jedoch keine Gewähr für die Richtigkeit und Vollständigkeit der Daten und Inhalte sowie die dauerhafte Verfügbarkeit der Dienste. Davon ausgenommen sind Schadensersatzansprüche aufgrund einer Verletzung des Lebens, körperliche Unversehrtheit oder Gesundheit. Ebenfalls ausgenommen sind Schäden, die auf Vorsatz oder grober Fahrlässigkeit beruhen.

    Vorschlag zur Formulierung der Datenlizenz Deutschland – Namensnennung – nicht kommerziell - Version 1.0

    Der Bereitsteller der Daten trifft im Wege der Allgemeinverfügung folgende Regelung:

    Jede Nutzung mit Quellenvermerk zu nicht kommerziellen Zwecken ist zulässig unter den Bedingungen dieser “Datenlizenz Deutschland - Namensnennung - nicht kommerziell” in der vorliegenden oder der zum Nutzungszeitpunkt aktuellen Version. Der Quellenvermerk muss wenigstens die URL der Daten, die Bezeichnung und URL dieser Datenlizenz und die Bezeichnung des Bereitstellers enthalten, soweit dieser die vorgenannten Quellenangaben zur Verfügung stellt. Als nicht kommerziell im Sinne dieser Datenlizenz gelten alle Handlungen, die für sich genommen nicht auf einen monetären Gewinn oder einen anderweitigen vermögenswerten Vorteil gerichtet sind. Auf die Durchsetzung etwaiger die Daten betreffender zivilrechtlicher Ansprüche verzichtet der Bereitsteller dauerhaft.

    Im Anschluss an Veränderungen, Bearbeitungen, neue Gestaltungen oder sonstige Abwandlungen ist der Quellenvermerk um einen Veränderungshinweis zu ergänzen, aus dem das Vorliegen und die Art der Veränderung hervorgeht.

    Der Bereitsteller stellt die Daten, Inhalte und Dienste mit der zur Erfüllung seiner öffentlichen Aufgaben erforderlichen Sorgfalt zur Verfügung. Für die Daten, Inhalte und Dienste gelten in Bezug auf deren Verfügbarkeit und deren Qualität die durch den Bereitsteller in den Metadaten oder sonstigen Beschreibungen zugewiesenen Spezifikationen und Qualitätsmerkmale. Der Bereitsteller übernimmt jedoch keine Gewähr für die Richtigkeit und Vollständigkeit der Daten und Inhalte sowie die dauerhafte Verfügbarkeit der Dienste. Davon ausgenommen sind Schadensersatzansprüche aufgrund einer Verletzung des Lebens, körperliche Unversehrtheit oder Gesundheit. Ebenfalls ausgenommen sind Schäden, die auf Vorsatz oder grober Fahrlässigkeit beruhen.

    Parallele Entwicklungen

    Aus dem Bereich Geodaten gibt es derzeit eine positive und eine negative Entwicklung: Grundsätzlich zu begrüßen ist die “Verordnung zur Festlegung der Nutzungsbestimmungen für die Bereitstellung von Geodaten des Bundes (GeoNutzV)”, die am 22. März 2013 im Bundesgesetzblatt (Jahrgang 2013 Teil I Nr. 14) veröffentlicht wurde.

    Die Verordnung bezieht sich auf das Geodatenzugangsgesetz (GeoZG) und konkretisiert die Bedingungen, nach denen Dritte Geodaten und Geodatendienste des Bundes nachnutzen dürfen. In der GeoNutzV heisst es unter §2 Absatz 1:

     

    Geodaten und Geodatendienste, einschließlich zugehöriger Metadaten, werden für alle derzeit bekannten sowie für alle zukünftig bekannten Zwecke kommerzieller und nicht kommerzieller Nutzung geldleistungsfrei zur Verfügung gestellt, soweit durch besondere Rechtsvorschrift nichts anderes bestimmt ist oder vertragliche oder gesetzliche Rechte Dritter dem nicht entgegenstehen.

     

    Wir begrüßen die Entscheidung, die Nachnutzung für jedermann auch für kommerzielle Zwecke kostenlos zu erlauben! Aus unserer Sicht gibt zwei Dinge in der GeoNutzV, die man etwas sorgenvoll sehen kann:

    1. Die Formulierung nach dem Verlangen der Quellenvermerkslöschung § 3 Abs 2. GeoNutzV, die aber unkritischer formuliert ist als in der Datenlizenz Deutschland - und auch so gemeint ist. Im Zweifel ist sie einfach nur die falsche Lösung zu einem Problem, das es gar nicht gibt und wird in der Praxis irrelevant bleiben.

    2. Die Tatsache, dass hier der Weg über eine Verordnung gegangen wurde und keine zivilrechtliche Lizenz verwendet wurde. Wie bei der Datenlizenz Deutschland ist dieser Sonderweg zu kritisieren, die Folgebn können nicht wirklich abgeschätzt werden.

    In der Summe sind wir mit der GeoNutzV aber einigermaßen zufrieden, zusammen mit dem Anspruch des GeoZG, alle Geodaten des Bundes frei verfüg- und nachnutzbar zu machen ist das eine großartige Sache. Wenn nun die Länder nachziehen und die GeoNutzV als Vorbild nehmen, würde dies die Nachnutzung von Geodaten in Deutschland nachhaltig verbessern. Wahrscheinlich ist diese Option derzeit die beste die wir haben und damit aus pragmatischer Sicht halbwegs vertretbar.

    Dieser erfreulichen Entwicklung steht das Modellvorhaben Geolizenz gegenüber.

    Das Modellvorhaben Geolizenz tritt an “die Bereitstellung von Geoinformationen bundesweit zu vereinheitlichen”. Dazu hat die Kommission für GeoInformationsWirtschaft des Bundeswirtschaftsministeriums (GIW) acht Lizenzvarianten entwickelt. Auf der Seite www.geolizenz.org heisst es:

     

    Bei der Gestaltung dieser Lizenz wurden folgende Leitprinzipien zugrunde gelegt: Die “OpenData”-Philosophie, sowie Erfahrungen mit zahlreichen Lizenzmodellen aus dem nationalen und internationalen Bereich […]

     

    Es ist nicht klar, wieso sich die GIW auf eine “OpenData-Philosophie” beruft, denn von den acht GeoLizenzen ist nur Variante GeoLizenz V 1.2 Ia auf den ersten Blick mit der Open Definition vereinbar und damit potentiell zur Bereitstellung von offenen Geodaten geeignet.

    Doch bei genauerem hinsehen wird schnell klar, dass auch die Variante 1.2 Ia nach gegenwärtigem Stand ungeeignet für offene Daten ist. Der Hauptmangel ist, dass zwar räumlich, aber keine zeitlich unbeschränkten Nutzungsrechte eingeräumt werden. Die Vertragsdauer ist ein Jahr, der Vertrag verlängert sich automatisch, kann aber jedes Jahr gekündigt werden (zusätzlich zu den Sonderkündigungsrechten bei Vertragsverletzung). Damit riskiert auch der wohlmeinende und lizenzkonform handelnde Nachnutzer den Wegfall der Nutzungsrechte, ohne dass er dies verhinden könnte. Hinzu kommen eine Reihe weiterer Mängel und Ungereimtheiten.

    Man kann nur hoffen, dass das Modellvorhaben Geolizenz ein solches bleibt und keine Nachahmung findet. Das Argument, dass die Wirtschaft solche Lizenzen brauche weil so die Verfügbarkeit der Daten verlässlich geregelt seien, ist eine Nebelkerze. Denn das nennt man in der Wirtschaft ein “Service Level Agreement (SLA)” oder zu Deutsch eine “Dienstleistungsvereinbarung (DLV)” und diese werden in der Regel in einem Vertrag geregelt. Es spricht nichts dagegen, dass Wirtschaftsunternehmen mit deutschen Behörden solche Verträge abschliessen, aber in Lizenzen haben solche Zusätze einfach nichts verloren. Schon gar nicht in Lizenzen die mit dem Anspruch antreten, die “Bereitstellung von Geoinformationen bundesweit zu vereinheitlichen”.

    Zur Kritik an den Geolizenzen siehe auch den Beitrag “Geobusiness Lizenz: open data und die sieben Zwerge” von Friedrich Lindenberg und zur GeoNutzV den Beitrag von Mathias Schindler.

    Update

    In der Zwischenzeit wurden wir von der GIW Kommission gefragt, ob wir bei der Formulierung einer Lizenzvariante behilflich sein könnten. Mathias Schindler (Wikimedia DE) und Daniel Dietrich (OKFDE) haben sich daraufhin mit Vertretern der Kommission für Geoinformationswirtschaft getroffen um an der Variante GeoLizenz V1.2.1 Open zu arbeiten. Diese wurde mit einer
    Pressemitteilung vom 07.10.2013 veröffentlicht.

    OKF DE und Wikimedia DE waren gerne behilflich eine offene Variante der GeoLizenz zu erstellen!

    Ob diese aber tatsächlich den Anforderungen an eine offene Lizenz genügt kann natürlich erst nach entsprechender Prüfung, zum Beispiel durch das Advisory Council der der Open Definition geklärt werden (im Zweifel kann eine abschliessende Beantwortung dieser Frage
    eigentlich erst nach einem entsprechenden Präzedenzfall beantwortet werden).

    Wir bitten daher die Kommission für Geoinformationswirtschaft in der Aussendarstellung darauf zu achten, dass unsere Mithilfe bei der Erstellung der offenen Variante NICHT gleichbedeutend ist mit einer vollen Unterstützung (im Sinne eines public endorsement) für diese ist, noch eine unabhängige Prüfung der Konformität mit der Open Definition vorwegnehmen kann. Eine Liste kompatibler Lizenzen können Sie hier einsehen:
    http://opendefinition.org/licenses/

    Eine solche Kompatibilitätsprüfung haben wir der GIW Kommission nahegelegt, und wurde dort positiv aufgenommen. Das BMI hat eine solche Prüfung erbeten mit dem Resultat dass Variante 1.0 der Deutschen Daten Lizenz Namensnennung eben NICHT
    kompatibel ist. Weshalb die Lizenz ja derzeit überarbeitet wird.

    Zusammenfassend: Aus grundsätzlichen Erwägungen sind international etablierte Standardlizenzen, wie die offenen Varianten von Creative Commons (hier vor allem CC0 und CC-BY), wegen ihrer größerer Interoperabilität mit anderen marktüblichen offenen Lizenzen ganz grundsätzlich nationalen Lösungen vorzuziehen.

     

    Wie geht es weiter?

    Am 14. Mai haben Mathias Schindler von Wikimedia und ich auf Einladung des BMI an der Unterarbeitsgruppe Recht der Bund-Länder-Arbeitsgruppe Open Government teilgenommen, um dort unsere Kritik an der “Datenlizenz Deutschland” vorzutragen. Das haben wir getan. Es scheint so, dass wir die Teilnehmer zumindest überzeugen konnten, den oben zitierten Absatz zur “Verpflichtung zur nachträglichen Entfernung der Attribution” ersatzlos zu streichen. Dadurch wird die “Deutsche Datenlizenz” nicht zu einer guten Lizenz für offene Daten, aber vielleicht lässt sich so wenigstens die Interoperabilität mit gut eingeführten marktüblichen Lizenzen für offene Daten erhöhen.

    Denn darum geht es: um Interoperabilität! Nur wenn Daten des öffentlichen Sektors rechtlich und technisch offen sind, können sie nachgenutzt werden. Will ich Datensätze die unter verschiedenen Lizenzen stehen in einer Anwendung verbinden, müssen diese Lizenzen miteinander interoperabel sein. Ohne Interoperabilität bleiben Deutsche Verwaltungsdaten - leider - Silos.