Kurzes UPDATE zu offenen Daten in Deutschland..

lobbyliste

.. nur weil es mich gerade schon wieder ein bisschen aufregt..
In den USA gibt es das schon seit 1995 ein öffentliches und sehr detailliertes Lobbyregister (ein Beispiel aus Chicago) .

In Deutschland streiten sich alle, ob wir sowas auch wollen. Die Folge: Wir haben so etwas natürlich nicht.

Ein erster Schritt ist die freiwillige Registrierung von Interessenverbänden beim deutschen Bundestag.

Nun frag ich mich aber, wie auch schon in diesem Artikel:
Warum um alles in der Welt werden diese Informationen als aufwändig (also wohl automatisch) verlinktes PDF in völlig kaputter Formatierung zum Download bereitgestellt? Die Daten sind doch sicher irgendwo erfasst und könnten eigentlich auch in „maschinenlesbarer Form“ angeboten werden? Oder!?

lobbyliste
Näheres zum Thema Lobbyregister in Deutschland auch bei LobbyControl

Kurzer Exkurs zu Open Data in Deutschland

Delikte

Offene Daten gibt’s inzwischen viele.

Im Rahmen der Open-Gouvernement-Initiativen der Regierung (z.B. offenedaten.de , deutschland-api.de, bundestagger.de, opendata.service-bw.de, etc.), der EU (z.B. open-data.europa.eu) und anderer öffentlicher Einrichtungen sind tausende Datensätze zu ebenso vielen Themenbereichen zu finden.

Was stört ist die Form der Veröffentlichung. Schon nach kurzer Recherche fällt auf, dass viele der Daten, die auf den Portalen veröffentlicht werden, in einem kläglichen Zustand und zudem meist alles nur nicht aktuell sind. Continue reading

Abgeordnete in Aufsichtsräten und anderen Ämtern – Open Data

bundestagsabgeordneteaemter

Nachdem es in den letzten Wochen immer wieder kleinere und größere Probleme mit Politikern in Aufsichtsräten gegeben hat (UPDATE: oder noch aktueller in anderen außerparlamentarischen Ämtern),  sind wir auf die Suche nach offenen Datenquellen gegangen, um uns selbst mal eine Übersicht über die Verstrickungen der Politik mit Aufsichtsräten, Beiräten und anderen Gremien in Unternehmen, Verbänden, Vereinen und anderen Organisationen zu verschaffen.

Fündig wurden wir u.A. bei bundestag.de und auf den Seiten diverser Landtage. Hier findet sich alles, was an Daten benötigt wird, um Netzwerke zu analysieren. Da wie immer keine Zeit ist, fangen wir heute mal ganz oben an und arbeiten uns in den nächsten Wochen Schritt für Schritt runter, bis in die Kreistage. Continue reading

Zeichen der Zeit – Studienfach “Datenjournalismus” an der Uni Zürich

Zuerich

Aus dem Vorlesungsverzeichnis der Universität Zürich

Man kann über die Schweiz denken was man will, speziell an der Universität Zürich jedenfalls scheinen ein paar vorausschauende Köpfe an der Planung neuer Lehrinhalte bzw. Studienrichtungen beteiligt zu sein.

In der Ankündigung des neuen Studienfachs „Politischer Datenjournalismus“ verweisen die Verfasser des Curriculums auf die wachsende Zahl an frei verfügbaren Daten, die förmlich dazu aufrufen, redaktionell aufbereitet und visualisiert zu werden. Das Fach selbst soll eine Kombination aus „klassischem politischem Journalismus“ und dem „Erschließen von Datenquellen sowie Methoden des Datamining und der Datenvisualisierung“ sein.

Können wir nur hoffen, dass der Datenjournalismus in Deutschland auch langsam ein bisschen mehr Aufwind bekommt!

 

Gnut.

Personen in der Zeit – Journalismus mit Gephi

Freut uns zu sehen, dass Gephi langsam den Weg in den deutschen Datenjournalismus findet. Auf jeden Fall hat Gregor Aisch  mit der Visualisierung der meistgenannten 250 Personen auf Zeit Online zum Neuen Jahr mal wieder gezeigt, wie schön Graphen sein können. Den Informationsgehalt betrachten wir dabei einfach mal nicht 😉

Gnut.

Simple Novelty Detection – Am Beispiel der Neujahrsrede unserer Kanzlerin

MerkelAnspracheTimeTTR

Heute mal ein kleiner Exkurs. Weg von Netzen hin zur Bestimmung des Neuigkeitsgrades einer Information, die in einem Text gegeben wird.

Spezieller geht es darum, einen gegebenen Text, ohne jegliche Segmentierung an der Oberfläche durch Absätze, in inhaltlich logische Segmente zu zerlegen.

Es gibt viele Verfahren, die zu diesem Zwecke instrumentalisiert werden können. In der hohen Wissenschaft bzw. bei einer der renommiertesten internationalen Konferenzen zur Textanalyse, der TRAC (Text Retrieval Conference), gab es schon eigene Tracks, die sich ausschließlich diesem Thema (novelty detection) widmeten. Daher ist es kaum verwunderlich, dass sich hochmathematische Papers finden lassen, in denen  alle Arten an machine-learning-Algorithmen zum Einsatz kommen und neben der Anwendung statistischen Verfahren, Texte auch in Form von Graphen und/oder Vektoren repräsentiert betrachtet werden, um den Neuigkeitsgrad zu bestimmen.

Alles für die Wissenschaft! Continue reading