Abgeordnete in Aufsichtsräten und anderen Ämtern – Open Data

bundestagsabgeordneteaemter

Nachdem es in den letzten Wochen immer wieder kleinere und größere Probleme mit Politikern in Aufsichtsräten gegeben hat (UPDATE: oder noch aktueller in anderen außerparlamentarischen Ämtern),  sind wir auf die Suche nach offenen Datenquellen gegangen, um uns selbst mal eine Übersicht über die Verstrickungen der Politik mit Aufsichtsräten, Beiräten und anderen Gremien in Unternehmen, Verbänden, Vereinen und anderen Organisationen zu verschaffen.

Fündig wurden wir u.A. bei bundestag.de und auf den Seiten diverser Landtage. Hier findet sich alles, was an Daten benötigt wird, um Netzwerke zu analysieren. Da wie immer keine Zeit ist, fangen wir heute mal ganz oben an und arbeiten uns in den nächsten Wochen Schritt für Schritt runter, bis in die Kreistage. Continue reading

Zeichen der Zeit – Studienfach “Datenjournalismus” an der Uni Zürich

Zuerich

Aus dem Vorlesungsverzeichnis der Universität Zürich

Man kann über die Schweiz denken was man will, speziell an der Universität Zürich jedenfalls scheinen ein paar vorausschauende Köpfe an der Planung neuer Lehrinhalte bzw. Studienrichtungen beteiligt zu sein.

In der Ankündigung des neuen Studienfachs „Politischer Datenjournalismus“ verweisen die Verfasser des Curriculums auf die wachsende Zahl an frei verfügbaren Daten, die förmlich dazu aufrufen, redaktionell aufbereitet und visualisiert zu werden. Das Fach selbst soll eine Kombination aus „klassischem politischem Journalismus“ und dem „Erschließen von Datenquellen sowie Methoden des Datamining und der Datenvisualisierung“ sein.

Können wir nur hoffen, dass der Datenjournalismus in Deutschland auch langsam ein bisschen mehr Aufwind bekommt!

 

Gnut.

Personen in der Zeit – Journalismus mit Gephi

Freut uns zu sehen, dass Gephi langsam den Weg in den deutschen Datenjournalismus findet. Auf jeden Fall hat Gregor Aisch  mit der Visualisierung der meistgenannten 250 Personen auf Zeit Online zum Neuen Jahr mal wieder gezeigt, wie schön Graphen sein können. Den Informationsgehalt betrachten wir dabei einfach mal nicht 😉

Gnut.

Simple Novelty Detection – Am Beispiel der Neujahrsrede unserer Kanzlerin

MerkelAnspracheTimeTTR

Heute mal ein kleiner Exkurs. Weg von Netzen hin zur Bestimmung des Neuigkeitsgrades einer Information, die in einem Text gegeben wird.

Spezieller geht es darum, einen gegebenen Text, ohne jegliche Segmentierung an der Oberfläche durch Absätze, in inhaltlich logische Segmente zu zerlegen.

Es gibt viele Verfahren, die zu diesem Zwecke instrumentalisiert werden können. In der hohen Wissenschaft bzw. bei einer der renommiertesten internationalen Konferenzen zur Textanalyse, der TRAC (Text Retrieval Conference), gab es schon eigene Tracks, die sich ausschließlich diesem Thema (novelty detection) widmeten. Daher ist es kaum verwunderlich, dass sich hochmathematische Papers finden lassen, in denen  alle Arten an machine-learning-Algorithmen zum Einsatz kommen und neben der Anwendung statistischen Verfahren, Texte auch in Form von Graphen und/oder Vektoren repräsentiert betrachtet werden, um den Neuigkeitsgrad zu bestimmen.

Alles für die Wissenschaft! Continue reading

gexf-js – Fast so schön wie sigma.js

Themenuniversum mit gexf-js

Interaktive (Gephi) Graphen ins Netz

Nachdem ich vor ein paar Jährchen auf eine der ersten Versionen von Gephi, damals noch im Alphastatus, aufmerksam geworden bin, hab ich mir immer die Frage gestellt: Und wie bringe ich das Ergebnis nun unters Volk?

Als PDF? Ein Screenshot? Zwing ich den Rezipienten Gephi zu installieren, oder schick ich ein Video?

Das alles war irgendwie nicht zufriedenstellen, so froh ich auch war nicht mehr auf iGraph, nodeXl und Co angewiesen zu sein. Bis ich durch Zufall auf Sigma.js aufmerksam wurde und das Themenuniversum, gedacht als kleine Spielerei, Gestalt annahm. Continue reading

Drop RTF – RTF to TXT Converter für Tulpe L2

droprtf_prog

Das Standardfileformat für Tulpe L2 ist TXT in UTF-8. Nun hat da jemand sehr sehr viele Daten (Schülertexte), die in RTF vorliegen und würde diese gerne analysieren.

Was liegt da näher als einen Converter zu benutzen?

Und weil ich es eben gerade brauche und gemerkt habe, dass es keine zufriedenstellende Lösung meines Miniproblems gab, hab ich einen kleinen Drop-Converter von RTF nach TXT (UTF-8) geschrieben.

Läuft auf allen Windowsrechnern ab XP mit Servicepack 2 (.net 2.0) und so es sein muss wahrscheinlich auch auf Linux mit aktuellem Mono.  Continue reading

Knoten mit der Gephi-API mergen

gephi

Gephi offen, Graph geladen, zwei drei vier Knoten in der Tabellenübersicht markiert, rechte Maustaste und „Merge Nodes“ auswählen. Schwups ist man in einem Dialog in dem man so einiges auswählen kann.

Wie soll der resultierende Knoten benannt sein? Sollen die Ursprungsknoten gelöscht werden?

Knoten in Gefphi zusammenführen

Knoten in Gefphi zusammenführen

Praktisch!

Aber halt! Continue reading

Das Themenuniversum wird kompakter – Firefox enabled

Themenuniversum nach der Umstellung der Initialwortberechnung

In Vorbereitung auf das neueste Feature im Themenuniversum ist uns aufgefallen, dass das so nicht geht. Also gehen würde es schon, aber irgendwie unübersichtlicher als wünschenswert. Die ganze Sache ist eh schon recht komplex und sollte eigentlich ein bisschen vereinfacht werden.

Im Moment wird das Universum, bzw. die Stärke der Verbindungen zwischen den Einzelnen Themenknoten und deren Größe, Zentralität etc. auf Basis von bis zu 100 Initialworten berechnet. Zur Berechnung dieser Initialworte werden alle 20 Minuten alle bis dahin veröffentlichten Artikel (von inzwischen Zeit, SZ, Spiegel, Welt und FAZ) analysiert und die 30 signifikantesten Worte berechnet. (Zur Signifikanzberechnung wird es bald einen gesonderten Artikel geben). Continue reading