Schlagwort-Archive: Data Driven History

Wieder einmal: Datan, Daten, Daten

Wir haben an dieser Stelle schon mehrmals über das Thema Big Data respektive Data Driven History berichtet. Nun gilt es einen Dienst zu vermelden, der für die Geschichtswissenschaften auf den ersten Blick vielleicht nicht so zentral zu sein scheint, aber sich bei genauerem Hinschauen als durchaus interessant erweist: da|ra.

da|ra ist eine Registrierungsagentur für Sozial- und Wirtschaftsdaten, die vom Leibniz-Institut für Sozialwissenschaften e.V. (GESIS) und von der Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW), zwei wichtigen deutschen Forschungseinrichtungen gemeinsam betrieben wird. «Im Sinne von Good Scientific Practice steht die Forderung, entstandene Primärdaten öffentlich zugänglich zu machen, damit nicht nur die endgültigen Forschungsergebnisse vorliegen, sondern auch der gesamte Forschungsprozess nachvollzogen werden kann. Aus diesem Grund bieten GESIS und ZBW einen Registrierungsservice für Forschungsdaten aus den Sozial- und Wirtschaftswissenschaften an. Mit dieser Infrastruktur werden die Voraussetzungen für eine dauerhafte Identifizierung, Sicherung, Lokalisierung und schließlich eine verlässliche Zitierbarkeit von Forschungsdaten geschaffen.»

Liste der lebendigen Traditionen in der Schweiz

Das schwezerische Bundesamt für Kultur hat imZusammenhang mit der Ratifikation des UNESCO-Übereinkommens zur Bewahrung des immateriellen Kulturerbes eine Liste der lebendigen Traditionen in der Schweiz erstellt und veröffentlicht. Sie enthält «bedeutende Formen des immateriellen Kulturerbes, die von Fachleuten und Vertretern der kantonalen Kulturstellen unter der Leitung des Bundesamtes für Kultur ausgewählt wurden.»
Weiterlesen

Ein Name, den man sich merken sollte: J++

Nein, J++ hat nichts mit der Programmiersprache C++ zu tun, sondern ist der Name eines Startup dreier junger Journalisten, die, noch keine 25 Jahre alt, bereits zu den Grössen des florierenden Spezialbereichs Data Journalism gehören. Data Journalism hat in den letzten Monaten einige Highlights erlebt, als mit Wikileaks grosse Mengen von aktuellen Daten aufbereitet und analysiert werden konnte.
Weiterlesen

Ein weiteres N-Gramm-Tool im Netz

Im boomenden Bereich der «Data Driven History» sind in den letzten Monaten mehrere Suchsysteme vorgestellt worden, die mit N-Grammen, einem speziellen computerlinguistischen Verfahren, arbeiten. Das bekannteste einschlägige Tool dürfte der «Books Ngram Viewer» von Google sein. Das UK Web Archive hat kürzlich ebenfalls einen spezialisierten Viewer vorgestellt, der ähnliche Suchabfragen ermöglicht.
Weiterlesen

Twittern für die F.A.Z.

Stell Dir vor, Du twitterst unbekümmert (um nicht zu sagen etwas polemisch) an einer Tagung mit, sagen wir, sechzig Leuten. Und ein paar Tage später zitiert die F.A.Z. aus einem Deiner etwas vorlauten Tweets. So geschehen im Nachgang zur Tagung «Dans la toile des médias sociaux / Im Netz der sozialen Medien» Ende Juni in Paris. Soll noch einer sagen, twittern sei irrelevant für die Wissenschaft (wie ich das selbst anfangs etwas vorwitzig gesagt habe – Asche über mein Haupt).

Weiterlesen

Call for Comments: «Data Driven History: Writing History by the Numbers?»

In the context of the amazing project «Writing History in the Digital Age», a born-digital, open-review volume edited by Jack Dougherty and Kristen Nawrotzki, I submitted a proposition and would like to invite you all to comment my abstract:
Weiterlesen

«Dans la toile des médias sociaux» | «Im Netz der sozialen Medien»

Morgen beginnt im Deutschen Historischen Institut Paris das zweitägige Kolloquium «Im Netz der sozialen Medien»: «Das Kolloquium beleuchtet in einer internationalen Perspektive die neuen sozialen Medien und die daraus resultierenden Netzwerke in ihrer Bedeutung für die Geisteswissenschaften. Im Mittelpunkt des Interesses steht dabei die Frage, wie sich die sozialen Medien auf unsere gegenwärtige Wissenschaftskultur auswirken. Eröffnet wird das Kolloquium durch Geert Lovink mit einem Vortrag zum Thema ‚Kulturpolitik der Sozialen Medien – von der Kritik zu Alternativen’» Das ausführliche Programm gibt es hier, den dazugehörigen Blog hier.

Daten, Daten, Daten – überall sind Daten!

Wir hatten ja unter dem Stichwort Data Driven History ja bereits mehrfach auf die wachsende Bedeutung von Daten auch für die Historische Forschung hingewiesen und unter anderem auch die Möglichkeiten und Grenzen des Google-Projektes Ngram diskutiert.

Nun steht bei JSTOR unter dem Titel Data for Research (DFR) ein neues, speziell auf geisteswissenschaftliche Analysen zugeschnittenes Tool zur Verfügung. Das Prinzip von DFR ist das gleiche wie von Google Ngram, indem grosse Textcorpora nach verschiedenen Häufigkeiten und Wortmustern durchsucht und graphisch dargestellt werden können. Anders als Ngram verwendet aber JSTOR einen klar umrissenen Textcorpus, nämlich die eigenen rund sechs Millionen Volltexte von wissenschaftlichen Aufsätzen, die in den eigenen Kollektionen enthalten sind. Anders als bei Google sind diese Texte sehr präzise metadatiert und erlauben deshalb wesentlich präzisere Abfragen.
Weiterlesen

re:publica XI

Ja, es stimmt, die re:publica hat schon gestern begonnen und wir haben bisher geschwiegen. Das kam so: Als einer der wenigen Teilnehmer marschierte ich gestern voll analog nur mit Notizblock und Schreibstift zum Friedrichstadtpalast in Berlin. Dachte, das ist stressfreier. Dachte, ich kann ja dann am Abend im Hotel etwas schreiben. Das mit dem stressfrei war zwar richtig, nur im Hotel hat es dann nicht geklappt, weil eine Netzwerkstörung vorlag.
Weiterlesen

Data Driven Date Prediction?

Die Datierung historischer Dokumente und Texte gehört zu einem der wichtigsten Aufgaben der archivischen und historischen Tätigkeit. Die historischen Hilfswissenschaften stellen dazu auch ein breites Set von Verfahren und Herangehensweisen zur Verfügung. Wie das geht, hat wohl ausnahmslos jeder angehende Historiker, jede angehende Historikerin bei Ahasver von Brandt einmal gelesen.

Was aber der gute Herr von Brandt selig noch nicht hat ahnen können – er verstarb schliesslich auch bereits im Jahre 1977 – ist die Tatsache, dass heute bereits laut darüber nachgedacht wird, die Datierung eines Textes mit algorithmisierter Unterstützung zu versuchen. Das ist zwar im Kontext einer Data Driven History naheliegend, bei Lichte betrachtet aber nicht ganz trivial.

Mit einem enormen statistischen Aufwand hat Andrew Tausz vom Institute for Computational and Mathematical Engineering (iCME) in Stanford einen ersten Versuch unternommen und ein Modell vorgelegt, das zwar für Historiker von der Anwendungsseite her höchst interessant sein könnte, aber natürlich den methodischen Horizont der meisten Kollegen (mich selbstverständlich inbegriffen) bei weitem übersteigen dürfte.

Als Nebenfachsoziologe hatte ich zwar einige Vorlesungen und Übungen in Statistik absolvieren dürfen, aber ich muss gestehen, dass weder die Bayessche Statistik noch die Gauss-Verteilung allzu detailliert in unserem soziologischen Curriculum vorgesehen waren. Bleibt zu hoffen, dass unsere geschätzten Leserinnen und Leser den Text von Andrew Tausz mit noch mehr Aha-Erlebnissen als ich es konnte lesen werden!

Die Geschichte der Welt in 100 Sekunden

A History of the World in 100 Seconds from Gareth Lloyd on Vimeo.

Wikipedia eignet sich aufgrund seiner Datenstruktur hervorragend für allerlei Experimente im Sinne der hier bereits mehrfach thematisierten Data Driven History. Eine beinahe maximal mögliche Datenaggregation haben die beiden BBC-Mitarbeiter Gareth Lloyd und Tom Martin im Rahmen des History Hack Day anfangs Jahr in London programmiert.
Weiterlesen