- weblog.histnet.ch - http://weblog.hist.net -

«Lecture des sources historiennes à l’ère numérique». Ein Kommentar

Unser geschätzter Kollege Frédéric Clavert vom Centre Virtuel de la Connaissance sur l’Europe [1] in Luxembourg hat kürzlich in seinem Blog einen interessanten Post [2] über die Quellenlektüre im digitalen Zeitalter publiziert. Darin unterscheidet er einerseits close reading und distant reading, andererseits lecture humaine und lecture computationelle. Mit diesen beiden «Achsen» gelingt es Clavert, eine gewisse Struktur in eine der wichtigsten Debatten im Feld der Digital Humanities zu bringen.

Anders als viele rein theoretische Abhandlungen zu diesem Thema expliziert Clavert seine Argumente an konkreten Beispielen. Dabei verarbeitet er Erfahrungen aus der Quellenarbeit zu seiner Dissertation, die sich mit der Politik von Hjalmar Schacht, dem deutschen Reichsbankpräsidenten 1933-1939, befasst hat. Die Dissertation wurde 2006 in Strasbourg abgeschlossen und erschien 2009 in Bruxelles. Mit anderen Worten: Sie wurde also noch weitgehend im prä-digitalen Zeitalter erstellt. Sehr anschaulich beschreibt Clavert, wie ihm einerseits die Nähe zu den Quellen geholfen hat, die Situation und den Zeitgeist der damaligen Zeit zu verstehen. Andererseits aber hätte ihm bei bestimmten Fragen auch eine Auswertung eines grossen Quellenkorpus geholfen, eine Arbeit die so nicht geleistet werden konnte, da hier eine maschinelle oder zumindest eine maschinell unterstützte Auswertung notwendig gewesen wäre.

In den wenigen Jahren seit der Fertigstellung der Arbeit (die im übrigen im deutschen Sprachraum erstaunlich wenig Echo [3] gefunden hat) hat sich einiges verändert. Eine immer grösser werdende Menge an Quellen ist digital zugänglich geworden und es gibt auch immer mehr Tools, die eine zielgerichtete Analyse von grossen Textkorpora ermöglichen.

Folgt man Claverts Argumentation, dann lassen sich die zwei Achsen so anordnen, dass vier Lese-Varianten entstehen: close human reading, distant human reading, close machine reading und distant machine reading. Was mir nun auffällt ist, dass von diesen vier Varianten mit Vorliebe zwei diskutiert und gegeneinander ausgespielt werden, eine Variante kaum zur Kenntnis genommen wird und eine Variante eigentlich nicht umsetzbar ist.

Zuerst zum Begrifflichen: Distant reading ist ein Begriff, der zur Zeit eine hohe Konjunktur in der Digital Humanities-Szene geniesst und auf drei Aufsätze von Franco Moretti aus den Jahren 2003 und 2004 im New Left Review zurück geht. Moretti behauptet darin, etwas überspitzt formuliert, dass man Bücher nicht wirklich lesen müsse, um sie analysieren zu können, sondern dass es auch möglich sei, algorithmisiert und mit Hilfe von quantitativen Methoden Strukturen und Themenverschiebungen zum Beispiel in der Literatur zu erkennen. Moretti ist Literaturwissenschaftler. Distant reading ist gleichzeitig auch der diskursive Gegenpart zum ebenfalls literaturwissenschaftlichen Konzept des close reading, wie es bereits vor einigen Jahrzehnten entwickelt wurde. Dieses Konzept setzt auf eine äusserst präzise Interpretation einzelner Passagen, Begriffe und stilistischer Eigenheiten des Textes. Human reading ist der Modus, der unserer Kultur grundlegend eingeschrieben ist. Maschinelles Lesen hingegen ist insofern paradoxal, dass die gemeinten Maschinen – die Computer – Rechen- und nicht Lesemaschinen sind. Lesemaschinen stellen also an sich schon eine funktionale Transformation dar. Oder, um es mit Christoph Tholens Worten zu formulieren: Machine reading ist ein Beweis für die «gestaltwechselnde Offenheit der Digitalität» (Zäsur der Medien, S. 52).

Kehren wir zurück zu den vier verschiedenen Modi, die nach Claverts Einteilung theoretisch möglich sein sollten: Ein menschliches Lesen grosser Textmengen mit dem Ziel, nicht die Inhalte, sondern die Strukturen und Diskurse zu erkennen, scheint nicht realisierbar. Das menschliche Gehirn ist nicht in der Lage, die Buchstaben, die wir lesen, von ihrer Semantik zu abstrahieren und in mathematische Auswertungsraster zu transformieren. Der Sinn der Schriftzeichen wird immer ins Bewusstsein des Lesenden eindringen und die abstrakte strukturelle Auswertung, die mit dem distant reading gefordert wird, unterlaufen.

Im Mittelpunkt stehen deshalb die beiden Antagonisten close human reading und distant machine reading. Oder mit anderen Worten: eine hermeneutische versus einer quantitiativen Auswertung. Wie Clavert völlig zu recht schreibt, haben beide ihre Berechtigung und die Frage ist, wie sie sich kombinieren lassen. Beide Verfahren haben ihre Stärken und Schwächen. So wie auch beide Verfahen ihre Entstehungsgeschichten und Traditionen haben, die eine unbefangene Auseinandersetzung mit diesen beiden Methoden nicht immer leicht machen.

Was aber ist mit dem vierten Feld, dem close machine reading? Mir scheint, dass hier ein gewisses Potential steckt, das weitgehend unentdeckt ist und das vielleicht Elemente der hermeneutischen und der quantitativen Auswertung vereinen könnte. Wie das genau funktionieren könnte, ist mir noch nicht klar. Frédéric Clavert geht auf das Thema direkt auch nicht ein. Aber vielleicht ist sein schöne Beitrag Anlass, auch diesen Punkt zu diskutieren?