«Lecture des sources historiennes à l’ère numérique». Ein Kommentar

Unser geschätzter Kollege Frédéric Clavert vom Centre Virtuel de la Connaissance sur l’Europe in Luxembourg hat kürzlich in seinem Blog einen interessanten Post über die Quellenlektüre im digitalen Zeitalter publiziert. Darin unterscheidet er einerseits close reading und distant reading, andererseits lecture humaine und lecture computationelle. Mit diesen beiden «Achsen» gelingt es Clavert, eine gewisse Struktur in eine der wichtigsten Debatten im Feld der Digital Humanities zu bringen.

Anders als viele rein theoretische Abhandlungen zu diesem Thema expliziert Clavert seine Argumente an konkreten Beispielen. Dabei verarbeitet er Erfahrungen aus der Quellenarbeit zu seiner Dissertation, die sich mit der Politik von Hjalmar Schacht, dem deutschen Reichsbankpräsidenten 1933-1939, befasst hat. Die Dissertation wurde 2006 in Strasbourg abgeschlossen und erschien 2009 in Bruxelles. Mit anderen Worten: Sie wurde also noch weitgehend im prä-digitalen Zeitalter erstellt. Sehr anschaulich beschreibt Clavert, wie ihm einerseits die Nähe zu den Quellen geholfen hat, die Situation und den Zeitgeist der damaligen Zeit zu verstehen. Andererseits aber hätte ihm bei bestimmten Fragen auch eine Auswertung eines grossen Quellenkorpus geholfen, eine Arbeit die so nicht geleistet werden konnte, da hier eine maschinelle oder zumindest eine maschinell unterstützte Auswertung notwendig gewesen wäre.

In den wenigen Jahren seit der Fertigstellung der Arbeit (die im übrigen im deutschen Sprachraum erstaunlich wenig Echo gefunden hat) hat sich einiges verändert. Eine immer grösser werdende Menge an Quellen ist digital zugänglich geworden und es gibt auch immer mehr Tools, die eine zielgerichtete Analyse von grossen Textkorpora ermöglichen.

Folgt man Claverts Argumentation, dann lassen sich die zwei Achsen so anordnen, dass vier Lese-Varianten entstehen: close human reading, distant human reading, close machine reading und distant machine reading. Was mir nun auffällt ist, dass von diesen vier Varianten mit Vorliebe zwei diskutiert und gegeneinander ausgespielt werden, eine Variante kaum zur Kenntnis genommen wird und eine Variante eigentlich nicht umsetzbar ist.

Zuerst zum Begrifflichen: Distant reading ist ein Begriff, der zur Zeit eine hohe Konjunktur in der Digital Humanities-Szene geniesst und auf drei Aufsätze von Franco Moretti aus den Jahren 2003 und 2004 im New Left Review zurück geht. Moretti behauptet darin, etwas überspitzt formuliert, dass man Bücher nicht wirklich lesen müsse, um sie analysieren zu können, sondern dass es auch möglich sei, algorithmisiert und mit Hilfe von quantitativen Methoden Strukturen und Themenverschiebungen zum Beispiel in der Literatur zu erkennen. Moretti ist Literaturwissenschaftler. Distant reading ist gleichzeitig auch der diskursive Gegenpart zum ebenfalls literaturwissenschaftlichen Konzept des close reading, wie es bereits vor einigen Jahrzehnten entwickelt wurde. Dieses Konzept setzt auf eine äusserst präzise Interpretation einzelner Passagen, Begriffe und stilistischer Eigenheiten des Textes. Human reading ist der Modus, der unserer Kultur grundlegend eingeschrieben ist. Maschinelles Lesen hingegen ist insofern paradoxal, dass die gemeinten Maschinen – die Computer – Rechen- und nicht Lesemaschinen sind. Lesemaschinen stellen also an sich schon eine funktionale Transformation dar. Oder, um es mit Christoph Tholens Worten zu formulieren: Machine reading ist ein Beweis für die «gestaltwechselnde Offenheit der Digitalität» (Zäsur der Medien, S. 52).

Kehren wir zurück zu den vier verschiedenen Modi, die nach Claverts Einteilung theoretisch möglich sein sollten: Ein menschliches Lesen grosser Textmengen mit dem Ziel, nicht die Inhalte, sondern die Strukturen und Diskurse zu erkennen, scheint nicht realisierbar. Das menschliche Gehirn ist nicht in der Lage, die Buchstaben, die wir lesen, von ihrer Semantik zu abstrahieren und in mathematische Auswertungsraster zu transformieren. Der Sinn der Schriftzeichen wird immer ins Bewusstsein des Lesenden eindringen und die abstrakte strukturelle Auswertung, die mit dem distant reading gefordert wird, unterlaufen.

Im Mittelpunkt stehen deshalb die beiden Antagonisten close human reading und distant machine reading. Oder mit anderen Worten: eine hermeneutische versus einer quantitiativen Auswertung. Wie Clavert völlig zu recht schreibt, haben beide ihre Berechtigung und die Frage ist, wie sie sich kombinieren lassen. Beide Verfahren haben ihre Stärken und Schwächen. So wie auch beide Verfahen ihre Entstehungsgeschichten und Traditionen haben, die eine unbefangene Auseinandersetzung mit diesen beiden Methoden nicht immer leicht machen.

Was aber ist mit dem vierten Feld, dem close machine reading? Mir scheint, dass hier ein gewisses Potential steckt, das weitgehend unentdeckt ist und das vielleicht Elemente der hermeneutischen und der quantitativen Auswertung vereinen könnte. Wie das genau funktionieren könnte, ist mir noch nicht klar. Frédéric Clavert geht auf das Thema direkt auch nicht ein. Aber vielleicht ist sein schöne Beitrag Anlass, auch diesen Punkt zu diskutieren?

3 Gedanken zu „«Lecture des sources historiennes à l’ère numérique». Ein Kommentar“

  1. Das ist mal ein Text, für den es sich lohnt, bis spät in die Nacht aufzubleiben.
    Konkret: Natürlich hat auch mich gleich von Beginn weg, schon beim Betrachten der Grafik am Anfang des Textes, dieses „close machine reading“ fasziniert: Was ist das? Was kann es? Wie kommen wir dazu? Wozu könnten wir es nutzen? Doch was wäre, wenn es wie sein Gegenpart (distant human reading) nur theoretisch gedacht, aber nicht konkret umgesetzt werden kann? Wenn die Maschinen eben doch keine „Lese-“ sondern „nur“ Rechenmaschinen sind, die nur so tun, als ob sie „lesen“ würden? Dafür müsste man wohl noch ergründen, was „lesen“ eigentlich erkenntnistheoretisch genau bedeutet. Eine Frage, die auch und gerade für die Geschichtsschreibung (insbesondere auch die digitale) von höchstem Interesse ist: dann, wenn die Geschichte sich erst im Akt des Lesens konkretisiert.

  2. Bonjour Peter,

    je me permets de répondre en Français.

    Je vais juste avancer deux points, peut-être un peu décevants:

    – Je crois qu’il existe une lecture distante humaine. Quand, pour une thèse, on fait – pour une thèse reposant sur des archives administratives et traitant d’histoire contemporaine – 250 à 500 cartons d’archives, on peut maîtriser les archives que l’on a lues suffisamment bien pour pouvoir prendre du recul et avoir une analyse d’ensemble de ses archives. Et c’est pour cela que j’ai distingué l’axe humain / computationnel de l’axe lecture proche / lecture distante. Toutefois, ce que va apporter la lecture computationnelle, c’est la possibilité d’accroître encore plus cette distance et donc d’embrasser plus d’archives.

    – Pour ce qui est de la lecture proche computationnelle, considérer que l’idéal-type de cette lecture proche computationnelle se situerait au niveau du paragraphe est juste. Mais avant cet idéal-type, il y a des lectures un peu moins proches, se situant au niveau d’un texte dans son ensemble (quelques pages, quelques dizaines de pages), où l’on ne peut pas encore parler de lecture distante. Cette lecture proche computationnelle non-idéale typique est aussi très féconde.

    En fait, il me semble qu’au-delà des quatre lectures idéales-typiques que tu distingues, il faut considérer la multitude des lectures les mélangeant. C’est ici que se trouve la richesse des ces deux échelles de lecture.

    Par ailleurs, merci à Jan Hodel pour son commentaire. Je n’ai pas encore de réponse à cette question du commencement de la lecture historienne. C’est une très belle piste de réflexion.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert