Noch einmal: «Dynamische Publikationen»

Wenn ich versuche, ein Fazit zu ziehen aus dem heutigen Gespräch in Bonn, dann scheint mir die wichtigste Erkenntnis zu sein, dass bisher sich noch niemand genau überlegt hat, was mit dem schönen Begriff «dynamische Publikationen» gemeint ist.

Ich sehe – nach diesem Tag, vorher war mir das auch nicht so klar – verschiedene Bereiche, die ich dazu zählen würde:

Zum einen sind es Websites, die relativ häufig aktualisiert werden, aber eine klare Struktur und in der Regel auch einen definierten Autor resp. Content-Lieferanten haben. Typischerweise sind das Webauftritte von Tageszeitungen, Newsportale etc. Wenn ich das richtig verstanden habe, dann war die Frage, wie man solche Seiten archivieren soll, der Auslöser der heutigen Veranstaltung und deshalb waren auch verschiedene Vertreter entsprechender Verlagshäuser (F.A.Z., Die Zeit u.a.) eingeladen worden. Bei diesen Seiten ist aber entscheidend, dass sehr viel Content von externen Sites zugespielt wird (Wetter, Börsendaten, zum Teil auch der journalistische Content …).

Bei der Archivierung dieser Inhalte sind einige rechtliche Fragen zu klären und zudem stellt sich die Frage, ob die gigantischen Redundanzen, die dabei generiert werden, sinnvoll sind. Die Börsendaten zum Beispiel sind überall die gleichen und werden meist auch von den gleichen spezialisierten Content-Lieferanten eingespielt. Die Diskussion drehte sich heute um die Frage, wie häufig von solchen Sites eine Kopie gezogen und archiviert werden soll. Von Seiten der Informatik wurde vorgeschlagen, dies ereignisgesteuert zu machen, d.h. jedes Mal, wenn etwas geändert wird, quasi ein Differentialbackup zu fahren. Eine andere Variante, die ich vorgeschlagen hatte, ist, eine algorithmisierte Relevanzbewertung vorzunehmen und bei den verschiedenen Sites entsprechend zu differenzieren. Das würde bedingen, dass irgendjemand – vermutlich die Bibliothekare, die Archivare und idealiter die Geschichtswissenschaft – eine entsprechende «Formel» entwerfen müsste.

Eine ganz andere Gruppe von «dynamischen Publikationen» stellen Angebote dar, die interaktiv abgefragt werden müssen. Konkret sind das elektronische Telephonbücher, Fahrpläne, aber auch Vorlesungsverzeichnisse und vieles andere mehr. Die Frage der Archivierung dieser Quellen ist insofern ziemlich relevant, dass im Moment die gedruckten Pendants dieser Quellen verschwinden und dann nur noch die elektronischen Versionen existieren. Diese drei Beispiele, die auch heute kurz diskutiert wurden, sind natürlich bei den Historikern höchst beliebte Quellen, das heisst, es besteht auf jeden Fall Handlungsbedarf. Vermutlich wird es hier sinnvoll sein, für die einzelnen Quellentypen spezielle XML-Strukturen zu definieren und die Daten auf diese Weise – aus der konkreten Anwendung extrahiert – zu archivieren.

Und drittens geht es um Publikationen wie zum Beispiel Wikipedia oder Weblogs, die heute nicht oder höchstens nach dem Zufallsprinzip gesammelt werden. Wikipedia archiviert zur Zeit noch alles selbst, aber wer weiss, was in fünf, zehn oder in dreissig Jahren sein wird. Man stelle sich die Situation für einen Historiker im Jahre 2101 vor: In den Massenmedien der ersten Jahre des 21. Jahrhunderts wird dauernd, fast täglich, über eine Enzyklopädie berichtet, aber diese Enzyklopädie ist nicht mehr auffindbar, die Diskussionen sind für den Historiker des 22. Jahrhunderts aus den Quellen heraus gar nicht mehr rekonstruierbar. Das gleiche gilt – vermutlich mit noch wesentlich mehr Schärfe – für die gesamte Blogosphäre. Natürlich geht es gerade in diesem dritten Segment nicht darum, alles zu archivieren und alle Versionen für alle Ewigkeit aufzubewahren. Aber es geht darum, nicht nur die Zeitungen und die grossen Portale zu berücksichtigen, sondern auch an das zu denken, was vielleicht nicht als einzelne Website von Interesse ist, sondern als Teil einer Lebenswelt und einer kulturellen Praxis zu Beginn des 21. Jahrhunderts.

Das heutige Gespräch war ein sinnvoller und konstruktiver Anfang. Nun gilt es, kreativ und vielleicht auch jenseits der so beliebten Trampelpfade nach konkreten Lösungen zu suchen. Dass die DFG mit dabei ist, werte ich als positives Zeichen, denn gerade der Bereich «Wissenschaftliche Literaturversorgungs- und Informationssysteme (LIS)» der DFG hat sich in den letzten Jahren immer wieder mit weitblickenden Initiativen zu Wort gemeldet.

12 Gedanken zu „Noch einmal: «Dynamische Publikationen»“

  1. Ich habe den Begriff der Dynamischen Publikationen sehr viel enger gesehen. Ich habe das auf Artikel bezogen, die sich nach dem veröffentlichen noch ändern. Also zum Beispiel Wikipedia Artikel. Ein Nachrichtenportal ist zwar an sich dynamisch, aber auch nicht viel dynamischer als eine Tageszeitung. Die Artikel werden einzeln veröffentlicht statt als Paket, aber entwickeln sich nicht mehr.

    Ich würde auch eine komplette Archivierung einer Relevanz-gesteuerten vorziehen. Speicherplatz ist, so zumindest laut Wikipedia Deutschland, kein Thema mehr. Bei einer Relevanzmethode wird gefiltert und dabei muss ich immer an die Quellenlage im Mittelalter denken. Nur dass nicht aus der Sicht der Geistlichen sondern aus der Sicht der Gedächtnisinstitutionen erzählt wird. Wer weiß wonach der Historiker 2101 überhaupt sucht?

  2. Ich dachte zuerst auch an diese Art von dynamischen Publikationen. Bei der Vorbereitung des gestrigen Tages und dann spätestens in Bonn wurde mir klar, dass es auch und vor allem um die Zeitungen geht. Für uns ist das sicherlich keine besonders dynamisch Sache, aber für die Bibliothekare und die Archivare eben schon.

    Komplette Archivierung tönt gut, aber was heisst das? Gerade bei Zeitungen ändert sich ja dauernd irgend etwas (Wetter, Börse, Newsticker). Da kann man nicht alles archivieren. Zumal das mit dem Speicherplatz, das kein Thema sein soll, eines dieser modernen Märchen ist, die offenbar nicht auszurotten sind. Natürlich ist Speicherplatz ein Thema, denn obwohl die Preise sinken und die Kapazitäten steigen, steigt auch die zu sichernde Informationsmenge und – und das ist dann das spezifische Problem der Archive – diese Informationen ja auch noch periodisch umkopiert werden müssen.

  3. Da haben sie einen viel wichtigeren Punkt als die Speicherkapazität angesprochen. Nämlich die Verwaltung und Instandhaltung der Daten. Darüber habe ich mir eher wenig Gedanken gemacht, das war etwas kurzsichtig.
    Da wäre eine Filterung der Datenmenge schon angebracht oder man verteilt die spezifischen Daten auf verschiedene Institutionen. Nur dafür muss dann auch wieder Zeit und Geld vorhanden sein. Einfach ist das Problem sicherlich nicht.

  4. Zitat: „Ein Nachrichtenportal ist zwar an sich dynamisch, aber auch nicht viel dynamischer als eine Tageszeitung. Die Artikel werden einzeln veröffentlicht statt als Paket, aber entwickeln sich nicht mehr.“

    Ich möchte nur kurz darauf hinweisen, dass dies nicht meinen Erfahrungen entspricht. Einige Stories, die sich mit „meiner“ Thematik (Plagiate etc.) in den vergangenen Jahren befasst haben und in Online-Ausgaben von Tageszeitungen erschienen sind (KURIER online, derstandard.at etc.), wurden auch NACH der Online-Erstpublikation noch umgeschrieben/erweitert/umgestellt, ohne dass ich dies veranlasst hätte.

    Änderungen NACH der Online-Erstpublikation (bei Ergänzungen, Fehlerkorrekturen…) entsprechen auch meiner praktischen Erfahrung bei Telepolis.

    Ich denke, man sollte deshalb auch diese Dynamik im Auge behalten.

    LG
    sw

  5. Das ist ein sehr interessanter Hinweis nicht nur für die Frage der Archivierung, sondern auch für die Frage nach der Zitierfähigkeit von Online-Zeitungsartikeln. Gehe ich richtig in der Annahme, dass diese Veränderungen nicht gekennzeichnet wurden, sondern dass Sie das nur gemerkt haben, weil Sie die jeweils alten Versionen abgespeichert hatten. Das wäre nämlich ziemlich unangenehm und würde bedeuten, dass Zeitungsartikel nicht mehr nach der Online-Version zitiert werden sollten. Denn anders als bei Wikipedia gibt es ja keine für den Benutzer sichtbare und nachvollziehbare Versionierung.

  6. Ja. Natürlich nicht gekennzeichnet. Etwa bei http://www.kurier.at/nachrichten/167618.php wurde im nachhinein der Abschnitt über Weber-Wulff eingefügt. Wäre interessant, zu erheben, wie viele Journalisten das bereits machen. Aber irgendwie entspricht es auch der Publikationslogik im Web: Man publiziert eine Story ASAP, sobald genug Content/Text da ist, wenn man sich dann noch etwas ergoogelt oder ein Interviewpartner zurückruft, ergänzt man sie.

  7. Ja aber auch in Zeitungen, werden in späteren Ausgaben Korrekturen und Erweiterungen gedruckt. Ich meinte nicht, dass Zeitungen völlig statisch sind, sie haben nur andere Möglichkeiten dynamisch zu sein. Natürlich können sie nach dem Druck die Seite nicht mehr rückwirkend ändern, aber eben in späteren Ausgaben. Genau genommen machen das Internetseiten auch so, nur das die verschiedenen Seiten sich ersetzen.
    Abgesehen davon veröffentlicht Telepolis nicht einfach nur News, sondern hat eher Magazin-Charakter, so wie http://www.spiegel.de. Mit reinen Nachrichten Portalen war eher zum Beispiel http://www.n24.de gemeint, also Internetangebote, die sich wirklich auf reine Nachrichten konzentrieren.

    Auch wenn ich gerade Definitionsprobleme habe, im Grundsatz sind wir uns ja einig. Es sollte archiviert werden. Die Grundprobleme sind aber weiterhin wie archivieren, wie viel und wer verwaltet es (usw.). Wichtig ist, denke ich, dass man eine Kommunikationsbasis hat. Das fängt damit an, was unter „Dynamische Publikationen“ zu verstehen ist und geht mit dem Wissen darüber weiter, wie dynamisch die verschiedenen Arten von Webseiten sind. Ich werde mich jedenfalls bessern und nicht so viel verallgemeinern.

  8. Das finde ich auch okay, nur wäre es schön – den Lesern gegenüber und speziell den Historikern gegenüber – wenn eine Ergänzung gekennzeichnet würde.

  9. Die angesprochenen Punkte sind allesamt wichtige Teile der Überlegungen. Entscheidend ist jedoch vorweg die Frage, welche Information gespeichert und wie zugänglich gemacht wird. Nun ist das zukünftige Interesse des Historikers nicht antizipierbar; Inhalte, zumal dynamisch verknüpft, mögen (erst) in Zukunft von Relevanz sein. Dennoch: Es braucht ein Konzept (Metadaten, Retrieval Strategy) welches zwar offen, aber dennoch leitend ist.

    Im privaten Sektor ist dies entscheidend. Angesichts der wachsenden Datenflut (eDaten-Jams) sind billige Speichermedien ein trügerischer Trost angesichts der anfallenden Kosten, um gesuchte Informationen in unstrukturierten Datenfriedhöfen zu finden.

    WEB 2.0 steigert die Bedeutung des Begriffs der Dynamik beim Web entscheidend und zusätzlich dadurch, dass eine URL je nach Gusto des users unterschiedliche Inhalte, unterschiedlicher Provienienz aufzeigt. Dies führt zur berechtigten Überlegung, dass der Inhalt an der Quelle, nicht am Frontend eingefangen werden muss, da die angezeigten Inhalte kontingent und flüchtig sind. Der individuell konfigurierte Browser ist nur die Einstellung am „Fernrohr“ auf andere Welten, wo Inhalte publiziert werden.

  10. Und wieder eine Aussage, die weitere Fragen aufwirft. Für mich sind Inhalte die wichtigsten Bestandteile der zu sichernden Quelle. Aber der zukünftige Historiker kann an ganz anderem interessiert sein als an dem Inhalt an sich. Vielleicht am Quellcode, an der Seitenstruktur – auch am Layout. Vielleicht beschäftigen sich Soziologen und Kunsthistoriker in 100 Jahren mit Webseiten als Äquivalent für bemalte Tonvasen aus der Antike.

    Der ganze Komplex der Archivierung enthält sehr viele Unbekannten, was die Entscheidungsfindung sicherlich sehr schwierig macht.

  11. Bloss müssten „wir“ langsam zu einem Ergebnis kommen. Die ersten zehn bis fünfzehn Jahre des WWW sind sowieso bereits futsch. Wenn wir noch lange zuwarten, wird immer mehr fehlen. Mit „wir“ sind natürlich die grossen Gedächtnisinstitutionen gemeint, die Archive und die Bibliotheken. Die ja nicht untätig sind, aber auch nicht so recht zu wissen scheinen, was zu tun ist. Ich glaube nicht, dass es eine grosse globale Lösung geben wird, sondern es wird notwendig sein, verschiedene Zugänge zum Thema aufzubauen, sprich: sowohl Snapshots zu archivieren als auch die Datenbanken sichern. Es braucht Koordination und Dialog, aber da sind die institutionellen Kanäle vorhanden. Was mir ein wenig fehlt in dem Ganzen, das ist die Expertise von Seiten der Geschichtswissenschaft. Die sollte noch besser integriert werden.

  12. Auch Print-Zeitungen besitzen oftmals mehrere Ausgaben an einem Tag, die durchaus unterschiedliche Inhalte transportieren können, vom Austauschen einzelner Artikel bis zum Ändern von Informationen in Artikeln.

    Bei meiner ungeliebten Stadtzeitung „Hamburger Abendblatt“ etwa war in dieser Woche in der Ausgabe für die Abonnenten noch kein Bericht über das Fußballspiel am vorigen Abend, in der Kiosk-Ausgabe, die mein Sohn in der Schule zu Gesicht bekam, war die ganze Titelseite geändert.

    Einige Zeitungen kennzeichnen das etwa mit Buchstaben-Kürzeln in der Titelzeile oder im Impressum. Bis in die Zitierweise hat sich das (auch bei mir) allerdings nicht ausgewirkt. Wir zitieren alle noch so, als wäre eine Ausgabe eine Ausgabe.

    Soweit ich sehe, archivieren auch Zeitungsarchive und Bibliotheken immer *eine* Ausgabe, und führen nicht alle Nachlieferungen nach.

    Ich bin mir auch nicht sicher, ob etwa eine Pflichtabgaberegelung für Druckerzeugnisse an das zuständige Archiv so genau greift: Müsste das Abendblatt nach derartigen Eingriffen von jeder Version ein Exemplar abliefern? Ich weiß es nicht.

    Da verschwindet eine Menge Information, die etwa bei sich überstürzenden Ereignissen später für die rekonstruktion durchaus von Bedeutung sein kann. Die elektronische Fassung verschärft das Problem allerdings deutlich.

    Wie dem Problem beizukommen ist, weiß ich nicht.
    Auf Seiten des Nutzers bzw. des Lernenden ist sicherlich die Aufmerksamkeit und das Problembewusstsein zu schärfen, vielleicht die Konsequenz zu ziehen, bei Print-Zeitungen immer auch die jeweilige Ausgabe zu nennen, bei online-Zeitungen nicht nur das Datum, sondern auch die Uhrzeit des Zugriffs.
    Was aber hilft das, wenn die Information so nicht wieder aufzufinden ist?

    Von Studierenden verlange man also nicht nur das Zitat, sondern einen Ausdruck der zitierten Seite im Anhang. Aber in Publikationen? Wollen wir anfangen, immer einen Materialanhang (noch dazu urheberrechtlich problematisch) beizugeben?

    Und wie sieht es mit der dokumentarischen Frage aus? Auch wenn noch niemand diese Seiten benutzt — wie kann man sie für zukünftige Nutzung sichern?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert