weblog.hist.net

Search Wikia: Das Wiki-Prinzip für Suchmaschinen

Wikipedia-Gründer Jimbo Wales will etwas Neues anpacken. Warum nicht, so dachte er sich wohl, die Welt der Suchmaschinen aufmischen. Denn die gängigen Suchmaschinen von Google bis Yahoo seien ohnehin kaputt:

It is broken for the same reason that proprietary software is always broken: lack of freedom, lack of community, lack of accountability, lack of transparency. Here, we will change all that. (J. Wales@Wikia, 23.12.2006)

Drum will Wales ein neues Projekt namens Search Wikia lancieren, das die Entwicklung einer Open-Source-Suchmaschine zum Ziel hat. Der Index soll jedermann zugänglich sein, und die Kriterien, die zur Rangierung der Suchergebnisse herangezogen werden, sollen transparent gemacht werden und sich auf Einschätzungen einer vertrauenswürdigen Community stützen.

Und was meint die Internet-Community dazu? Sie berichtet relativ gelassen und reiht die Wikia-Initiative unter die vielen “Killer”-Meldungen ein von Projekten, die einem erfolgreichen Web-Unternehmen das Fürchten lehren wollen. (Heise, C-net, TechCrunch (mit Screenshot)).

Ach ja, Amazon soll sich an dem Projekt finanziell beteiligen, heisst es da und dort. Allerdings hat Amazon vor allem in die Firma Wikia von Jimbo Wales Geld eingeschossen, zu der Search Wikia gehört. Ein direkter Link von Amazon zu Wikiasari ist nicht bekannt. Und: das Projekt heisst nicht “Wikiasari” (als Vermengung von Wiki und dem japanischen Wort “Asari” für “Suchen”), obwohl es in fast allen Meldungen mit diesem Namen bezeichnet wird.

Was das für die Praxis der Internet-Recherche für Historiker und Historiker bedeutet, ist mir noch unklar: Bessere oder andere Suchergebnisse? Oder noch mehr Wikipedia-Artikel? Wir berichten, sobald mehr (und Essentielleres) bekannt ist.

HOK Lesen/Schreiben: Von Aggressionen und Aggregatoren

Der Fall einer belgischen Zeitung, die sich gegen die ungefragte Verwertung durch GoogleNews wehrt, weist auf eine bemerkenswerte Eigenschaft der Internet-Gesellschaft. Die Aggregation von Daten, die von anderen erstellt worden sind, wird zu einem Mehrwert generierenden (und damit Profit abwerfenden) Service. Google programmiert die Suchmaschinen, welche die Websites der bekannten Zeitungen abgrasen, lässt die Inhalte gescheit darstellen und kassiert für diese Aggregation eine Menge Werbegeld, dass den Produzenten der Informationen fehlt.

Auf dieses Ungleichgewicht der web 2.0-Ökonomie weist auch Geert Lovink in seiner kritischen Würdigung “Kein Zugriff” hin (Zusammenfassung seiner kommenden Publikation bei “Jungleworld“). Er zeigt das Prinzip auch anhand community-basierter Aggregations-Leistungen auf. Die Tagging-Funktionen habe nicht nur strukturierenden Nutzen für die angemeldeten User einer Community. Sie lassen auch Profilierungen und Marktstudien zu. Wikipedia (um noch einen Schritt weiter weg von den technischen Aggregations-Definitionen zu gehen) ist nicht nur eine Gratis-Dienstleistung, die locker alle bezahlten Modelle der Wissensaggregation (Lexika) punkto Popularität aussticht – es ist auch ein Rekrutierungsfeld für Autor/innen, die sich bereits profiliert haben und nun in anderen Projekten genutzt werden können. Wikipedia ist auch eine beliebte Quelle für so genanntes DataMining: das Auswerten der Datenbestände mit verschiedensten Fragestellungen.

Bei Google kann man noch der Meinung sein, es handle sich um eine Produktivitätssteigerung bei der Datenverwertung, wie dies die Mechanisierung und Informatisierung bei der Produktfertigung im 19. und 20. Jahrhundert war. Doch bei den Geschäftsideen im web 2.0 wird mit dem Community-Effekt günstig produziert, dank Idealismus, Altruismus, Spieltrieb, Exhibitionismus. Jüngstes Beispiel ist der Versuch von Google, mit einem Online-Game durch die Community seine Bilddatenbank beschlagworten zu lassen. Wikipedia ist zwar im Gegensatz zu Google (und anderen web 2.0-Firmen) ein Non-Profit-Unternehmen. Doch es generiert auch ziemlich viel Geld – durch Spenden. Davon können einige Leute leben, nicht zuletzt Gründer Jimmy Wales. Doch weitaus wichtiger: die Wikipedia-Community beschert dem Wikipedia-Gründer wertvolle Aufmerksamkeit, die er auch für kommerzielle Projekte (wie Wikia) nutzen kann. Letztlich geht es bei Projekten wie bei Wikipedia nicht nur um die Frage der wissenschaftlichen Güte der gemeinschaftlich-ehrenamtlich erstellten Inhalte. Es ist auch eine Verdrängung bezahlter Professionals durch idealistische Freiwillige.

Zuletzt noch ein gewagter Schlenker in die akademische Welt. Wer die Bedeutung des Aggregations-Prinzips für das web 2.0 verstanden hat, und sieht, wie dieses Prinzip bei Google, Flickr, Wikipedia und in privaten Blogs zur Anwendung kommt, staunt nicht mehr darüber, dass mit den Nutzer/innen des web 2.0 auch Copy/Paste-Verhalten und Plagiats-Vergehen in den Universitäten Einzug halten. Doch einfach nur ein sorgloses Umgehen mit fremdem geistigen Eigentum bei den jungen Studienanfängern zu beklagen, greift zu kurz. Was wird denn von Ihnen verlangt – und was haben Sie für Vorbilder?

In einem zunehmend verplanten und modularisierten, auf Leistung (= in Credits messbaren Output) getrimmten Bologna-Hochschul-System kann es nicht überraschen, dass die Aufgaben im Grundstudium oft einfachen Aggregationen gleichen. “Fassen Sie zusammen!” ist als wissenschaftliche Herausforderung so dürr, dass es zum Copy/Paste einlädt. Stattdessen wären klare Fragestellungen zu verlangen, bzw. auch zu vermitteln, was eine klare Fragestellung ausmacht und wie diese eine wissenschaftliche Arbeit schon grundlegend strukturieren kann. Denn: auch wer sauber ein Zitat nachweist, muss es noch lange nicht gelesen oder gar verstanden haben.

Generell sollte nicht nur mit dem Argument der wissenschaftlichen Redlichkeit (keine fremden Erkenntnisse als eigene ausgeben) gearbeitet werden. Denn oft sind die Vorbilder nicht so vorbildlich, wie sie sein sollten: Auch bestandene Akademiker werden immer öfter beim Tricksen und Klauen entlarvt – nicht immer mit Konsequenzen. Und ist eine Paraphrase nicht oft einfach eine elegante Vermeidung des offensichtlichen Bekenntnisses, dass einem selber nichts Besseres eingefallen ist, man dies aber elegant in eigene Worte fassen kann?

Immerhin, und dies sei hier auch erwähnt, kann nicht genug auf die lernpsychologische Wirkung des epistemischen Schreibens hingewiesen werden: Sachverhalte besser verstehen, indem man sie verständlich niederzuchreiben versucht.

Zu den Argumenten der Redlichkeit und der Lernpsychologie kommt auch noch jenes der Urheberrechte: man ist in der Regel nicht befugt, ohne Nachweis längere Passagen aus Werken anderer abzuschreiben/ zu kopieren. Hier gilt jedoch zu beachten, dass die GNU Public License die bestehenden Regeln verändert. Aus Wikipedia darf ohne Zitatnachweis wörtlich zitiert (auch in beliebig abgeänderter Form) werden – solange das Ergebnis auch der GNU Public License untersteht und frei weitergegeben und weiter bearbeitet werden kann.

Noch zum Titel: Angesichts der starken Überzeugungen, die zur Disposition stehen (Konzepte der Wissenschaftlichkeit), und der ökonomischen Realitäten (Wer bezahlt und wer kassiert?) wundert mich der zuweilen scharfe Ton nicht, mit dem über die “schlimmen Entwicklungen” des Internets – und des web 2.0 als Untermenge davon – hergezogen wird. Aber bleibt nur Euphorie, Fatalismus oder Beklagen?

Literatur:

Übersicht HOK Lesen/Schreiben

HOK Lesen: Suchen und Finden: Ich bin nur eine Maschine!

Eine interessante Mitteilung bei Heise:
Die Suchmaschinen-Betreiber verlangen eine Änderung der gesetzlichen Grundlagen für ihre Dienstleistung, denn:

“Suchmaschinen werden in einem zunehmenden Maße mit der Entscheidung in Anspruch genommen, ob einzelner Inhalte im Internet auffindbar und zugänglich sein sollten oder nicht”, monieren die Anbieter. Sie sähen sich dabei angesichts der sehr weitgehenden zivilrechtlichen (Störer-) Haftung dazu gezwungen, bereits von der Mitteilung einer rein behaupteten Rechtsverletzung einzelne Suchtreffer aus ihren Ergebnislisten zu löschen. Diese Situation machten sich “zahlreiche Akteure” durch bewusstes Abmahnen missliebiger Inhalte etwa von Konkurrenten zunutze. Die Praxis zeige, dass hinter den angeblichen Rechtsverstößen häufig seriöse und vollkommen legale Inhalte steckten.

Daraus folgt:

“Auf Verdacht” hin vorgenommene Maßnahmen von Suchmaschinen stellten auch einen “starken Eingriff” in die grundgesetzlich geschützten Informationsinteressen der Nutzer dar.

Mit anderen Worten: Manipulationen der Suchmaschinen-Indices (also der in Datenbanken abgelegten Verweise auf Websites, die als Ergebnisse bei Suchanfragen ausgewiesen werden) sind an der Tagesordnung.

Soweit so gut. Eine Änderung der Rechtslage weg von einer “vorauseilenden Gehorsams-Zensur” wäre wohl wünschenswert; obwohl unklar bleibt, wie gross der Schaden sein könnte, der durch die Verzögerungen entsteht, wenn illegale Inhalte erst nachträglich, auf Antrag und womöglich mit richterlicher Anordnung gelöscht werden können.

Erstaunlich finde ich die Argumentation der Suchmaschinen-Betreiber. Suchmaschinen böten…

(…) wie Zugangs- oder Hostprovider keinen eigenen Content an, sondern machten Inhalte Dritter auf “Milliarden unterschiedlicher und sich permanent verändernder Webseiten” ausfindig, indexierten sie und verschafften dem Nutzer Zugang dazu.
“Suchmaschinen im eigentlichen Sinne sind keine redaktionell gestalteten Link-Kataloge”, heißt es in dem Positionspapier, das AOL, Google, Lycos, MSN, T-Info, T-Online und Yahoo gemeinsam verfasst haben. Die unüberschaubare Anzahl an Informationen im Internet könne auch gar nicht auf der Basis persönlicher Prüfung und Zusammenstellung der Suchergebnisse strukturiert werden, wehren sich die Anbieter vor einer Haftung für die von ihnen gelisteten Online-Materialien. Nur technische und “voll automatisierte Suchverfahren” könnten zum Einsatz kommen, weshalb die Betreiber sich auch “zwangsläufig” als “rein technische Infrastrukturdienstleister” sehen. (Hervorhebungen durch jh)

Da kann ich nur sagen: “Ich bin nur eine Maschine!” Aber warum bloss verkaufen die Suchmaschinen massenweise Werbung auf ihren Seiten? Hier wird doch ein klarer Mehrwert angeboten, der nicht nur mit “rein technischer Infrastruktur” zu umschreiben ist. Maschinell ist ja lediglich die Ausführung des intellektuellen Ansatzes, die Ergebnisse zu sammeln, auszuwerten, zu gewichten und sortiert auszugeben (Stichwort “PageRank”).

Hier machen es sich die Suchmaschinen-Betreiber meiner Ansicht nach zu einfach. Sie sind mehr als reine technische Dienstleister, sondern zentrale Aggregatoren von Inhalten und recht eigentliche “Gatekeeper”. Dass keine inhaltlichen, sondern “nur” ökonomische Interessen handlungsleitend sind, mag ein Trost sein. Die Suchmaschinenbetreiber wollen keine Inhalte ausschliessen, weil es nicht im Interesse des Nutzer liegt und folglich dem Geschäft schadet – das klingt einleuchtend. Aber wie können wir sicher sein, dass sie auch wirklich keine Inhalte ausschliessen oder sonstwie manipulieren? Und: ist es wirklich in jedem Fall im Interesse der Nutzer/innen, dass Inhalte nicht ausgeschlossen werden? Oder gibt es hier nicht eher doch konkurrierende Interessen?

Übersicht HOK Lesen: Suchen und Finden

 

Wechsle zu unserer Mobil-Seite