Ein weiteres N-Gramm-Tool im Netz

Im boomenden Bereich der «Data Driven History» sind in den letzten Monaten mehrere Suchsysteme vorgestellt worden, die mit N-Grammen, einem speziellen computerlinguistischen Verfahren, arbeiten. Das bekannteste einschlägige Tool dürfte der «Books Ngram Viewer» von Google sein. Das UK Web Archive hat kürzlich ebenfalls einen spezialisierten Viewer vorgestellt, der ähnliche Suchabfragen ermöglicht.

Interessant am Datenbestand, der hier befragt wird, ist aber, dass das britische Web-Archiv nicht Bücher oder Fachaufsätze (wie der entsprechende JSTOR-Viewer), sondern das «normale» Web als Basis für seine N-Gramme nimmt. Damit lassen sich auch Abfragen generieren, die nicht nur näher an der Alltagssprache sind, sondern die auch einen rezenteren Datenbestand auswerten als die anderen beiden Tools.

Das Beispiel vergleicht das Aufkommen der Begriffe «Facebook», «Twitter», «Blog» und «Web 2.0».

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert