Ich tagge, sie taggt, wir taggen – die neue Duden-Auflage kommt mit Digitalbegriffen. Und Machine Learning!

Paul Hofmann
Aug 9, 2017

Selfie, Tablet, postfaktisch und Urban Gardening sind Begriffe des täglichen Sprachgebrauchs. Bierdusche, futschikato, Tüddelkram oder Hygge nicht. Trotzdem sind alle Begriffe seit dieser Woche im Duden zu finden. Die Standardreferenz für deutsche Schriftsprache wurde um 5.000 auf nunmehr 145.000 Begriffe erweitert. Darunter einige aus dem Digital- und Technologiesektor.

https://twitter.com/janskudlarek/status/894494499942129664

Wie jede der 26 vorhergegangenen Neuauflagen reflektiert auch die 27. Ausgabe des Duden aktuelle Sprachentwicklungen – zumeist Komposita aus vorhandenen Wörtern oder Wortteilen und Adaptionen aus Fremdsprachen – in den Bereichen Mode, Sport oder Politik. Und natürlich sprachliche Aktualitäten aus dem Technologie- und Digitalsektor. Oder zumindest, was die Duden-Redaktion als für den Digitalstandort Deutschland aktuell betrachtet:

  • Livestream
  • Linken
  • Emoji
  • Tablet
  • Taggen
  • Pixelig
  • Selfie (und Selfiestick)
  • Drohnenangriff
  • Facebooken
  • Entfreunden
  • Liken

Wobei Verben streng deutsch konjugiert werden: ich like, er/sie/es likt und ich habe gelikt bzw. er/sie/es hat gelikt. Für solche Klärungen dürften Digital Natives (wurde bereits mit der 26. Auflage verzeichnet) und Immigrants gleichermaßen dankbar sein. Betrachten beide den Duden unverändert als höchste Sprachinstanz. Für die Auflagenrhythmen von drei bis fünf Jahren erstaunlich aktuell verhält es sich etwa bei

  • Tindern
  • Postfaktisch
  • Fake News
  • Social Bot
  • Datenbrille
  • Filterblase
  • Adblocker

Ob die digitalen Ergänzungen für ein Verständnis der Moderne spricht? Wir sind unsicher. Nach Blog wurde nun etwa "Internetblog" eingetragen, obwohl der verdeutlichende Präfix immer überflüssiger wird. Interessant ist auch, dass der analoge Duden "Blog" weiter mit dem Genus Neutrum aufführt und die maskuline Form lediglich registriert, obwohl "der Blog" zunehmend häufiger zu lesen ist.

Welche Wörter aufgenommen werden, wird übrigens auf Basis einer elektronischen Textsammlung entschieden, die Zeitungsartikel, Gebrauchsanweisungen und Romane umfasst. Eine Vorauswahl wird anschließend von Computerlinguisten und der Duden-Redaktion gefiltert, um den deutschen Schriftwortschatz zu aktualisieren.

Das ließe sich doch mit Machine Learning sicher intelligenter lösen?