Forschung

CLARIN – Common Language Ressources and Technology Infrastructure

Inhalte und Methoden

Heute verstehen Telefone natürliche Sprache, Autos sprechen zu ihren Fahrern und digitale Wörterbücher verbessern nicht nur die Rechtschreibung, sondern visualisieren ihre Inhalte oder machen sie hörbar. All diese Errungenschaften wurden durch sprachtechnologische Entwicklungen der jüngeren Vergangenheit möglich. Sprachtechnologie basiert auf digitalen Sprachressourcen: auf Sprachdaten wie digitale Sammlungen von Texten oder gesprochener Sprache, Wörterbüchern, Glossaren, Terminologiedatenbanken, Ontologien, Thesauri, Enzyklopädien und auf Werkzeugen, die solche Daten erzeugen und verarbeiten. Die Verfügbarkeit digitaler Sprachressourcen hat nicht nur für den Wissenschaftsstandort Österreich höchste Bedeutung, sondern wird auch für die schnell wachsende österreichische Sprachindustrie immer wichtiger.

Zu den Zielen von CLARIN gehören einfacher und dauerhaft garantierter Zugang zu Sprachdaten und digitalen Sprachtechnologien, mit denen AnwenderInnen Sprachdaten finden, annotieren, analysieren und kombinieren können, egal wo diese physisch gespeichert sind oder in welchen Formaten sie vorliegen. Im Rahmen von CLARIN werden neue Sprachressourcen entwickelt und bestehende modifiziert, integriert und weiterentwickelt, um Ressourcen und Services in eine zusammenhängende Domäne zu verschmelzen. Zum Aufbau dieses einzigartigen Spracharchivs gehört es auch, existierende Datenbestände mit neuen digitalen Werkzeugen interoperabel zu machen, was wiederum den Einsatz und die Weiterentwicklung von relevanten Standards und Normen notwendig macht.

Mitgliedsländer und Geschichte

An CLARIN-ERIC nehmen gegenwärtig 19 Länder teil: Österreich, Bulgarien, Dänemark Deutschland, Estland, Finnland, Griechenland, Italien, Lettland, Litauen, Niederlande, Norwegen, Polen, Portugal, Schweden, Slowenien, Tschechische Republik, Ungarn und als internationale Organisation die Niederländische Sprachunion. Großbritannien hat Beobachterstatus. Österreich ist durch das neu gegründete Austrian Centre for Digital Humanities (ACDH) beteiligt. Am ACDH arbeiten u.a. die Österreichische Akademie der Wissenschaften, die Universität Wien und die Universität Graz zusammen. Das ACDH ist aus einer gemeinsam gestarteten Initiative der Österreichischen Akademie der Wissenschaften (ÖAW) und dem Bundesministerium für Wissenschaft, Forschung und Wirtschaft entstanden

Geschichte: 2008 wurde mit dem Aufbau von CLARIN begonnen, 2012 hat es den Status eines European Research Infrastructure Consortium (ERIC) zuerkannt bekommen.

Nutzungspotentiale und Zugang zu den Daten

Die CLARIN-Infrastruktur ist in vielen Teilen erst im Aufbau begriffen. Gegenwärtig sind die involvierten ForscherInnen bemüht, eine europäische Föderation von Datenrepositorien und Servicecentern zu etablieren. In Österreich ist das ACDH das erste offizielle Clarin-Zentrum im Land. Es stellt die Hauptverbindung zur europäischen Infrastruktur und der internationalen CLARIN-Gemeinschaft dar und macht digitale österreichische Sprachdaten und linguistische Werkzeuge zugänglich.

ACDH - Austrian Centre for Digital Humanities

Im Fokus liegt der Ausbau von Forschungsinfrastrukturen für die digitalen Geisteswissenschaften in Österreich und der Aufbau eines Österreichischen Zentrums für Digitale Geisteswissenschaften an der ÖAW. Das ACDH betreibt Forschung in verschiedenen Bereichen der digitalen Geisteswissenschaften und bietet Dienstleistungen für digital arbeitenden Geisteswissenschaften an. Zu den Tätigkeiten gehören unter anderem die systematische Nutzung digitaler Infrastrukturen, Transdisziplinarität, kollaborative Arbeiten der jeweiligen Österreich-Konsortien DARIAH-AT und CLARIN-AT und deren operativen Einbettung.