Skip to content

Free University of Bozen-Bolzano

Linguistics Artificial intelligence Society

Alexa und der Dialekt

Die Künstliche Intelligenz droht den Gebrauch von Dialekten einzuschränken, warnen die Germanisten Prof.in Birgit Alber und Joachim Kokkelmans. Ihr Projekt AlpiLinK arbeitet dagegen an.

By Birgit Alber, Joachim Henri Kokkelmans

Alexa-Box vor rotem Hintergrund
Wenn KI-basierte Sprachassistenten wie Alexa keinen Dialekt verstehen, droht eine Änderung des Sprachgebrauchs. Foto: unibz

In der breiten Debatte über Künstliche Intelligenz – von Analysen zu den Veränderungen, die sie in unserem täglichen Leben bewirken wird, bis hin zu berechtigten Fragen über ihre ethischen Implikationen – gibt es ein Thema, das vielleicht etwas unter dem Radar geblieben ist: Wie wirken sich KI und die zunehmende Verbreitung von Geräten, die auf dieser Technologie basieren, auf die sprachliche Vielfalt aus? Im Oktober des vergangenen Jahres haben wir im Rahmen des Projekts AlpiLinK - Alpine Sprachen im Kontakt“ bei der mit Oberschulen durchgeführten Veranstaltung VinKiamo ein kleines Experiment durchgeführt: Gemeinsam mit den Schülern und Schülerinnen haben wir einige Sprachassistenten und Anwendungen getestet, die auf generativer KI basieren. Als wir einen der beliebtesten Assistenten auf Grödnerisch angesprochen haben, erhielten wir eine Antwort auf Albanisch, die nichts mit der Frage zu tun hatte. Bei den anderen Geräten war es nicht viel besser, die Antworten waren unbefriedigend. KI-basierte Anwendungen sind nicht darauf trainiert, Sprachvarietäten oder Dialekte von Minderheiten zu erkennen, weil die Datenbanken, auf die sie zugreifen können, weder mündlich noch schriftlich ausreichend hergeben. 

Porträtbild von Prof.in Birgit Alber.
Prof.in Birgit Alber. Foto: unibz

Meta, der große Tech-Riese, der unter anderem Facebook, Instagram und WhatsApp kontrolliert, entwickelt derzeit ein Übersetzungssystem für ungeschriebene Sprachen, die immer noch einen beträchtlichen Teil der Weltsprachen ausmachen. Erste Tests wurden mit Hokkien durchgeführt, einer Sprache, die von Millionen Menschen in Taiwan gesprochen wird. Anders sieht es bei Minderheitensprachen aus: Um KI-basierte Algorithmen zu trainieren, werden große Datenmengen benötigt, die in diesem Fall weder mündlich noch schriftlich vorliegen. Mit dem Projekt AlpiLinK bauen wir die größte italienische Datenbank für Dialekte und Minderheitensprachen des italienischen Alpenbogens auf, die auf einer Crowdsourcing-Plattform implementiert wird und der gesamten Bevölkerung offen steht.

Porträtbild von Forscher Kokkelmans auf Gang von Campus Brixen
Forscher Joachim Kokkelmans. Foto: unibz

Ein Thema, das neue und noch unbeantwortete Fragen aufwirft: Wie können wir sicherstellen, dass die zunehmende Verbreitung von KI die sprachliche Vielfalt nicht beeinträchtigt? Sprachassistenten werden vielfach zu Hause verwendet, also in einem Umfeld, in dem besonders häufig Dialekt gesprochen wird. Um diese Geräte nutzen zu können, muss leider die eigene Sprache "verändert" werden, wenn KI keinen Dialekt versteht. Und nicht nur das: Es gibt Sprachvarietäten, wie z.B. die Tiroler Dialekte in unserer Region, die nicht nur in informellen Kontexten verwendet werden, sondern auch in vielen formellen Situationen wie etwa Geschäftsbesprechungen. Auch hier stellt sich die Frage nach dem Zugang zu Technologie. Die Tatsache, dass es nicht möglich ist, die fortschrittlichsten KI-Tools zu nutzen, die Sitzungen aufzeichnen und anschließend einen detaillierten Bericht liefern, stellt zweifellos eine Einschränkung dar und birgt die Gefahr, dass eine Änderung des Sprachgebrauchs „erzwungen“ wird. Projekte wie AlpiLink können ein erster Schritt zur Integration von Minderheitensprachen in neue Technologien sein.