Alexa und der Dialekt
By Birgit Alber, Joachim Henri Kokkelmans
In der breiten Debatte über Künstliche Intelligenz – von Analysen zu den Veränderungen, die sie in unserem täglichen Leben bewirken wird, bis hin zu berechtigten Fragen über ihre ethischen Implikationen – gibt es ein Thema, das vielleicht etwas unter dem Radar geblieben ist: Wie wirken sich KI und die zunehmende Verbreitung von Geräten, die auf dieser Technologie basieren, auf die sprachliche Vielfalt aus? Im Oktober des vergangenen Jahres haben wir im Rahmen des Projekts „AlpiLinK - Alpine Sprachen im Kontakt“ bei der mit Oberschulen durchgeführten Veranstaltung VinKiamo ein kleines Experiment durchgeführt: Gemeinsam mit den Schülern und Schülerinnen haben wir einige Sprachassistenten und Anwendungen getestet, die auf generativer KI basieren. Als wir einen der beliebtesten Assistenten auf Grödnerisch angesprochen haben, erhielten wir eine Antwort auf Albanisch, die nichts mit der Frage zu tun hatte. Bei den anderen Geräten war es nicht viel besser, die Antworten waren unbefriedigend. KI-basierte Anwendungen sind nicht darauf trainiert, Sprachvarietäten oder Dialekte von Minderheiten zu erkennen, weil die Datenbanken, auf die sie zugreifen können, weder mündlich noch schriftlich ausreichend hergeben.
Meta, der große Tech-Riese, der unter anderem Facebook, Instagram und WhatsApp kontrolliert, entwickelt derzeit ein Übersetzungssystem für ungeschriebene Sprachen, die immer noch einen beträchtlichen Teil der Weltsprachen ausmachen. Erste Tests wurden mit Hokkien durchgeführt, einer Sprache, die von Millionen Menschen in Taiwan gesprochen wird. Anders sieht es bei Minderheitensprachen aus: Um KI-basierte Algorithmen zu trainieren, werden große Datenmengen benötigt, die in diesem Fall weder mündlich noch schriftlich vorliegen. Mit dem Projekt AlpiLinK bauen wir die größte italienische Datenbank für Dialekte und Minderheitensprachen des italienischen Alpenbogens auf, die auf einer Crowdsourcing-Plattform implementiert wird und der gesamten Bevölkerung offen steht.
Ein Thema, das neue und noch unbeantwortete Fragen aufwirft: Wie können wir sicherstellen, dass die zunehmende Verbreitung von KI die sprachliche Vielfalt nicht beeinträchtigt? Sprachassistenten werden vielfach zu Hause verwendet, also in einem Umfeld, in dem besonders häufig Dialekt gesprochen wird. Um diese Geräte nutzen zu können, muss leider die eigene Sprache "verändert" werden, wenn KI keinen Dialekt versteht. Und nicht nur das: Es gibt Sprachvarietäten, wie z.B. die Tiroler Dialekte in unserer Region, die nicht nur in informellen Kontexten verwendet werden, sondern auch in vielen formellen Situationen wie etwa Geschäftsbesprechungen. Auch hier stellt sich die Frage nach dem Zugang zu Technologie. Die Tatsache, dass es nicht möglich ist, die fortschrittlichsten KI-Tools zu nutzen, die Sitzungen aufzeichnen und anschließend einen detaillierten Bericht liefern, stellt zweifellos eine Einschränkung dar und birgt die Gefahr, dass eine Änderung des Sprachgebrauchs „erzwungen“ wird. Projekte wie AlpiLink können ein erster Schritt zur Integration von Minderheitensprachen in neue Technologien sein.