Ein Amerikaner und der Tiroler Dialekt
By Rosmarie Hagleitner

Seine Faszination für Kleinsprachen und Dialekte führte Jay Hevelone aus Fort Collins in Colorado vor zwei Jahren nach Südtirol. Er spricht perfekt Deutsch und Italienisch und hat sogar die Zweisprachigkeitsprüfung abgelegt. Besonders bemerkenswert ist, dass er auch noch verschiedene bairische Dialekte versteht und spricht, zu denen auch der Südtiroler Dialekt zählt. In seiner Abschlussarbeit im Masterstudiengang Angewandte Linguistik an der Fakultät für Bildungswissenschaften der unibz befasste er sich intensiv mit dem Südtiroler Dialekt, der für viele nicht nur die Alltagssprache, sondern auch ein wichtiger Teil ihrer kulturellen Identität darstellt.
Im Rahmen seiner Masterarbeit hat Jay Hevelone ein neuronales Netzwerk entwickelt, das gesprochene Dialekttexte versteht und in eine Schriftsprache übertragen kann. Das ist von besonderer Relevanz, da es bislang kaum technische Lösungen zur automatisierten Verarbeitung dieser Sprachvarianten gibt.
Ein neuronales Netz ist die Architektur eines Programms oder Modells des maschinellen Lernens. Es ermöglicht diesem, Entscheidungen auf ähnliche Weise zu treffen, wie das menschliche Gehirn. Das Modell von Jay Hevelone lernt in zwei Phasen. Zunächst wird das neuronale Netzwerk mit Audiodateien ohne entsprechende Texttranskription trainiert, wobei Muster und wiederkehrende Strukturen in der Sprache erkannt werden, jedoch nicht die Bedeutung der Laute in Form von graphemischen Wörtern. In der zweiten Phase werden dem Modell die Dateien mit dem transkribierten Text bereitgestellt. „Dadurch lernt es, den erkannten Mustern und Lauten – auch ob eine Frau, ein Mann oder ein Kind spricht – konkrete Schreibweisen zuzuordnen. Das Modell muss verstehen, dass beispielsweise das Wort ‚der‘ im Tiroler Dialekt als ‚dr‘ oder ‚dor‘ geschrieben werden kann‘, erklärt Jay Hevelone. Die Variabilität der dialektalen Schreibweise stellte eine besondere Herausforderung dar, da es keine einheitliche Orthographie für den Dialekt gibt. Daher entwickelte der Student eine eigene Schreibnorm, die als Grundlage für das Training diente. Auch wenn ihm der Südtiroler Dialekt sehr vertraut ist, setzte der Student bei der Datenerstellung auf authentische Quellen. Er nutzte ein im Dialekt geschriebenes Buch als schriftliche Grundlage, die Sprachaufnahmen erstellte er mit Muttersprachlern - so entstand das Trainingsgerüst für sein neuronales Netzwerk.
Ein Modell, wie Hevelone es entwickelt hat, könnte vielfältig angewendet werden, beispielsweise zur automatischen Transkription von Dialekt-Audioaufnahmen – sei es für die Erstellung von Untertiteln oder Spracherkennungsprogrammen. In ähnlicher Weise wie bei der Diktierfunktion auf Smartphones könnte das System gesprochene Dialekte in geschriebene Texte umwandeln. Es handelt sich dabei aber nicht um ein Übersetzungstool im klassischen Sinn, sondern um eine Technologie, die gesprochene Sprache originalgetreu in eine schriftliche Form überträgt.
Wie kommt ein Amerikaner auf die Idee, den Tiroler Dialekt in den Mittelpunkt seiner Masterarbeit zu stellen? Jay Hevelone, der bereits vor 13 Jahren auf der High School seine ersten Deutschkenntnisse erlangte, hat sich schon immer für Kleinsprachen und Dialekte interessiert. Während eines einjährigen Aufenthaltes in Regensburg kam er erstmals mit bairischen Dialekten in Kontakt. Die Entscheidung an der Freien Universität Bozen zu studieren, wurde maßgeblich durch die Zweisprachigkeit der Region sowie durch seine Faszination für den bairischen Dialekt beeinflusst – Südtirolerisch ist im linguistischen Sinne ein bairischer Dialekt – den er hier erlenen konnte.
Mit seiner Masterarbeit wollte Jay Hevelone zeigen, dass es möglich ist, eine Technologie zur automatisierten Verarbeitung des Tiroler Dialekts zu entwickeln – trotz der Herausforderung, dass Dialekte zu den sogenannten Kleinsprachen gehören und es daher keine großen Datensätze gibt, wie für Sprachen wie Standarddeutsch, Englisch oder Chinesisch. Zudem legte er besonderen Wert auf den linguistischen Aspekt und die damit einhergehende linguistische Vielfalt innerhalb des Tiroler Dialekts. In Südtirol existieren zahlreiche Varianten – sowohl in der Aussprache als auch in der Schreibweise. Das Modell wurde daher so trainiert, dass es diese Variationen berücksichtigt. Diese Flexibilität war dem Master-Studenten besonders wichtig, denn für ihn ist der Dialekt mehr als nur ein Kommunikationsmittel: „Dialekt ist auch eine Form von Identität – und die wollte ich mit meinem Modell bewahren“, erklärt der Amerikaner mit einer großen Affinität zum Südtiroler Dialekt.