Afrikanische Sprache "Fon"Student entwickelt Übersetzungssoftware für eine afrikanische Sprache
Wenn seine Mutter ihm Sprachnachrichten in ihrer Sprache "Fon" schickt, versteht Bonaventure Doussau sie kaum. Dem Studenten fehlen Gestik und Mimik. Also entwickelt er selbst eine Übersetzungssoftware, was wegen fehlender Datengrundlage aber gar nicht so einfach ist.
In Afrika gibt es über 2000 Sprachen – viele davon werden von Generation zu Generation nur mündlich weiter gegeben, gemeinsam mit der Tradition, die diesen Sprachen innewohnt.
Die Sprache von Bonaventure Doussaus Mutter ist "Fon". Er hat sie kaum gelernt, da er in seiner Heimat Benin sechs Tage die Woche von morgens bis abends in der Schule war, wo nur Französisch gesprochen wurde.
Bonaventure versteht seine Mutter kaum
Als er zum Studium von zu Hause weg war, schickte seine Mutter ihm Sprachnachrichten, doch Bonaventure verstand sie kaum, da ihm Gestik und Mimik fehlten. Das war sehr traurig für ihn, da seine Mutter ihm sehr liebevolle Nachrichten schickt, die ihm viel bedeuten, erzählt er unserer Reporterin Felicitas Boeselager.
"Sie hat mir diese Nachricht an einem Montag geschickt und wünscht mir einen guten Start in die Woche und dass Gott mit mir sein möge und der Heilige Geist, also das war eine Art Gebet für mich."
Bonaventure Doussaus Vater ist Architekt und legt viel Wert auf eine gute Ausbildung, berichtet der 23-Jährige, der Data-Engineering in Bremen studiert. Schon mit 17 Jahren war Bonaventure über ein Stipendium in Russland. Weil ihm die Sprachbarriere zu schaffen machte, brachte sich der Student selbst das Programmieren bei und las viele Bücher über künstliche Intelligenz.
Übersetzungssoftware für afrikanische Sprachen selbst programmieren
Gemeinsam mit einem Kommilitonen beschloss er, ein Übersetzungsprogramm für seine Muttersprache zu entwickeln. Das war allerdings leichter gesagt als getan, denn Fon ist, wie viele afrikanische Sprachen, eine mündliche Sprache, es gibt keine Texte, mit denen Bonaventure seine KI füttern konnte, sagt er.
"Wir können keine Künstliche Intelligenz ohne Daten bauen."
Um die KI einer Übersetzungssoftware mit Datensätzen zu füttern, musste der Student an Daten kommen. Das war gar nicht so leicht, denn für Fon gibt es kein Wörterbuch. Nur Bibelausgaben, deren Sprache aber zu veraltet und deshalb ungeeignet ist.
25.000 Datensätze über Social Media gesammelt
Also rief Bonaventure über die sozialen Medien dazu auf, ihm Sätze auf Fon zu schicken, die häufig verwendet werden, um an eine gute Datengrundlage zu kommen. Knapp 25.000 Satzpaare, jeweils auf Fon und Französisch, bekam er so zusammen. Das sei immerhin etwas, sagt Bonaventure, auch wenn der Datensatz noch sehr klein sein. Über die Beschäftigung mit der Sprache hat er sie inzwischen recht gut gelernt und kann seine Mutter besser verstehen.
"Wir haben auf Facebook, Instagram und Twitter Umfragen gepostet, dort sollten die Menschen fünf bis zehn Sätze in Fon eintragen, die sie am meisten benutzen."
Und er hat noch ein zweites Problem in Angriff genommen: Für Fon gibt es keine Handy-Tastatur. Was aber wichtig wäre, denn die Sprache besitzt viele spezielle Buchstaben und Akzente. Zusammen mit einem Freund hat Bonaventure nun eine eigene Tastatur für Fon programmiert. Darauf ist er sehr stolz.
Demoversion läuft gut
Auf seinem Computerbildschirm läuft die Demoversion seiner Übersetzungssoftware. Unsere Reporterin hat sie ausprobiert und liest dort die Worte "Ich liebe dich sehr, meine Mutter."
Bonaventure sagt, dass die Software schon gut funktioniere, er müsse die Datensätze noch etwas bereinigen, dann könnte sie schon bald online stehen. Er hofft, dass mit seiner Übersetzungssoftware irgendwann auch andere mündliche afrikanische Sprachen übersetzt werden können.