Details
Der schwierige Weg zum leichten Verständnis
Das Internet hat sich zum wichtigsten und beliebtesten Informationsmedium unserer Zeit entwickelt: In Sekundenschnelle findet jede:r Nutzer:in auf (fast) jede Frage eine Antwort. Was ein Vorteil für die meisten Menschen ist, benachteiligt Personen mit Leseeinschränkungen. Menschen mit einer geistigen Behinderung, Demenz oder geringen Deutschkenntnissen haben oft Probleme, die komplexen Texte im Netz zu verstehen. "Es geht dabei nicht nur um die Vermittlung von Wissen", erklärt Prof. Dr. Bodo Kraft, Experte für Wirtschaftsinformatik am Fachbereich Medizintechnik und Technomathematik. "Durch das Bereitstellen von Texten in ‚Leichter Sprache‘ kann den Menschen mit Leseeinschränkungen ein möglichst selbstbestimmtes, unabhängiges und vor allem ein von gesellschaftlicher Teilhabe geprägtes Leben ermöglicht werden."
Begrenztes Angebot
"Leichte Sprache" definiert eine schriftliche Ausdrucksform, die sich durch einfach verständliche Wörter, eine simple Grammatik sowie kurze Sätze auszeichnet. Der Transferprozess von konventionellen Texten zu leichten gestaltet sich jedoch als schwierig. "Die Redakteur:innen übersetzen die Texte heute überwiegend manuell und daher sehr langsam", erklärt Prof. Kraft. "Deswegen existiert derzeit nur ein begrenztes Angebot an Texten in ‚Leichter Sprache‘ im Internet." Der Wissenschaftler hat mit seinem Team hierfür eine Lösung gefunden: Mit Methoden der Künstlichen Intelligenz (KI) soll der Übersetzungsprozess vereinfacht und beschleunigt werden. Für das Projekt "Erstellung und Analyse Leichter Sprache durch Künstliche Intelligenz", kurz ErLeSen, hat das Team eine Zuwendung vom Bundesministerium für Familie, Senioren, Frauen und Jugend (BMFSFJ) in Höhe von knapp 225.000 Euro erhalten.
Algorithmen verarbeiten große Datenmengen
Der Ansatz von Krafts Team basiert auf der Materie des Deep Learning, also der Verarbeitung von großen Datenmengen durch das Training von künstlichen, neuronalen Netzen. Die entwickelte KI extrahiert Informationsbausteine und weist diesen Textabschnitten Bedeutungen zu. Unverständliche Begriffe werden in diesem Zuge identifiziert und durch einfache Synonyme ersetzt. Diese Bedeutungsinhalte aus Ausgangstexten werden in einem Korpus in einer Datenbank gesammelt. Im darauffolgenden Schritt komponiert die KI den Inhalt in Bezug auf die Termini, die Syntax und die Semantik komplett neu, sodass ein Satz mit verständlichen Formulierungen mit gleicher kommunikativer Bedeutung entsteht. "Es reicht nicht aus, die Sätze einfach nur zu verkürzen", erklärt Prof. Kraft, "denn jede Verkürzung führt zu Ungenauigkeit." Um die Verständlichkeit für Leser:innen mit unterschiedlichen Voraussetzungen zu sichern, werden von der KI auch zusätzliche Informationen zur Erklärung von schwierigen Begriffen angeboten.
Individuelle Optimierung
"Unser Verfahren hat feste Lösungsschritte, die individuell bearbeitet werden können, wenn die Übersetzung nicht der Vorstellung entspricht", betont Lars Klöser, wissenschaftlicher Mitarbeiter und Promovend in der Gruppe von Prof. Kraft die Besonderheit ihrer Entwicklung. "Einzelne Stellen können so jederzeit bearbeitet werden." Das Benutzerfeedback an Verbesserungen wird direkt wieder in die KI eingespeist, sodass die neuen Informationen für darauffolgende Verarbeitungsschritte verwendet werden können. Dieser iterative Prozess soll dabei helfen, immer qualitativ hochwertige Ergebnisse zu erzielen. Das Büro für Leichte Sprache in Köln unterstützt das Team bei der Entwicklung: Neben der Sensibilisierung für die Merkmale der Leichten Sprache stellt eine Gruppe von Prüfer:innen sicher, dass die Ergebnisse praxistauglich sind.
Das Ziel der Forschenden ist es, die KI in einer Art Webportal zu veröffentlichen und damit einer breiten Öffentlichkeit zugänglich zu machen. Das Team verspricht sich durch diesen Open-Source-Gedanken eine rasche Verbreitung und somit ein größeres Angebot an Texten in leichter Sprache im Netz.
Verarbeitung von natürlicher Sprache als große Herausforderung
Die Forschungsgruppe um Prof. Kraft konzentriert sich auf das Forschungsgebiet um Natural Language Processing (NLP), der Verarbeitung von natürlicher Sprache. Die Forschungsprojekte und die daraus entstandenen Ergebnisse erleichtern die Verarbeitung großer informeller und textbasierter Dokumentmengen in unterschiedlichen Domänen, die heute manuell kaum noch zu bearbeiten sind. Prof. Kraft ist im Rahmen der Initiative "Civic Coding – Innovationsnetz KI für das Gemeinwohl" Inputgeber für das Bundesministerium für Arbeit und Soziales (BMAS), das Bundesministerium für Umwelt, Naturschutz, nukleare Sicherheit und Verbraucherschutz (BMUV) und das Bundesministerium für Familie, Senioren, Frauen und Jugend (BMFSFJ).
"Die Analyse von natürlicher Sprache bietet auch große Chancen für viele Unternehmen", erklärt Prof. Kraft. "Ein Großteil der Kommunikation und Dokumentation erfolgt in den Unternehmen informell, also textbasiert. Der unternehmerische Nutzen entsteht mit der erfolgreichen Integration in bestehende Arbeitsabläufe und durch die konsequente Umsetzung von Innovationen."