Details

Technomathematik

Wie ein Computer lesen und verstehen lernt

Computer begleiten unseren Alltag. Wir nutzen sie täglich, tippen Briefe, surfen im Internet. Der Computer ist für uns ein Sprachmittel – doch können die Geräte unsere Wörter und Sätze auch verstehen? "Nein, ein Computer kann die Bedeutung unserer Sprache zunächst nicht erfassen", erklärt Marc Schreiber, Doktorand im Fachbereich Medizintechnik und Technomathematik, "ein PC-Programm erkennt Zeichen, aber keine Sprache an sich".  Er muss es wissen - schließlich will er dem Computer quasi das Lesen beibringen.

Der 27-Jährige beschäftigt sich seit September 2012 im Rahmen seiner Promotion im Forschungsprojekt "ETL QUADRAT" mit dem Thema Natural Language Processing. Hier haben sich die antibodies-online GmbH, einer der weltweit größten Online-Marktplätze für Antikörper und verwandte Forschungsprodukte sowie die ene‘t GmbH, ein unabhängiger Datenbank-Dienstleister für die Strom- und Gaswirtschaft, mit der FH Aachen zu einem Konsortium zusammengeschlossen.

Dass ein Computer die natürliche Sprache prinzipiell nicht begreifen kann, stößt an manchen Stellen auf Probleme, die Schreiber zu lösen versucht. Unternehmen arbeiten mit vielen verschiedenen Dateiformaten, die Sprache enthalten. Ein Computer kann aus diesen Dokumenten keine Bedeutung ableiten. Es ist daher immer noch vonnöten, dass der Inhalt manuell in eine Datenbank übertragen werden muss. Das ist vor allem für kleinere Unternehmen zeitaufwendig und teuer. Hier knüpft die Arbeit von Schreiber an. "Sprache ist sehr vielfältig. Doppeldeutigkeiten beispielsweise kann ein Computer schwer nachvollziehen", erläutert der Doktorand. Der Computer muss also nicht nur die Buchstaben und Wörter, sondern auch die Wortzusammenhänge erkennen können.  "Ich bringe dem PC bei, einzelne Phrasen und deren Beziehungen zueinander zu verstehen", beschreibt Schreiber seine Arbeit.

Um dem Computer solche Anweisungen geben zu können, muss der angehende Doktorand statistische Verfahren programmieren, die den Computer anlernen, natürliche Sprache lesen und semantische Verknüpfungen automatisch interpretieren zu können. Als Technomathematiker ist Schreiber das Bindeglied zwischen der Informatik und der Mathematik. Mithilfe von mathematischen Methoden überträgt er das Problem der Spracherkennung in die Software.

Marc Schreiber hat seine bisherige berufliche Laufbahn dem Computer und seiner Programmierung gewidmet. Nach seinem Abitur hat er an der FH Aachen das Duale Studium Scientific Programming aufgenommen. Neben seinem Bachelor hat er so parallel eine Ausbildung zum Mathematisch-Technischen Softwareentwickler absolviert. Daran schloss er ein Masterstudium in Technomathematik an der FH Aachen an. Hier knüpfte er dann die ersten Kontakte zu Prof. Dr. Bodo Kraft, der nun sein betreuender Professor im Forschungsprojekt ist, das durch das Programm "KMU innovativ" vom Bundesministerium für Bildung und Forschung gefördert wird.  Seine Promotion erfolgt in Kooperation mit der Universität Kassel bei Prof. Dr. Albert Zündorf im Fachbereich Elektrotechnik und Informatik.