Universität des Saarlandes
21.10.2021, 14:39 Uhr
Informatik und Sprachwissenschaft: Das interaktive Kochbuch
Professor Alexander Koller will gemeinsam mit seinen Studenten ein interaktives Kochbuch entwickeln. Dazu gilt es zahlreiche interessante Forschungsfragen seines Faches zu lösen.
Die Computerlinguistik-Studenten Theresa Schmidt und Urs Peter demonstrieren einen Koch-Assistenten, der zu der Idee für ein "Sprechendes Kochbuch" führte.
(Quelle: Iris Maurer, Uni Saarland)
Es ist Pizza-Abend. Man steht in der Küche, hat die Hände voller Mehl und fragt sich: "Wie viel Wasser muss nochmal in den Teig?" Jetzt mit schmutzigen Fingern das Kochbuch oder Tablet anfassen, um das nachzuschlagen, will man eigentlich nicht. Viel angenehmer wäre doch, einfach die Frage stellen zu können und von einem Computer per Sprachausgabe die Antwort zu erhalten. Genau solch ein interaktives Kochbuch will der Computerlinguistik-Professor Alexander Koller entwickeln. Dazu gilt es zahlreiche interessante Forschungsfragen seines Faches zu lösen.
Das Forschungsprojekt "Das interaktive Kochbuch" wird ab November 2021 von der Deutschen Forschungsgemeinschaft (DFG) gefördert. Ziel ist ein Dialogsystem zu entwickeln, das seinen Benutzer interaktiv durch die Zubereitung von Essen führt. Dabei soll sich das System auf die Kocherfahrung des individuellen Nutzers anpassen und auf Rückfragen reagieren. Grundlage dafür bilden Rezepttexte, die zuvor in verschiedenen Arbeitsschritten automatisiert aufbereitet werden.
"Das interaktive Kochbuch" steht stellvertretend für eine grössere Klasse von Dialogsystemen, die einen interaktiven Zugang zu Informationen bieten, die in Textform vorliegen. So könnte die Forschung Grundlage für Systeme sein, die Bauanweisungen geben oder das Lernen klar strukturierter Vorgänge unterstützen.
Die Idee für das interaktive Kochbuch ist in einer Lehrveranstaltung an der Universität des Saarlandes entstanden. "Die Studierenden sollten mithilfe einer speziellen Software namens DialogOS ein beliebiges Dialogsystem entwickeln – also ein System, dass man per Sprachbefehl steuern kann und das mit sprachlichem Output reagiert. Eine Gruppe hatte sich dazu entschieden, einen Koch-Assistenten zu entwerfen", sagt Alexander Koller, der seit 2016 Professor für Computerlinguistik an der Universität des Saarlandes ist. Dabei sei ihm bewusst geworden, dass in dieser Anwendung zahlreiche noch ungelöste Forschungsfragen der Computerlinguistik stecken. Mit dem interaktiven Kochbuch wolle er diese grundsätzlichen Probleme nun angehen.
"Rezepte als Textsorte weisen viele sprachliche Eigenheiten auf, die für Computer schwer zu handhaben sind", erklärt Alexander Koller. So werden zahlreiche Informationen und Anweisungen implizit vorausgesetzt. "Sätze wie 'Gemüse bereitlegen. Schneiden.' sind für uns Menschen leicht verständlich. Dem Computer fehlt aber vor allem bei der Anweisung 'Schneiden.' jegliches Bezugswort, so dass wir Mittel und Wege finden müssen, diese semantischen Verbindungen trotzdem zu erkennen", erklärt Koller. Der Wissenschaftler nutzt dafür verschiedene Methoden aus dem Werkzeugkasten der Künstlichen Intelligenz, etwa das Maschinelle Lernen mit neuronalen Netzen.
Im ersten Schritt wird im Projekt ein Algorithmus entwickelt, der Rezepttexte automatisch in Flussdiagramme übersetzt, die den Ablauf des Kochvorgangs darstellen. Damit das interaktive Kochbuch individuell auf verschiedene Nutzer reagieren kann, müssen die Rezepte in mehreren Abstraktionsstufen analysiert und die Ergebnisse miteinander verknüpft werden. Während in einem Profikochbuch nur "Kartoffeln kochen" steht, wird in einem Anfängerkochbuch auch dieser Schritt ausführlich erklärt. Ziel ist dabei, einen Algorithmus zu entwickeln, der automatisch Rezepte zu einem Gericht online zusammenträgt und in beschriebener Weise aufbereitet.
Auch die Sprachausgabe des interaktiven Kochbuchs ist eine Herausforderung. Die Forscherinnen und Forscher wollen erreichen, dass das Kochbuch nicht nur Versatzstücke aus dem ursprünglichen Rezepttext in der richtigen Reihenfolge wiedergibt, sondern eigene, korrekte Äusserungen generiert. "Bekannte Methoden zur Sprachsynthese wie der Algorithmus GPT-3 können zwar äusserst überzeugend wirkende, sprachlich schöne Texte produzieren – inhaltlich sind diese aber oft mangelhaft. Da es bei Rezepten aber gerade auf inhaltliche Präzision ankommt, müssen wir aufpassen, dass uns der Sprachsynthese-Algorithmus nicht entgleist und Sachen hinzuerfindet, nur weil sie schön klingen", erläutert Koller.
Im letzten Schritt will das Forscherteam seine Ergebnisse evaluieren, indem es das interaktive Kochbuch als App für verschiedene Smart-Home-Geräte veröffentlicht. Eine Kommerzialisierung der Arbeit ist nicht geplant.
Weitere Informationen: https://gepris.dfg.de/gepris/projekt/461220770