Humboldt-Universität zu Berlin - Computer- und Medienservice

Humboldt-Universität zu Berlin | Computer- und Medienservice | Aktuelles und Veranstaltungen | Zwischenstand zum Daidalos-Projekt: Eine NLP-Forschungsinfrastruktur in Exploration

Zwischenstand zum Daidalos-Projekt: Eine NLP-Forschungsinfrastruktur in Exploration



Die Digitalisierung eröffnet der Klassischen Philologie neue Perspektiven. Das DFG-geförderte Daidalos-Projekt (2023–2026) entwickelt hierzu eine Forschungsinfrastruktur, die Forschenden den Einstieg und die Anwendung digitaler Methoden erleichtert. Dabei stehen aktuelle Ansätze des Natural Language Processing (NLP) im Mittelpunkt, mit deren Hilfe lateinische und altgriechische Texte neu erschlossen werden können.

Ein Kernanliegen von Daidalos ist es, existierende NLP-Technologien – darunter Part-of-Speech-Tagging, Named Entity Recognition, Sentimentanalyse, Word Embeddings und Topic Modelling – speziell für die Bedürfnisse der Klassischen Philologie nutzbar zu machen. Dadurch werden sowohl sprachgeschichtliche Analysen, etwa zur Veränderung von Wortbedeutungen im Laufe der Zeit, als auch literaturwissenschaftliche Untersuchungen zu spezifischen Motiven oder Konzepten ermöglicht.

Die praxisnahe Entwicklung erfolgt durch Forschungstandems: Forschende bringen konkrete Fragen und Textkorpora ein, das Daidalos-Team unterstützt bei der Auswahl passender NLP-Methoden und begleitet die Evaluierung der Ergebnisse. Auf diese Weise entstehen nutzerfreundliche Werkzeuge, die unmittelbar auf aktuelle Forschungsfragen zugeschnitten sind.

Darüber hinaus setzt Daidalos auf nachhaltige Weiterbildung und methodische Reflexion. Nutzerinnen und Nutzer profitieren von Demo-Workflows in Form von kuratierten Jupyter Notebooks, mit denen sie ihre digitale Kompetenz (Digital Literacy) eigenständig ausbauen können. 

Im Rahmen der angedachten Weiterbildungsmaßnahmen finden Workshops an verschiedenen universitären Standorten statt: In Berlin (Juni 2024) kamen etwa 30 Interessierte zum Thema Word Embeddings zusammen und im Januar dieses Jahres wurde ein zweitägiger Workshop mit dem Thema Sentimentanalyse durchgeführt. Im Juni ist ein weiterer Workshop zum Thema Named Entity Recognition in Freiburg geplant. Bei allen Veranstaltungen gibt es neben einführenden Vorträgen zum jeweiligen Themenschwerpunkt praxisorientierte Hands-on-Übungen, die dank des JupyterHubs der HU leicht via Jupyter Notebooks durchgeführt werden können.

Im Frühjahr 2026 veranstaltet das Daidalos-Projekt zudem an der Humboldt-Universität zu Berlin eine internationale Konferenz zu KI in den historischen Sprachen. Ziel dieser Aktivitäten ist es, digitale Methoden, die Gewinnung digitaler Ressourcen und die entsprechende Forschungskompetenz nachhaltig in der philologischen Forschung zu etablieren und den wissenschaftlichen Austausch in diesem Bereich zu fördern.

 

Plattform: daidalos-projekt.de

 

Kontakt: daidalos-projekt@hu-berlin.de

 

Hinweis: Dieser Text ist eine aktualisierte Version der Veröffentlichung von Dr. Andrea Beyer und Nico Faltin zum Thema Daidalos in der CMS Jahresbroschüre 2023/2024.