Zum Hauptinhalt springen

Keynotes

Image of Robert Lew

Robert Lew

ist ordentlicher Professor an der Faculty of English der Adam-Mickiewicz-Universität in Poznań und Mitglied der Academia Europaea. Seine Forschungsschwerpunkte konzentrieren sich auf die Wörterbuchnutzung, und er war an zahlreichen Forschungsprojekten beteiligt, die sich unter anderem mit zugangsunterstützenden Elementen, Definitionsformaten, produktionsorientierten Wörterbüchern, Schreibassistenten, digitalen Wörterbuchschnittstellen, dem Training von Wörterbuchkompetenzen sowie zuletzt dem Einsatz von KI in der Lexikographie beschäftigen. Er ist Editor des International Journal of Lexicography (Oxford University Press) und gehört seit 2016 dem EURALEX Board an. Darüber hinaus war er als praktischer Lexikograph für verschiedene Verlage tätig, darunter Harper-Collins, Pearson-Longman und Cambridge University Press. Foto © Dr. Adrian Wykrota

With bots like these, who needs dictionaries?

Date
29. September 2026 um 15:00

Four years after the public launch of ChatGPT, Generative AI has entered many domains, both private and professional, and it is not going away. As anticipated in a prescient presentation at eLex 2019 (The Sintra variations), AI bots have begun to compete with dictionaries as reference tools for language-related tasks. Yet despite the pervasiveness of this emerging technology, dictionaries remain important consultation tools for certain types of language problems, at least for advanced learners, who appear able to choose critically between dictionaries and AI tools depending on the task at hand. At the same time, recent studies comparing the effectiveness of chatbots and dictionaries suggest that AI chatbots are not necessarily more effective than dictionaries—especially bilingual dictionaries—whether measured in terms of immediate success or longer-term learning. Against this empirical backdrop, the talk will sketch the current and near-future roles of dictionaries and AI tools. 


This keynote will be held on Tuesday, 29.9. from 15:00 - 16:00, a stream will be provided.

The full conference programme overview is available here .

Image of Kate Wild

Kate Wild

ist seit fünfzehn Jahren Lexikografin beim 'Oxford English Dictionary' und leitet heute das Programm OED Refresh, das darauf abzielt, veraltete Inhalte im gesamten Wörterbuch in großem Maßstab zu modernisieren, ergänzend zum laufenden Projekt der eintragsweisen Überarbeitung. Darüber hinaus ist sie leitende Redakteurin des Historical Thesaurus beim OED und arbeitet dabei eng mit dem Historical-Thesaurus-Projekt der University of Glasgow zusammen. Zuvor war sie am Historical-Thesaurus-Projekt in Glasgow tätig und als freiberufliche Lexikographin für Collins, Lexical Computing und andere Organisationen. Sie promovierte in englischer Sprache und Linguistik an der University of Glasgow. Zu ihren Forschungsinteressen zählen Thesauri, historische englische Grammatik und Korpuslexikographie. Aktiv beschäftigt sie sich mit der Frage, wie die historische Lexikographie auf gesellschaftliche, kulturelle und technologische Veränderungen reagieren kann, einschließlich der Entwicklungen im Bereich der Künstlichen Intelligenz.

Beyond the Entry: The Evolution of Historical Lexicography at the Oxford English Dictionary

Date
30. September 2026 um 11:30

As the Oxford English Dictionary approaches the centenary of the completion of its first edition, this talk reflects on how the practice and possibilities of historical lexicography have changed over the past century. The first edition of the OED was produced letter by letter and entry by entry, culminating in the publication of its final volume in 1928. Alphabetical order is no longer a constraint, and for the past two decades entries have been selected for revision according to criteria such as cultural significance, semantic complexity, and user feedback, enabling more dynamic and targeted updates. In recent years there has been a further development in that the individual entry is no longer the only, or even the primary, unit of revision. Alongside traditional entry-by-entry revision, the OED is now undertaking systematic improvements to components across the text, sometimes supported by computational methods and AI. Key goals for the centenary include the addition of recent quotation evidence to all senses in current use, the modernization of outdated defining language across the dictionary, and the inclusion of etymologies and variant forms lists in all entries.  

Looking beyond the text itself, the OED is also engaged in initiatives that position it increasingly as a digital dataset as well as a dictionary. These include the development of a historical corpus both as a tool to support editorial work and as a resource to complement OED data; and (in collaboration with the Historical Thesaurus team at the University of Glasgow) the further development and improvement of the Historical Thesaurus taxonomy, both as a structured dataset linked to the OED and as a tool which can support historical word sense disambiguation and other types of data analysis.  

The argument advanced in this talk is not that historical lexicography should abandon its entry-by-entry craft, but that its future depends on combining that craft with methods designed for the dynamic, linked, data-rich digital environments in which dictionaries now live. 


This keynote will be held on Wednesday, 30.9. from 11:30 -12:30, a stream will be provided.

The full conference programme overview is available here .

Image of Andreas Baumann

Andreas Baumann

ist Assistenzprofessor für Digitale Linguistik am Institut für Germanistik der Universität Wien. Zu seinen akademischen Tätigkeiten zählen Gastforschungsaufenthalte an der Universität Stellenbosch und der Universität Turin, Lehrtätigkeiten an der AMU in Poznań sowie eine Gastforschertätigkeit am Austrian Center of Digital Humanities (ÖAW). Mit einem multidisziplinären Hintergrund in Linguistik, Mathematik und Kognitionswissenschaft widmet sich Andreas der Modellierung von Sprachevolution und Sprachwandel. Er analysiert dynamische Systeme, um die Evolution sprachlicher Elemente wie Wörter und ihre Semantik theoretisch zu modellieren, und untersucht deren Dynamiken empirisch anhand großer historischer Textkorpora und psycholinguistischer Datenbanken. Andreas hat zwei Digital-Humanities-Projekte mitgeleitet – eines zur Erforschung kurzfristiger semantischer Veränderungen im Österreichischen Deutsch mittels lexikalischer Netzwerke und ein weiteres zur Anwendung dynamischer Sentimentanalyse auf österreichische Mediendaten – und ist derzeit Principal Investigator des Projekts Disentangling effects of digitization on linguistic diversity.

Polysemy: Operationalization, emergence, perception, and the human in the loop

Date
1. Oktober 2026 um 11:30

In lexica of natural languages, polysemy is the rule rather than the exception. Understanding why it is so prevalent - given that the presence of multiple senses for a single form, from a purely semiotic point of view, constitutes ambiguity - and how it emerges is central to lexicology. Addressing this question, of course, requires proper operationalization of polysemy in the first place. A robust, straight forward, and commonly used way of measuring the polysemy of a word is simply counting the number of sense entries in a lexicographically curated resource. Such an approach, however, neglects the relative frequencies of a word’s senses as well as how similar senses are to each other. By integrating lexicographic and corpus data, I will discuss frequency and similarity aware measures of polysemy, originating from quantitative ecology (Leinster & Cobbold, 2012, Ecology), and how they relate to ratings of subjectively perceived polysemy, gathered through crowdsourcing efforts. I will then discuss the roles that frequency and acquisition play in the emergence of polysemy (Baumann & Hartmann, 2016, Cognition). Finally, I will zoom in on one specific dimension of meaning: lexical sentiment. I show that variation in human sentiment annotations correlates well with how emotional polysemy is subjectively perceived, but that purely NLP based approaches in fact struggle with appropriately capturing subjective emotional ambiguity. I take this to stress the relevance of ‘the human in the loop’ also in lexical and lexicographic research. 


This keynote will be held on Thursday, 1.10. from 11:30 -12:30, a stream will be provided.

The full conference programme overview is available here .

Image of Ana Salgado

Ana Salgado

beschreibt sich selbst ganz einfach als Lexikographin. Sie begann ihre Karriere bei Porto Editora, wo sie mehrere Jahre an großen Wörterbuchprojekten arbeitete – eine Erfahrung, die die praktische und redaktionelle Dimension ihrer Arbeit prägte. Derzeit ist sie Präsidentin des Instituto de Lexicologia e Lexicografia da Língua Portuguesa an der Akademie der Wissenschaften von Lissabon, wo sie das "Dicionário da Língua Portuguesa", das "Vocabulário Ortográfico da Língua Portuguesa" und Fachwörterbücher koordiniert. Darüber hinaus ist sie Assistenzprofessorin an der Fakultät für Geisteswissenschaften der Universität Porto und Forscherin am CLUP (Zentrum für Linguistik der Universität Porto). Sie promovierte im Bereich Übersetzung und Terminologie (Spezialisierung auf Terminologie) von der NOVA-Universität Lissabon und einen Abschluss in Lusitanistik von der Universität Porto. An der Akademie der Wissenschaften von Lissabon leitet sie das von La Caixa geförderte Projekt ACL+ – Linguagem, Cultura e Inclusão Digital, das den universellen Zugang zu portugiesischen lexikographischen Ressourcen fördert und die digitale Inklusion stärkt. Sie arbeitet mit ISO im Bereich der Modellierung lexikographischer Daten zusammen, wirkt in Arbeitsgruppen von DARIAH mit und leitet gemeinsam mit anderen die Arbeitsgruppe 1 von ENEOLI, die sich der Entwicklung eines mehrsprachigen Glossars zur Neologie widmet. Ihre Forschungsschwerpunkte sind Lexikographie, Terminologie, digitale lexikalische Ressourcen und TEI-basierte Datenmodellierung.

Dictionaries as Pipelines: Lexicographic Work at the Lisbon Academy of Sciences

Date
2. Oktober 2026 um 11:30

This keynote reframes dictionary-making as the design of a living, governed pipeline: a system that turns linguistic evidence into publishable lexical knowledge while keeping editorial decisions traceable and revisable. Drawing on current work at the Lisbon Academy of Sciences across a portfolio of initiatives, it shows how this pipeline supports complementary goals: a continuously updated Dicionário da Língua Portuguesa (DLP), inclusive and participatory lexicographic practices (ACL+), a collaborative lexicographic platform mapping variation across the Community of Portuguese Language Countries (CPLP) via the Atlas Lexicográfico da Língua Portuguesa (ALLP), and the reuse of lexical data in infrastructures and language technologies (PORTULAN). 

The pipeline starts by converting legacy materials into structured, machine-actionable data (such as XML) and by applying consistent normalisation and TEI-based annotation. Evidence is then continuously gathered from corpora, query logs, and community contributions, and assessed through a combination of quantitative signals and expert editorial judgement. A central theme is governance: how inclusion and revision decisions are documented, reviewed, and made auditable—especially when balancing pluricentric Portuguese. 

Extending the pipeline from dictionary entries to atlas-style knowledge, ALLP illustrates how lexical description can also support cartography of variation, combining curated entries with usage evidence and, where relevant, multimedia documentation. The keynote concludes with practical lessons—what scales well, what slows teams down, and how to monitor quality over time. 


This keynote will be held on Friday, 2.10. from 11:30 -12:30, a stream will be provided.

The full conference programme overview is available here .

Image of Jan Hajič

Jan Hajič

ist Professor für Computerlinguistik am Institute of Formal and Applied Linguistics der School of Computer Science an der Karls-Universität in Prag, Tschechien. Seine Forschungsinteressen umfassen grundlegende formallinguistische Fragestellungen, maschinelle Übersetzung, tiefes Sprachverständnis und deren Anwendungen. Er hat Ressourcen für zahlreiche Sprachen mit umfangreicher linguistischer Annotation entwickelt. Derzeit leitet er die standortübergreifende Forschungsinfrastruktur für offene Sprachressourcen in Tschechien, LINDAT/CLARIAH-CZ, und koordiniert zwei EU-Projekte zum Aufbau großer Sprachmodelle: HPLT und OpenEuroLLM. Seine berufliche Erfahrung umfasst sowohl die industrielle Forschung (IBM Research, Yorktown Heights, NY, USA) als auch die akademische Tätigkeit (Karls-Universität Prag, Johns Hopkins University und University of Colorado, USA; Fellow des Centre for Advanced Studies der Norwegischen Akademie der Wissenschaften, neben weiteren Tätigkeiten). Er hat mehr als 200 wissenschaftliche Arbeiten veröffentlicht, die insgesamt rund 16.000 Mal zitiert wurden. Zudem ist er Vorsitzender oder Mitglied zahlreicher internationaler und nationaler Gremien und Ausschüsse.

Large Language Models, Symbolic Meaning Representations and Ontologies: Perspectives and Questions

Date
3. Oktober 2026 um 11:30

In the talk, I will present the basics of Large Language Models (LLMs) and the status of the European LLM developments, in particular the OpenEuroLLM project that aims to develop open, multilingual foundational models in Europe and its challenges. I will then move on to summarise some recent developments on the other side of the research spectrum: symbolic meaning representations and latest developments of the most prominent ones, such as the Uniform Meaning Representation and the Prague Dependency Treebank. Such representations make heavy use of lexical resources – and I will show how these can be linked together and unified for making current and future meaning representation annotation efforts more consistent, while preserving all the information and alignment between form (plain text) and the representations. Towards the end of the talk, I will connect the current work on LLMs and meaning representations by postulating new research questions for which we now have resources and tools to work on.


This keynote will be held on Saturday, 3.10. from 11:30 -12:30, a stream will be provided.

The full conference programme overview is available here .