Presentazione del Laboratorio di Filologia Collaborativa Presentazione del Laboratorio di Filologia Collaborativa

Le tematiche di ricerca del laboratorio si articolano intorno a tre assi: formalizzazione delle entità e delle relazioni nel dominio della filologia collaborativa; creazione di risorse digitali; progettazione e sviluppo di componenti software.

La formalizzazione degli oggetti di studio della filologia nell'era digitale è il primo obiettivo. L'attenzione è rivolta in particolare al testo, alla variante e all'annotazione: al testo inteso come prodotto di un processo storico; alla variante messa in relazione alle sue coordinate sociali, spaziali e temporali; all'annotazione nelle sue molteplici tipologie, che vanno dall'analisi linguistica al commentario continuo e insistono sul testo con varianti. La formalizzazione delle entità e delle relazioni nel dominio d'indagine coinvolge competenze storico-filologiche, linguistiche, ingegneristiche e logico-matematiche. Questa parte teorica della ricerca è volta alla modellazione del dominio astraendo dai limiti imposti dalle tecnologie correnti, in modo da fornire quadri di riferimento a lungo termine robusti e indipendenti dai singoli progetti.

La creazione di risorse è focalizzata sulle lingue storiche che hanno contribuito alla trasmissione del sapere nel bacino del Mediterraneo antico, medievale e rinascimentale, in special modo Greco, Latino, Arabo, Ebraico, Italiano, nonché altre lingue/dialetti della nostra penisola. Le risorse principali riguardano collezioni di immagini e modelli tridimensionali di text bearing objects, collezioni di testi basate su edizioni di riferimento senza apparato (corpora), collezioni di testi con originale e traduzione in parallelo (corpora paralleli), edizioni diplomatiche ed edizioni critiche digitali, repertori di varianti, repertori di congetture, basi di dati morfosintattiche (treebanks), basi di dati semantico-lessicali (ad esempio wordnets), analisi metriche e tematiche, annotazioni in linguaggio naturale che puntano alle fonti primarie digitalizzate. La generazione delle risorse può essere automatica, semiautomatica o manuale.

La progettazione e lo sviluppo di componenti ha per obiettivo la creazione e il mantenimento di librerie software basate su consolidati design patterns volti ad assicurare l'estendibilità e il riuso dei componenti stessi. All'interno del paradigma di programmazione object oriented, le librerie vengono progettate con sistemi di modellazione language-independent e poi implementate in almeno due dei maggiori linguaggi di programmazione correnti (in particolare Java e Python), per servire le esigenze di più comunità che ne faranno uso. Il framework complessivo che si intende realizzare è orientato alla gestione (editing, visualizzazione, classificazione, retrieval, etc.) di strutture dati che tengono conto della complessità del dominio filologico (ad esempio text retrieval di variantistica oppure editing di molteplici interpretazioni che insistono su più varianti della medesima porzione di testo).

Collaborative Philology Lab - Overview Collaborative Philology Lab - Overview

The main interests of the CoPhiLab are focused upon the formal description of the entities and relations involved in the domain of Collaborative Philology; the creation of digital resources; and the design and implementation of software components.

The first goal relates to the formal modelling of the entities and relations studied within the field of philology, taking into consideration also the development of the field in the digital age. Our attention is focused in particular on the text, on variants and on annotations. The treatment is as follows. The text is understood to be the product of historical procesess. Variants are considered in relation to their social, spatial and temporal coordinates. Annotations associated with a text with variants are treated according to multiple different typologies, such as whether they are part of a linguistic or a philological  analysis or a historical or a philosophical commentary. The formalization of entities and relations involved in the domain of philology requires historical, philological, linguistic, engineering and logico-mathematical competences. This (theoretical) aspect of the research carried out in the CoPhiLab is aimed at the modelling of the domain, independently of the limits imposed by current technologies, in order to provide robust and long-term frameworks, decoupled from specific projects.

The creation of resources is focused on those historical languages that have enabled the transmission of knowledge in the Ancient, Medieval and Renaissance Mediterranean worlds, in particular Greek, Latin, Arabic, Hebrew, as well as the Italian language and its dialects. The main resources include collections of images and three-dimensional models of text bearing objects, collections of texts based on reference editions without critical apparatus (corpora), collections of original texts with parallel translations (parallel corpora), diplomatic and critical digital editions, repertories of variants, repertories of conjectures, morpho-syntactic databases (treebanks), lexico-semantic databases (e.g. wordnets), metrical and thematic analyses, and annotations in natural language, linked to the digital copies of the primary sources. The generation of the resources in question may be automated, semi-automated or manual.

The design and implementation of components aims towards the creation and maintenance of software libraries based on well-known design patterns, in order to ensure the extendibility and the reuse of the components. Following the object oriented programming paradigm, libraries are designed with language-independent modelling systems and implemented in at least two programming languages (e.g. Java and Python), in order to be useful for multiple communities. The general framework is oriented towards the management (i.e. editing, visualization, classification, retrieval, etc.) of data structures that are suitable for the complex needs of the philological domain (e.g. text retrieval of variants or editing of multiple interpretations based on multiple variants of the same textual chunk).