Aggiornamenti e modifiche
al sito e alla metodologia
Questa sezione registra in ordine cronologico inverso gli aggiornamenti metodologici, le nuove funzionalità e le modifiche rilevanti all’Informativa sulla Privacy.
Risoluzione canonica delle entità
Tutti i visual del sito mostrano ora il nome canonico delle entità al posto della forma grezza estratta dalla trascrizione.
Il risultato è reso possibile da un nuovo sistema di entity resolution strutturato in tre fasi. La prima ha misurato la dimensione del problema sul corpus esistente — 675 surface form distinte, con PERSON come categoria dominante del problema di disambiguazione. La seconda ha eseguito un processo batch retroattivo sull’intero corpus, popolando la tabella ENTITY_CANONICAL con i nomi di riferimento ufficiali e la tabella ENTITY_ALIAS con le varianti note. La terza ha integrato un worker asincrono nel pipeline giornaliero: per ogni nuova edizione processata, ogni entità estratta da Haiku viene confrontata con il dizionario canonico e, nei casi ambigui, instradata a una coda LLM (PENDING_LLM_REQUESTS) risolta in background da un servizio dedicato (er-llm-worker).
L’effetto visibile è l’eliminazione dei duplicati generati da varianti superficiali dello stesso soggetto — meloni, Meloni, Giorgia Meloni, premier, Presidente del Consiglio confluiscono ora in un’unica voce Giorgia Meloni — e la correzione di attribuzioni editorialmente connotate, come Governo Meloni normalizzato in Governo Italiano. Il Radar Temporale, il Tracking Entità e il Confronto Valenza beneficiano in modo particolare di questa modifica: le entità distinte nel top N riflettono ora soggetti realmente diversi, aumentando la densità informativa dei grafici.
Daily Digest e Weekly Report
La homepage si arricchisce di due nuove sezioni narrative che sintetizzano l’attività editoriale dei telegiornali a due scale temporali distinte.
Il Daily Digest presenta il caso del giorno: l’evento o il tema che ha generato la maggiore divergenza di trattamento tra le testate. Per ciascuna rete viene mostrato il frame apparente adottato, la posizione editoriale e il tono prevalente, rendendo immediatamente visibili le asimmetrie narrative tra i principali telegiornali italiani.
Il Weekly Report offre una lettura di sintesi sull’intera settimana: i topic dominanti, le entità più citate, i silenzi ricorrenti e le tendenze narrative che attraversano le edizioni serali. Il report viene generato automaticamente ogni settimana a partire dall’insieme delle analisi FMSDM disponibili.
Prima pubblicazione
OsservatorioTG è ora pubblicamente accessibile. Il sito pubblica analisi semantiche delle edizioni serali dei principali telegiornali italiani — TG1, TG2, TG3, TG4, TG5, Studio Aperto e TGLa7 — elaborate dal framework FMSDM a partire dalle trascrizioni integrali di ciascuna edizione.
Sono disponibili tre sezioni analitiche: Snapshot, che offre una lettura giornaliera per singolo telegiornale; Timeline, che traccia l’evoluzione di topic ed entità nel tempo; e Arena, che consente il confronto diretto tra testate su una stessa finestra temporale.