Ho scaricato il diritto UE e l’ho messo nel grafo della legge italiana

17/06/20264 min read
Ho scaricato il diritto UE e l’ho messo nel grafo della legge italiana

Risposta diretta: il diritto italiano non vive da solo — recepisce direttive, attua regolamenti, rinvia a norme europee. Per Open·Parlamento ho preso il bulk dump RDF dell'Ufficio Pubblicazioni dell'UE (56.292 atti disponibili), l'ho parsato e ho integrato ~2.312 norme europee nel knowledge graph — regolamenti, direttive, decisioni — ciascuna con identificatori CELEX ed ELI. Il full-text completo via connettore EUR-Lex/CELLAR è il passo successivo. Ecco il metodo e i numeri veri, senza gonfiarli.

TL;DR

  • Fonte: bulk dump RDF dell'Ufficio Pubblicazioni UE — 56.292 atti disponibili.
  • Integrati nel grafo: ~2.312 atti come nodi (43% regolamenti, decisioni, direttive…), arco temporale 1964–2025.
  • Identità: ogni atto ha CELEX + ELI, per collegarlo alle norme italiane che lo attuano o lo recepiscono.
  • Onestà: è metadato + titolo per la maggior parte; il full-text integrale richiede il connettore EUR-Lex/CELLAR, in corso.

Perché il diritto UE serve nel grafo

Una grande fetta della legge italiana è, di fatto, diritto europeo travestito: un decreto legislativo che recepisce una direttiva, una norma nazionale che attua un regolamento. Se il grafo si ferma ai confini italiani, perde metà della storia. Aggiungere il diritto UE permette di rispondere a domande come «quale direttiva attua questo decreto» o «qual è la base giuridica europea di questa norma» — esattamente i collegamenti che oggi richiedono ore di lavoro manuale.

La fonte: il bulk dump dell'Ufficio Pubblicazioni UE

L'UE pubblica i propri atti come dump RDF (modello dati CDM, Common Data Model) attraverso l'Ufficio delle Pubblicazioni. È la via giusta: niente scraping, un dump strutturato e standard. Il dump che ho processato conteneva 56.292 atti legislativi.

Da lì ho estratto, per ciascun atto, i metadati chiave: identificatore CELEX, titolo (in italiano dove disponibile, con fallback all'inglese), data, tipo (regolamento/direttiva/decisione) e autorità emittente.

I numeri reali (niente overclaim)

Voce Valore
Atti disponibili nel dump 56.292
Atti integrati nel grafo ~2.312
Arco temporale 1964–2025
Regolamenti ~43%
Decisioni ~23%
Direttive ~6%
Altro (pareri, ecc.) ~28%

Voglio essere onesto, perché è il principio del progetto: non ho ancora ingerito a testo pieno tutto il diritto UE. Ho integrato migliaia di atti come nodi del grafo (metadati + titolo), e questi nodi sono già navigabili e collegabili alle norme italiane. Il passo successivo è il full-text integrale tramite un connettore EUR-Lex/CELLAR dedicato (SPARQL + content-negotiation su CELLAR), che porterà il corpo degli atti dentro il motore semantico.

Il metodo: RDF + CDM, non scraping

Il parsing è fatto su file RDF con rdflib, interrogando l'ontologia CDM dell'UE. Le difficoltà reali (e dichiarate): una quota di atti aveva RDF malformato o incompleto, alcuni mancavano del titolo italiano, altri avevano metadati parziali. Per questo il tasso di estrazione pulita è stato intorno al 46% — un numero che racconta la realtà dei dump istituzionali, non la brochure.

L'identità condivisa: CELEX ed ELI

Il valore vero non è «avere» gli atti UE, ma collegarli. Ogni atto europeo ha un CELEX (l'ID classico di EUR-Lex) e un ELI: gli stessi identificatori stabili che usiamo per le norme italiane. È ciò che permette di tracciare un arco tra un decreto legislativo italiano e la direttiva che recepisce, o tra una legge e il regolamento UE che attua — il cuore della promessa «legge ↔ legge, senza ambiguità».

FAQ

Hai scaricato tutto il diritto UE?

Ho scaricato il bulk dump completo dell'Ufficio Pubblicazioni UE (56.292 atti) e ne ho integrati ~2.312 come nodi nel grafo. Il full-text integrale di tutti gli atti richiede il connettore EUR-Lex/CELLAR, che è la fase successiva. Preferisco dichiarare i numeri reali piuttosto che dire «tutto».

Cos'è il CELEX?

CELEX è l'identificatore univoco usato da EUR-Lex per ogni atto del diritto dell'Unione. Insieme all'ELI, è la chiave stabile che permette di citare e collegare gli atti UE senza ambiguità, anche con le norme nazionali che li attuano.

Perché integrare l'UE nel grafo della legge italiana?

Perché gran parte della normativa italiana recepisce o attua il diritto europeo. Senza gli atti UE nel grafo, mancano i collegamenti più importanti: quale direttiva sta dietro un decreto, qual è la base giuridica europea di una norma.


Colleghiamo norme italiane ed europee in un unico grafo citabile — con identificatori stabili, non con parafrasi. Vedi come funziona Open·Parlamento, oppure parliamone.

Knowledge GraphDiritto UEOpen DataAI

Scritto da Giulio Garofalo