Ho scaricato il diritto UE e l’ho messo nel grafo della legge italiana

Risposta diretta: il diritto italiano non vive da solo — recepisce direttive, attua regolamenti, rinvia a norme europee. Per Open·Parlamento ho preso il bulk dump RDF dell'Ufficio Pubblicazioni dell'UE (56.292 atti disponibili), l'ho parsato e ho integrato ~2.312 norme europee nel knowledge graph — regolamenti, direttive, decisioni — ciascuna con identificatori CELEX ed ELI. Il full-text completo via connettore EUR-Lex/CELLAR è il passo successivo. Ecco il metodo e i numeri veri, senza gonfiarli.
TL;DR
- Fonte: bulk dump RDF dell'Ufficio Pubblicazioni UE — 56.292 atti disponibili.
- Integrati nel grafo: ~2.312 atti come nodi (43% regolamenti, decisioni, direttive…), arco temporale 1964–2025.
- Identità: ogni atto ha CELEX + ELI, per collegarlo alle norme italiane che lo attuano o lo recepiscono.
- Onestà: è metadato + titolo per la maggior parte; il full-text integrale richiede il connettore EUR-Lex/CELLAR, in corso.
Perché il diritto UE serve nel grafo
Una grande fetta della legge italiana è, di fatto, diritto europeo travestito: un decreto legislativo che recepisce una direttiva, una norma nazionale che attua un regolamento. Se il grafo si ferma ai confini italiani, perde metà della storia. Aggiungere il diritto UE permette di rispondere a domande come «quale direttiva attua questo decreto» o «qual è la base giuridica europea di questa norma» — esattamente i collegamenti che oggi richiedono ore di lavoro manuale.
La fonte: il bulk dump dell'Ufficio Pubblicazioni UE
L'UE pubblica i propri atti come dump RDF (modello dati CDM, Common Data Model) attraverso l'Ufficio delle Pubblicazioni. È la via giusta: niente scraping, un dump strutturato e standard. Il dump che ho processato conteneva 56.292 atti legislativi.
Da lì ho estratto, per ciascun atto, i metadati chiave: identificatore CELEX, titolo (in italiano dove disponibile, con fallback all'inglese), data, tipo (regolamento/direttiva/decisione) e autorità emittente.
I numeri reali (niente overclaim)
| Voce | Valore |
|---|---|
| Atti disponibili nel dump | 56.292 |
| Atti integrati nel grafo | ~2.312 |
| Arco temporale | 1964–2025 |
| Regolamenti | ~43% |
| Decisioni | ~23% |
| Direttive | ~6% |
| Altro (pareri, ecc.) | ~28% |
Voglio essere onesto, perché è il principio del progetto: non ho ancora ingerito a testo pieno tutto il diritto UE. Ho integrato migliaia di atti come nodi del grafo (metadati + titolo), e questi nodi sono già navigabili e collegabili alle norme italiane. Il passo successivo è il full-text integrale tramite un connettore EUR-Lex/CELLAR dedicato (SPARQL + content-negotiation su CELLAR), che porterà il corpo degli atti dentro il motore semantico.
Il metodo: RDF + CDM, non scraping
Il parsing è fatto su file RDF con rdflib, interrogando l'ontologia CDM dell'UE. Le difficoltà reali (e dichiarate): una quota di atti aveva RDF malformato o incompleto, alcuni mancavano del titolo italiano, altri avevano metadati parziali. Per questo il tasso di estrazione pulita è stato intorno al 46% — un numero che racconta la realtà dei dump istituzionali, non la brochure.
L'identità condivisa: CELEX ed ELI
Il valore vero non è «avere» gli atti UE, ma collegarli. Ogni atto europeo ha un CELEX (l'ID classico di EUR-Lex) e un ELI: gli stessi identificatori stabili che usiamo per le norme italiane. È ciò che permette di tracciare un arco tra un decreto legislativo italiano e la direttiva che recepisce, o tra una legge e il regolamento UE che attua — il cuore della promessa «legge ↔ legge, senza ambiguità».
FAQ
Hai scaricato tutto il diritto UE?
Ho scaricato il bulk dump completo dell'Ufficio Pubblicazioni UE (56.292 atti) e ne ho integrati ~2.312 come nodi nel grafo. Il full-text integrale di tutti gli atti richiede il connettore EUR-Lex/CELLAR, che è la fase successiva. Preferisco dichiarare i numeri reali piuttosto che dire «tutto».
Cos'è il CELEX?
CELEX è l'identificatore univoco usato da EUR-Lex per ogni atto del diritto dell'Unione. Insieme all'ELI, è la chiave stabile che permette di citare e collegare gli atti UE senza ambiguità, anche con le norme nazionali che li attuano.
Perché integrare l'UE nel grafo della legge italiana?
Perché gran parte della normativa italiana recepisce o attua il diritto europeo. Senza gli atti UE nel grafo, mancano i collegamenti più importanti: quale direttiva sta dietro un decreto, qual è la base giuridica europea di una norma.
Colleghiamo norme italiane ed europee in un unico grafo citabile — con identificatori stabili, non con parafrasi. Vedi come funziona Open·Parlamento, oppure parliamone.
Articoli correlati
- Come ho messo Costituzione e codici italiani in un knowledge graphCostituzione e sette codici (penale, civile, procedura, strada, consumo, assicurazioni): ~6.445 articoli ingeriti uno per uno, con identificatori ELI e 86.672 relazioni di modifica autoritative da Normattiva. Ecco metodo, numeri e limiti reali.
- Grafo del Parlamento italiano: perché Camera e Senato non parlano la stessa linguaCamera e Senato pubblicano open data ottimi ma con due ontologie diverse (OCD e OSR): cognome, legislatura, date e relazioni sono modellati in modo incompatibile. Ecco i problemi e come li abbiamo risolti costruendo un grafo unico.
- Open data in Italia: aperti sulla carta, inusabili nella praticaI dati pubblici italiani sono «aperti» per legge ma spesso tenuti malissimo: portali datati, endpoint che rispondono vuoti, certificati rotti, link spuntati, progetti civici abbandonati. Un’analisi documentata, fonte per fonte, da chi li ha dovuti integrare davvero.