Licenses folks

# Licenses folks Su twitter è partita una discussione - che si è suddivisa in diversi rami - su un vecchio e importante problema: la **poca "compatibilità"** tra le **licenze più usate in Italia** per i dati e il mondo **Wikimedia**, **Wikidata**, **OpenStreetMap**. Questo ad esempio un ramo del *thread* [https://twitter.com/GiorgiaLodi/status/1045273277256671232](https://twitter.com/GiorgiaLodi/status/1045273277256671232). [![](https://i.imgur.com/jOubuVE.jpg)](https://twitter.com/mindrones/status/1046754687024812034) L'immagine di sopra è una rappresentazione del thread, a cura di [Luca Bonavita](https://twitter.com/mindrones/status/1046754687024812034). ## Criticità ### Incompatibilità tra le licenze opendata più diffuse e progetti come OpenStreetMap La CC BY 4.0 è una licenza molto usata in Italia per i dati aperti ed è ammessa da https://opendefinition.org/licenses/, ma non è considerata compatibile con OpenStreetMap da OSMF: https://blog.openstreetmap.org/2017/03/17/use-of-cc-by-data/ > [name=Maurizio Napolitano] il problema principale è nella gestione della attribuzione in quanto, OpenStreetMap, la cambia Questo vale per qualsiasi licenza di attribuzione Nel caso specifico della versione 4.0 si aggiunge anche il vincolo della gestione del drm che è molto differente rispetto a quello della odbl Pertanto la soluzione è quello di chiedere il permesso per l'importazione ### Standard per l'open by default L'[art. 52, comma 2 del CAD](http://www.normattiva.it/uri-res/N2Ls?urn:nir:stato:decreto.legislativo:2005-03-07;82~art52!vig=) è di difficile applicazione se non c'è un modo standard di rappresentare questo stato giuridico. Un chiarimento potrebbe assicurare che tutti i dataset prodotti dalla PA sono CC0 fino a prova contraria (esplicita diversa indicazione). AgiD [nelle linee guida del patrimonio informativo pubblico](https://lg-patrimonio-pubblico.readthedocs.io/it/latest/licenzecosti.html) parla di CC BY 4.0 e «attribuzione automatica di tale licenza nel caso di applicazione del principio "Open Data by default"» ma non è chiaro: 1) lo stato giuridico di tale raccomandazione; 2) che cosa significhi "nel caso di applicazione"; 3) secondo quale logica giuridica l'assenza di azione dell'amministrazione possa risultare in un'aggiunta di restrizioni rispetto a quelle esplicitamente enumerate dal CAD. > [name=matt_fortini (Matteo Fortini)] Aggiungo un dubbio sugli obiettivi delle licenze: > * Scelgo CC perché voglio che la conoscenza sia patrimonio di > tutti, soprattutto quando prodotta con denaro "di tutti" > * Scelgo BY, o NC, o ND, perché voglio gestire *come* questa conoscenza sia condivisa > > In particolare, -BY tutela la "proprietà intellettuale". A questo punto: > * la P.I. sarebbe piuttosto della persona, che dell'ente (a meno di accordi di cessione, che vanno verificati) > * nel caso di molti dati "derivati", che si basano su opere, lavori, raccolte di dati (es. cataloghi beni culturali, ma anche bilanci, statistiche ISTAT, ...), c'è effettivamente un lavoro intellettuale, ma mi chiedo quale sia il giovamento a tutelarlo. Se non il fatto che, chiedendo la citazione, si è poi responsabili del dato. > * fra le PA l'attribuzione rischia di diventare sia un freno, sia un ginepraio. Si immagini una PA che copi un documento da più PA diverse, e che in calce debba scrivere "capitolo 1 CC-BY comune di ..., capitolo 2 CC-BY regione ..." > [name=Sannita (Luca Martinelli)] > Concordo su tutto. Inoltre, paradossalmente il rischio con un database rilasciato in CC BY è che possa eventualmente incorporare al suo interno dati provenienti da un database rilasciato in CC0 (es. Wikidata), ma che non si possa fare il contrario. > Senza contare che l'attribuzione "forzata" di un determinato dato rischia di essere un problema non da poco se viene riutilizzato all'interno di un'app (es. l'indirizzo di una biblioteca in un navigatore satellitare). Anche per questa ragione, mi fu spiegato in ICCU che l'Anagrafe delle biblioteche fu rilasciata appositamente in CC0 per permettere il riuso dei dati all'interno dell'app di SBN e di altre iniziative di riuso (commerciale). > Su Wikidata, peraltro, la derivazione di determinati dati viene riconosciuta tramite il campo "fonte". In altre parole, esiste un campo dedicato dove poter inserire da dove viene preso un determinato dato, compilabile tanto a mano quanto automaticamente. ### Confusione fra strumenti giuridici Molte PA sembrano mescolare strumenti giuridici diversi come diritti morali, copyright, diritti d'immagine, privacy, diritti *sui generis* (quelli sulle banche dati) e Codice dei beni culturali. Le [linee guida](https://lg-patrimonio-pubblico.readthedocs.io/it/latest/licenzecosti.html) alimentano tale confusione, laddove suggeriscono erroneamente che le licenze per copyright e diritti *sui generis* possano avere effetti sul «rispetto di altre normative (e.g., norme in materia di protezione dei dati personali)» quando ciò è generalmente falso ed è espressamente escluso dagli articoli [4(c) della CC0](https://creativecommons.org/publicdomain/zero/1.0/legalcode.it) e [2(b)(1)](https://creativecommons.org/licenses/by/4.0/legalcode.it#s2b1) nonché [5(a)](https://creativecommons.org/licenses/by/4.0/legalcode.it#s5a) della CC BY 4.0. ### Il problema dell'attribuzione dell'opera originaria > [name=Sannita (Luca Martinelli)] > Si pensa *erroneamente* che la CC0, essendo una dichiarazione di rinuncia e non una licenza d'uso vera e propria (come la CC BY), non permetta o addirittura costringa l'autore di un'opera a rinunciare ai propri "diritti morali" (fra cui la corretta attribuzione dell'opera). Così non è. > > La CC0 stabilisce *all'inizio* dell'[articolo 2](https://creativecommons.org/publicdomain/zero/1.0/legalcode.it) che la rinuncia avviene «Nella più ampia misura permessa dalla legge applicabile, e senza contravvenire ad essa». Per quanto riguarda l'Italia, l'[articolo 20, comma 1](http://www.altalex.com/documents/codici-altalex/2014/06/26/legge-sul-diritto-d-autore#art20) della legge sul diritto d'autore stabilisce chiaramente che «Indipendentemente dai diritti esclusivi di utilizzazione economica dell'opera, (...) ed anche dopo la cessione dei diritti stessi, l'autore conserva il diritto di rivendicare la paternità dell'opera». Inoltre, secondo l'[articolo 22, comma 1](http://www.altalex.com/documents/codici-altalex/2014/06/26/legge-sul-diritto-d-autore#art22), «I diritti indicati (...) sono inalienabili». > > In altri termini, la CC0 **non** prevede la rinuncia anche ai diritti morali. Questo è tanto più vero se si considera che una richiesta del genere sarebbe in aperto contrasto con tutte le Convenzioni internazionali in materia (cito, per esempio, l'[articolo 6-bis della Convenzione di Berna](http://www.interlex.it/testi/convberna.htm#6-bis)), ma anche con la storia stessa delle licenze CC (che hanno incluso la clausola BY *di default* a partire dalla versione 2.0 *anche* per uniformarsi alle Convenzioni e alle principali normative nazionali). ## Proposte ### Incontro tra AgID e Associazione Wikimedia Italia In ambito di dati aperti, Wikimedia Italia ha in essere collaborazioni e azioni "bilaterali" con [ICCU](http://www.iccu.sbn.it/opencms/opencms/it/archivionovita/2015/novita_0008.html) e [BNCF](http://digitalia.sbn.it/article/download/1292/849), ICCD (come da tavolo aperto dai rispettivi vertici nell'autunno 2017), varie regioni ed enti locali (come OpenStreetMap Italia), diversi membri [OGF](http://open.gov.it/open-government-partnership/open-government-forum/), alcuni progetti di ricerca europei e varie reti globali. AgID potrebbe aiutare a mettere a sistema queste esperienze, in un'ottica di medio periodo. Le persone che più frequentemente hanno rappresentato Wikimedia Italia o posizioni equivalenti nei tavoli ministeriali e UE in materia includono Marco Ciurcina, Lorenzo Losa, Federico Morando e Marco Ricolfi. ### Incontro operativo tra ICCD e Associazione Wikimedia Italia Nell'immediato, un incontro tecnico fra Synapta e ICCD può identificare i prossimi passi concreti per la valorizzazione di [dati.beniculturali.it in Wikidata](https://www.wikimedia.it/le-novita-wlm-2018-nostro-patrimonio-culturale-wikidata/) in modo mutuamente benefico (aggiustamenti sullo schema di importazione, scambio reciproco di aggiornamenti e correzioni ecc.). Azioni concrete sono possibili già nello scorcio d'autunno 2018, anche per preparare tecnicamente la prossima edizione di Wiki Loves Monuments con un numero molto maggiore di beni partecipanti. ### Aggiornare le linee guida nazionali Inserire un paragrafo nelle "[Linee guida per la valorizzazione del patrimonio informativo pubblico](https://lg-patrimonio-pubblico.readthedocs.io/it/latest/)" che illustri in premessa questi problemi di compatibilità e proponga delle modalità per superarli. > [name=Maurizio Napolitano] è molto difficile che venga fatta una azione di passaggio a CC0 al tavolo servono anche altri stakeholders è più facile suggerire delle modalità intelligenti di attribuzione o di accompagnamento di rinuncere senza alterare i testi delle licenze > [name=Sannita (Luca Martinelli)] Eppure IMHO bisogna puntare su questo. Anche [Creative Commons, quando si parla di dati](https://creativecommons.org/about/program-areas/open-data/), non nomina la CC BY mentre nomina la CC0, che definisce «particularly important to maximize the re-use of data and databases, since it otherwise may be unclear whether highly factual data and databases are restricted by copyright or other rights». > [name=matt_fortini (Matteo Fortini)] voglio sottolineare come queste linee guida abbiano un doppio effetto: posso utilizzarle (se ben motivate con tutti gli appigli alle leggi fatte da qualcuno "che parli la lingua") per controbattere e spingere nelle discussioni con i funzionari che non sono convinti di fare il bene dell'Ente usando licenze troppo aperte. Dall'altra parte possono fare "da tappo" quando ad esempio ibc Emilia-Romagna ha scelto -NC-ND come licenza per i dati sulle opere, implicando quindi che siano clausole importanti. > ### Fare partire un'azione "governativa" di sensibilizzazione sulle licenze AgID (o qualsiasi altro ente centrale con "titolo" a farlo), potrebbe lanciare una campagna di comunicazione diretta con tutti i "responsabili alla transizione digitale", con un testo breve che indichi quali licenze sono le più adatte a un più ampio riuso. Una sorta di promemoria. > [name=Maurizio Napolitano] AgiD lo fa con le linee guide dove spinge su cc-by > [name=Andrea Borruso] la mia idea è quella appunto di attivare questa azione, per mostrare le alternative al cc-by > [name=Maurizio Napolitano] la mia proposta è quella di spingere sulla [CDLA Permissive](https://cdla.io/permissive-1-0/) - una licenza creata da Linux Foundation sulla falsa riga di licenze per il software come la BSD, MIT o Apache ma più legata al problema dati. Ne parlo in questo [blog post](http://de.straba.us/2018/08/22/community-data-license-agreement-permissive-una-licenza-opendata-ben-studiata/). Il punto 3.3 della licenza recita *3.3 You and each Data Provider agree that Enhanced Data shall not be considered a work of joint authorship by virtue of its relationship to Data licensed under this Agreement and shall not require either any obligation of accounting to or the consent of any Data Provider.* che porta a questa considerazione "per la CDLA dichiara i data enhanced non sono considerati una paternità comune Questo implica che il mix fra dati che fanno uso di altre licenze è garantito ed incoraggia una circolazione dei dati distribuiti evitando la discussione sulle banche date collettive o derivate" ### Circolo virtuoso PA - comunità collaborativa > [name=Andrea Mignone] L'integrazione dei dati pubblici in contesti basati su comunità collaborative (e.g., Wikidata, OSM) attiva un processo di annotazione, revisione ed espansione dell'informazione iniziale che può essere sfruttato a ritroso dalla PA pubblicante. Si può innestare un naturale circolo virtuoso tra PA e comunità che porta al miglioramento del dataset iniziale. > [name=Maurizio Napolitano] una pa si scontra sempre con questioni di certificazioni e responsabilità il processo di feedback si può ottenere con una proattività da parte delle PA Non è poi detto che ci sia una corretta ambivalenza In particolare nel caso del dato geografico la precisione è legata a cosa il dato deve rappresentare infine, fino a quando rimangono i problemi di gestione della attribuzione e quelli di share alike (casi di OSM) l'allineamento sarà sempre complesso > [name=Andrea Mignone] Si potrebbe partire dalle casistiche di feedback più facili (e.g., typo, pattern incoerenti dei dati in uno specifico campo, errori vari, etc...). I grossi dataset sono spesso pieni zeppi di sporcizia che si tende a sottovalutare ma che spesso li rende difficilmente usabili. Questa non è una critica nei confronti degli emittenti. Anzi, tutti sappiamo che pulire queste informazioni è un’impresa titanica. Questo feedback può decisamente aiutare a farlo. Il feedback *non* dovrebbe essere ingerito ad occhi chiusi dalle PA. Tuttavia, può essere un’utile baseline da usare come differenziale per valutare e fixare eventuali problematiche sui dati iniziali. L'approccio proattivo della PA emittente è fondamentale. Immagino che ci possano anche essere altri utilizzi, peraltro molto più interessanti. Occorre capire, come osservato in precedenza, come conciliare il tutto con il processo di certificazione dell'ente resposabile. > [name=Sannita (Luca Martinelli)] Un buon esempio di come possa funzionare un import di dati da un database su Wikidata è quello relativo al Servizio Bibliotecario Nazionale, che ho supervisionato come Wikipediano in residenza. In poche parole: una scheda SBN è collegata all'elemento corrispondente su Wikidata tramite la [proprietà P396](https://www.wikidata.org/wiki/Property:P396). Questa proprietà ha dei *constraint* specifici, fra cui per esempio un rapporto *inderogabile* di 1:1 fra SBN e WD (cioè a una scheda SBN può corrispondere *solo e soltanto* un elemento WD e viceversa). Eventuali violazioni di questo e degli altri vincoli vengono riportati in un ["database report"](https://www.wikidata.org/wiki/Wikidata:Database_reports/Constraint_violations/P396) che viene aggiornato in automatico da un bot ogni 24/48 ore. Questo report facilita notevolmente il lavoro perché permette di correggere velocemente gli errori: > * nel caso in cui l'errore sia lato Wikidata, qualcuno (spesso io) toglie il codice errato e lascia quello giusto; > * nel caso in cui ci sia effettivamente un doppione in SBN, mando una mail all'ufficio competente in ICCU che provvede a correggere l'errore nel database, poi quando mi avvisano di aver sistemato, io provvedo a levare il codice sbagliato; > * nel caso in cui ci sia un "falso positivo" (esistono rarissimi casi dove il doppione è necessario, ne abbiamo già trovati due), è possibile impostare un'eccezione in modo tale che il bot non lo segnali più come errore. > > Da quando Wikimedia Italia e ICCU hanno sottoscritto l'accordo di collaborazione (marzo 2015), abbiamo corretto decine di codici in questo modo, ma sempre con una frequenza di massimo 2-3 codici una volta ogni tanto. Questo per dire che, sì, è possibile che ci siano degli errori, ma che spesso sono una percentuale *veramente* piccola del dataset intero. Quanto da me descritto vale per centinaia di altri identificatori relativi a tantissimi altri database nazionali e internazionali. Non è assolutamente un'eccezione, ma la pratica corrente. (Dopodiché, nel caso dell'import del DBUnico e delle scuole, andrebbe comunque fatta un po' di pulizia, specie nella parte "attribuzione", ma non stiamo parlando di un lavoro impossibile.)