ConnessioniPillole di ...Privacy e GDPRRiflessioni teoriche

Ogni dato è metadato a qualche dato

Chi frequenta gli argomenti di trasformazione digitale entra in contatto sempre più insistentemente con il concetto di metadato. I metadati, alla fine, sono dati associati a dati. Sono quindi dei dati, come altri, che sono indicati come “meta-” per il semplice fatto di essere abbinati ad altri che, evidentemente, hanno un ruolo preminente nella situazione specifica. Un po’ come un documento che, talvolta, pur dotato di autonoma dignità, svolge il ruolo del “documento allegato”.

Faccio un esempio che si allontana dal mondo strettamente archivistico e documentale, così per rendere l’idea.

Servizi di streaming video

Va da sé che in una piattaforma di streaming (Netflix, Amazon Prime – così per intendersi) il dato principale sono i video da trasmettere agli utenti, siano questi film, episodi di serie tv, documentari o altro. Semplificando, ci si può immaginare che un video sia un file depositato su qualche database e qualche cartella.

La piattaforma però non ci mostra l’elenco dei file sul suo hard disk, ma ci offre dei gradevolissimi, sfogliabilissimi e ricercabilissimi cataloghi. Per ogni film ci mostra la locandina (o un’immagine significativa), il titolo, il cast, il paese di produzione, il regista, le valutazioni degli utenti o di un catalogo esterno, un sunto della trama, l’età consigliata, la durata, una lista di contenuti simili a mo’ di suggerimento ecc. Ecco, possiamo tranquillamente dire che il flusso video è il “dato”, mentre tutto il resto sono “metadati”.

La pagina iniziale di Prime VIdeo

Incidentalmente, si può osservare che molte di quelle informazioni (per esempio i crediti artistici) sono anche contenuti nel flusso video (fra titoli di coda e titoli di testa) ma non sono immediatamente fruibili. Infatti, bisogna scorrere il film per trovarli e, soprattutto, non hanno una forma strutturata né sono interpretabili direttamente dal sistema che sovrintende alla composizione del catalogo dei film della piattaforma.

Il Mereghetti

Restando in tema cinema prendiamo in considerazione una pubblicazione must per i cinefili: il “Dizionario dei film” del Mereghetti.

La copertina del Dizionario dei film 2021 del Mereghetti

Si tratta di un catalogo voluminosissimo, aggiornato ogni anno, in cui, tendenzialmente, sono elencati tutti i film prodotti e distribuiti nella storia del cinema. Per ogni film il dizionario indica: il titolo (che è pure la chiave di ordinamento), l’anno, il giudizio sintetico del curatore del dizionario, il regista, il cast, un sunto della trama, una recensione/commento. A parte valutazione e recensione, le informazioni presenti nel dizionario sono presenti anche sulla piattaforma di streaming, sotto forma di metadati. Qui non c’è dubbio che assurgono a rango di dato: è il dizionario dei film, individuati tramite il titolo, non c’è discussione che il titolo sia un dato, come non c’è dubbio che il lettore del dizionario lo consulti per conoscere trama, commento e giudizio: anche questi sono dati.

Una pagine del Dizionario dei film del Mereghetti

Ne consegue che, per un dato, lo stato di metadato è relativo e non assoluto. Occorre specificare bene il contesto in cui è inserito, l’uso che se ne fa.

Attenzione però, questo non vuol dire che il metadato è accessorio. Hai mai pensato a come apparirebbe Netflix se non avesse i metadati? Così, uno schermo nero…

Interfaccia di Netflix tutta nera

I metadati della posta elettronica

Chi segue le vicende di trasformazione digitale delle organizzazioni pubbliche o private, qualche mese fa ha senz’altro intercettato un provvedimento del Garante per la protezione dei dati personali che, come linea di condotta generale, indica ai datori di lavoro di cancellare dopo sette giorni dalla loro formazione i metadati delle e-mail.

Il Garante, tuttavia, non specifica esattamente da dove questi metadati vadano cancellati, né fornisce un quadro preciso del contesto. In una simile circostanza non c’è che appellarsi alla letteratura e alla consuetudine. Entrambe concordano che i metadati delle e-mail siano i dati contenuti nelle intestazioni dei messaggi (di intestazioni dei messaggi di posta elettronica e loto significato ho detto qualcosa qui). Fra questi mittente, destinatario, oggetto, date di invio e ricezione… Insomma, tutto ciò che serve a visualizzarle, ricercarle e anche a dare loro un significato. Qualcuno è rimasto interdetto, qualcuno perplesso, qualcuno ha iniziato a escogitare soluzioni per aggirare il problema e mantenere la “compliance”[1]Per esempio: stampare tutto! E certo, perché se quei metadati li tieni stampati vale?, qualcuno – giustamente – ha sindacato sul termine perentorio indicato dall’Autorità nazionale in barba ai principi di accountability che giusto adesso stiamo iniziando ad assimilare e applicare. Qualcuno ha chiesto chiarimenti.

Il Garante ha deciso per una pausa di riflessione, ha sospeso il provvedimento e ha chiamato a consultazione la comunità degli interessati al tema, invitando a inviare osservazioni e proposte via… posta elettronica!

Oltre al contributo dato a titolo personale alla consultazione, in attesa dell’esito delle riflessioni del Garante, larchivistadigitale.it lancia e promuove una non-campagna a tutela del metadato. Di seguito la bozza dell’opuscolo informativo (che bozza resterà).

Foto personale, no AI involved. – Nessuno dei marchi citati ha interferito con il contenuto dell’articolo (e nemmeno hanno pagato per la pubblicità, così a scanso di equivoci 😉 )

Note

Note
1 Per esempio: stampare tutto! E certo, perché se quei metadati li tieni stampati vale?
Condividi

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *