Sistemi & Tecnologie
per l'Editoria Digitale

ArchiviDigitali



Registrandovi come utenti potrete utilizzare tutti i nostri servizi e accedere alle aree protette del sito.

Download

Informativa privacy.
Contratto di fornitura.

Autenticazione Utenti

Dimenticata la password?

Richiesta Iscrizione

ver. 2.0 - 2018
910
    

Sezioni:

Certificati legali
Digital Object Code
Pubblicità legale


Registrazioni:

Registrazione utenti
Registrazione nuovi prefissi
Listino

Contatti:

Chi siamo
Copyright / Info
Richiesta informazioni


Aevo Online - ArchiviDigitali©
Centro di Ricerca per i Beni Culturali

CAR: 61781QLT

Sede legale:
Via Marco Polo, 9 - 65126 Pescara (Italia)
Tel.: (+39) 085.9116906 / (+39) 334.3263556

http://www.archividigitali.it
Id://ArchiviDigitali

P.I.: 01553580687


DIGITAL OBJECT CODE (DOC)



Cos'é il DOC?
Il DOC (Digital Object Code) è il codice identificativo per risorse digitali adottato da ArchiviDigitali. Ogni codice DOC permette di individuare in modo inequivoco e permanente materiali digitali di qualunque tipologia (testi, immagini, video, audio, siti web, epub, ecc.) identificati dal codice stesso, una serie di metadati ad esso collegati e un prefisso universale in protocollo ID.EM. I → prefissi ID.EM sono identificatori astratti che possono essere collegati ad uno o più url di destinazione non necessariamente univoci. Il DOC viene assegnato automaticamente ad ogni prefisso ID.EM registrato da editori o istituzioni ed esteso ad ogni risorsa digitale allocata sotto lo stesso indirizzo di destinazione.

Quali elementi identifica un DOC?
Un codice DOC identifica risorse digitali di qualunque tipologia (testi, immagini, video, audio, siti web, epub, ecc.), allocate su rete Internet, associate necessariamente ad un prefisso astratto ID.EM, con possibilità di avere discendenti correlati all'infinito: ad es. un sito web, una cartella al suo interno, una pagina in essa contenuta, un'immagine nella pagina, un link all'immagine, ecc. purché tali elementi abbiano un unico id generatore con risoluzione su uno o più indirizzi finali specifici. Non è necessario fare riferimento all'indirizzo finale esatto della risorsa (ad es.: "id://Immagine1" che risolve in: "http://aevo.com/immagine.png") ma è possibile assegnare al prefisso l'url della pagina che contiene la risorsa (ad es.: "id://LaMiaPagina" che risolve in "http://aevo.com/immagine.htm"). Se l'url di riferimento è la pagina index di un sito (ad es.: "id://IlMioSito" che risolve in "http://aevo.com/index.php") viene identificato il sito nel suo complesso.

Qual è la struttura di un DOC?
Un DOC è un codice alfanumerico costituito da cinque sezioni separate da due punti:

P1P2P3P4P5
IdentificatoreCodice EditoreCodice ProgressivoTipologiaCodice ID.EM
DOC:AEVO:1.0:HTM:000001

Il codice stesso, pertanto, permette già una prima identificazione della tipologia del materiale di riferimento.

P1: l'Identificatore è sempre "DOC".

P2: il Codice Editore, assegnato o acquisito in fase di registrazione al sistema, è un codice alfanumerico di lunghezza variabile (min. 4 cifre). L'insieme DOC:AEVO, ad es., identifica il catalogo di un editore.

P3: il Codice Progressivo, nella forma "x.y" (max 10 cifre numeriche) viene assegnato in fase di registrazione. Nella prima posizione (x) troviamo il codice progressivo di collocazione in base all'ordine di registrazione. Nella seconda posizione (y), separata da un punto, viene riportato l'eventuale Codice Derivato alfanumerico assegnato dall'editore ad elementi collocati all'interno o direttamente collegati allo stesso Codice ID.EM. Gli elementi in Codice Derivato collocabili all'interno di un PDF/A (testi, immagini, ecc.) o linkabili (video, audio, ecc.) possono essere autonomamente catalogati e registrati in DLDD purché non siano essi stessi elementi primari (ad es. un sito web) da registrare con Codice ID.EM. Il Codice Progressivo primario (contenitore) ha sempre il Codice Derivato indicato con "0" (es.: 5.0).

P4: la Tipologia è un codice alfanumerico di tre cifre collegato alla natura generica del materiale digitale pubblicato [Html (HTM), Pdf (PDF), Immagine (IMG), Video (VID), Audio (AUD)].

P5: il Codice ID.EM viene assegnato automaticamente al momento della registrazione di un nuovo prefisso. È unico e non può essere modificato. Occupa sempre l'ultimo posto del codice e non ha limiti di lunghezza. Un codice DOC è composto quindi da un minimo di 20 caratteri alfanumerici case insensitive (senza differenze tra maiuscole e minuscole) assegnati, ad eccezione del Codice Derivato, sempre in forma automatica. Le singole sezioni non possono contenere a loro volta simboli di separazione (":").

Risoluzione di un DOC
Ogni DOC può essere immediatamente visualizzato, se ad accesso libero, immettendo l'ultima parte del codice (le cifre del Codice ID.EM) precedute dal prefisso "Cod." nella barra degli indirizzi di un idbrowser o dalla pagina "http://id.crbc.it" in qualunque browser standard selezionando "Cod.". In caso di edizioni a ticket o coperte da copyright viene visualizzata la scheda di catalogo generale.

Utilizzo dei metadati
I metadati sono le parole chiave collegate ad ogni risorsa. Tramite le parole immesse in fase di registrazione il motore di ricerca può recuperare immediatamente una specifica risorsa evitando lunghe ricerche generiche. Le parole chiave non devono limitarsi ai contenuti testuali ma possono riferirsi anche, ad es., alla data e al luogo di edizione, al nome della collana, ai soggetti all'interno di una immagine o di un video, al nome dell'autore, ecc. Non richiedono l'inserimento in un codice XML o JSON ma possono essere liberamente trascritti separando ogni termine con una virgola. I metadati sono continuamente aggiornabili e costituiscono un prezioso collegamento a ciascuna risorsa digitale.

Quali sono i vantaggi di un codice DOC?
Il codice DOC ha delle caratteristiche che lo rendono superiore a qualsiasi altro codice analogo:

- identifica univocamente qualsiasi risorsa digitale poiché è collegata ad un indirizzo astratto ID.EM necessariamente unico e immodificabile;
- viene assegnato automaticamente e non richiede alcun intervento da parte dell'editore se non nei Codici Derivati opzionali;
- permette già una prima identificazione della risorsa dal codice dell'editore e dalla tipologia della risorsa;
- risolve immediatamente all'url di collocazione della risorsa contenendo il codice ID.EM di riferimento (da usare come "Cod.");
- è sufficiente comunicare il proprio prefisso ID.EM o il "Cod." (ultima parte numerica del codice) per individuare qualsiasi risorsa;
- è permanentemente collegato ai metadati aggiornati dall'editore stesso;
- è semplice, automatico, flessibile e può essere adattato a qualsiasi esigenza;
- può essere facoltativamente tutelato mediante deposito DLDD (soggetto a quote di registrazione annuali);
- è completamente e permanentemente gratuito se associato ad un prefisso ID.EM.


Il codice DOC quale Persistent Identifier (PI)
L'uso del Protocollo ID.EM nel DOC (Digital Object Code) assicura la corrispondenza univoca, permanente e autoreferenziale, senza alcuna necessità di un terzo organismo garante, del codice assegnato alla risorsa digitale identificata ponendosi, attualmente, quale unica valida e autorevole alternativa al codice NBN Italia non privo di criticità e aleatorietà tecnico-amministrative intrinseche alla propria struttura organizzativa. Infatti, secondo quanto riportato nel documento "Il progetto National Bibliography Number Italia (NBN:IT). Un identificatore persistente a supporto del deposito legale nazionale delle risorse digitali", firmato da Emanuele Bellini, Chiara Cirinnà, Maurizio Lunghi, Cinzia Luddi, Maurizo Messina, Giovanni Bergamin, Raffaele Messuti, Giovanna Cordani, Roberto Delle Donne, Francesca Rossi, Marialaura Vignocchi, Stefania Arabito, Jordan Piscanc: "L'associazione di un Persistent Identifiers (PI) a una risorsa digitale è considerata oggi una best practice che contribuisce alla risoluzione del problema del reperimento affidabile delle risorse in rete, andando ben oltre la soluzione dell'errore Internet 404. Attualmente i PI sono considerati un mezzo per poter garantire non solo l'identificazione e l'accesso nel lungo periodo, ma anche la certificazione, l'autorevolezza e l'affidabilità delle risorse stesse a patto però che l'implementazione dell'infrastruttura prenda in considerazione non solo i requisiti tecnici, ma soprattutto quelli organizzativi, di processo, di comunità, di conservazione etc. L'associazione di un PI a una risorsa digitale può essere usata come un concreto strumento di localizzazione affidabile, ma, allo stesso tempo, può supportare la certificazione dell'autenticità della risorsa, della sua provenienza, dei suoi diritti di sfruttamento etc. Ovviamente la garanzia di una reale persistenza degli identificativi è principalmente legata all'impegno mostrato da un'organizzazione nell'assegnarli e gestirli. Questo impegno deve declinarsi nell'adozione di precise politiche di servizio, nell'implementazione di specifiche soluzioni tecnologiche, nella definizione di un modello di business sostenibile, nell'identificazione della comunità di riferimento, nel rispetto di opportuni standard condivisi internazionalmente. La reale persistenza di un sistema di identificazione si deve quindi basare sul rispetto di una serie di criteri qualitativi e quantitativi verificabili così come proposto dai risultati di iniziative internazionali, quali NESTOR1 ("NESTOR Catalogue of criteria for assessing the trustworthiness of PI systems") e APARSEN2 (Bazzanella et al.). Attualmente sono disponibili diverse tecnologie e standard per l'implementazione di un sistema di attribuzione di PI; manca tuttavia un accordo sulla loro adozione, anche perché alcuni di questi sistemi sono nati come soluzioni tecniche senza il supporto delle comunità di utenti che si aspettano dai PI livelli di servizio. Sistemi come il PURL3 oppure i Cool URI4 (Berners-Lee) presentano indubbiamente notevoli vantaggi (il più rilevante tra questi è la loro immediata dereferenziabilità attraverso il protocollo HTTP6), ma il limite di queste soluzioni è che la loro persistenza non è in principio garantita da una terza parte indipendente e autorevole. Inoltre, nell'ambito del progetto europeo APARSEN è stata condotta un‘indagine i cui risultati mostrano che un numero limitato di approcci, come il Digital Object Identifier DOI (33%), il sistema Handle (29%) e gli identificatori URN-based (Moats) (25%), sembrano ormai prevalere a livello europeo (Bazzanella et al.). Una particolare attenzione merita in ogni caso il Cool URI. Com'è noto il Cool URI è un approccio alla persistenza delle URL basato sulla loro progettazione. Questo approccio principalmente tecnico è considerato una best practice dal W3C per l'implementazione delle URI del semantic web e dei LinkedData. L'assunzione di base è che una progettazione corretta delle URI dovrebbe ridurre i casi in cui risulterà necessario cambiarle, garantendone la loro stabilità nel tempo. Un esempio di questa best practice è quello di evitare di esplicitare l'estensione delle pagine web come .php o .asp, in modo che se cambia la tecnologia di base (da PHP ad ASP) la URI rimane la stessa. In questa ottica, la persistenza si baserebbe esclusivamente sull'impegno della singola istituzione; s'instaura così una relazione di trust diretta tra l'utente e l'istituzione stessa, senza mediazioni. In questo senso il trust è il livello di fiducia che un utente ha nella capacità di un'istituzione di mantenere le caratteristiche dichiarate del servizio offerto. Il livello di fiducia viene ciclicamente verificato durante l'interazione che l‘utente ha con il servizio stesso, e dove si ha una conferma positiva, il trust si rafforza; in caso contrario decresce. È ben noto, purtroppo, che l'impegno della singola istituzione non è più sufficiente a garantire né la persistenza della URL né tanto meno la certificazione delle risorse in termini di provenienza, autenticità, integrità, conservazione etc. Nella pratica, le risorse si muovono sulla rete, vengono modificate o cancellate a causa di una infinità di fattori che non possono essere sempre predeterminati dalle politiche di gestione dei contenuti delle singole istituzioni, né tanto meno governate da best practice esclusivamente tecniche. Un caso tipico è quando un'istituzione chiude le sue attività perché viene comprata da un'altra istituzione o viene soppressa, oppure semplicemente cambia nome. In questi casi gli oggetti possono essere rinominati per essere adattati al workflow interno della nuova istituzione, o ceduti ad altre istituzioni, o nel peggiore dei casi cancellati perché non più corrispondenti agli obiettivi istituzionali. È evidente che tutte queste azioni possono produrre l'invalidazione delle vecchie URL indipendentemente da come queste siano state costruite. Questo potrebbe non essere un problema se l'istituzione non gestisce contenuti di valore scientifico, culturale o amministrativo, ma cosa diversa è se la medesima sorte la subiscono istituzioni come editori scientifici, biblioteche, archivi, etc. In questi casi, ad esempio, bibliografie basate su semplici URL o anche Cool URI, facenti riferimento a risorse che erano presenti negli archivi di queste istituzioni, non potranno più essere usate, ad esempio, per verificare il lavoro scientifico o per calcolare indici bibliometrici. La cosa più critica, però, è l'impossibilità di implementare sistemi di verifica dell'autenticità, della provenienza e dell'integrità di queste risorse in assenza di una terza parte che si faccia garante dell'associazione nome – risorsa. L'uso dei PI consente, quindi, di inserire non solo nel web ma anche nel nuovo web semantico quel necessario livello di trust che attualmente manca allo scenario così come auspicato (...)"

La procedura di registrazione
Per ottenere un codice DOC è sufficiente richiedere l'→adesione come editore ad ArchiviDigitali: l'adesione è gratuita per istituzioni, editori associati e soggetti pubblici mentre è soggetta ad una quota annuale per i privati (con possibilità di pubblicare un numero illimitato di edizioni). Il codice viene assegnato subito nella sua prima parte (DOC:CodiceEditore) e quindi completato automaticamente ad ogni nuovo prefisso. I Codici Derivati, generati autonomamente da ciascun editore, richiedono sempre un prefisso di destinazione e, analogamente al Codice Primario, possono essere facoltativamente riportati su PDF/A e registrati, anche se non necessariamente soggetti a copyright, mediante il →Deposito Legale Documenti Digitali (DLDD) che assicura e tutela i contenuti depositati in base alla data di registrazione.

ARCHIVIDIGITALI | NUOVI DOMINI | CERTIFICATI | PANNELLO CONTROLLO | IDBROWSER | EDITORI | CATALOGO
Ultimo aggiornamento: 19 Luglio 2018