Invented archives. Un problema teoretico per la ricerca storica o per l’Archivistica?
Il saggio guarda al fenomeno degli “archivi inventati” e alle sue implicazioni nella scienza archivistica e nella ricerca storica nell’era digitale. Questi archivi, per lo più tematici, emergono come risposte alla digitalizzazione e al bisogno di accesso aperto, sfidando i principi classici dell’archivistica, come il rapporto tra soggetto produttore e documento, l’accumulazione e la conservazione documentaria. Inoltre, il saggio cerca di individuare le origini teoretiche degli archivi inventati, analizzando come queste collezioni documentarie traggano ispirazione dalle metodologie di histoire sérielle sviluppate negli anni Cinquanta del Novecento, dove la serialità e l’analisi quantitativa dei dati storici divennero centrali nella costruzione di una nuova metodologia storiografica. Con la diffusione delle tecnologie digitali, queste metodologie si sono potenziate, portando alla creazione di complessi documentari che non seguono le gerarchie archivistiche tradizionali, ma guardano alla flessibilità e alla riorganizzazione dei dati.
1. Introduzione
L’invenzione di internet e l’implementazione del World Wide Web hanno dato all’umanità l’opportunità di estendere e rendere capillare il sistema linguistico e i meccanismi di interscambio, dove l’informatica, nata come estensione della logica e della matematica, diventa un codice di comunicazione. E se è vero che tale codice è stato sviluppato per impartire ai computer i comandi necessari affinché svolgano dei lavori di calcolo, o per attivare processi meccanici e di routine, è ancor più vero che ha spinto alla creazione della Nicchia Ecologica Digitale1 e di una nuova Heimat comunicativa2, una interplay dimension3, dove la computer science costituisce il comun denominatore linguistico tra le scienze.
Ma il fervore e l’entusiasmo seguiti all’avvento delle tecnologie digitali, soprattutto in ambito umanistico, di fatto, hanno creato un distacco dalla reale comprensione dei processi e dei linguaggi che sottostanno all’informatica. La nascita del web non è stata segnata dalla prospettiva della “processabilità dei dati”, ma solamente dalla possibilità di rapido accesso e dalla diffusione (capillare) di materiali e dati, che, nella sostanzialità, erano privi di una struttura, di un mezzo, che consentisse agli studiosi di operare analisi informatizzate. Ciò che sembra sia sfuggito è il fatto che grazie alle ICT è stato possibile portare l’attenzione sulle “parole” e intenderle come “numeri”; e, di conseguenza, guardare a tutte quelle possibilità che si potevano aprire con l’applicazione di tali tecnologie in settori della conoscenza dove la computazione, in chiave matematica, non è mai stata considerata quale colonna portante.
Ciò che da subito fu chiaro, è che il WWW era un sistema di documenti collegati tra loro attraverso dei nessi ipertestuali e milioni di URL. Tale aspetto, nell’evidenza della nostra quotidianità e della importante letteratura di settore4, non richiede, in questa sede, ulteriori approfondimenti e definizioni di sorta.
Se è vero che l’infrastruttura Internet garantisce l’interconnessione, è ancor più vero che i computer nascono per processare dati, e l’informatica per consentire all’operatore umano di comunicare con queste tecnologie.
Questi tre postulati (interconnessione, processabilità, linguaggio logico) - se così possiamo intenderli - saranno alla base del nostro ragionamento per comprendere la nascita degli invented archives, ossia quegli insiemi, basati sull’infrastruttura internet e sul web, all’interno dei quali i documenti sono correlati tra loro sulla base di un rapporto prettamente tematico, e strutturati per rispondere alle direttive della computer science: interconnessione e computazione.
Nel momento in cui un testo viene messo online, esso assume una struttura non lineare. Il lettore non è guidato dallo scrittore in un percorso, che, come nella dimensione tradizionalmente tipografica, si muove rigo per rigo, dal primo verso l’ultimo, dall’introduzione iniziale fino all’ultimo capitolo e agli indici, i cybertesti5 hanno un’organizzazione meccanica che mette il web user all’interno di una condizione di dinamicità in cui le sue attività neurali vengono sottoposte a stimoli diversi e variegati, pur derivanti dallo stesso documento.
Il principio dell’interconnessione diventa, quindi, fondante della struttura dei siti web, dei documenti in essi contenuti e di tutti quei complessi testuali che mettono in relazione le proprie parti, verso l’interno e verso l’esterno.
Non c’è, nella rete, un interesse diverso. Tutto è, e deve essere, linkato.
Da un altro lato, per ottemperare al principio della processabilità, tutto quello che ha segnato la nascita di paradigmi e statuti disciplinari viene rimesso in discussione per rispondere alla struttura logica su cui si fonda la computer science.
Un esempio determinante è dato dal concetto di documento, la cui definizione deve assumere una struttura logico-computazionale.
La tradizionale sua enunciazione, utilizzata dalla Diplomatica generale, è quella di «testimonianza scritta di un fatto di natura giuridica, compilata coll’osservanza di certe determinate forme, le quali sono destinate a procurarle fede e darle forza di prova» – anche se gli archivisti l’hanno utilizzata in un’accezione più generale e onnicomprensiva, in grado di includere fattispecie non necessariamente assimilabili ai soli documenti formali6.
Tale enunciato pone grossi problemi quando si sposta il punto di vista sul piano informatico. Utilizzare, infatti, un termine che denoti la funzione del documento, ossia quella di “testimonianza”, “prova”, allontana il ragionamento dal soggetto dell’enunciato – il documento –, impedendo che si costruisca una definizione sulle qualità (in senso aristotelico) di quest’ultimo.
Una definizione più appropriata sarebbe, invece:
«una sequenza di proposizioni in forma scritta e/o non scritta, che stabilisce le prerogative di un soggetto (persona fisica o giuridica) su un oggetto, su un bene mobile e/o immobile, su una condizione e/o uno status, sulla volontà o nolòntas, sui diritti e sui doveri conformi alle disposizioni della legge vigente all’atto del suo venire in essere»7.
In questo caso, e probabilmente solo in questo, l’enunciato può essere sottoposto a un processo di computazione, in grado di produrre quegli effetti logici su cui si fonda la computer science. Cioè, in questo caso, siamo di fronte a una definizione processabile dalle macchine (intese, queste, come strumenti algoritmici); ovvero da tools di Intelligenza Artificiale (IA), che elaborano correttamente solamente quando l’informazione è discreta e formalizzata8, ossia quando la parola è assimilabile a un’astrazione di secondo ordine, un numero9.
Riconoscendone la struttura di base, quindi, ossia “le proposizioni”, gli algoritmi e le IA potranno riconoscere cosa sia un documento e ricavare da esso quei dati necessari all’archivistica informatica per la classificazione e la metadatazione automatica.
Nel caso della definizione tradizionale di documento, invece, un eventuale prompt dato alla macchina, dovrebbe contenere tutte quelle informazioni (cosa è il soggetto, cosa l’oggetto, la struttura, la funzione ecc.) e istruzioni (ad esempio, “non usare la funzione per definire l’oggetto”) che creerebbero, in realtà, risultati non controllabili, ovvero – come vengono definiti, oggi, nel contesto delle IA e dei Large language model (LLM) –, «allucinati»10. Sarebbe come impartire al calcolatore l’informazione che “il treno trena”.
Per questo motivo, occorrerebbe che in progetti come Records in Contexts, o InterPARES Trust AI (2021-2026), si guardasse con più attenzione ai postulati che abbiamo individuato, in quanto il mondo degli archivi, siano essi fisici, digitali, invented e partecipativi, vive una “sconnessione” dalle prospettive reali della Nicchia Ecologica Digitale, ossia da quello spazio caratterizzato dall’esistenza di più enti cognitivi, agents connessi secondo la relazione person2persons2machines, che non sono solamente umani, e la cui semantica è anche quella delle IA, di cui ChatGPT e la sua azienda OpenAI rappresentano, ad oggi, l’esperienza più importante.
Alla luce di tali considerazioni, nel nostro caso in esame, abbiamo la necessità di rivedere il concetto di invented archive, il quale, ad oggi, viene utilizzato in maniera non corretta. Ciò che accade, da un lato, perché l’aspetto della “computazione” è totalmente inesistente in tali insiemi documentari, che rappresentano, per lo più, dei complessi fotografici (quando presente l’immagine del documento), ovvero dei dataset, quando troviamo metadati e tags; e, da un altro lato, perché occorre uscire fuori dalla logica dell’accumulo e dell’accesso libero quali prospettive uniche del processo di digitalizzazione del patrimonio archivistico e culturale.
Esistono, infatti, svariate aggregazioni definite invented archives, le quali vengono costruite con l’intento di dinamizzarne i contenuti, ma che, in realtà, seppur pensate e pretese a tale scopo, non riescono a sfuggire alla tradizionale logica dell’indicizzazione, ossia di consentire agli utenti di individuare i documenti all’interno del sito, finendo col realizzare complessi non processabili. Basti pensare ai portali tematici del Sistema Archivistico Nazionale (SAN), che consentono una consultazione dal gusto totalmente retrò (analogico, di close reading), in cui il concetto di “calcolo” è fuori da ogni portata. Oppure al “The September 11 digital archive”11, più volte preso quale esempio di archivio inventato da Federico Valacchi12.
Si sta assistendo, cioè, a un processo di digitalizzazione che, anche quando accompagnato da fasi di trascrizione integrale dei testi fotografati, risponde al bisogno – non informatico! – di creare dei metadati minimal che consentano ai visitatori del sito internet di individuare il documento che serve loro. E poco importa se trascritto in digitale, metadatato nei contenuti, taggato, organizzato per essere “legato” ai linked open data; non siamo di fronte al processo di digitalizzazione che guarda al documento, nella rete, come cybertesto, così come era emerso dalle idee di Aarseth e del suo Cybertext: perspectives on ergodic literature – una riflessione che già nel 1965 aveva spinto Ted Nelson verso il concetto di hypertext.
Ciò deve portarci alla considerazione che i paradigmi su cui si fondano la digital history13 e l’archivistica digitale – che non si intende, qui, quale sinonimo di “archivistica informatica”, la quale guarda al problema della gestione documentale come frutto dell’attività di un soggetto giuridico – sono tutte da definire, sia dal punto di vista statutario che metodologico. E non bastano, ancora, gli accorati incoraggiamenti e inviti a guardare alla digitalità quale cambiamento che fa della ricerca, sia storica che archivistica, una dimensione di “collaborazione” con gli strumenti informatici e le IA – e prova ne è la difficile definizione del concetto di “archivio inventato” e la sua posizione all’interno dei paradigmi delle due discipline.
2. L’archiviazione, gli archivi e il web
Il web, scrive Nelson,
«accepts large and growing bodies of text and commentary, listed in such complex forms as the user might stipulate. No hierarchical file relations were to be built in; the system would hold any shape imposed on it. It would file texts in any form and arrangement desired […]. Besides the file entries themselves, it would hold commentaries and explanations connected with them»14.
Questa affermazione fa della computer science una grande opportunità per tutte quelle discipline che studiano il testo, come la filologia e la linguistica (computazionale), mentre archivistica e storia sembrerebbero lasciare uno spazio limitato e controllabile alle ICT. In realtà, testi e documenti, nei due settori, hanno una loro specifica valenza ma del tutto diversa nelle loro prospettive metodologiche rispetto alle scienze fisiche e naturali – o, per lo meno, questo è quello che si è cercato di sottolineare quando si è giunti all’affermazione che, essendo l’uomo l’oggetto della storia e delle scienze umanistiche in genere, gli eventi non possono essere catalogati e analizzati alla stregua di un fenomeno naturale, quindi processabile come un dato matematico.
Dal suo canto, l’archivistica ha iniziato, sin dagli albori di internet, ad acquisire uno status di presa di coscienza verso questa nuova tecnologia, che si tradusse in diverse tavole rotonde in cui numerosi studiosi presero posizione nei confronti della emergente computer science – tra le più importanti sicuramente il convegno del 17-19 giugno 1985 a Torino, dal titolo “Informatica e archivi”15. Ma, seppur visti come opportunità, il web e i postulati su cui si fondano i concetti di cybertesto, electracy e, ancor di più, quello di digitality, non furono acquisiti come un vantaggio per lo statuto disciplinare dell’archivistica, anche se oggi ci si muove in maniera diversa, come dimostra il progetto InterPares Trust AI16 il quale - anche se i sistemi di database e network tra i dati mostravano il loro perché - si sarebbe sempre fondato sui principi di conservazione e organizzazione della produzione documentaria di un soggetto, sia esso fisico o giuridico (il soggetto produttore, che resta chiave di volta necessaria per il venire in essere di un archivio, per garantirne l’identificazione e la sua corretta fruizione).
L’archivistica informatica, ad esempio, non ha mai ragionato in termini di computazione, perdendo la maggior parte delle opportunità che sarebbero derivate da questa prospettiva; ma, nel pieno dei dettami del suo statuto, essa guarda ai problemi della conservazione dei documenti informatici, ai requisiti funzionali per la gestione informatica di tali corpora, allo sviluppo di software per la classificazione e la fascicolazione, ai formati e al problema dell’autenticità. Nessuna computazione.
Ciò detto, se è vero che l’archivistica non ha mai avuto la necessità di considerare il documento (digitale) come file di testo processabile e, quindi, di considerarlo sotto la luce dell’interconnessione e della logica dei linguaggi informatici, e se è vero che gli elementi fondanti di un archivio sono il suo soggetto produttore e il vincolo archivistico, è ancor più vero che il discorso sugli invented archives deve partire da altre premesse concettuali.
Quando ci troviamo di fronte a un archivio inventato, dobbiamo partire dal presupposto che non abbiamo un soggetto produttore e che il vincolo cede il passo al tema; ossia ci troviamo di fronte a un atto creativo con cui un soggetto trae da archivi diversi (e, quindi, da diversi soggetti produttori) la documentazione necessaria a risolvere una questione storica, per legarla insieme senza un vincolo archivistico in senso stretto, ma allo scopo di farla diventare un complesso di fonti storiche, su cui si ergerà il ragionamento degli studiosi e la loro interpretazione storiografica.
Occorre, però, non cadere nell’errore di considerare archivistica, internet e invented archives dei mondi privi di un legame: gli archivi tradizionali (sia fisici che digitali) sono la base fondante degli invented. Come afferma Rosenzweig, gli archivi inventati sono «sites devoted to collecting and making available documents that are scattered in various “real” archives»17, ossia questi ultimi (i real archives) servono alla creazione della sedimentazione degli invented, ma sono altro rispetto ad essi. Li anticipano, magari guardandoli come effetti ulteriori propri.
Dal primo sito messo online18, col quale si dava libero accesso agli utenti del web, alle idee e alle caratteristiche proprie dell’invenzione del WWW, tutto quello che è stato “uploadato” ha poco a che vedere con il concetto di archivio. Mentre gli invented archives si fondano proprio sul web, in quanto vedono in questa infrastruttura il “luogo” dove riunire la documentazione che viene intercettata dai loro creatori e, allo stesso tempo, il medium essenziale per farla conoscere.
Dal 1991, la rete vede una costante implementazione di siti web che racchiudono documenti archivistici, la cui finalità è quella di dare corpo “digitale” a un progetto storico, a una idea di ricerca o semplicemente a una passione personale. Il “Mosaic Netscape” e il “Netscape Navigator” (era già il 1994) diedero a tutti la possibilità di creare le proprie collezioni e di fare della rete una struttura informativa globale. La “storia” era dappertutto e, sorprendentemente, le persone si precipitarono per mettere le proprie storie su internet, grazie alla creazione di siti dedicati ai loro soggetti e temi preferiti.
Non siamo di fronte ad archivi, bensì a quello che Stefano Vitali19 definisce il «risultato dell’iniziativa di molteplici soggetti, animati da varie ed eterogenee motivazioni». Soggetti che non (cor)rispondono alle solide caratteristiche del “produttore”, quanto invece alla figura del creator, e che al fine di soddisfare i democratici principi della “diffusione larga” aggregano e raccolgono tutta la variegata documentazione che intercettano negli archivi per legare insieme le varie carte e porle alla base di filoni di ricerca, siano essi di ampia visione oppure a supporto di un evento specifico, limitato nello spazio e nel tempo.
Certamente, c’è da sottolineare che non è solo l’entusiasmo di cultori a far sì che emergano questi database online – termine, a mio avviso, più indicato – ma anche la volontà di ricercatori professionisti, i quali mostrano la chiara finalità di creare un complesso documentario in grado di guidare, successivamente, la ricerca storica in quell’ambito determinato. Numerose aggregazioni vengono realizzate tra il 1995 e il 2000 e crescono continuamente, con chiari scopi scientifici, ma in assenza di un vincolo archivistico scientificamente inteso. In altre parole, risulta ben definito il criterio che determina la scelta di farvi accedere dei documenti piuttosto che altri, ma non troviamo, tra queste collezioni, alcun archivio tradizionale, e guardarle come tali pare presenti più rischi che vantaggi. Ciò è ancor più vero quando si pensa agli invented archives e all’infrastruttura informatica su cui si basano, ossia alle “relazioni semantiche” – espressione che non si presenta, già di per sé, di facile analisi. Parlare, infatti, di semantica vuol dire addentrarsi nelle complesse maglie della comunicazione umana: il significato, i significati.
Oggetto della ricerca umanistica non è una semplice informazione, ma la produzione visibile e invisibile della mente umana che non si struttura in regole e leggi, quanto piuttosto in segni e glifi, i quali, però, sono parte della dimensione della conoscenza; “denotatori”20, ossia, come asserisce Sebeok, «sign[s] without either similarity or contiguity, but only with a conventional link between [their] signifier and [their] denotata»21, quindi, un’espressione convenzionale in cui il denotato è qualcosa di indipendente. Un assunto, questo, che mette in evidenza una prospettiva d’indagine profonda sul concetto stesso di testo, che parte dal presupposto che ogni scrittore – produttore di documenti – attribuisce a un segno, sulla base di regole che lui stesso sceglie, un significato. Ed è tale relazione che la computer science deve ambire a ricostruire per poter tradurre in linguaggio informatico la corretta informazione e, qualora possibile, l’intenzionalità dell’autore, ossia la sua consapevolezza che il messaggio avrà la funzione di causare una reazione22.
In ambito informatico, quanto meno a partire dalle esperienze di Ada Lovelace e Babbage, i quali guardavano più che altro all’aspetto discreto dell’informazione da far processare23, il tema dei significati (e, quindi, della semantica) aveva avuto poco appeal, e questo fino agli anni Cinquanta del Novecento e alla fatidica domanda posta da Alan Turing: «Can Machines think?»24.
Questa domanda ha dato vita a diversi progetti di ricerca, la cui linea d’azione era quella di comprendere quali meccanismi devono crearsi e sottostare a quella che, a partire proprio da quegli anni, venne chiamata intelligenza artificiale25. Questo percorso ci porta – e porta gli invented archives – molto lontano rispetto ai paradigmi dell’archivistica, la quale, da sempre, ha basato le metodologie di conservazione e fruizione su meccanismi che non hanno mai dato particolare attenzione al significato.
Un documento non ha un “significato” perché inserito in un determinato contesto (serie, fondo ecc.) come per gli archivi inventati, ma esso si trova in un determinato “frangente” (inteso come momento spaziotemporale) dell’archivio, perché lì sta la sua ragione giuridica, e perché lì il soggetto produttore ha deciso di collocarlo. Non vi è una semantica, la quale potrebbe, probabilmente, emergere sotto la spinta di analisi e procedimenti intellettuali.
L’organizzazione di un archivio è di tipo gerarchico e non relazionale. È una struttura a “grafo”, ad “albero”; mentre il web e gli invented archives – seppur detentori di un termine (archive) che da un punto di vista prettamente archivistico non denota il loro reale status – chiedono altro, come abbiamo avuto modo di analizzare.
3. Internet, archivi, invented, web archiving
Il 6 agosto 1991, veniva lanciato il primo sito web della storia dal fisico britannico Tim Berners-Lee – noto come l’inventore del World Wide Web. Nel decennio successivo, i siti hanno uno sviluppo esponenziale e il numero di database e complessi documentari online aumenta sempre più, fino ai nostri giorni. Occorre dunque, per ciò che ci riguarda, un distinguo tra le varie opportunità di consultazione che si aprono di fronte ai web-users, i quali possono accedere a:
- siti ufficiali di archivi fisici e biblioteche;
- invented archives;
- siti di web archiving.
Nel primo caso, ci troviamo di fronte a spazi in cui gli utenti hanno la possibilità di accedere a tutte le informazioni relative alle attività dell’ente conservatore e ai fondi che esso possiede e conserva. Nell’ultimo decennio, a tali finalità si aggiunge quella della consultazione delle unità archivistiche, che scaturisce dalla riflessione degli archivisti, la quale mette al centro il “punto di vista esterno”26 rispetto a quello degli archivi; non più, cioè, quello che l’archivio rappresentava per sé stesso (e per gli archivisti), bensì quello che esso avrebbe rappresentato per il mondo che, da quel momento, lo avrebbe “preteso” attraverso siti e repository online. Non più il sito internet come pagina ufficiale, ma come portale di accesso alla documentazione riprodotta in formato digitale e/o eventuali database che cercano di riprodurre la struttura ad albero dei fondi, talvolta cercando di garantire anche un accesso analitico grazie a dei metadati generali. Non archivi inventati, quindi, ma siti che rispondono, da un lato, al sistema di pubblicità degli enti conservatori e, da un altro lato, alla consultazione. E anche nel caso di una messa online di fondi archivistici o parti di essi, il concetto di invented non va a denotare la sostanzialità di questi progetti di digitalizzazione, ossia la creazione di versioni consultabili che non hanno, quindi, alcun nesso semantico tra i dati se non quello tra le carte, il fondo di cui fanno parte, e il vincolo che le lega al soggetto produttore – unica fonte in grado di garantire, in maniera inoppugnabile, l’attività che ha dato vita a quel determinato documento.
Avendo già chiarito ciò che concerne il secondo punto (gli invented archives), il nostro ragionamento può spostarsi verso il terzo elemento: il web archiving.
Berners-Lee aveva pensato – e realizzato – una rete di informazioni che permettesse agli utenti di accedere a contenuti (le pagine dei siti web, le immagini, i video, i vari documenti ufficiali che si trovano nei siti istituzionali dei governi, dei ministeri ecc.) grazie a un URL (Uniform Resource Locator) utile ad intercettare l’informazione.
Ma il problema che ne deriva è quello della destinazione finale di tali contenuti, dell’obsolescenza dei formati e della rivoluzione che questa tecnologia comporta nei vari ambiti della conoscenza. Scaturiscono domande che chiamano in causa gli umanisti, gli archivisti, gli storici: questo flusso di documenti ha la necessità di confluire in un archivio? Quale sarà la struttura di tale archivio? Come si rapporteranno gli storici e gli archivisti a tali contenuti?
Anche se molte di queste domande sembrano aver trovato, nel tempo, una risposta, trent’anni sono un tempo troppo breve per far sì che uno statuto millenario come quello dell’archivistica possa rapidamente porre delle concettualizzazioni definitive e chiare al problema della digitalizzazione e del trattamento/conservazione dei documenti nella rete.
Fin dai suoi albori, il web ha sentito la necessità di creare uno spazio dove “archiviarsi”. Tutto quello che viene concepito come informazione, fin dalla nascita dell’umanità, entra nel corso del tempo che scorre e, logicamente, nel passato. Abbiamo l’innata necessità di archiviare tutto quello che produciamo, in termini di scrittura, concetti ed enunciati, qualunque sia il supporto che utilizziamo. Il web rappresenta un nuovo supporto, e per questo motivo, nel 1996, qualche anno dopo l’upload del primo sito internet, Brewster Kahle fonda Internet Archive, una macchina (archivistica) virtuale che mira a preservare i siti web creati e messi online, che rischiano di sparire dalla rete se gli spazi sui server dei provider non vengono più finanziati.
Siamo di fronte, dunque, a un’organizzazione non-profit (il soggetto collettore) costituita da varie istituzioni governative e non, che ha dato vita a una libreria con sede a San Francisco in cui convergono «millions of books, movies, software, music, websites, and more, all free of charge»27.
Il sistema si basa su una struttura entry point che consente ai web users di individuare un contenuto e di ricostruire, nel caso di un sito web, la sua evoluzione in termini di aggiornamenti dell’interfaccia e della sua composizione grafica e funzionale originaria. A questo si aggiunga la possibilità di poter leggere ed effettuare il download di quei documenti che, dalla messa offline del sito ospitante, non sono più disponibili. Internet Archive, infatti, attraverso la sua Wayback Machine consente di intercettare nella collezione un PDF o qualunque altro file e memorizzarlo in remoto (download).
Rispetto alla sua fondazione, nel corso del tempo la piattaforma ha superato i suoi limiti geografici, estendendo l’archiviazione a tutto quello che si trovava sul web attraverso il processo di crawling28.
Esiste, dunque, un soggetto conservatore? I vari archivi, una volta dentro la Wayback Machine, saranno considerati alla stregua di fondi, o ancora meglio, alla stregua di inventari? Come si rapporteranno gli storici con Internet archive?
Domande non semplici, alle quali la letteratura non sembra aver trovato risposta.
Possiamo ipotizzare, però, che ogni sito memorizzato non debba essere considerato un documento, ma un fondo specifico, preservato dall’organizzazione di Brewster Kahle, che può fungere da ente conservatore, e da poter aprire e consultare nel tentativo di individuare, al suo interno, un determinato documento (pensiamo ai file PDF delle determine dei sindaci degli enti comunali, a cui si potrebbe accedere attraverso la pagina dell’albo pretorio online, salvata in Internet Archive, come mostrato nella figura che segue).
Figura 1. Pagina dell’Albo pretorio online del Comune di Riposto (provincia di Catania, Italia
Certamente, gli interrogativi sull’“archivio degli archivi (digitali)” restano tanti: quali sono i criteri di classificazione adottati dall’organizzazione, ben sapendo che l’ordinamento costituisce una funzione centrale per la corretta formazione e gestione di un archivio, soprattutto se prodotto in forma digitale? Il motore di ricerca di Internet Archive e lo strumento Wayback Machine costituiscono un thesaurus, ovvero un inventario tout court?
A tutto questo si aggiunga che il sito non fornisce un motore di ricerca per i contenuti dei siti e non fornisce informazioni bibliografiche esaurienti, o brevi, sui documenti che contiene. L’archivio, inoltre, non divulga dettagli sui siti che conserva, la quantità e la natura dei loro nomi di dominio e il paese a cui appartengono. Ma la criticità più importante è che, poiché l’archivio non fornisce alcuna categorizzazione o classificazione oggettiva dei siti che preserva, l’utente deve essere a conoscenza dell’URL per poter individuare il documento “archiviato” dentro l’enorme heritage. Ciò non gioca a favore dell’accessibilità rapida, ma, soprattutto, dei criteri generali e standardizzati che sottostanno al concetto di collocazione (ad esempio stanza, scaffale, faldone, fascicolo ecc.), stabiliti dalla dottrina archivistica. Come afferma Stefano Allegrezza, «i documenti che riguardano uno stesso affare formano un fascicolo e, nel mondo analogico, vengono collocati all’interno di una camicia [sulla quale] vanno riportati i dati identificativi del fascicolo», e più fascicoli «sono generalmente riuniti in un contenitore (cartelle, buste, mazzi, faldoni)». E il mondo digitale non si discosta da tale metodologia, se non nella terminologia utilizzata, così come, ancora, descrive Allegrezza:
«Passando al mondo digitale, i documenti cartacei vengono ‘rimpiazzati’ da documenti informatici, che, in ultima analisi, sono file — e quindi sequenze di bit — e come tali necessitano, anche solamente per ‘esistere’, di un supporto su cui essere memorizzati. I fascicoli diventano ‘cartelle’ o altre forme di aggregazione documentale nel file system in uso, mentre il concetto di unità di condizionamento, stante la diversa ‘fisicità’ dei materiali digitali, perde molta della sua importanza. Gli scaffali scompaiono per lasciare il posto ai rack, strutture metalliche su cui vengono collocati i dispositivi di storage — come gli hard disk o i solid state disk (SSD) che stanno progressivamente soppiantando i primi — e l’infrastruttura necessaria per il loro funzionamento e che, nel loro complesso, consentono di memorizzare i documenti informatici. I locali degli archivi tradizionali vengono rimpiazzati dai datacenter che hanno anch’essi la necessità di adottare tutta una serie di misure di sicurezza sia logiche che fisiche per garantire la conservazione degli archivi digitali in essi ospitati al pari dei loro equivalenti analogici»29.
Internet Archive non risponde a tale logica. Abbiamo un ente conservatore, ma non abbiamo un sistema di classificazione e un inventario che aiutino l’utente a individuare l’unità archivistica. E su questo concetto, gioca negativamente anche il fatto che, nel web, l’URL sembra essere l’unica nuova concettualizzazione di collocazione. Si aggiunga che la Wayback Machine consente di individuare il sito internet – quello che potremmo definire “fondo” – ma non il suo contenuto. Non vi è, quindi, un inventario costruito dall’ente conservatore, e l’unico modo per scoprire il contenuto dei fondi è quello di navigare tra le pagine di un sito archiviato, senza poter utilizzare il motore di ricerca interno al sito stesso, il quale, non lavorando più sul server originario, non può accedere al dataset. L’unico modo per intercettare una “unità” è conoscerne esattamente l’URL.
Nel caso già preso in esame come esempio: il sito internet del comune di Riposto è <http://comune.riposto.ct.it/>, ma dentro la Wayback Machine l’URL (la collocazione in ambiente digitale) per la sua individuazione diventa <https://web.archive.org/web/20130913175143/http://www.comune.riposto.ct.it/it/elenco-albo-pretorio.php> – che sarà, nel brevissimo futuro, alla base delle ricerche di quegli studiosi che avranno interesse a scrivere la storia di questo ente (o di altri) o di eventi ad esso collegati.
4. La rete e la ricerca storica. Gli invented archives come histoire sérielle?
Se è vero che gli invented archives non presentano quelle caratteristiche che ci consentono di accostarli a un archivio tradizionale (anche se costruito in uno spazio web), è ancor più vero che l’individuazione di una genealogia di tale concetto può trovarsi solamente in ambito storico, spostando la nostra analisi verso il metodo storiografico dell’histoire sérielle, ossia dentro quell’approccio che negli anni Cinquanta del Novecento fondava la sua metodologia sull’individuazione di determinati documenti archivistici e il loro inserimento in una serie definita, allo scopo di spiegare un fenomeno storico che diventava, per Furet30, condizione necessaria per il venire in essere della storia quantitativa31.
A servirsi dell’espressione histoire sérielle è stato Pierre Chaunu, per chiarire la prospettiva della sua opera Séville et l’Atlantique, 1504-165032. Seguiranno, poi, altre sue opere che specificheranno ancora tale concetto, come Histoire quantitative ou histoire sérielle e La durata, lo spazio e l’uomo nell’epoca moderna. La storia come scienza sociale33, la quale impegnava il lettore all’analisi dell’elemento ripetuto – che si integrava in una dimensione di omogeneità – e non al fatto individuale, con la finalità di costruire un complesso di informazioni processabili, secondo le metodologie delle matematiche sociali.
La serialità sostituisce all’inafferrabile avvenimento della storia positivistica, la ripetizione regolare dei dati selezionati, lasciando allo storico la possibilità di muoversi dentro il complesso di documenti, il quale acquisisce una struttura livellare, suddivisa in sottosistemi, «di cui egli è libero poi di proporre, o meno, le articolazioni interne»34 al fine di rispondere al suo quesito sulla storia.
Siamo agli albori della Digital History, ma soprattutto di quello che, oggi, è il concetto di invented archive.
Gli anni Novanta del Novecento sono forieri di novità metodologiche in ambito storico. L’avvento delle tecnologie informatiche rimodula e porta la riflessione verso nuove prospettive, su cui si aprono crisi e diffidenze35, ma anche visioni di progressione nella scienza storica. Se da un lato, infatti, Braudel sottolineava la «crisi generale delle scienze dell’uomo»36, dall’altro accettava la necessità di ragionare sui fenomeni per inserirli in un’originale visione dei tempi: la breve, la media e la lunga durata.
In tutti questi casi, seppur non evidente, la presenza di dati costanti è necessaria non solo alla costruzione della teoria, bensì anche a quella storiografia che individua elementi “onnipresenti” nel tempo. Quest’ultimo, chiamato in causa sulle trame di ampie partizioni che non possono non basarsi sull’analisi di elementi/dati che, una volta individuati, spiegano la serie, la quantità, la lunga durata. Ed è ancora Furet ad affermare che «la storia seriale [è] una delle strade più feconde dello sviluppo della conoscenza storica»37, non già solamente per gli apporti quanto per l’aver posto le condizioni necessarie al venire in essere di nuovi concetti che, oggi, dopo maturi dibattiti, hanno mostrato il lato “promettente” della digitalità: dataset, database, data organization, Big Data, digital archive, e così via.
Nell’intimità della sua ricerca, ogni storico organizza le sue informazioni, isola dei dati e li inserisce in un prodotto storiografico, nel quale prende corpo la sua interpretazione su eventi e soggetti del passato.
Sia essa una prova evenemenziale o un fenomeno di lunga durata, ciò che caratterizza il lavoro dello storico, nelle sue prime fasi, è la necessità di organizzare e concatenare le informazioni che trae dal close reading.
Questa necessità si era concretizzata, sotto la sollecitazione delle idee che Vannevar Bush fa confluire nel suo As We May Think38, già a partire dagli anni Cinquanta, nell’uso di computer e software in grado di organizzare le informazioni storiche in dataset.
Il database, nel pensiero di Oscar Itzcovich, diventa lo strumento più duttile e tecnologicamente avanzato, per lo storico, per costruire complessi di informazione e analizzarli39 superando l’approccio di close reading.
La matematizzazione della documentazione scritta, in tale prospettiva, è una prassi che si fa sempre più presente nella ricerca umanistica. La maggior parte delle fonti d’archivio può essere datificata40 e inserita in mainframe, database e archivi inventati.
Il Novecento, però, ha mostrato ben altre possibilità. Assunto che il database abbia fornito la base concettuale degli invented archives, la presenza di questi ultimi si fa più capillare grazie alla infrastruttura internet e al web.
Il 20 dicembre 1990, il CERN mette a disposizione dei suoi dipendenti il progetto WWW. Il 6 agosto 1991, come già detto, appare nella rete il primo sito internet e il 30 aprile 1993 il CERN decide di rendere il World Wide Web opensource, rilasciando il codice sorgente in pubblico dominio e determinando una sostanziale rottura nei modi di produzione e di comunicazione dei risultati delle ricerche, finanche quella umanistica e storica.
In Italia, il primo sito web fu messo online dal Centro di ricerca, sviluppo e studi superiori in Sardegna (CRS4)41, oggi ancora attivo, nella primavera del 1993.
Il web ha modificato – e continua a farlo in quei settori in cui ci si trova in profondo ritardo con l’acquisizione della prospettiva informatica – la vita dei ricercatori che vengono investiti, proprio in quel periodo, dall’impossibilità di restare fuori da questo metamedium42 che irrompe nella vita quotidiana di ciascuno in misura crescente, in relazione all’aumento delle possibilità di interazione, influenzando non solo i modi e i tempi della ricerca storica, ma ancor più profondamente le pratiche di disseminazione e di condivisione del suo discorso, la didattica della storia e la sua comunicazione43.
La ricerca sul passato ha assunto tutto un altro senso metodologico, non semplice da definire: «Non esistono in sostanza prodotti già bell’e pronti, adatti all’impiego da parte degli storici, né forse esisteranno mai»44.
È qui che trova posto e si espande il concetto di invented archive: tutto può essere dentro la rete, può essere veicolato e, soprattutto, arricchito. La rete è un mondo aperto, di condivisione, che porta sul desk degli studiosi una quantità di materiale inimmaginabile45 e, il più delle volte, incontrollabile.
Ecco, quindi, il nodo della nostra disamina: posto che l’archivistica inizia a guardare agli invented archives con particolare attenzione, sembrerebbe tuttavia non aver elaborato una specifica concettualizzazione di “archivio inventato”, ed è la ricerca storica, invece, a sostenere il fondamento e il venire in essere di tale concettualizzazione in maniera costante.
La storia è dappertutto. Storici e studiosi di vario livello mettono online grossi complessi documentari che attirano l’attenzione di altri storici e altri studiosi, i quali necessitano di accedere a quei documenti.
Nel 2000, Dennis Trinkle e Scott Merriman danno alle stampe il libro The History Highway 200046, la cui lettura e consultazione può dare un’idea della voglia di contribuire alla costruzione di una massa critica che renda la ricerca storica un’attività sempre più dinamica e partecipativa – è questo ultimo il principio alla base della public history.
È la rivalsa dell’histoire sérielle? Probabilmente. Così come i database offline, utilizzati originariamente dagli studiosi, gli invented archives richiedono un processo di datificazione e metadatazione dei vari documenti in essi inseriti (record). Non basta, quindi, scegliere un tema storico e muoversi alla ricerca della documentazione archivistica (sia pubblica che privata) per costruire un archivio inventato. Il tema è il leitmotiv ma la funzione del database/archivio digitale inventato è quella di costruire un complesso di dati che possano, in primis, dialogare tra loro ed essere processabili per consentire allo studioso di acquisire informazioni sempre più analitiche e individuare modelli che possano spiegare un determinato evento, o una serie di essi, e che rappresentino l’esplicazione del tema fondante del complesso documentario.
Gli archivi inventati, dunque, la loro sempre più rapida proliferazione, oltre che lo sviluppo continuo di applicazioni e tools per la loro creazione, come Omeka-S47 e Arches48, affascinano e attraggono anche gli studiosi legati alla tradizione della metodologia qualitativa, i quali, come affermava già Furet, vedono un’efficacia superiore nella serialità e nella quantificazione49, soprattutto quando la presenza di archivi e documentazione e l’assenza di interruzioni continue, come nel caso della storia moderna, ne valorizzano l’approccio.
Gli invented archives sono frutto spontaneo della metodologia della serialità al servizio degli storici intenti a “misurare” il cambiamento e i mutamenti, l’origine dei fenomeni e la loro diffusione geografica. Pensiamo, ad esempio, ai database sul fenomeno della schiavitù, uno tra tutti Slave Voyages50, i quali mostrano la sua complessità e la capillarità.
Avendo, lo storico, la necessità di organizzare le sue carte per individuare quelle che possano assumere il ruolo di fonte per l’analisi e la descrizione del suo problema storico, in ambiente digitale, il processo di datificazione diventa molto più profondo e si traduce nella creazione di una versione dinamica di un documento, un cybertesto.
Dentro gli archivi inventati, la documentazione risponde alle necessità dello storico e non all’“accessibilità” archivistica. Non conta solamente la sua collocazione, ma la sua relazione con le altre fonti del database, anche se lo stesso Records in Contexts (RiC) guarda a tale prospettiva.
Al suo interno, l’archivio inventato:
«would accept large and growing bodies of text and commentary, listed in such complex forms as the user might stipulate. No hierarchical file relations were to be built in; the system would hold any shape imposed on it. It would file texts in any form and arrangement desired - combining, at will, the functions of the card file, loose-leaf notebook, and so on. It would file under an unlimited number of categories. It would provide for filing in Bush trails. Besides the file entries themselves, it would hold commentaries and explanations connected with them. In addition to these static facilities, the system would have various provisions for change. The user must be able to change both the contents of his file and the way they are arranged. Facilities would be available for the revising and rewording of text. Moreover, changes in the arrangements of the file’s component parts should be possible, including changes in sequence, labelling, indexing and comments»51.
L’archivio inventato deve rispondere, infatti, alla dinamicità della ricerca storica, la quale modula la sua fonte sulla base del suo progetto di ricerca. La serialità, infatti, spinge lo storico a non esaurire mai le possibilità dell’interpretazione e dell’analisi delle fonti, le quali, proprio nella struttura dell’invented archive paragonabile a quella che Nelson definisce l’Evolutionary List File (ELF)52, «can be used and compounded in many different ways»53.
Ricerca storica e invented archives sono dimensioni strettamente legate, la cui struttura paradigmatica è stata segnata dalla serialità e dal “quantitativo” che portano lo storico a ragionare in termini diversi sulle immagini del passato. Egli si trova di fronte a un nuovo modo di organizzazione dei dati, i quali, seppur ordinati nel tentativo di farsi comun denominatore del tema che ha dato origine all’archivio inventato, rispondono a una malleabilità che fa del “fatto” un’interpretazione basata sulla coerenza tra di essi.
«Il documento, il dato, non esistono più di per [sé] stessi, ma in rapporto alla serie che li precede e li segue; ciò che diventa obiettivo è il loro valore relativo e non il loro rapporto con un’inafferrabile sostanza “reale”. Così si trova a essere spostato, al tempo stesso, anche il vecchio problema della “critica” del documento storico»54.
L’invented archive, quindi, garantisce quella che Furet definisce come una critica “esterna”, la quale
«non si basa più su una credibilità fondata sul confronto del documento con testi contemporanei di natura diversa, ma sulla coerenza con un testo della stessa natura che ha una posizione diversa nella stessa serie temporale, ossia lo precede o lo segue. [Al contrario, la] critica “interna” viene ad essere tanto più semplificata, in quanto molte operazioni di “rastrellamento” dei dati possono essere inserite nella memoria del calcolatore elettronico»55.
Ed è ricorrendo ancora alle affermazioni di Furet, che possiamo individuare una generale, decisiva e prima definizione di invented archive:
«Questo incontro di una rivoluzione metodologica e di una rivoluzione tecnica, che non sono d’altra parte estranee l’una all’altra, permette di prendere in considerazione la costituzione di archivi nuovi, conservati su schede perforate, che rimandano non soltanto a un nuovo sistema di classificazione, ma soprattutto a una critica documentaria diversa da quella del secolo XIX. […] La coerenza [tra i dati] è assicurata […] da un minimo di formalizzazione del documento, in modo che si possano ritrovare, per un lungo periodo di tempo e per ogni unità di tempo, gli stessi dati, nella stessa successione logica. Da questo punto di vista, l’utilizzazione del calcolatore elettronico per lo storico non costituisce solo un immenso progresso pratico, per il risparmio di tempo, [ma] è anche una coazione teorica molto utile, nella misura in cui la formalizzazione di una serie documentaria destinata a essere programmata obbliga fin dall’inizio lo storico a rinunciare alla sua ingenuità epistemologica, a costruire il suo oggetto di ricerca, a riflettere sulle sue ipotesi, e a passare dall’implicito all’esplicito»56.
5. Conclusioni
Il concetto di invented archive rappresenta una sfida e allo stesso tempo un’opportunità per l’archivistica e la ricerca storica contemporanea, sebbene probabilmente non in egual misura per i due ambiti. Da un lato, la digitalizzazione e l’emergere di archivi inventati, nel contesto del web e delle tecnologie digitali, pongono questioni fondamentali sulla natura, sulla funzione e sul valore degli archivi tradizionali. Essi, infatti, non rispondono pienamente ai principi classici dell’archivistica, basati sulla relazione tra soggetto produttore, sedimentazione, uso e conservazione del documento. La loro creazione è guidata da motivazioni e scopi che variano dal desiderio di accesso aperto e democratizzazione della conoscenza, alla necessità di colmare lacune documentarie attraverso l’aggregazione di fonti disperse. Questa varietà di intenti, pur promuovendo l’accesso a informazioni storiche, rischia di sminuire l’importanza del vincolo archivistico e della coerenza interna che caratterizzano gli archivi tradizionali. In altre parole, un archivio inventato riflette più l’intenzione di chi lo crea che non la realtà documentaria del soggetto produttore, ponendo quindi un problema epistemologico per la disciplina archivistica.
D’altra parte, gli invented archives offrono alla ricerca storica grandi prospettive e possibilità. Il carattere tematico e la struttura non gerarchica permettono di ripensare l’organizzazione e l’analisi dei dati storici in modi che sfuggono alle convenzioni archivistiche tradizionali. L’infrastruttura digitale del web facilita l’aggregazione e la consultazione di documenti provenienti da repository diversi, superando i limiti fisici e logistici degli archivi tradizionali. Inoltre, la possibilità di collegare documenti attraverso hyperlink e di manipolare digitalmente i dati, crea un ambiente di ricerca dinamico in cui le fonti possono essere continuamente riorganizzate e reinterpretate. Questo approccio dinamico ricorda, in parte, la metodologia dell’histoire sérielle degli anni Cinquanta del Novecento, che privilegiava l’analisi quantitativa e la serialità dei dati per spiegare i fenomeni storici. Gli archivi inventati possono, infatti, essere visti come una moderna evoluzione di quella metodologia in cui la serialità si integra con la flessibilità della struttura digitale, consentendo una più ampia gamma di interpretazioni e analisi storiche.
Tuttavia, mentre gli archivi inventati ampliano le possibilità di ricerca storica, pongono anche rischi significativi. La mancanza di criteri standardizzati di classificazione, descrizione e conservazione dei documenti nei contesti digitali può compromettere l’affidabilità delle fonti e la qualità della ricerca. Il fatto che l’accesso ai documenti digitali possa essere mediato solo da motori di ricerca o che la localizzazione dei dati dipenda da URL specifici, evidenzia una fragilità intrinseca nella loro archiviazione. L’assenza di un inventario formalizzato e di un sistema coerente di classificazione compromette la capacità degli archivi inventati di servire come depositi affidabili di conoscenza storica. Ciò solleva ulteriori interrogativi sulla loro sostenibilità a lungo termine e sull’integrità dei dati che custodiscono.
Nel contesto dell’archiviazione del web e delle sue sfide associate, emerge un altro punto cruciale: la necessità di un approccio ibrido che possa integrare i benefici della digitalizzazione con i principi tradizionali dell’archivistica. La creazione di archivi digitali non dovrebbe limitarsi alla mera riproduzione di documenti cartacei in formato digitale, ma dovrebbe impegnarsi in una riorganizzazione dei dati che rispetti sia la logica dei sistemi di archiviazione tradizionali sia le nuove esigenze di accesso e interazione poste dagli ambienti digitali. Strumenti come Internet Archive, pur rappresentando un tentativo di conservare l’eredità digitale, mostrano limiti evidenti in termini di classificazione, accessibilità e conservazione a lungo termine. L’assenza di un soggetto produttore chiaro e la mancanza di una struttura coerente di collocazione archivistica evidenziano le difficoltà nel considerare tali progetti come veri e propri archivi in senso tradizionale.
Infine, se è vero che gli invented archives rispondono a una domanda crescente di accesso immediato e illimitato a risorse storiche, è altrettanto vero che questo nuovo paradigma di archiviazione richiede una riflessione più profonda e critica sul ruolo degli archivi nell’era digitale. L’archivistica deve, quindi, affrontare una duplice sfida: riconoscere e adattarsi ai cambiamenti tecnologici e metodologici portati dalla digitalizzazione e dalla creazione di archivi inventati, e al tempo stesso mantenere e riaffermare i propri principi fondamentali, i quali garantiscono l’integrità, la contestualizzazione e la continuità delle fonti documentarie. È essenziale che archivisti, storici e computer scientists collaborino per sviluppare metodologie che possano armonizzare questi due mondi apparentemente contrastanti, al fine di preservare l’affidabilità delle fonti storiche e promuovere una ricerca sia rigorosa che innovativa.
In questo senso, la definizione stessa di “archivio” che ha da sempre rappresentato una sfida per i teorici dell’archivistica che, così come descritto e ricostruito da Gianni Penzo Doria57, si sono cimentati nella formulazione del suo enunciato, necessita di un aggiornamento che rifletta la nuova realtà della documentazione digitale, della struttura dei “luoghi” (i server e i supporti di connessione e memorizzazione, il ruolo delle aziende che forniscono gli spazi e i vari servizi cloud – accettando il rischio di vendor lock-in, ossia la creazione di un rapporto di dipendenza col fornitore), del ruolo dei web users (che, in un certo qual modo, lasciano “dati” sui server e nei vari siti internet al momento della consultazione) e che tenga conto delle specifiche di tali complessi documentari anche sotto l’ottica della computer science, pur rimanendo ancorati ai fondamenti teorici e metodologici della tradizione umanistica.
La ricerca si è avvalsa di un finanziamento dell’Unione europea – Next Generation EU – missione 4, componente 2, investimento 1.1, nell’ambito del programma PRIN-PNRR. Il titolo del progetto è: A Database on the Slave Trade between the Mediterranean and the Atlantic (15th-16th centuries).
L’ultima consultazione dei siti web è avvenuta nel mese di dicembre 2025.
Riferimenti Bibliografici
| Espen J. J. Aarseth. Cybertext: Perspectives on Ergodic Literature. Baltimore: Johns Hopkins University Press, 1997. |
| Syed E. Ahmed. Perspectives on big data analysis methodologies and applications, ed. by International Workshop on Perspectives on High-Dimensional Data Analysis. Providence (RI): American Math. Soc., 2014. |
| Stefano Allegrezza. Towards a new archival economy: the development of the discipline in the transition from analogue to digital. «JLIS.It», 1 (2017), n. 8, p. 114–126. |
| Gianluca Braschi. Archivi inventati. «Medium», 19 luglio 2024, <https://braschi.cc/archivi-inventati-9d67aba2e83a>. |
| Fernand Braudel. Scritti sulla storia. Milano: Bompiani, 2003. |
| Vannevar Bush. As we may think. «Atlantic», 1 (1945), n. 176, p. 112-124. |
| Ernst Cassirer. The philosophy of symbolic forms. London and New York: Routledge, 2021. |
| Pierre Chaunu. Séville et l’Atlantique, 1504-1650 : Structures et conjoncture de l’Atlantique espagnol et hispano-américain (1504-1650). Tome II, volume 1 : La conjoncture (1504-1592). Paris: SEVPEN, 1959. |
| Pierre Chaunu. Histoire quantitative ou histoire serielle. Paris: Armand Colin, 1964. |
| Pierre Chaunu. La durata, lo spazio e l’uomo nell’epoca moderna: la storia come scienza sociale. Napoli: Liguori, 1983. |
| Giovanni Ciofalo — Silvia Leonzi. Homo communicans. Una specie di/in evoluzione. Roma: Armando Editore, 2013. |
| Alberto Clerici — Maurizio De Pra. Informatica e web. Milano: EGEA, 2012. |
| Leo Corry. David Hilbert and the Axiomatization of Physics (1898–1918): From Grundlagen der Geo-metrie to Grundlagen der Physik. Londra: Kluwer Academic Publishers, 2004. |
| Robert Darcy — Richard C. Rohrs. A guide to quantitative history. Westport (Conn.): Praeger, 1995. |
| Charles M. Dollar — Richard J. Jensen. Historian’s guide to statistics; quantitative analysis and historical research. Huntington (N.Y.): R.E. Krieger, 1974. |
| Gianni Penzo Doria. A new archives definition. «JLIS.It», 2 (2022), n. 13, p. 156–173. |
| Joris van Eijnatten — Toine Pieters — Jaap Verheul. Big Data for Global History: The Transformative Promise of Digital Humanities. «BMGN - Low Countries Historical Review», 4 (2013), n. 128, p. 55–77. |
| Roberto Franzosi. A third road to the past? Historical scholarship in the age of big data. «Historical Methods: A Journal of Quantitative and Interdisciplinary History», 4 (2017), n. 50, p. 227–244. |
| Gottlob Frege. The Foundations of Arithmetic: A Logico-Mathematical Enquiry Into the Concept of Number. Evanston: Northwestern University Press, 1980. |
| Gottlob Frege. Senso, funzione e concetto. Scritti filosofici 1891-1897. Bari: Laterza, 2007. |
| Gottlob Frege. L’alfabeto del pensiero. Roma: Lit Edizioni, 2021. |
| Gottlob Frege. On Sense and Reference. Londra: Routledge, 2011. |
| François Furet. Sur quelques problèmes posés par le développement de l’histoire quantitative. «Social Science Information», 1 (1968), n. 7, p. 71–82. |
| François Furet. L’histoire quantitative et la construction du fait historique. «Annales. Histoire, Sciences Sociales», 1 (1971), n. 26, p. 63–75. |
| François Furet. Il quantitativo in Storia. In: Fare storia. Temi e metodi della nuova storiografia, a cura di J. Le Goff, P. Nora. Torino: Einaudi, 1981. |
| Kurt Gödel. The Consistency of the Axiom of Choice and of the Generalized Continuum-hypothesis with the Axioms of Set Theory. Princeton (N.J.): Princeton University Press, 1940. |
| Kurt Gödel. On Formally Undecidable Propositions of Principia Mathematica and Related Systems. New York: Dover, 1992. |
| Teofilo Gonzalez — Jorge Diaz-Herrera — Allen Tucker. Computing Handbook, Third Edition: Computer Science and Software Engineering. Boca Raton-London-New York: CRC Press, 2014. |
| Shawn Graham — Ian Milligan — Scott Weingart. Exploring Big Historical Data. The Historian’s Macroscope, Singapore: World Scientific Publishing, 2015. |
| Maria Rosaria Guercio. Archivistica informatica: i documenti in ambiente digitale. Roma: Carocci, 2019. |
| David Hilbert. Grundzüge der Theoretischen Logik. Berlin: Springer, 1972. |
| David Hilbert. Mathematical Problems. Lecture delivered before the International Congress of Mathematicians at Paris in 1900, Lancaster & New York: Macmillan Company, 2021. |
| David Hilbert — Stephan Cohn-Vossen. Geometry and the Imagination. Providence (RI): AMS Chelsea publishing, 1999. |
| Oscar Itzcovich. Lo storico e il database. «Quaderni storici», 70 (1989), n. 24, p. 321–325. |
| Oscar Itzcovich. L’uso del calcolatore in storiografia. Milano: FrancoAngeli, 1993. |
| Oscar Itzcovich. Dal mainframe al personal, il computer nella storiografia quantitativa. In: Storia e Computer: alla ricerca del passato con l’informatica, a cura di S. Soldani e L. Tomassini. Milano: Mondadori, 1996, p. 30-47. |
| Klaus Bruhn Jensen. Metamedium. The International Encyclopedia of Communication Theory and Philosophy, Chichester: Wilet-Blackwell, 2016, p. 1–4. |
| Takeshi Kojima — Shixiang Shane Gu — Machel Reid — Yutaka Matsuo — Yusuke Iwasawa. Large Language Models are Zero-Shot Reasoners. arXiv, 2023, <https://arxiv.org/abs/2205.11916>. |
| Richard J. Lane. The big humanities: digital humanities/digital laboratories. New York: Routledge, 2017. |
| John McCarthy — Nathaniel Rochester — Marvin L. Minsky — Claude E. Shannon. A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence, August 31, 1955. <https://upload.wikimedia.org/wikipedia/commons/f/f4/A_Proposal_for_the_Dartmouth_Summer_Research_Project_on_Artificial_Intelligence%2C_by_John_McCarthy_et_al%2C_1955.pdf>. |
| Ministero per i Beni Culturali e Ambientali. Ufficio Centrale per i Beni Archivistici — Archivio di Stato di Torino — Regione Piemonte. Assessorato alla Cultura — CSI Piemonte — Istituto Bancario S. Paolo di Torino. Informatica e Archivi. Atti del Convegno. Torino 17-19 giugno 1985. Roma: Istituto Poligrafico e Zecca dello Stato ; Libreria dello Stato, 1986. |
| Ted H. Nelson. Complex information processing: a file structure for the complex, the changing and the indeterminate. In: ACM ’65: Proceedings of the 1965 20th national conference. New York: Association for Computing Machinery, 1965, p. 84-100. |
| Tito Orlandi. Informatica umanistica. Roma: La Nuova Italia Scientifica, 1990. |
| Discipline umanistiche e informatica: il problema della formalizzazione, a cura di Tito Orlandi. Roma: Accademia Nazionale dei Lincei, 1997. |
| Tito Orlandi. Formal Methods in the Humanities and their Teaching. Presentato al The future of the humanities in the digital age, Bergen, 1998. |
| Edwin D. Reilly — Anthony Ralston — David Hemmendinger. Encyclopedia of Computer Science. London: Nature Publishing Group, 2000. |
| Francisco Rodriguez-Consuegra. Kurt Gödel: Unpublished Philosophical Essays. Basel-Boston-Berlin: Birkhäuser Verlag, 1995. |
| Joan Roselló. Hilbert, Göttingen and the Development of Modern Mathematics. Newcastle upon Tyne: Cambridge Scholars Publishing, 2019. |
| Roy Rosenzweig. Brave New World or Blind Alley? American History on the World Wide Web. «Journal Of American History», 1 (1997), n. 84, p. 132–155. |
| Roy Rosenzweig. The Road to Xanadu: Public and Private Pathways on the History Web. «Journal of American History», 2 (2001), n. 88, p. 548–579. |
| Robert Rowland. L’Informatica e il mestiere di storico. «Quaderni storici», 3 (1991), n. 26, p. 693–720. |
| Robert Rowland — Renzo Derosas. Premessa. «Quaderni Storici», 78 (1991), n. 3., p. 687–691. |
| Enrica Salvatori. Digital (Public) History: la nuova strada di una antica disciplina. «RiMe. Rivista dell’Istituto di Storia dell’Europa Mediterranea», (2017), p. 57–94. |
| Thomas A. Sebeok. Encyclopedic Dictionary of Semiotics. Berlin-Boston: De Gruyter Mouton, 1986. |
| Salvatore Spina. Datificazione delle fonti storiche per la digital history delle pandemie. «Umanistica Digitale», (2021), n. 10, p. 1-18. |
| Salvatore Spina. Digital History. Metodologie informatiche per la ricerca storica. Napoli: Edizioni Scientifiche Italiane, 2022. |
| Salvatore Spina. Homo-Loggatus. The anthropological condition of historians in the digital world. «Journal of Mathematical Techniques and Computational Mathematics», 10 (2023), n. 2, p. 431–437. |
| Salvatore Spina. “Homo-loggatus”: uomo e macchine nella nicchia ecologica digitale. «Informatica Umanistica e Cultura Digitale: il blog dell’AIUCD», 19 luglio 2023, <https://infouma.hypotheses.org/2224>. |
| Salvatore Spina. Digitality as a longue durée historical phenomenon. «Umanistica Digitale», (2024), n. 18, p. 1–25. |
| Dennis A. Trinkle — Scott A. Merriman. The history highway 2000, a guide to Internet resources. Armonk (N.Y.): M.E. Sharpe, 2000. |
| Alan Mathison Turing. Computing machinery and intelligence. «Mind», 236 (1950), n. LIX, p. 433–460. |
| Federico Valacchi. Se l’archivio è artificiale: Verso uno ius archivi partecipativo?. «AIDAinformazioni», (2023), n. 1–2, p. 153–170. |
| Stefano Vitali. Passato digitale. Le fonti dello storico nell’era del computer. Milano: Bruno Mondadori, 2004. |
| Alfred North Whitehead — Bertrand Russell — Kurt Gödel. Principia mathematica: Vorwort und Einleitungen. Frankfurt am Main: Suhrkamp, 1986. |
| Zhiwei Xu — Jialin Zhang. Computational Thinking: A Perspective on Computer Science. Singapore: Springer Nature, 2022. |
Note
- Salvatore Spina, Homo-Loggatus. The anthropological condition of historians in the digital world, «Journal of Mathematical Techniques and Computational Mathematics», 10 (2023) n. 2, p. 431–437; Id, “Homo-loggatus”: uomo e macchine nella nicchia ecologica digitale. «Informatica Umanistica e Cultura Digitale: il blog dell’AIUCD», 19 luglio 2023, <https://infouma.hypotheses.org/2224>.
- Giovanni Ciofalo — Silvia Leonzi, Homo communicans. Una specie di/in evoluzione, Roma: Armando Editore, 2013.
- Salvatore Spina, Homo-Loggatus. The anthropological condition of historians in the digital world. cit.; Id, Digitality as a longue durée historical phenomenon, «Umanistica Digitale», 18 (2024), p. 1–25.
- Consiglio la lettura di Alberto Clerici — Maurizio De Pra, Informatica e web, Milano: EGEA, 2012; Teofilo Gonzalez et al., Computing Handbook, Third Edition: Computer Science and Software Engineering, Boca Raton-London-New York: CRC Press, 2014; Edwin D. Reilly et al., Encyclopedia of Computer Science, London: Nature Publishing Group, 2000; Zhiwei Xu – Jialin Zhang, Computational Thinking: A Perspective on Computer Science, Singapore: Springer Nature, 2022.
- Espen J. J. Aarseth, Cybertext: Perspectives on Ergodic Literature, Baltimore: Johns Hopkins University Press, 1997.
- Maria Rosaria Guercio, Archivistica informatica. I documenti in ambiente digitale, Roma: Carocci, 2019, p. 21.
- La definizione è dell’autore.
- Tito Orlandi, Informatica umanistica, Roma: La Nuova Italia Scientifica, 1990; Discipline umanistiche e informatica. Il problema della formalizzazione, a cura di T. Orlandi, Roma: Accademia Nazionale dei Lincei, 1997; Tito Orlandi, Formal Methods in the Humanities and their Teaching, presentato al The future of the humanities in the digital age, Bergen, 1998.
- Leo Corry, David Hilbert and the Axiomatization of Physics (1898–1918): From Grundlagen der Geometrie to Grundlagen der Physik, Londra: Kluwer Academic Publishers, 2004; Gottlob Frege, The Foundations of Arithmetic: A Logico-Mathematical Enquiry Into the Concept of Number, Evanston: Northwestern 1980; Id, Senso, funzione e concetto. Scritti filosofici 1891-1897, Bari: Laterza, 2007; Id, L’alfabeto del pensiero, Roma: Lit Edizioni, 2021; Id, On Sense and Reference, Londra: Routledge, 2011; Kurt Gödel, The Consistency of the Axiom of Choice and of the Generalized Continuum-hypothesis with the Axioms of Set Theory, Princeton (N.J.): Princeton University Press, 1940; Id, On Formally Undecidable Propositions of Principia Mathematica and Related Systems, New York: Dover, 1992; David Hilbert, Grundzüge der Theoretischen Logik, Berlin: Springer, 1972; Id, Mathematical Problems. Lecture delivered before the International Congress of Mathematicians at Paris in 1900, Lancaster & New York: Macmillan Company, 2021; David Hilbert — Stephan Cohn-Vossen, Geometry and the Imagination, Providence (RI): AMS Chelsea publishing, 1999; Francisco Rodriguez-Consuegra, Kurt Gödel: Unpublished Philosophical Essays, Basel-Boston-Berlin: Birkhäuser Verlag, 1995; Joan Roselló. Hilbert, Göttingen and the Development of Modern Mathematics, Newcastle upon Tyne: Cambridge Scholars Publishing, 2019; Alfred North Whitehead et al., Principia mathematica: Vorwort und Einleitungen, Frankfurt am Main: Suhrkamp, 1986.
- Takeshi Kojima et al., Large Language Models are Zero-Shot Reasoners, arXiv, 2023, <https://arxiv.org/abs/2205.11916>.
- https://911digitalarchive.org.
- Federico Valacchi, Se l’archivio è artificiale: verso uno ius archivi partecipativo?, «AIDAinformazioni», (2023) 1–2, p. 153–170.(2023
- Salvatore Spina, Digital History: metodologie informatiche per la ricerca storica, Napoli: Edizioni Scientifiche Italiane, 2022.
- Ted H. Nelson, Complex information processing: a file structure for the complex, the changing and the indeterminate, in: ACM ’65: Proceedings of the 1965 20th national conference, New York: Association for Computing Machinery, 1965, p. 84-100: 88.
- Ministero per i Beni Culturali e Ambientali. Ufficio Centrale per i Beni Archivistici — Archivio di Stato di Torino et al., Informatica e Archivi. Atti del Convegno. Torino 17-19 giugno 1985, Roma: Istituto Poligrafico e Zecca dello Stato ; Libreria dello Stato, 1986.
- https://interparestrustai.org/trust.
- Roy Rosenzweig, Brave New World or Blind Alley? American History on the World Wide Web, «Journal Of American History», 1 (1997) n. 84, p. 132–155; Id, The Road to Xanadu: Public and Private Pathways on the History Web, «Journal of American History», 2 (2001), n. 88, p. 548–579.
- http://info.cern.ch/hypertext/WWW/TheProject.html.
- Stefano Vitali, Passato digitale: le fonti dello storico nell’era del computer, Milano: Bruno Mondadori, 2004, p. 116.
- Ernst Cassirer, The philosophy of symbolic forms, London and New York: Routledge, 2021.
- Thomas A. Sebeok, Encyclopedic Dictionary of Semiotics, Berlin-Boston: De Gruyter Mouton, 1986, p. 108.
- Gianluca Braschi, Archivi inventati, «Medium», 19 luglio 2024, <https://braschi.cc/archivi-inventati-9d67aba2e83a>.
- S. Spina, Digitality as a longue durée historical phenomenon. cit.
- Alan Mathison Turing, Computing machinery and intelligence, «Mind», 236 (1950), n. LIX, p. 433–460.
- John McCarthy et al., A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence, August 31, 1955, <https://upload.wikimedia.org/wikipedia/commons/f/f4/A_Proposal_for_the_Dartmouth_Summer_Research_Project_on_Artificial_Intelligence%2C_by_John_McCarthy_et_al%2C_1955.pdf>.
- Ministero per i Beni Culturali e Ambientali. Ufficio Centrale per i Beni Archivistici — Archivio di Stato di Torino et al., Informatica e Archivi. Atti del Convegno. Torino 17-19 giugno 1985, cit., p. 15.
- https://archive.org/.
- L’archiviazione avviene attraverso l’applicazione di software crawler specializzati, i quali “scandagliano” il web, per copiare e salvare informazioni. Nell’ambito della Web Archive Collection, i siti archiviati e le informazioni che essi rappresentano sono resi accessibili online. Questi siti e le informazioni raccolte sono anche visibili, leggibili e consultabili, proprio come quando erano direttamente sul web, ma vengono conservati sotto forma di istantanee web delle informazioni in un certo momento. Dentro l’archivio è possibile trovare siti di biblioteche nazionali, archivi nazionali, organizzazioni di informazione, gruppi tecnologici e varie altre organizzazioni. Queste parti, inoltre, sono tutte coinvolte nella conservazione accurata del materiale online più significativo.
- Stefano Allegrezza, Towards a new archival economy: the development of the discipline in the transition from analogue to digital, «JLIS.It», 1 (2017), n. 8, p. 114–126.
- François Furet, L’histoire quantitative et la construction du fait historique, «Annales. Histoire, Sciences Sociales», 1 (1971), n. 26, p. 63–75; Id, Il quantitativo in Storia, in: Fare storia: temi e metodi della nuova storiografia, a cura di J. Le Goff e P. Nora, Torino: Einaudi, 1981.
- Robert Darcy — Richard C. Rohrs, A guide to quantitative history, Westport, Conn.: Praeger, 1995; Charles M. Dollar — Richard J. Jensen, Historian’s guide to statistics; quantitative analysis and historical research, Huntington, N.Y.: R.E. Krieger, 1974; François Furet, Sur quelques problèmes posés par le développement de l’histoire quantitative, «Social Science Information», 1 (1968), n. 7, p. 71–82; Oscar Itzcovich, Dal mainframe al personal, il computer nella storiografia quantitativa. in: Storia e Computer: alla ricerca del passato con l’informatica, a cura di S. Soldani e L. Tomassini, Milano: Mondadori, 1996, p. 30-47.
- Pierre Chaunu, Séville et l’Atlantique, 1504-1650 : Structures et conjoncture de l’Atlantique espagnol et hispano-américain (1504-1650). Tome II, volume 1 : La conjoncture (1504-1592), Paris: SEVPEN, 1959.
- Pierre Chaunu, Histoire quantitative ou histoire serielle, Paris: Armand Colin, 1964; Id, La durata, lo spazio e l’uomo nell’epoca moderna. La storia come scienza sociale, Napoli: Liguori, 1983.
- François Furet, Il quantitativo in Storia. cit., p. 6.
- Robert Rowland, L’Informatica e il mestiere di storico, «Quaderni storici», 3 (1991), n. 26, p. 693–720.
- Fernand Braudel, Scritti sulla storia, Milano: Bompiani, 2003.
- François Furet, Il quantitativo in Storia, cit., p. 4.
- Vannevar Bush, As we may think, «Atlantic», 1 (1945), n. 176, p. 112-124.
- Oscar Itzcovichk, Lo storico e il database, «Quaderni storici», 70 (1989), n. 24, p. 321–325; Id, L’uso del calcolatore in storiografia, Milano: FrancoAngeli, 1993.
- Salvatore Spina, Datificazione delle fonti storiche per la digital history delle pandemie, «Umanistica Digitale», (2021), n. 10, p. 1-18.
- https://www.crs4.it.
- Klaus Bruhn Jensen, Metamedium. The International Encyclopedia of Communication Theory and Philosophy, Chichester: Wilet-Blackwell, 2016, p. 1–4.
- Enrica Salvatori, Digital (Public) History: la nuova strada di una antica disciplina, «RiMe. Rivista dell’Istituto di Storia dell’Europa Mediterranea», (2017), p. 57–94.
- Robert Rowland — Renzo Derosas, Premessa, «Quaderni Storici», 78 (1991), n. 3, p. 687-691: 691.
- Syed E. Ahmed, Perspectives on big data analysis methodologies and applications, ed. by International Workshop on Perspectives on High-Dimensional Data Analysis, Providence (RI): American Math. Soc., 2014; Joris van Eijnatten et al., Big Data for Global History: The Transformative Promise of Digital Humanities, «BMGN - Low Countries Historical Review», 4 (2013), n. 128, p. 55–77; Roberto Franzosi, A third road to the past? Historical scholarship in the age of big data, «Historical Methods: A Journal of Quantitative and Interdisciplinary History», 4 (2017), n. 50, p. 227–244; Shawn Graham et al., Exploring Big Historical Data. The Historian’s Macroscope, Singapore: World Scientific Publishing, 2015; Richard J. Lane, The big humanities: digital humanities/digital laboratories, New York: Routledge, 2017.
- Dennis A. Trinkle — Scott A. Merriman, The history highway 2000, a guide to Internet resources, Armonk (N.Y.): M.E. Sharpe, 2000.
- https://omeka.org/s/.
- https://www.archesproject.org.
- François Furet, Il quantitativo in Storia, cit., p. 6.
- https://www.slavevoyages.org.
- Ted Nelson, A File Structure for the Complex, the Changing, and the Indeterminate, cit., p. 88.
- Ibidem, p. 89–90: «It is an evolutionary file structure constructed with lists. The system proposed here is not the only ELF possible. It is built upon a specific technique of attaching lists together which has a natural resistance to becoming confused and messy. The ELF has three elements: entries, lists and links. An entry is a discrete unit of information designated by the user. It can be a piece of text (long or short), a string of symbols, a picture or a control designation for physical objects or operations. A list is an ordered set of entries designated by the user. A given entry may be in any number of lists. A link is a connector, designated by the user, between two particular entries which are in different lists».
- Ibidem, p. 89.
- François Furet, Il quantitativo in Storia, cit., p. 9.
- Ibidem.
- Ibidem, p. 9–10.
- Gianni Penzo Doria, A new archives definition, «JLIS.It», 2 (2022), n. 13, p. 156–173.
