XM24

Il recupero del sito perduto

Lo spazio pubblico autogestito XM24

Bologna, via Fioravanti 24
2002 - 2019

https://it.wikipedia.org/wiki/XM24
https://zic.it/tag/xm24/
https://openddb.it/film/come-una-foresta-in-citta/

www.ecn.org/xm24

phpnuke 2003 - 2005
textpattern 2005 - 2012
wordpress 2012 - 2022

--
Wayback Machine https://web.archive.org

https://grafton9.net/xm24

webarchiving

https://en.wikipedia.org/wiki/Web_archiving

Processi tecnici e organizzativi per la raccolta,
la conservazione e l'accesso a materiali dal web.

NON significa realizzare archivi NEL web,
ma fare archivi DEL web.

webarchiving

Il web archiving non ha una soluzione unica e universale.
Tecniche in evoluzione per affrontare i cambiamenti del web.

Fasi: acquisizione - accesso

Registra (record) - Riproduci (replay)

Tecnologia di acquisizione

client http → browser headless

webarchiving

Standards

WARC ISO 28500:2017
https://en.wikipedia.org/wiki/WARC_(file_format)
WACZ
https://specs.webrecorder.net/wacz/1.1.1/

webarchiving / WARC

WARC

webarchiving

https://github.com/iipc/awesome-web-archiving
https://zinebakery.com/homemade-zines/bakeshop-2-diywebarchiving

Webrecorder

browsertrix-crawler
https://github.com/webrecorder/browsertrix-crawler

replayweb.page
https://github.com/webrecorder/replayweb.page

Recupero del sito in locale

Stack Docker Compose

Wordpress + Browsertrix Crawler

Crawler trap!

L'agenda genera URL all'infinito.
URL opache, difficili da blacklistare con regexp.

Crawl in due step:

  1. Crawl completo con esclusione
    di /xm24/agenda
  2. Singole url degli eventi dell'agenda

Altri siti archiviati

https://grafton9.net/webarchive/

Bologna Social Forum (Contropiani)
https://archivio.network/web/contropiani2000/

Altri software

browsertrix
https://github.com/webrecorder/browsertrix
web-archive-site-mirror
https://github.com/webrecorder/web-archive-site-mirror
pywb
https://github.com/webrecorder/pywb
zeno
https://github.com/internetarchive/Zeno

Live recording

archiveweb.page
https://archiveweb.page

archiveweb.page express
https://express.archiveweb.page

conifer
https://conifer.rhizome.org

Salva l'HTML

singlefile
https://www.getsinglefile.com

monolith
https://github.com/Y2Z/monolith

La cura delle informazioni

https://grafton9.net/blog/la-cura-delle-informazioni/

Information Maintenance as a Practice of Care
https://zenodo.org/records/3251131

Archiving Activism in the Digital Age
https://networkcultures.org/blog/publication/archiving-activism-in-the-digital-age/

Titivillus

Titivillus è un diavolo, conosciuto dal 1200,
alle dipendenze di Belfagor, Lucifero o Satana
che induceva in errore i copisti.
Oggi, induce in errore i copisti del web.

https://it.wikipedia.org/wiki/Titivillus

https://grafton9.netvoid@grafton9.net