viernes, 22 de noviembre de 2019

O Archivo de la Web Española


Recentemente a Biblioteca Nacional de España (BNE) anunciou que terminou a recolección masiva anual do dominio .es deste ano 2019, polo que con esta publicación queremos achegarvos información sobre este proxecto que a BNE vén realizando dende 2009 e que ten como obxectivo rastrexar o dominio .es, sen exclusións nin seleccións, para obter un panorama global ou “foto fixa” da web española.
Podemos comezar sinalando que ao igual que é importante gardar unha serie de exemplares dos libros editados nun país, tamén o é facelo do que se publica en Internet, sobre todo tendo en conta que a información en liña é especialmente efémera, é dicir, que é de curta duración ou pasaxeira. Ao contrario do que poida parecer, é trascendental preservar esta información para as xeracións futuras de investigadores, dende prensa dixital, sitios web institucionais, vídeos…e por que non, ata os memes. De feito, a BNE os conserva xunto a outros elementos virtuais como tuits ou fotografías de Instagram polo seu valor documental para o futuro, xa que esta información poderá reflectir unha sociedade ou un momento histórico determinado.

Como diciamos, en 2009 a BNE deu o primeiro paso na construción do Archivo de la Web Española coa sua primeira recolección masiva anual. Estas recoleccións de páxinas web realízanse con robots rastreadores que percorren as URL e gardan todo o que atopan enlazado, coa frecuencia, profundidade e tamaño que se determine. As recoleccións buscan reproducir con detalle o aspecto e as funcionalidades que o sitio presenta no momento da captura, intentando proporcionar unha experiencia de navegación o máis parecida posible á orixinal.
Xunto ás recoleccións masivas, a BNE tamén realiza recoleccións selectivas, que son de tres tipos: temáticas, de evento e de risco. As temáticas teñen o obxectivo de capturar unha selección de recursos sobre un tema; as de evento son sobre acontecementos de especial relevancia para a sociedade española (a abdicación de Juan Carlos I, os procesos electorais…); e as de risco realízanse no caso de risco de desaparición de sitios web.

Ademais, as Comunidades Autónomas elaboran coleccións temáticas cos recursos que consideran necesario conservar como parte do depósito legal do seu ámbito competencial. No caso de Galicia inclúense dende asociacións, museos…ata medios de comunicación ou blogs.
Toda a información conservada no Archivo de la Web Española pódese consultar nas salas da BNE e nos centros de conservación das Comunidades Autónomas, en computadores especialmente habilitados para iso. No caso da nosa comunidade autónoma, o centro de consulta é a Biblioteca de Galicia en Santiago de Compostela. Con todo, dende Internet ou dende terminais non autorizados, é posible acceder á ferramenta de busca e ver se un sitio web foi arquivado e en que datas se capturou. Ademais, o contido das recoleccións selectivas tamén se pode consultar no sitio web da  BNE.
Máis información:

No hay comentarios: