Webs capturados
Desde el 21 de Julio de 2006 el sistema ha evolucionado para capturar sistemáticamente y de manera eficaz un número creciente de sitios web. También ha evolucionado el espacio necesario para almacenar y dar acceso a estos datos.
En la exposición de datos estadísticos, nos referimos a “web”, o “sitio web”, como un recurso publicado en Internet que está identificado por una URL independiente. Y nos referimos a “archivo”, como cada uno de los archivos informáticos que contiene un sitio web. Se incluyen otros datos técnicos que pueden ser de interés del público de PADICAT.
Contenidos del repositorio:
Concepto | Total |
---|---|
Número de webs | 146.460 |
Número de capturas | 383.371 |
Espacio total (TB) | 54,72 |
Procedencia de las capturas
Los recursos depositados en el repositorio proceden: de la captura del dominio .cat; de recursos compilados para crear colecciones monográficas; de páginas web recomendadas por el público de PADICAT; y de recursos digitales de las instituciones que han firmado convenio de cooperación con la Biblioteca de Catalunya.
Concepto | Número de webs | Número de capturas |
---|---|---|
Convenios | 723 | 7.288 |
Recomendados | 12.142 | 86.509 |
Monográficos | 7.184 | 95.228 |
.cat | 53.186 | 132.267 |
Total | 73.125 | 321.292 |
Distribución del tipo de archivo informático que contiene el repositorio PADICAT.
Tipo | Ficheros | |
---|---|---|
text/html | 470.031.467 | 69,71% |
image/jpeg | 94.859.253 | 14,07% |
image/png | 16.853.933 | 2,50% |
image/gif | 13.146.830 | 1,95% |
application/rss+xml | 9.048.245 | 1,34% |
application/pdf | 8.267.872 | 1,23% |
application/atom+xml | 6.382.130 | 0,95% |
text/xml | 6.274.786 | 0,93% |
text/css | 5.721.966 | 0,85% |
application/json | 5.449.566 | 0,81% |
application/javascript | 5.020.227 | 0,74% |
text/dns | 4.922.473 | 0,73% |
text/plain | 4.870.847 | 0,72% |
application/javascript | 3.930.964 | 0,58% |
application/http | 2.214.667 | 0,33% |
text/javascript | 1.809.139 | 0,27% |
application/x-javascript | 1.735.910 | 0,26% |
application/xml | 1.613.883 | 0,24% |
application/opensearchdescription+xml | 1.362.813 | 0,20% |
Otros | 10.792.070 | 1,60% |
Evolución de los monográficos: las colecciones temáticas de PADICAT
Se han realizado ocho monográficos: museos de Cataluña, música folk-rock en Cataluña, campaña electoral de las elecciones al Parlamento Europeo (2009), al Parlamento de Cataluña (2006 y 2010), al Congreso y Senado español (2008), y elecciones municipales (2007 y 2011).
Concepto | Número de webs nuevas | Número de capturas | Número de ficheros | Espacio (GB) |
---|---|---|---|---|
Elecciones al Parlament 2006 | 81 | 775 | 4.953.215 | 175 |
Elecciones Municipales 2007 | 531 | 1.747 | 13.641.991 | 457 |
Folkrock | 56 | 56 | 1.148.312 | 22 |
Elecciones generales 2008 | 129 | 896 | 3.117.638 | 135,11 |
Elecciones europeas 2009 | 170 | 613 | 5.404.291 | 233,05 |
Museos de Cataluña | 1.523 | 1.550 | 2.146.133 | 147,49 |
Elecciones al Parlament 2010 | 967 | 31.210 | 17.202.999 | 707,65 |
Elecciones Municipales 2011 | 3.346 | 47.429 | 21.766.832 | 1.127 |
Elecciones generales 2011 | 304 | 939 | 1.764.159 | 276 |
Elecciones al Parlament 2012 | 77 | 10.013 | 16.890.655 | 328 |
Total | 7.184 | 95.228 | 88.036.225 | 3608,3 |
Más información sobre las colecciones monográficas de PADICAT en las campañas electorales:
Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764