|
En el entorno económico actual, el tejido empresarial y la Administración Pública necesitan gestionar sus documentos invirtiendo los menores recursos económicos posibles y adaptándose a las nuevas normativas. Algunos ejemplos son la Ley 56/2007, que promueve la facturación electrónica y exige que los documentos permanezcan almacenados de forma segura durante cierto periodo de tiempo, y la Ley 11/2007, que permite que los ciudadanos accedan a los Servicios Públicos de forma electrónica. Esto nos incitó investigar en este campo, buscando un sistema de almacenamiento acorde a las necesidades expuestas. Tras analizar los sistemas actuales en el mercado, hemos creado una extensión para el gestor de contenidos Alfresco, CMS de código abierto, que permitirá almacenar los contenidos en las cabinas EMC Centera con bajo coste. Este tipo de almacenamiento es orientado a contenidos y utiliza direccionamiento único aplicando funciones Hash sobre los datos almacenados (CAS, Content Addressed Storage) de forma transparente al usuario, sin preocuparse por la ruta de almacenamiento (en NFS, etc). Alfresco permite reducir el coste en la gestión de contenidos, ya que se basa en proyectos de código abierto, a la vez que ofrece una solución empresarial robusta y escalable. Su arquitectura está basada en J2EE: Hibernate, Spring, JBoss/Tomcat, Apache Lucene, MyFaces. Cabe destacar que es una solución multiplataforma, con suficientes extensiones como para integrarlo con otras tecnologías (OpenOffice, @firma...) y protocolos de interconexión y sistemas de ficheros(ftp, cifs, nfs...).  Estuvimos estudiando las alternativas comerciales en el sector de los sistemas de almacenamiento y concluimos que las cabinas EMC Centera son las más adecuadas en este planteamiento. La característica central es la deduplicación, que consiste en almacenar sólo una instancia de un mismo documento (más la copia en espejo), aunque se referencie muchas veces en el sistema. Y no solo eso, la deduplicación de datos consiste en particionar los documentos en varios bloques, de forma que si hay un documento un 90% de bloques iguales, de uno de ellos se almacena el 100% y del otro solo un 10%. Esto es realmente útil si realizamos frecuentemente backups de la misma información, almacenamos archivos de gran tamaño o los usuarios almacenan muchas veces el mismo documento, como sucede en el caso analizado, llegándose a conseguir reducciones de un 99,9% en copias completas . Por otro lado, estas cabinas permiten acceder on-line con bajo tiempo de acceso a un documento independientemente del contenido total almacenado (frente a las cintas magnéticas convencionales) y garantizan su integridad. Cada vez más empresas exigen que el sistema sea escalable y éste lo es: basta con añadir módulos de almacenamiento fácilmente configurables en RAIN (frente a NAS de bajo coste).
Además del software que ya hemos desarrollado y que ofrecemos, continuamos investigando en varios frentes relacionados con el almacenamiento de información digitalizada. Agradecemos cualquier propuesta o sugerencia sobre este artículo que sin duda contribuirá a que nuestras investigaciones resuelvan de forma óptima vuestras necesidades.
|