Almacenamiento para Alfresco con EMC Centera PDF Imprimir
Escrito por Luis Andrés García, Carlos Andrés García   
Miércoles, 17 de Junio de 2009 08:55

En el entorno económico actual, el tejido empresarial y la Administración Pública necesitan gestionar sus documentos invirtiendo los menores recursos económicos posibles y adaptándose a las nuevas normativas. Algunos ejemplos son la Ley 56/2007, que promueve la facturación electrónica y exige que los documentos permanezcan almacenados de forma segura durante cierto periodo de tiempo, y la Ley 11/2007, que permite que los ciudadanos accedan a los Servicios Públicos de forma electrónica. Esto nos incitó investigar en este campo, buscando un sistema de almacenamiento acorde a las necesidades expuestas.
Tras analizar los sistemas actuales en el mercado, hemos creado una extensión para el gestor de contenidos Alfresco, CMS de código abierto, que permitirá almacenar los contenidos en las cabinas EMC Centera con bajo coste. Este tipo de almacenamiento es orientado a contenidos y utiliza direccionamiento único aplicando funciones Hash sobre los datos almacenados (CAS, Content Addressed Storage) de forma transparente al usuario, sin preocuparse por la ruta de almacenamiento (en NFS, etc).
Alfresco permite reducir el coste en la gestión de contenidos, ya que se basa en proyectos de código abierto, a la vez que ofrece una solución empresarial robusta y escalable. Su arquitectura está basada en J2EE: Hibernate, Spring, JBoss/Tomcat, Apache Lucene, MyFaces. Cabe destacar que es una solución multiplataforma, con suficientes extensiones como para integrarlo con otras tecnologías (OpenOffice, @firma...) y protocolos de interconexión y sistemas de ficheros(ftp, cifs, nfs...).

 

Costes de diferentes CMSs en su primer año
Estuvimos estudiando las alternativas comerciales en el sector de los sistemas de almacenamiento y concluimos que las cabinas EMC Centera son las más adecuadas en este planteamiento. La característica central es la deduplicación, que consiste en almacenar sólo una instancia de un mismo documento (más la copia en espejo), aunque se referencie muchas veces en el sistema.  Y no solo eso, la deduplicación de datos consiste en particionar los documentos en varios bloques, de forma que si hay un documento un 90% de bloques iguales, de uno de ellos se almacena el 100% y del otro solo un 10%. Esto es realmente útil si realizamos frecuentemente backups de la misma información, almacenamos archivos de gran tamaño o los usuarios almacenan muchas veces el mismo documento, como sucede en el caso analizado, llegándose a conseguir reducciones de un 99,9% en copias completas .
Por otro lado, estas cabinas permiten acceder on-line con bajo tiempo de acceso a un documento independientemente del contenido total almacenado (frente a las cintas magnéticas convencionales) y garantizan su integridad. Cada vez más empresas exigen que el sistema sea escalable y éste lo es: basta con añadir módulos de almacenamiento fácilmente configurables en RAIN (frente a NAS de bajo coste).

Además del software que ya hemos desarrollado y que ofrecemos, continuamos investigando en varios frentes relacionados con el almacenamiento de información digitalizada. Agradecemos cualquier propuesta o sugerencia sobre este artículo que sin duda contribuirá a que nuestras investigaciones resuelvan de forma óptima vuestras necesidades.

 

 
Teiid: virtualización de datos PDF Imprimir
Escrito por Juan Ignacio Sánchez   
Miércoles, 10 de Junio de 2009 12:04

Hace unas pocas semanas liberó en JBoss.org un nuevo producto de extraño nombre: Teiid, y desde entonces hemos fijado nuestra atención en él. Nuestra apuesta por la investigación en nuevas tecnologías nos lleva a invertir esfuerzos en estudiar nuevas herramientas como esta, en la que vemos un gran potencial.

Teiid es una herramienta de virtualización/federación/homogeneización de datos (a lo largo de la documentación se destaca uno u otro aspecto de ella). Esto, en resumen, significa que podemos crear una base de datos virtual a partir de datos que provienen de diferentes fuentes.

Teiid - esquema conceptual

En el diagrama conceptual de la plataforma vemos cómo Teiid se puede situar entre datos provenientes de diferentes fuentes y varias aplicaciones. Esto, que para algunos podría parecer algo muy específico, es una situación muy común en el mundo empresarial. Cuando te enfrentas al reto de realizar una nueva aplicación específica para una organización de tamaño medio o grande es muy común que uno de los requisitos sea integrar datos de varios sistemas existentes: bases de datos, ficheros de intercambio, ERPs o CRMs... Cualquiera que haya trabajado en alguna Administración Pública, por ejemplo, seguro que estará familiarizado con esta situación.

A menudo no sólo es habitual tener que integrar diferentes fuentes, sino también consumirlas desde varios sitios: una nueva aplicación, un sistema de data warehousing, un CRM, un generador de informes... Esto, unido a lo anterior, a menudo se aborda con una costosa arquitectura punto a punto: cada aplicación se enfrenta de forma diferente a la integración de cada una de las fuentes, con lo que los costes se multiplican de forma exponencial a medida que crece el número de elementos.

Las arquitecturas SOA han agravado si cabe este entorno. Lo que antes se hacía con un sistema monolítico, integrado a la fuerza, ahora es realizado de forma coordinada por aplicaciones independientes que se comunican a través de los servicios. Esto tiene grandes ventajas, pero... ¿qué pasa con los datos?

Teiid proviene de la compra de la compañía MetaMatrix por parte de RedHat y su posterior liberación, con lo que se añade al conjunto de tecnologías de middleware JBoss. El proceso de liberación y evolución en estas primeras etapas se está centrando, por tanto, en la integración con ellas.

Llevamos varias semanas analizándolo y realizando unos primeros desarrollos con él, y podemos confirmar que es un producto tan prometedor como parece. Su potencial en el mundo empresarial es casi ilimitado, y esperamos incorporarlo en los próximos meses a una buena cantidad de proyectos. n próximos artículos profundizaremos en sus características y funcionamiento. ¡No dejéis de visitarnos!

 
¡Bienvenidos! PDF Imprimir
Escrito por Juan Ignacio Sánchez   
Miércoles, 10 de Junio de 2009 11:29

Con este artículo abrimos una nueva línea de trabajo y comunicación: el blog del Centro Experimental del Conocimiento. En él iremos publicando una serie de artículos sobre Tecnologías de la Información que reflejarán nuestros intereses y esfuerzos en este sector. A diario realizamos tareas de Investigación, Desarrollo e Innovación que pueden ser de interés para muchos y que queremos compartir con vosotros.

Artículos técnicos, estado de la industria, informes específicos... todo tiene cabida aquí. ¡Esperamos vuestros comentarios!

Bienvenidos.

 
<< Inicio < Prev 1 2 Próximo > Fin >>

Página 2 de 2