Al parecer ese es el grito de guerra de un conjunto de proyectos Open Source que desean liberarce de la presencia casi ineludible de las bases de datos relacionales como soporte de almacenamiento de datos en los proyectos web 2.0. Al menos ese fue el espiritu de la reunion que tuvo la comunidad NoSQL hace poco menos de un mes en San Francisco.
En el evento que ha pasado casi desapercibido por los principales medios TIC, hasta hace poco cuando ComputerWorld publicó un artículo sobre la comunidad NoSQL, se presentaron los representantes de 10 proyectos Open Source que nos ofrecen escalabilidad y confiabilidad, a una facción del costo de las alternativas DBMS, como pueden ser MySQL, PostgreSQL u Oracle. Como punto de comparación hay que mencionar que uno de estos proyectos NoSQL llamado Cassandra, ofrece la capacidad de poder escribir hasta 50GB de datos en tan sólo 0.12 milisegundos, esto es 2500 veces más rápido que la perfomance ofrecida por MySQL (la DB relacional más rápida).
El romper con el pasado no es fácil, dejar atras viejos paradigmas que han demostrado sus limitaciones en la era del Petabyte en la cual nos encontramos, será una decisión difícil para los gerentes de los departamentos TIC, mientras no exista una empresa que respalde la nueva tecnología, o inclusive un estándar único para los proyectos de almacenamientos de datos de alta disponiblidiad clave-valor. Hay que tener en cuenta que ninguno de estos proyectos NoSQL se llama a sí mismos "base de datos", sino sistemas de "almacenamiento valor-clave" distribuido.
Todos estos proyectos NoSQL comparten las siguientes características:
- Los datos son automáticamente replicados en múltiples servidores.
- La falla de algún servidor es manejada de forma transparente y sin interrupción del servicio.
- Todos los nodos que constituyen el sistema son independientes y no existe un único punto de falla.
- El sistema maneja internamenta la consistencia de los datos.
- La escalabilidad es prácticamente infita.
- Utilizan como bloques de construcción PCs baratos con grandes discos duros.
- Son proyectos Open Source.
Parecería un sueño, pero es cierto. Son proyetos Open Source que ofrecen hacer por una fracción del costo, aquello que Oracle cobraría millones de dólares por implementar, configurar y afinar a nuestras necesidades de alta disponibilidad y escalabilidad.
Aquí la lista de los proyectos que fueron presentados en la conferencia de la comunidad NoSQL, los videos de las presentaciones y las presentaciones en formato PDF donde ha sido posible obtenerlos.
Proyecto |
Expositor
|
Empresa | Presentación |
Videos
|
Introducción a la Reunión
y Hadoop.
|
Todd Lipcon | Cloudera | ||
Voldemort | Jay Kreps | |||
Cassandra | Avinash Lakshman | Video | ||
Dynomite | Cliff Moon | Powerset | Video | |
HBase | Ryan Rawson | StumbleUpon | Video | |
Hypertable | Doug Judd | Zvents | Video1, Video2 |
|
CouchDB | Chris Anderson | couch.io | Video1, Video2 |
|
VPork | Jon Travis | Springsource | Video | |
MongoDb | Dwight Merriman | 10gen | Video | |
Google BigTable | Jonas S Karlsson | Video |
Es bastante fácil de entender por qué en una web donde el contenido multimedia se multiplica a una velocidad jamas vista antes, el seguir almacenando datos en bases de datos relacionales, es una forma ineficiente y costosa de hacerlo, es por ello que los proyectos NoSQL son definitivamente la forma como deberíamos manejar la información en el futuro. Estos proyectos son ideales, donde la estructura de datos es simple, pero se necesitan manejar grandes volúmenes de datos y es importante el tiempo de respuesta del sistema.
Luego de haber visto los videos de las conferencias, estoy convencido de que el futuro del almacenamiento en grandes volúmenes, esta en los sistemas NoSQL. Así que si alguien está buscando donde estará la siguiente revolución en la industria TIC, este es definitivamente un campo al cuál prestarle mucha atención.