Digg cambia MySQL por NoSQL

19 03 2010

El domingo pasado en nuestro tradicional “Alrededor de la Red” publicamos un enlace a la notica de que Twitter se cambiaba de MySQL a una arquitectura de NoSQL basada en el proyecto de Cassandra.

Cassandra es un sistema de administración de base de datos distribuído diseñado para manejar enormes cantidades de información replicadas en varios servidores comunes y corrientes. Básicamente es una base con el modelo de datos del BigTable de Google ejecutando sobre una infraestructura similar a la de Dynamo usada por los servicios web de Amazon como S3.

Pero lo más importante es que, como una solución NoSQL, Cassandra rompe con la larga historia y teoría de las bases de datos relacionales por otro modelo con un almacenamiento híbrido del tipo “clave ⇒ valor”, totalmente descentralizado y mucho más fácil de escalar que MySQL.

Por ese motivo es que ahora Digg quiere alejarse tanto como puedan de LAMP, comenzando por cambiar MySQL por Cassandra:

“Nuestra principal motivación para alejarnos de MySQL es la creciente dificultad de construir una aplicación de alta performance con escrituras intensivas en un conjunto de datos que crece rápidamente, sin un final a la vista.

A medida que nuestro sistema crece, es importante abarcar múltiples data centers para redundancia y performance de la red, para agregar capacidad o reemplazar sin downtimes nodos que hayan fallado. Planeamos continuar usando hardware común y continuar asumiendo que fallará regularmente. Todo esto es crecientemente difícil con MySQL”.

Cassandra fué desarrollado por Facebook, pero ahora es de código abierto amparado bajo la licencia de Apache. Digg también prometió comenzar a contribuir sus propias mejoras y modificaciones.





Un futuro promisorio para Drizzle

19 03 2010

Cuando todavía era Director de Arquitectura en MySQL AB, Brian Aker develó Drizzle, una versión de “MySQL a dieta” especialmente diseñada para la Web 2.0 y la nube computacional. Pero a principios de este año, Aker se dejó de trabajar en Sun Microsystems, prometiendo que sin embargo continuaría desarrollando la nueva base de datos “forkeada” del código de MySQL 6.0.

Hoy sus novedades son mucho mejores: Aker está trabajando en Rackspace Cloud, el mismo proveedor de hosting que el año pasado se hizo cargo de la creciente demanda de tráfico e infraestructura de GitHub. Según otro desarrollador de Rackspace:

“Rackspace reconoce que los puntos dolorosos que sienten con el MySQL tradicional no pueden ser resueltos con hacks simples y atajos, y que para servir las necesidades de sus clientes necesitan un servidor de base de datos que piense en sí mismo como una pieza amigable de su infraestructura y no como el conductor de sus aplicaciones. Los principios fundamentales de Drizzle de flexibilidad y enfoque en la escalabilidad se alinean con los objetivos que Rackspace Cloud tiene para el futuro de su plataforma.

Rackspace también está muy comprometido con Cassandra, y vé la integración de Drizzle con Cassandra como una manera principal para agregar valor a sus plataformas y en consecuencia a sus clientes”.

Así que de la mano de Rackspace, Drizzle parece tener un futuro mucho más promisorio del que tenía en MySQL AB, Sun y luego Oracle. Para comenzar, toda la administración del desarrollo del proyecto se mudó a Lauchpad para darle más transparencia y fomentar el crecimiento de su comunidad.