Un Estudio de Caso de un Minorista de Mejoras y Reparaciones para el Hogar
Cómo mantener un alto rendimiento durante las campañas de marketing y optimizar la escalabilidad de la infraestructura de TI
Acerca del Cliente
Una cadena en crecimiento de tiendas de mejoras y reparaciones para el hogar. Al inicio del proyecto, la empresa operaba 45 locales minoristas y estaba expandiendo activamente su división de comercio electrónico. Su estrategia comercial central era ser "tu tienda integral para todo lo relacionado con mejoras y reparaciones del hogar", lo que requería una amplia variedad de productos y una logística compleja. La gerencia consideraba la infraestructura de TI como un activo estratégico, fundamental para respaldar el funcionamiento sin problemas de sus tiendas físicas, almacenes y tienda en línea.
Estado Inicial Antes del Proyecto
La infraestructura de la empresa se construyó sobre una plataforma de virtualización Proxmox VE, implementada varios años antes en hardware de servidor HP. El parque total comprendía 28 servidores físicos, divididos entre un centro de datos principal y un sitio de recuperación ante desastres.
Los sistemas críticos para el negocio funcionaban en entornos virtualizados, incluyendo:
- El sistema de gestión de bases de datos (DBMS) del catálogo de productos y precios
- El sistema ERP
- El sistema de gestión de almacenes (WMS)
- Un conjunto de servicios web orientados al cliente
La configuración de las máquinas virtuales estaba lejos de ser óptima. La mayoría de las VM estaban sobreaprovisionadas con recursos "por si acaso", mientras que los sistemas de misión crítica sufrían simultáneamente cuellos de botella de rendimiento. La solución de copia de seguridad, basada en las herramientas nativas de Proxmox, no cumplía con los objetivos de tiempo de recuperación (RTO) requeridos.
Desafíos
La infraestructura de TI existente ya no podía seguir el ritmo del crecimiento del negocio, lo que generó una serie de problemas críticos que comenzaron a impactar directamente las operaciones diarias y los resultados financieros de la empresa.
El sistema de gestión de bases de datos (SGBD) central para el catálogo de productos y precios se volvió inestable, especialmente durante las cargas máximas. Los retrasos en la actualización de precios y niveles de inventario alcanzaron los 15-20 minutos, lo que provocó conflictos en el punto de venta, insatisfacción del cliente y pérdidas financieras directas. Bajo carga máxima, el tiempo de respuesta promedio del sistema ERP era 3-4 veces mayor que los acuerdos de nivel de servicio aceptables.
Agregar nuevos servidores al clúster requería una reconfiguración compleja y no garantizaba un funcionamiento estable. La empresa se encontró incapaz de escalar recursos rápidamente para promociones estacionales (como las rebajas de primavera) o la apertura de nuevas tiendas. La capacidad de lanzar nuevas iniciativas digitales se vio sofocada por estas limitaciones tecnológicas.
Agregar nuevos servidores al clúster requería una reconfiguración compleja y no garantizaba un funcionamiento estable. La empresa se encontró incapaz de escalar recursos rápidamente para promociones estacionales (como las rebajas de primavera) o la apertura de nuevas tiendas. La capacidad de lanzar nuevas iniciativas digitales se vio sofocada por estas limitaciones tecnológicas.
El sistema de copias de seguridad heredado no podía cumplir con los objetivos de tiempo de recuperación (RTO) requeridos. Una restauración completa podía tardar hasta 12 horas, lo cual era inaceptable para una operación minorista 24/7.
A pesar de una tasa de utilización promedio de servidores físicos de solo el 35-40%, las aplicaciones empresariales clave sufrían escasez de potencia computacional debido a la asignación subóptima de recursos virtuales. La empresa gastaba aproximadamente X anualmente en mantener esta infraestructura sobredimensionada sin obtener ganancias de rendimiento tangibles.
Actualizar la plataforma de virtualización requería una interrupción total del servicio de 6 a 8 horas, lo que representaba un riesgo empresarial inaceptablemente alto. Los administradores del sistema dedicaban hasta el 30% de su tiempo a tareas rutinarias de monitoreo y mantenimiento solo para mantener funcionando el entorno virtual.
Objetivos y Metas del Proyecto
Los problemas identificados exigían una solución integral: no solo el reemplazo de la plataforma de virtualización, sino la creación de una nueva base tecnológica para el crecimiento futuro del negocio.
Los objetivos clave del proyecto fueron:
- Reducir los gastos operativos para la gestión y soporte del entorno virtual.
- Garantizar la fiabilidad del servicio y minimizar los tiempos de recuperación en caso de fallos.
- Establecer un marco de gestión unificado para toda la infraestructura de TI, desde el hardware físico hasta los entornos virtuales.
- Mejorar el rendimiento y la estabilidad de los sistemas empresariales críticos, específicamente el DBMS del catálogo de productos y el sistema ERP.
- Construir una infraestructura de TI escalable y ágil capaz de adaptarse rápidamente a las necesidades de un minorista dinámico, incluido el lanzamiento de nuevas iniciativas digitales.
Para lograr estos objetivos, el cliente necesitaba cumplir varios objetivos clave:
- Migrar de Proxmox VE a una plataforma empresarial sin interrumpir las operaciones comerciales en curso.
- Implementar una solución para la gestión centralizada de toda la flota de servidores físicos.
- Reducir el tiempo que el personal de TI dedicaba a tareas rutinarias de gestión de virtualización.
- Desplegar una solución eficiente de copia de seguridad y recuperación ante desastres con un objetivo de tiempo de recuperación (RTO) de no más de X horas.
- Optimizar la asignación de recursos entre máquinas virtuales con rendimiento garantizado para sistemas prioritarios.
- Crear una infraestructura que permita escalar los recursos computacionales en un plazo de 24 horas para apoyar picos estacionales y nuevas iniciativas empresariales.
Requisitos de la solución
Para abordar sus necesidades de transformación de infraestructura, la empresa implementó una solución combinada utilizando VMmanager de ISPsystem para virtualización y DCImanager para el control de la infraestructura.
Los factores clave decisivos para esta elección fueron:
Un ecosistema unificado: la integración perfecta y lista para usar entre VMmanager y DCImanager, el acceso a soporte técnico centralizado y la capacidad de establecer flujos de trabajo de gestión integral.
Soporte para hardware heredado: compatibilidad total con la flota de servidores existente, sin bloqueo del proveedor para futuras adquisiciones de hardware y capacidad de operar en un entorno heterogéneo.
Facilidad de implementación y uso: una interfaz de usuario intuitiva, capacidades de implementación rápida, requisitos mínimos de capacitación del personal y documentación integral.
Rentabilidad: un modelo de licenciamiento transparente sin tarifas ocultas, que proporciona un costo total de propiedad predecible a largo plazo.
Funcionalidad de nivel empresarial: herramientas integradas para la automatización de tareas operativas y la capacidad de escalar de acuerdo con las futuras demandas del negocio.
Tras una evaluación exhaustiva, la plataforma combinada VMmanager y DCImanager demostró la mayor alineación tanto con las especificaciones técnicas como con las necesidades estratégicas de negocio de la empresa.
Implementación del Proyecto
La implementación de VMmanager y DCImanager se ejecutó en varias fases cuidadosamente planificadas para minimizar el riesgo empresarial.
Durante la fase preparatoria, el equipo de TI del cliente, con el apoyo de los ingenieros de ISPsystem, realizó una evaluación exhaustiva de la infraestructura existente y desarrolló un plan de migración detallado y por fases. Para mitigar el riesgo, se desplegaron entornos de prueba para ensayar todos los procedimientos de migración, y el personal clave del departamento de TI recibió formación integral.
El despliegue de la plataforma DCImanager proporcionó al equipo del cliente la capacidad de incorporar e inventariar rápidamente todos los servidores físicos, así como configurar un monitoreo integral del hardware.
El siguiente paso fue la migración de la infraestructura de virtualización.
Tras el despliegue exitoso de VMmanager, el departamento de TI diseñó configuraciones optimizadas de máquinas virtuales para los sistemas críticos: el DBMS, el sistema ERP y los servicios web orientados al cliente. La migración por fases de las máquinas virtuales fue acompañada de pruebas rigurosas después de cada paso, culminando con la configuración de mecanismos de alta disponibilidad.
En la fase final, el equipo automatizó los procedimientos de copia de seguridad y recuperación y estableció un modelo de acceso detallado basado en roles para los administradores, garantizando la gestión segura y eficiente de la nueva infraestructura.
El proyecto se completó según lo programado, resultado directo de una preparación meticulosa y la colaboración fluida entre los especialistas internos del cliente y los ingenieros de soporte del proveedor.
Características clave de las soluciones implementadas
DCImanager se integró para automatizar la gestión de la infraestructura física, proporcionando las siguientes capacidades clave:

Gestión Unificada Remota de Servidores
La plataforma ofrece amplias funciones de gestión remota de servidores, simplificando la administración y aumentando su eficiencia. Proporciona un monitoreo efectivo de la salud física de los servidores, permitiendo la prevención proactiva de incidentes. Esta automatización redujo el tiempo requerido para tareas administrativas rutinarias de varias horas a solo minutos.
Verificación de Salud del Hardware
La plataforma asegura el control sobre el estado de toda la infraestructura física—equipos de servidores y red, UPS y PDUs—en todas las ubicaciones conectadas. El monitoreo en tiempo real con notificaciones instantáneas ayuda a resolver problemas rápidamente y evitar tiempos de inactividad no planificados.
Gestión de Equipos de Red y Redes Virtuales
DCImanager permite el control de cualquier switch y el inventario de recursos de red. Agregar un switch, configurar puertos y configurar VLAN se puede hacer en unos pocos clics. La documentación de configuraciones de red, el registro de direcciones IP y la asignación están todos automatizados. Esto le dio al cliente la capacidad de conectar rápidamente nuevas ubicaciones minoristas a la red corporativa sin requerir visitas in situ.
Inventario de Hardware y Componentes
El módulo de gestión de activos permite rastrear servidores, switches, routers, UPS y otros dispositivos. Se pueden agregar tipos de equipos personalizados, como paneles de parcheo y cables. La plataforma detecta automáticamente los componentes instalados en los servidores (CPUs, RAM, discos duros), eliminando el trabajo manual de llenar registros de activos con especificaciones detalladas. La empresa obtuvo una base de datos precisa de todo el equipo, simplificando la planificación de adquisiciones y mantenimiento.

Alta Escalabilidad
La arquitectura de VMmanager está construida para una escalabilidad masiva. Una sola instalación puede gestionar más de 56,000 VMs, más de 50 clústeres y más de 350 servidores físicos. Se puede escalar aún más agregando más instalaciones de la plataforma. Esta capacidad sentó las bases para el crecimiento de la infraestructura TI a varios años sin necesidad de cambiar el stack tecnológico, dando al cliente la confianza de que su TI coincidiría con el crecimiento del negocio durante los próximos 5-7 años.
Garantía de Continuidad del Servicio
Características como la distribución automatizada de carga (DRS) y la capacidad de modificar parámetros de VM sin tiempo de inactividad permitieron al negocio realizar mantenimiento planificado y escalar potencia de cómputo para tareas que consumen muchos recursos sin detener servicios o aplicaciones. Por ejemplo, el equipo podía aumentar recursos para el sistema de pedidos en línea durante horas pico sin interrumpir el servicio al cliente.
Monitoreo Centralizado de Infraestructura
El sistema de monitoreo integrado proporcionó al departamento de TI una vista única para rastrear las métricas clave del entorno virtual. El tiempo dedicado al diagnóstico se redujo significativamente, y las alertas proactivas sobre violaciones de umbrales permitieron al equipo prevenir fallas antes de que ocurrieran.
Alta Disponibilidad a Nivel de Plataforma y Clúster
Gracias a su función "Clústeres irrompibles", VMmanager garantiza un alto nivel de tolerancia a fallos. Si un nodo falla, la plataforma migra automáticamente las máquinas virtuales a servidores saludables en cuestión de segundos, cumpliendo con los requisitos de procesos operativos ininterrumpidos. En la práctica, esto permite a la empresa asegurar el funcionamiento continuo de sus aplicaciones más críticas.
Escalado Bajo Demanda para Cargas Máximas
El mecanismo para agregar sin problemas nuevos hosts a un clúster con balanceo de carga automático proporcionó al cliente una herramienta para una respuesta rápida a picos de tráfico. El departamento de TI ahora puede escalar la capacidad rápidamente y sin tiempo de inactividad, mientras que el balanceador de carga integrado de la plataforma asegura una distribución uniforme de los recursos. Durante campañas de marketing, el equipo de TI puede agregar prontamente nuevos servidores al clúster, permitiendo que la infraestructura maneje un aumento múltiple en la carga de la tienda de comercio electrónico.
Resultados y Planes Futuros
La implementación de VMmanager y DCImanager permitió a la empresa lograr resultados operativos y financieros significativos, estableciendo una sólida base tecnológica para el crecimiento futuro.
Resultados clave:
Los costos totales para gestionar y soportar la infraestructura IT disminuyeron un 45% interanual.
El esfuerzo del personal de IT dedicado a tareas rutinarias de gestión de virtualización y hardware físico se redujo en un 60%.
Los tiempos de respuesta de los sistemas clave, incluidos el DBMS y el ERP, mejoraron entre 4 y 5 veces. El tiempo de inactividad de los servicios IT se minimizó; el cliente ha reportado cero incidentes críticos que afecten los procesos de negocio en los últimos seis meses.
El tiempo de recuperación del servicio tras fallos se redujo de 12 horas a solo 5 minutos. La redistribución automatizada de la carga entre servidores garantizó una disponibilidad del 99% para los sistemas críticos.
De cara al futuro, el cliente planea integrar otra solución de ISPsystem: BILLmanager. Esta se utilizará para crear un portal de autoservicio para las unidades de negocio, lo que acelerará el despliegue de entornos de prueba y reducirá el time-to-market de nuevos servicios digitales.