SRE en el mundo de las startups | Bootcamp Institute SAPI de CV

SRE en el mundo de las startups

Site Reliability Engineering (SRE) proporciona un equilibrio entre la creación de nuevas funciones  y la garantía de que el uso de éstas sea confiable, elemental para el proceso de automatización y estandarización en una startup.

La sociedad actual resuelve muchas de sus necesidades a través del uso de herramientas digitales. Las startups son un ejemplo, al ser empresas emergentes, expertas en encontrar un mercado, desarrollar productos de alta demanda y reducir tiempos y costos, esto a través de las tecnologías de la información.

Sin embargo, una startup además de crear su producto y comenzar a iterar, necesita garantizar la administración de sistemas, resolución de los posibles problemas y automatizar algunas tareas.

Es aquí donde surge el rol Site Reliability Engineering (SRE), el cual posee un enfoque de ingeniería de software que busca crear sistemas ultraescalables y fiables. 

Este término surgió a inicios de los 2000 y es acuñado por Ben Treynor Sloss del grupo de ingenieros de Google. 

Importancia del rol de SRE en una startup 

El objetivo de SRE, o ingeniería de fiabilidad del sitio, es hallar el equilibrio entre la creación de nuevas funciones y la garantía de que el uso de éstas sea confiable, dos de sus metas básicas son automatizar y estandarizar. 

SRE mediante fórmulas matemáticas puede dar un sí o un no a los lanzamientos, elimina el debate en torno a lo que se puede lanzar y cuándo hacerlo. Se le asigna la supervisión de la fiabilidad del producto.

Se encarga de la implementación, configuración y supervisión del código, la respuesta ante emergencias y la capacidad de los servicios de producción. El rol SRE no garantiza una confiabilidad del 100%, sin embargo planifican para evitar fallas, acepta y resuelve las que surjan. 

SRE ayuda a las startups en cuestiones de producción, aumenta la calidad en el ciclo de vida del desarrollo de software, desarrolla estrategias para la gestión del cambio, anticipándose a posibles problemas en iteraciones futuras, fomenta la sinergía entre las diferentes áreas como operaciones TI, desarrollo y CX. Desarrolla una visión holística, un end to end en la entrega de software que corresponda y esté alineada al ritmo de negocio.

Buenas prácticas en el rol SRE

Un ingeniero de fiabilidad del sitio debe poseer vasta experiencia, gran fluidez en la ingeniería de software y comprensión conceptual de las operaciones de sistemas amplios y complejos.

Para poder explicar las buenas prácticas de un SRE, se pueden contemplar dominios de responsabilidad técnica: 

Producto: se busca que sea viable y fiable.

Desarrollo: ingeniería de software y diseño de sistema desde dentro de la empresa. 

Capacidad: equilibrio entre la inversión y resultados. 

Pruebas: generar simulaciones para identificar fallos actuales y prevenir los futuros.  

Causa de raíz: evitar la repetición de incidentes, no buscar culpables sino soluciones. 

Respuesta: disponibilidad y contacto con el equipo para resolver los problemas de forma eficaz.

Supervisión: detección de problemas antes que lleguen al usuario final. 

DevOps y SRE 

Se denomina DevOps al conjunto de prácticas de desarrollo de software y su ciclo, tiene como objetivo proporcionar una entrega continua de alta calidad.  

El concepto ganó popularidad como herramienta para combatir cargas de trabajo aisladas, disminuir el acoplamiento entre tareas de diferentes áreas y la falta de visibilidad de flujos end to end

La cultura DevOps ha ayudado a mejorar la sinergia entre equipos de TI y entregar software más rápido, no tienen como prioridad crear estrategias de arquitectura para aumentar la confiabilidad, ni el rendimiento.

Es el rol de SRE el que funge como facilitador para crear estrategias y software que mejoren la confiabilidad de los sistemas, prever problemas en el ciclo de vida de desarrollo y formar escenarios de solución a incidentes. 

SRE suele estar centrado en la parte del desarrollo. DevOps por su parte, combina el desarrollo y las operaciones para crear y entregar software. 

SRE y DevOps comparten algunas responsabilidades: 

  • Identificar y aceptar fallos 
  • Implementar cambios graduales
  • Automatizar para eliminar tareas 
  • Monitorear todo

La ingeniería de fiabilidad del sitio es una forma altamente eficiente de implementar DevOps, tanto en empresas de varios años, como en startups, permite a los desarrolladores enfocarse en otras tareas. Un SRE se asegurará de que los clientes reciban un producto confiable y seguro.

DevOps se concentra en la eficiencia a todo el proceso, mientras que  SRE se encarga de la confiabilidad del sitio con la creación de nuevas características.

Nuestros Cloud Advisors e Instructores tienen siempre la disposición de charlar contigo para atender cualquier duda que tengas, y de esta manera guiarte en tu camino de formación en la nube.

Quizá podría interesarte: Cloud SRE Engineer en AWS o Azure

Todos los programas son impartidos por expertos en la industria, conoce todas las oportunidades que tenemos para ti en Bootcamp Institute.

Deja un comentario

Este sitio está protegido por reCAPTCHA y se aplican la Política de privacidad de Google y los Términos del servicio.