...

Chainwizz

24B6EBDC6093F0C1F639A6A7DA12473E2D2C5C390185833B0F398CC7FCE1368C.jpg

Github informa interrupciones del servicio en enero de 2025


Jessie A Ellis
13 de febrero de 2025 20:05

GitHub experimentó tres incidentes en enero de 2025, causando interrupciones del servicio debido a la implementación, los cambios de configuración y las fallas de hardware, según el informe de disponibilidad de GitHub.



Github informa interrupciones del servicio en enero de 2025

Interrupciones del servicio en enero

En enero de 2025, GitHub experimentó tres incidentes significativos que condujeron al rendimiento degradado en sus servicios, como se detalla en su informe de disponibilidad. Estas interrupciones se atribuyeron a varios problemas técnicos, incluidos los errores de implementación, los cambios de configuración y las fallas de hardware.

Detalles del incidente

9 de enero de 2025 (31 minutos)

El primer incidente ocurrió el 9 de enero, de 01:26 a 01:56 UTC. Una implementación introdujo una consulta problemática que saturó un servidor de base de datos primario, lo que llevó a una tasa de error del 6%, alcanzando un máximo de 6.85%. Los usuarios enfrentaron 500 errores de respuesta en varios servicios. Github mitigó el problema al revertir la implementación después de 14 minutos de investigación, identificando la consulta errante a través de sus herramientas y paneles internos.

13 de enero de 2025 (49 minutos)

El 13 de enero, entre las 23:35 UTC y 00:24 UTC, las operaciones de GIT no estaban disponibles debido a un cambio de configuración relacionado con el enrutamiento de tráfico. Este ajuste provocó que el equilibrador de carga interna deje las solicitudes necesarias para las operaciones de GIT. La situación se resolvió revirtiendo el cambio de configuración. GitHub ahora está mejorando las prácticas de monitoreo e implementación para mejorar los tiempos de detección y automatizar los esfuerzos de mitigación.

30 de enero de 2025 (26 minutos)

El incidente final del 30 de enero, de 14:22 a 14:48 UTC, implicó fallas en las solicitudes web a Github.com, con una tasa de error máxima del 44% y un tiempo de solicitud exitoso promedio superior a tres segundos. Este problema se originó a partir de una falla de hardware en la capa de almacenamiento en caché responsable de la limitación de la velocidad. Debido a la ausencia de conmutación por error automatizada, el impacto se prolongó. Github realizó una conmutación por error manual para el hardware de confianza para prevenir la recurrencia. Planean implementar una configuración de caché de alta disponibilidad para reforzar la resiliencia contra fallas similares.

Mejoras futuras

GitHub está invirtiendo activamente en mejorar sus herramientas para detectar consultas problemáticas antes de la implementación y mejorar su resistencia de caché para evitar interrupciones futuras. Estas medidas tienen como objetivo reducir los tiempos de detección y mitigación para problemas potenciales.

Para actualizaciones en tiempo real sobre el estado del servicio y los informes posteriores al incidente, los usuarios pueden visitar GitHub's página de estado. Se pueden encontrar más información sobre los esfuerzos de ingeniería de GitHub en el Blog de ingeniería de Github.

Fuente de la imagen: Shutterstock


Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Seraphinite AcceleratorOptimized by Seraphinite Accelerator
Turns on site high speed to be attractive for people and search engines.