Примерно в 20:13 (UTC+4) twitter.com перестал быть доступен по 443
порту из web-браузеров и с мобильных устройств для пользователей из
разных стран.
Подтверждают недоступность
techcrunch,
mashable и
другие.
Примерно с 21:05 сервис стал доступен и на
status.twitter.com владельцы сервиса написали, что проблема устранена.
Но уже примерно с 22:00 доступ к twitter.com был опять затруднен через браузер и не работают мобильные приложения.
При этом, то открывался 443 порт, то порт был недоступен и соединение не
создавалось. Так же временами наблюдается потеря icmp до всех IP,
которые приписаны к домену.
В 23:20 в аккаунте twitter'а для связей с общественность появилось
сообщение:
Today's outage is due to a cascaded bug in one of our infrastructure components.
Боюсь это переводить, но: «сбои в работе вызваны
каскадной ошибкой в одном из наших компоненте инфраструктуры».
На 00:30 все еще наблюдаются перерывы с доступом к сервису, а на
status.twitter.com примерно с 22:30 висит следующее сообщение:
(«Проблема еще сохраняется, инженеры работают над её устранением»).
В 4:28 в официальном блоге
сообщили, что проблема решена и привели объяснение, что такое «каскадный баг»:
This wasn’t due to a hack or our new office or Euro 2012 or
GIF avatars, as some have speculated today. A "cascading bug” is a bug
with an effect that isn’t confined to a particular software element, but
rather its effect "cascades” into other elements as well. One of the
characteristics of such a bug is that it can have a significant impact
on all users, worldwide, which was the case today. As soon as we
discovered it, we took corrective actions, which included rolling back
to a previous stable version of Twitter.
[Проблема] не была вызвана взломом, или связана с нашим
новым офисом, или Euro 2012, или аватарками в GIF. «Каскадный баг» — это
баг, который не ограничился какой-то определенной частью софта, а
вызвал эффект «каскадов», затронув другие части. Одной из отличительных
характеристик этой ошибки было то, что он затронул всех пользователей по
всему миру. Как только баг был обнаружен, мы приняли корректирующие
меры, включающие откат на предыдущую стабильную версию Twitter.
К сожалению, точное время восстановления мне найти не удалось в официальных сообщениях, а в сообщениях СМИ оно разное.
P.S.: Я понимаю, «twitter упал» это не для всех важная новость и
намного интереснее читать про подробный анализ сбоя, причин и методов
устранения, но:
Странное поведение «инженеров» twitter: то починят, то,
оказывается, не совсем и починили. Может, под временной недоступностью
было что-то большее и, например, наш ждет база хешей пользователей
twitter? (опровергнуто официальным сообщением)- Для меня сервис является не местом для «Just posted a photo
instagr.am/*», а источником короткой оперативной информации. Например, у
коллег из .masterhost отличный twitter с очень оперативным реагированием на различные неполадки.
- Прошу прощение у всех, для кого это не новость, в отличии от
«s/yandex/google упал». Искренне. Клянусь, больше не буду браться за
новости и буду писать сухие топики. Но не убирать же, пусть даже
позорный, но уже опубликованный топик в черновики и портить всем пользователям RSS настроение.
Судя по всему автор этим вечером отлично провел время.