Forwarded from IT-блогер Серж Потаман | Мурманск
Гайз, я еще немного поразбираю тему недавнего блэкаута Мурманской области, хорошо?
Глазами программера, так сказать.
Если помните первый пост на эту тему, то я отмечал своё удивление тем, что многие считали единственным «виновником» стихию с её «редким обледенением» и удобное «а как вообще можно быть к такому готовым?!».
При таких словах у меня начинается профессиональный тик.
Т.е., подписчики моего канала согласятся, что мы в айтишечке давно не живём в логике «сломалось — поехали чинить»
Мы живём в логике:
сломается — и мы знаем где, а иногда даже знаем когда и почему 😉
Вам могло показаться, что я свалил в кучу в прошлый раз понятия «резервирование» и «устойчивость»
Давайте я поясню:
Резерв != устойчивость
Резервирование — это база.
ИБП, дизеля, дублирующие линии, N-1. Это чтоб вот совсем не обделаться, ага 😉
Но устойчивая система немного про другое. Она допускает отказ, ожидает отказ и делает так, чтобы пользователь его не заметил 🫥
Самое странное в этой истории — разговоры про непредсказуемость.
Ребят, в Заполярье:
обледенение — не сюрприз, как бы.
Я вас еще удивлю: мороз у нас тоже — не ЧП, честно!
Это, если дальше душнить терминами из АйТи, входные данные для проектирования.
А тут ещё и факты подъехали: две из пяти рухнувших опор стояли с 1966 года (60 лет!), нормативный срок службы — 40 лет, истёк десятилетия назад.
Остальные — с 80-х.
В прошлый раз говорили, что я не разбираюсь просто. Оки. А чего тогда Следком возбудил дело о халатности. Мол линии не чистили вовремя, освидетельствования под вопросом.
Не знакомый ли это сисадминам накопленный игнор старой инфраструктуры? 🤔
Вы можете спросить «а чего ты опять притащил свой IT?»
Ну, а есть явное сходство и даже связь:
- датчики есть
- погодные модели есть
- история аварий есть
- уязвимые участки известны
- бюджеты (по идее) тоже были
Но ответственная компания всё равно ждала, пока «упало»,
а потом героически ликвидировала последствия.
В IT для этого есть термин —«реактивный подход».
… и он считается устаревшим лет на 15 ⌛️
А есть более актуальный термин — «предиктивность»
Опять же, поправьте, если я неправ, но разве авария не показала, что чинить заранее дешевле, чем тушить пожар? 🧯
Если в Арктике, несмотря на постоянные рассказы про ИИ со стороны Правительства, нет предиктивных моделей для критической инфраструктуры, то это очевидное отсутствие системного подхода.
И это, блин, самый тревожный момент всей истории!
С такими подходами не строят системы.
С такими подходами ждут следующую аварию.
Гайз, ловите афоризм: «Арктика — это не оправдание.
Арктика — это ТехЗадание с повышенными требованиями»
И если система к ним не готова —
проблема не в погоде! 😒
З.Ы. Хотя доп. финансирование получить при уже случившемся ЧП проще 😉
#АрктикаНеОправдание
#Мурманск #Блэкаут #УстойчивостьСистемы #ИТМышление
Глазами программера, так сказать.
Если помните первый пост на эту тему, то я отмечал своё удивление тем, что многие считали единственным «виновником» стихию с её «редким обледенением» и удобное «а как вообще можно быть к такому готовым?!».
При таких словах у меня начинается профессиональный тик.
Т.е., подписчики моего канала согласятся, что мы в айтишечке давно не живём в логике «сломалось — поехали чинить»
Мы живём в логике:
сломается — и мы знаем где, а иногда даже знаем когда и почему 😉
Вам могло показаться, что я свалил в кучу в прошлый раз понятия «резервирование» и «устойчивость»
Давайте я поясню:
Резерв != устойчивость
Резервирование — это база.
ИБП, дизеля, дублирующие линии, N-1. Это чтоб вот совсем не обделаться, ага 😉
Но устойчивая система немного про другое. Она допускает отказ, ожидает отказ и делает так, чтобы пользователь его не заметил 🫥
Самое странное в этой истории — разговоры про непредсказуемость.
Ребят, в Заполярье:
обледенение — не сюрприз, как бы.
Я вас еще удивлю: мороз у нас тоже — не ЧП, честно!
Это, если дальше душнить терминами из АйТи, входные данные для проектирования.
А тут ещё и факты подъехали: две из пяти рухнувших опор стояли с 1966 года (60 лет!), нормативный срок службы — 40 лет, истёк десятилетия назад.
Остальные — с 80-х.
В прошлый раз говорили, что я не разбираюсь просто. Оки. А чего тогда Следком возбудил дело о халатности. Мол линии не чистили вовремя, освидетельствования под вопросом.
Не знакомый ли это сисадминам накопленный игнор старой инфраструктуры? 🤔
Вы можете спросить «а чего ты опять притащил свой IT?»
Ну, а есть явное сходство и даже связь:
- датчики есть
- погодные модели есть
- история аварий есть
- уязвимые участки известны
- бюджеты (по идее) тоже были
Но ответственная компания всё равно ждала, пока «упало»,
а потом героически ликвидировала последствия.
В IT для этого есть термин —«реактивный подход».
… и он считается устаревшим лет на 15 ⌛️
А есть более актуальный термин — «предиктивность»
Опять же, поправьте, если я неправ, но разве авария не показала, что чинить заранее дешевле, чем тушить пожар? 🧯
Если в Арктике, несмотря на постоянные рассказы про ИИ со стороны Правительства, нет предиктивных моделей для критической инфраструктуры, то это очевидное отсутствие системного подхода.
И это, блин, самый тревожный момент всей истории!
С такими подходами не строят системы.
С такими подходами ждут следующую аварию.
Гайз, ловите афоризм: «Арктика — это не оправдание.
Арктика — это ТехЗадание с повышенными требованиями»
И если система к ним не готова —
проблема не в погоде! 😒
З.Ы. Хотя доп. финансирование получить при уже случившемся ЧП проще 😉
#АрктикаНеОправдание
#Мурманск #Блэкаут #УстойчивостьСистемы #ИТМышление
👍67 2💩1