Все вакансии
SRE / Эксперт по обеспечению надежности
18 августа 2025МоскваIT: Разработка
Мы в поиске SRE инженера в практику обеспечения надежности, на задачи внедрения практик на уровне продуктов и систем Банка.
ЧТО НУЖНО ДЕЛАТЬ
- внедрять практики SRE на уровне продуктов и систем Банка
- формировать и контролировать реализацию
- нефункциональных требований к доработкам
- прорабатывать и описывать методики диагностики, подготавливать эксплуатационные инструкции, обучать L1 и L2
- улучшать метрики надежности, наблюдаемости в продуктах/системах совместно с продуктовыми командами или администраторами систем
- выстраивать процессы управления уровнем сервиса на основе SLA/SLO/SLI
- обеспечивать формирование планов и мероприятий по обеспечению непрерывности (DRP/DRT, катастрофоустойчивость, подтверждению заявленных RTO/RPO)
- выявлять проблемы и дефекты функционала по продуктовым метрикам, логам, БД
- устранять аварии и нештатные ситуации, выявлять причины, подготавливать Postmortem-отчёты
- проведение анализа ИТ-решений, взаимодействие с командами и подразделениями в рамках анализа ИТ-решений и интеграций.
КОГО МЫ ИЩЕМ
- опыт внедрения практик и инструментов SRE
- практический опыт локализации проблем и устранения инцидентов в больших и сложных системах
- опыт разработки SLA/SLI/SLO и знание принципов их формирования;
- умение работать с высоконагруженными сервисами
- знание принципов и методов обеспечения качества и надёжности ИТ сервисов
- уверенные навыки работы в Grafana – создание дашбордов, настройка Alerting
- опыт работы с ELK (запросы, визуализация, дашборды)
- навыки работы в ОС Linux, в том числе опыт написания bash-скриптов
- понимание жизненного цикла ИТ-продуктов
- опыт участия в ИТ-проектах или работы в продуктовых командах (взаимодействие с аналитиками, разработчиками, QA)
- высшее техническое образование