Все вакансии

SRE / Эксперт по обеспечению надежности

18 августа 2025МоскваIT: Разработка

Мы в поиске SRE инженера в практику обеспечения надежности, на задачи внедрения практик на уровне продуктов и систем Банка.

ЧТО НУЖНО ДЕЛАТЬ

  • внедрять практики SRE на уровне продуктов и систем Банка
  • формировать и контролировать реализацию
  • нефункциональных требований к доработкам
  • прорабатывать и описывать методики диагностики, подготавливать эксплуатационные инструкции, обучать L1 и L2
  • улучшать метрики надежности, наблюдаемости в продуктах/системах совместно с продуктовыми командами или администраторами систем
  • выстраивать процессы управления уровнем сервиса на основе SLA/SLO/SLI
  • обеспечивать формирование планов и мероприятий по обеспечению непрерывности (DRP/DRT, катастрофоустойчивость, подтверждению заявленных RTO/RPO)
  • выявлять проблемы и дефекты функционала по продуктовым метрикам, логам, БД
  • устранять аварии и нештатные ситуации, выявлять причины, подготавливать Postmortem-отчёты
  • проведение анализа ИТ-решений, взаимодействие с командами и подразделениями в рамках анализа ИТ-решений и интеграций.

КОГО МЫ ИЩЕМ

  • опыт внедрения практик и инструментов SRE
  • практический опыт локализации проблем и устранения инцидентов в больших и сложных системах
  • опыт разработки SLA/SLI/SLO и знание принципов их формирования;
  • умение работать с высоконагруженными сервисами
  • знание принципов и методов обеспечения качества и надёжности ИТ сервисов
  • уверенные навыки работы в Grafana – создание дашбордов, настройка Alerting
  • опыт работы с ELK (запросы, визуализация, дашборды)
  • навыки работы в ОС Linux, в том числе опыт написания bash-скриптов
  • понимание жизненного цикла ИТ-продуктов
  • опыт участия в ИТ-проектах или работы в продуктовых командах (взаимодействие с аналитиками, разработчиками, QA)
  • высшее техническое образование