Айти Базис

Инженер по диагностике и тестированию серверного оборудования

От 70 000 RUR
  • Москва
  • От 1 года до 3 лет
  • тестирование серверов
  • Linux
  • Стресс-тестирование
  • IPMI
  • Supermicro
  • Dell
  • NVMe
  • RAID
  • GPU

Мы в HOSTKEY растём, и вместе с этим растёт нагрузка на инфраструктуру и требования к её надёжности. Мы создаём отдельную роль, которая отвечает за ключевой этап — проверку серверов перед тем, как они начнут работать в продакшене.

Это не просто тестирование. Это точка контроля качества всей инфраструктуры: именно вы определяете, готов ли сервер к реальной нагрузке или нет.

Если вам нравится работать с железом, разбираться в сложных сбоях и видеть результат своей работы в стабильной работе систем - эта работа для вас.


Что вы будете делать:
  • Проводить полный цикл проверки серверов: от базовой диагностики до глубокого стресс-тестирования под реальными нагрузками (CPU, память с ECC, накопители, сеть и GPU).

  • Работать с автоматизацией: использовать автоматизированную платформу на базе Ansible (загрузка серверов по PXE, запуск live-образа и выполнение Ansible-playbook для сбора диагностических данных).

  • Проводить ручное тестирование: в отдельных кейсах применять ручную диагностику с помощью специализированного ПО в Linux.

  • Анализировать ошибки и логи: выявлять скрытые дефекты через утилиты автоматизации и логи (journalctl, dmesg, MCE, SEL).

  • Взаимодействовать с командой: фиксировать результаты, оперативно информировать инженеров в ДЦ о выявленных проблемах, их сути и давать рекомендации по устранению неисправностей.

  • Управлять серверами: работать через IPMI, iDRAC, iLO (обновлять прошивки, проверять RAID-массивы, контролировать состояние).


Мы ожидаем:
  • Уверенную работу с Linux и понимание, как устроена система.

  • Отличные знания специализированного диагностического ПО: smartctl, ipmitool, fio, stress-ng, memtest86, lspci, dmidecode, ethtool, iperf3, journalctl, dmesg.

  • Опыт взаимодействия с серверным оборудованием (Supermicro, Dell, HP и др.).

  • Понимание архитектуры серверов: CPU, NUMA, PCIe, RAID, память, сеть.

  • Практический опыт диагностики и поиска причин нестабильной работы железа.

Будет плюсом:

  • Опыт работы в дата-центрах или с большим парком серверов.

  • Навыки автоматизации и написания скриптов (Bash / Ansible).

  • Опыт работы с GPU и высоконагруженными системами.

  • Глубокое понимание аппаратных ошибок.

Условия:

  • Полностью удалённая работа.
  • Гибкое начало рабочего дня
  • Зарплата от 70 000 ₽ на руки, стабильные выплаты.
  • Работа в аккредитованной IT-компании.
  • Сильная команда и возможность быстро расти в экспертизе.