Обязанности:
Сейчас мы находимся в поиске MLops/DevOps-инженера в Ростелеком ИТ. «РТК ИТ» специализируется на проектировании и автоматизации процессов продаж, а также обслуживании телекоммуникационной компании в В2С, В2В, B2O сегментах. Проект построения и развития внутренней платформы ИИ. Мы предлагаем: - Удаленную работу (на территории РФ);- Оформление по ТК РФ в аккредитованной ИТ-компании;- Кафетерий льгот с возможностью выбора категорий (ДМС или компенсация затрат на медицинские услуги, спорт и т.д.). Вам предстоит: - Разворачивать инструменты AI/ML-разработки в кластере Kubernetes;- Разворачивать инференс моделей;- Настраивать кластер Kubernetes для работы с GPU устройствами Nvidia;- Обеспечивать высокую доступность приложений в продуктиве;- Сопровождать работу команд разработки;- Оптимизировать системы для обучения нейросетевых моделей на GPU с использованием Volcano, PyTorch в Kubernetes;- Разворачивать и поддерживать хранилище секретов. Нам важны: - Опыт работы с GPU;- Опыт работы с Kubernetes и с Gitlab CI;- Опыт работы с Linux, понимание сетевой модели OSI.- Опыт работы с мониторингом: Zabbix, Prometheus, Victoria metrics, Grafana и логированием: Opensearch, Loki. Будет плюсом: - Опыт работы со Spark или Airflow;- Опыт работы с JupyterHub;- Опыт работы с Kubeflow, MLFlow, ClearML.Похожие вакансии