Обязанности:
- Разворачивать инструменты AI/ML-разработки в кластере Kubernetes;- Разворачивать инференс моделей;- Настраивать кластер Kubernetes для работы с GPU устройствами Nvidia;- Обеспечивать высокую доступность приложений в продуктиве;- Сопровождать работу команд разработки;- Оптимизировать системы для обучения нейросетевых моделей на GPU с использованием Volcano, PyTorch в Kubernetes;- Разворачивать и поддерживать хранилище секретов.
Требования:
- Опыт работы с GPU;- Опыт разворачивания GPU кластера;- Опыт работы с Kubernetes и с Gitlab CI;- Опыт работы с Linux, понимание сетевой модели OSI.- Опыт работы с мониторингом: Zabbix, Prometheus, Victoria metrics, Grafana и логированием: Opensearch, Loki. Будет плюсом: - Опыт работы со Spark или Airflow;- Опыт работы с JupyterHub;- Опыт работы с Kubeflow, MLFlow, ClearML.Похожие вакансии