Мы - команда профессионалов, работающих над созданием сервиса машинного перевода "Толмач". Мы стремимся к постоянному развитию и улучшению нашего продукта, поэтому ищем талантливого MLE, который поможет нам расширить возможности "Толмача". Обязанности Исследование и внедрение перспективных методов оптимизации пайплайнов на инференсе. Поиск и устранение проблемных мест в пайплайнах моделей на инференсе. Оптимизация существующих пайплайнов под различные вычислительные платформы. Разработка бэкенда для интеграции моделей в продукт. Требования Знание языков программирования: Python Знание фреймворков, платформ и технологий: PyTorch, ONNX, Triton, REST Понимание особенностей обучения моделей на основе архитектуры трансформеров Глубокие знания о работе transformer-like моделей Навыки оптимизации пайплайнов обучения и инференса Опыт разработки инференса каскада моделей Системный подход к решению задач Английский язык на уровне чтения научных статей Будет плюсом: Опыт разработки звуковых моделей (TTS, ASR) и моделей машинного перевода Понимание различий между R&D и продуктом и умение применять эти знания в работе. Знание C++ Условия Работу в дружной и профессиональной команде. Возможность влиять на развитие молодого быстроразвивающегося продукта. Конкурентоспособную заработную плату. Гибкий график работы. (Возможность гибрида обсуждается отдельно) Участие в конференциях и семинарах по машинному обучению. Если вы готовы присоединиться к нашей команде и внести свой вклад в развитие "Толмача"