Наша команда оптимизирует инференс нейросетевых моделей. Мы начинали с голосовых технологий и смогли заметно улучшить throughput и latency. Теперь мы развиваем решения для NLP, LLM, CV и других направлений.Наша цель — сделать так, чтобы использовать передовые модели в продуктах компании можно было быстро и эффективно. Как мы работаем: Делимся опытом во всех областях ML: CV, NLP, RecSys, Speech. Проводим внутренние семинары и обсуждаем последние новости AI. Даем возможность как закидывать наработки в прод на миллионы пользователей, так и проводить исследования в своей области. Развиваем в МФТИ лабораторию, с которой можно и нужно делать коллаборации. Выстраиваем процессы и используем инфраструктуру компании, при этом минимизируем бюрократию. Фокусируемся на принципе AI-first. Не копим легаси. Оплачиваем участие в топовых AI-конференциях 2—3 раза в год. Обязанности Оптимизировать производительность моделей машинного обучения для архитектур GPU Работать с фреймворками для ускорения вычислений и развертывания нейросетей Писать производительный низкоуровневый код на C++, оптимизированный под GPU с использованием CUDA Требования У вас есть опыт разработки ML-моделей с использованием современных DL-фреймворков (Pytorch, Jax/Tensorflow и других) и их применения в продакшене Хорошо понимаете современных DL-архитектур, знание методов оптимизации инференса Работали с TensorRT, TRT-LLM, Triton Inference Server и другими инструментами ускорения моделей Будет плюсом, если у вас есть опыт интеграции open-source-фреймворков, разработки высоконагруженных приложений на C/C++ Мы предлагаем: Возможность работать с SOTA-моделями в разных сферах с настоящим бизнес-применением, доступ к современным вычислительным ресурсам, развитие и обучение новым технологиям Работу в офисе или удаленно — по договоренности Платформу обучения и развития «Т‑Банк Апгрейд». Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев. Предложим льготное страхование вашим близким Возможность работы в аккредитованной ИТ-компании Линейку льготных тарифов на продукты Т‑Банка Частичную компенсацию затрат на спорт Сервисы для поддержки сотрудника по психологическим, юридическим и финансовым вопросам Три дополнительных дня отпуска в год Достойную зарплату — обсудим ее на собеседовании
Похожие вакансии
Senior ML Engineer в команду Search
Договорная
Москва. Станции метро: Белорусская
«UZUM TECHNOLOGIES»
Middle+ ML Engineer в команду RecSys
Договорная
Москва. Станции метро: Белорусская
«UZUM TECHNOLOGIES»