ML-инструменты1. Основные библиотеки:
— NumPy,
— Pandas,
— Sklearn,
— PyTorch
и другие популярные.
2.
PyTorch Lightning упрощает процесс написания кода для обучения моделей.
— Почитайте
документацию (нужен VPN).
— Сделайте пару учебных проектов.
3.
ClearML используем для отслеживания результатов экспериментов и удаленного запуска (последнее можно не изучать).
— Посмотрите
видеоуроки.
— Выполните учебные задачи, например, на
Kaggle.
Dev-инструменты1.
FastAPI нужен для написания backend API на Python.
— Достаточно знать основы.
— Напишите пару небольших pet-проектов.
2.
Docker используем для контейнеризации и деплоя приложений.
— Важно уметь пользоваться и понимать задачи и принцип работы.
— В интернете много учебных материалов:
документация, видеоуроки, статьи и пр.
3.
Git используется в любой разработке.
— Для стажировки достаточно знать базовые вещи: как делать commit, как работать с ветками, что такое Pull Request или Merge Request.
— Мы используем
gitlab, поэтому рекомендуем завести себе аккаунт и познакомиться с инструментом.
КурсыВ команде периодически проходим открытые курсы и рекомендуем их новичкам. Курсы повышают шансы кандидатов попасть на стажировку.
1.
mlcourse.ai — курс по классическим алгоритмам машинного обучения.
Отлично подходит для новичков, которые раньше не занимались ML. Знакомит с основными инструментами: Pandas, NumPy, Sklearn, Matplotlib и Catboost.
2.
dlcourse.ai — базовый курс по направлению Deep Learning.
Часть информации уже устарела, но все равно полезная. Курс знакомит с основными инструментами и алгоритмами в области нейронных сетей.