БЕСПЛАТНАЯ ДОСТАВКА по Москве в пределах МКАД при заказе на любую сумму
X
 
Рубрики

/ / Data science: что это такое и где ей учиться

Data science: что это такое и где ей учиться

02 Июня 2020

Просмотров за сутки 9834
Изображение к посту «Data science: что это такое и где ей учиться»

Онлайн-магазины, банки, стриминговые сервисы и многие другие компании собирают информацию о поведении своих пользователей. Чтобы найти в этих данных закономерности и использовать их для решения конкретных бизнес-задач, необходимо построить не одну модель и протестировать десятки гипотез. Здесь на помощь приходит Data Science — наука о данных.

Рассказываем, как появилась эта наука, чем занимается специалист по Data Science и какие навыки нужны, чтобы им стать.

Яндекс.Практикум — сервис онлайн-образования. Мы помогаем людям расти — на работе и в жизни. Вы освоите новую специальность, заговорите на иностранном языке и будете получать удовольствие от того, чем занимаетесь, каждый день. Здесь учатся, получают навыки и опыт, создают новое и меняют свою жизнь.

Что такое Data Science

При работе с данными Data Science находит нужные решения, руководствуясь методами статистики. Эти решения используют в медицине, чтобы с помощью данных об уже поставленных диагнозах точнее ставить новые, в онлайн-магазинах, чтобы рекомендовать товары, составлять акции и планировать закупки и даже в работе беспилотного транспорта — нейронные сети распознают дорогу, разметку и препятствия.

Зачем нужна отдельная наука о данных, если решения на основе данных принимали и раньше, например, с помощью построения диаграмм на основе опросов? Отдельная область знаний появилась потому, что количество данных и их сложность начали стремительно расти. Больше нельзя было обработать такие объёмы вручную, а закономерности стало труднее увидеть старыми методами.

Современная наука о данных делится на две условные категории: анализ данных и машинное обучение. К анализу данных относятся задачи поиска закономерностей, чтобы с их помощью отвечать на запросы бизнеса. Пример такой задачи: выяснить, какой товар и в какое время больше покупают, есть ли сезонные всплески интереса. Машинное обучение, в отличие от анализа, не даёт ответов на вопросы, но помогает делать автоматические предсказания, например, прогнозировать цены на авиабилеты, учитывая страну вылета и прилёта, дату и время отправления и другие факторы. Классические задачи машинного обучения: распознавание лиц и речи, рекомендации, поиск.

Есть несколько понятий, которые часто упоминают в контексте Data Science:

  1. ML (Machine Learning, «машинное обучение»). Про машинное обучение мы уже говорили выше, это набор методов и алгоритмов для создания моделей, которые могут предсказать результат по входным данным. Один из методов машинного обучения — нейросети.
  2. AI (Artificial Intelligence, «искусственный интеллект»). Искусственный интеллект используют в компьютерных системах для решения задач, в которых обычно нужна помощь человека. Например, чтобы узнавать людей на фото, анализировать и сравнивать книги в вашей электронной библиотеке и предлагать на их основе новые. Задачи искусственного интеллекта решают в том числе с помощью методов машинного обучения.
  3. Big Data («большие данные»). Для построения моделей машинного обучения требуются числовые и текстовые данные, фото, видео и аудио. Чтобы эту информацию хранить и анализировать нужно знание Big Data. Инженер по работе с большими данными продумывает, как собрать и где хранить данные, как сделать их доступными для внутренних и внешних пользователей.

У новичков в Data Science часто возникает путаница, когда нужно определить связи между этими тремя понятиями. На этой схеме хорошо показано, как это есть на самом деле:

Data science: что это такое и где ей учиться
Источник: Хабр

Чем занимается специалист по Data Science

В задачи датасаентиста входит всё, о чём мы рассказывали выше: анализ данных, машинное обучение, построение моделей. Благодаря работе этих специалистов:

  • Алиса понимает вашу речь и может поддержать разговор,
  • Онлайн-магазины умеют подбирать сопутствующие товары, которые вы всё время забываете добавить в корзину,
  • Камера IPhone умеет различать вас и ваших друзей в кадре.

Какие навыки нужны, чтобы стать специалистом по Data Science

У работодателей пока нет единых требований к таким кандидатам, набор навыков и инструментов зависит от задач конкретной компании. Можно выделить базовые требования для специалистов, которые работают с большим количеством данных:

  • математика (статистика, теория вероятности, линейная алгебра и математический анализ), чтобы строить математические модели, искать закономерности или предсказывать что-то новое;
  • программирование (языки программирования Python, R), чтобы написать модель для первоначальной оценки гипотезы, поиска общих данных или простой аналитики;
  • машинное обучение, чтобы переобучать готовые или создавать собственные модели;
  • инструменты анализа данных (библиотеки Pandas, Matplotlib).

Где узнать больше

Мы собрали книги, лекции и курсы, чтобы поближе познакомиться с наукой и задачами специалистов, которые с ней работают.

Для тех, кто интересуется:

Yufeng Guo

«What is Machine Learning?»

Первый ролик из серии AI Adventures команды Google Cloud. В нём на простых примерах объясняется, как работает и где применяется машинное обучение. В полной серии 53 ролика, в которых подробно и просто рассказано о машинном обучении, работе облачных сервисов и искусственном интеллекте.

Стоимость: бесплатно

Язык: английский, есть английские субтитры

Asitang Mishra

«Demystifying Data Science»

Датасаентист NASA Аситанг Мишра сравнивает себя с Властелином колец, потому что такой специалист совмещает много ролей. Он пытается объяснить различные причуды этой новой, быстрорастущей и порой расплывчатой области науки о данных в простых и доступных каждому терминах.

Стоимость: бесплатно

Язык: английский, есть английские субтитры

Data science: что это такое и где ей учиться

Кирилл Еременко

«Работа с данными в любой сфере»

Что общего у аналитика данных и Шерлока Холмса? Как у Netflix получилось создать 100% хит — сериал «Карточный домик»? Ответ кроется в правильном использовании данных. Эта книга — практическое руководство, независимо от того, хотите ли вы использовать анализ данных в своей профессии, собираетесь ли стать аналитиком данных, или уже работаете в этой области.

Подробнее о книге

Стоимость: 650 рублей

Для тех, кто хочет научиться:

Data science: что это такое и где ей учиться

Профессия «Специалист по Data Science» в Яндекс.Практикуме

За 8 месяцев обучения вы освоите язык программирования Python, основы анализа данных и методы машинного обучения. Познакомитесь с основными системами хранения данных, научитесь решать простые задачи компьютерного зрения и определять тональность отзывов в интернете. Соберете портфолио из 17 проектов: спрогнозируете вероятность ухода клиента из банка и обучите модель для предсказания добычи нефти с наименьшим риском убытка.

Чтобы начать, достаточно иметь законченное среднее образование и возможность заниматься не меньше 10 часов в неделю. Первые 20 часов курса ― бесплатно, чтобы попробовать и принять решение, продолжать обучение или нет.

Подробнее о курсе

Стоимость: 90 000 рублей

Язык: русский

Data science: что это такое и где ей учиться

Джон Келлехер, Брендан Тирни

«Наука о данных. Базовый курс»

Книга одного из самых престижных в мире технических университетов — Массачусетского технологического института (MIT). Это базовый учебник, который знакомит с основами науки о данных. В нём охватываются все ключевые аспекты, начиная с истории развития сбора и анализа данных и заканчивая этическими проблемами, связанными с конфиденциальностью информации. Авторы объясняют, как работают нейронные сети и машинное обучение, приводят примеры анализа бизнес-проблем и того, как их можно решить, рассказывают о сферах, на которые наука о данных окажет наибольшее влияние в будущем.

Подробнее о Книге

Стоимость: 610 рублей

Data science: что это такое и где ей учиться

Специализация МФТИ и Яндекса «Машинное обучение и анализ данных»

Специализация включает в себя шесть курсов: «Математика и Python для анализа данных», «Обучение на размеченных данных», «Поиск структуры в данных», «Построение выводов по данным», «Прикладные задачи анализа данных», «Анализа данных: финальный проект». Вы освоите основные темы, необходимые в работе с большим массивом данных, научитесь строить рекомендательные системы, оценивать эмоциональную окраску текста и прогнозировать спрос на товар.

Подробнее о Курсе

Стоимость: 6 036 рублей в месяц, можно прослушать бесплатно

Язык: русский

Data science: что это такое и где ей учиться

Курс Stepik «Введение в Data Science и машинное обучение»

Курс знакомит слушателей с основами машинного обучения и рассчитан в первую очередь на тех слушателей, которые только начинают свой путь в Data Science. Разберёте основные теоретические понятия, а также начнёте знакомство с библиотеками Pandas и Scikit-learn — наиболее популярными инструментами для анализа данных и машинного обучения, используя язык программирования Python. Для успешного прохождения потребуются базовые знания в области статистики и программирования на Python для решения практических задач (но его можно выучить и параллельно курсу).

Подробнее о Курсе

Стоимость: бесплатно

Язык: русский


Читайте также:

Читайте также

Получать самые интересные статьи

Подпишитесь на рассылку «Альпина.Медиа»

Книги на эту тему

Комментарии для сайта Cackle
 

Войти на сайт

или


Ваша корзина пуста
Нажмите здесь, чтобы продолжить покупки
Корзина