Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
- 28.09.2020, 10:30
- Денис Гордеев
-
6,8 тыс
Как стать Data Scientist’ом: рассказываем по-простому
Еще лет десять назад о «науке больших данных» слышали только отдельные ученые, а сегодня data science называют «самой сексуальной профессией XXI века». Это неудивительно, ведь качественная работа с данными — ключ к успеху как для больших корпораций, так и для стартапов на несколько десятков человек.
Data Science применяется почти во всех сферах человеческой деятельности: в маркетинге — для повышения эффективности рекламы, в сельском хозяйстве — для прогнозирования цен на продукцию, в банковской сфере — для принятия решений о выдаче кредитов и ссуд. Список этот можно продолжать чуть ли не до бесконечности; важно, что специалисты, умеющие извлекать из огромных массивов информации полезные данные для бизнеса, нынче в цене.
Если вам хочется стать повелителем Big Data и научиться управлять информационными потоками, мы расскажем, что для этого нужно и как быстро и безболезненно влиться в новую для вас сферу. Было бы желание!
Что нужно знать
Тем, кто не связан со сферой IT, Data Science зачастую кажется чем-то вроде магии. Но для того, чтобы этим заниматься, не нужна ни волшебная палочка, ни полученый от предков дар. Достаточно ясной головы и усидчивости.
Итак, первым делом нужно знать язык — да не язык программирования, а английский. На нем написана большая часть документации, да и названия моделей, функций и команд в коде тоже взяты из него. Идеального британского произношения и словарного запаса в 20000 слов вам не понадобится, но научиться бегло читать придется однозначно.

Второе необходимое условие — какой-то из языков программирования. Если у вас покрылся холодным потом лоб от школьных мучений с Pascal или C++, у нас есть хорошая новость. Основной инструмент для работы в Data Science — Python, один из самых простых для понимания и работы языков программирования. «Простое лучше, чем сложное, а сложное лучше, чем запутанное», гласят принципы Python. Так что не пугайтесь: это будет вам под силу.
Ну и третье — не последнее, но очень важное: придется освежить в голове знания основ высшей математики и статистики. Возможно, даже выучить что-то новое для себя. Если вы освоите эти три пункта хотя бы на твердую четверку — считайте, что вам открыт путь в мир больших данных и больших зарплат. Но это далеко не финиш: войдя в эту реку однажды, плыть по течению не получится. Нужно будет все время грести — учить новые фреймворки, читать документацию и знакомиться с инновационными подходами к данным.
Как учиться
Казалось бы, цели намечены, а задачи ясны — но с чего начать и как выстроить план обучения? Даже человека, который уже немного знаком с программированием и компьютерными науками, переизбыток фреймворков, туториалов и библиотек может попросту ввести в ступор. Обучающих видео и статей на разных ресурсах тоже не счесть — но нырять в это все в случайном порядке, то уже через пару дней можно и не вспомнить, зачем все это началось.
Структурированный подход — вещь неочевидная, но очень важная. Отдельные элементы нужных знаний можно сравнить с кирпичами, которые сами по себе просты. Но возвести из этих кирпичей хороший дом без подробного предварительного плана попросту невозможно: получится что-то не очень пригодное для жилья.

Поэтому если уж вы всерьез решили освоить эту специальность, то лучше не пытаться с наскоку пересмотреть все видео по теме на Youtube, а пройти структурированный курс. При этом не придется переживать о том, что вы чего-то не знаете: школа GeekBrains обучает Data Science с нуля — даже тех, для кого «питон» это такая змея, а «интеграл» — группа Бари Алибасова.
Программа этого курса, несмотря на ее объем и насыщенность информацией, достаточно проста для понимания: знания в ней даются от простых к сложным, от базовых понятий к продвинутым инструментам анализа. После обучения в GeekBrains у вас в голове будет по полочкам разложено все, что нужно для работы: как писать запросы к базам данных, как создавать облачные сервера, как искать информацию, тестировать гипотезы и находить корреляции в данных.
Что можно делать
Как мы уже говорили, Data Scientist’ы нужны почти в любых сферах деятельности. Поэтому выбор карьерных путей в этой профессии невероятно широк. Data Science — междисциплинарная наука, поэтому позволяет охватить сразу несколько жизненных интересов.

Если вам интересна медицина – вы можете разрабатывать системы для предварительной постановки диагноза и моделирования развития пандемий. Следите за политикой – можете участвовать в создании программ для анализа и прогнозирования результатов выборов. Любите машины? Создавайте комплексы сбора данных для беспилотных автомобилей.
Немаловажно, что спрос на Data Scientist’ов постоянно растет, и без работы вы не останетесь. К тому же в GeekBrains гарантируют выпускникам своего курса трудоустройство по полученной специальности в компании с мировым именем. Для этого основная часть курса состоит из практических задач — чтобы вы, придя на новую работу, сразу могли заняться делом, а не «забывать все то, чему вас учили».
Согласно гипотезе о так называемой Еврогондване, в эпоху динозавров Европа, как часть северного суперконтинента Лавразия, еще не полностью отделилась от южного суперконтинента Гондвана и животные могли свободно мигрировать между Европой и Африкой. Однако новый анализ найденных в Венгрии костей первобытного крокодила показал, что его сходство с гондванскими видами обусловлено не близким родством, а схожим образом жизни.
Треть века назад Штаты и Мексика подписали Североамериканское соглашение о свободной торговле. Авторы новой научной работы показали, что это спровоцировало рост войн между бандами и подъем смертности среди молодых мужчин на десятки процентов — но только в тех зонах, которые были интересны картелям. Всего после подписания соглашения в Мексике было убито (оценка с учетом исчезнувших трупов) более 0,85 миллиона человек.
Новые данные показали, что удар зонда DART не только изменил орбитальный период небольшого спутника Диморфа вокруг его «родителя» Дидима, но и вызвал небольшое изменение движения всей бинарной системы вокруг Солнца. Эти результаты укрепляют уверенность ученых в том, что технология кинетического удара, при заблаговременном обнаружении опасного объекта, может помочь отклонить потенциально опасный астероид от столкновения с Землей.
Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.
Запасы лития в России требуют переоценки и могут оказаться в разы выше, чем считалось до 2025 года. Об этом говорится в исследовании «Состояние ресурсной базы критически важных металлов и элементов для развития современных технологий», подготовленном учеными РГУ нефти и газа (НИУ) имени И.М. Губкина.
Российские ученые из МФТИ с коллегами из Института прикладной математики им. М. В. Келдыша РАН и Института физики Земли им. О.Ю. Шмидта РАН разработали инновационный метод для расчета равновесного распределения несмешивающихся жидкостей в пористой среде. Результаты применения этого метода можно использовать в разработках по повышению нефтеотдачи и гидрологии, а также геологического СО2-хранения.
Астрономы недавно проанализировали базу данных о падающих на Землю объектах и пришли к выводу, что два из них прибыли из межзвездного пространства. Известна не только дата, но и место падения каждого из них.
В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.
«Любить лишь можно только раз», — писал поэт Сергей Есенин, а герои культовых сериалов приходили к выводу, что «настоящая» влюбленность случается в жизни максимум дважды. Однако ни один из этих тезисов не подкреплен научными данными. Американские исследователи подошли к вопросу иначе: опросили более 10 тысяч человек и вывели среднее число сильных влюбленностей, возможных в течение жизни.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии