- 28.09.2020, 10:30
- Денис Гордеев
-
6,8 тыс
Как стать Data Scientist’ом: рассказываем по-простому
Еще лет десять назад о «науке больших данных» слышали только отдельные ученые, а сегодня data science называют «самой сексуальной профессией XXI века». Это неудивительно, ведь качественная работа с данными — ключ к успеху как для больших корпораций, так и для стартапов на несколько десятков человек.
Data Science применяется почти во всех сферах человеческой деятельности: в маркетинге — для повышения эффективности рекламы, в сельском хозяйстве — для прогнозирования цен на продукцию, в банковской сфере — для принятия решений о выдаче кредитов и ссуд. Список этот можно продолжать чуть ли не до бесконечности; важно, что специалисты, умеющие извлекать из огромных массивов информации полезные данные для бизнеса, нынче в цене.
Если вам хочется стать повелителем Big Data и научиться управлять информационными потоками, мы расскажем, что для этого нужно и как быстро и безболезненно влиться в новую для вас сферу. Было бы желание!
Что нужно знать
Тем, кто не связан со сферой IT, Data Science зачастую кажется чем-то вроде магии. Но для того, чтобы этим заниматься, не нужна ни волшебная палочка, ни полученый от предков дар. Достаточно ясной головы и усидчивости.
Итак, первым делом нужно знать язык — да не язык программирования, а английский. На нем написана большая часть документации, да и названия моделей, функций и команд в коде тоже взяты из него. Идеального британского произношения и словарного запаса в 20000 слов вам не понадобится, но научиться бегло читать придется однозначно.

Второе необходимое условие — какой-то из языков программирования. Если у вас покрылся холодным потом лоб от школьных мучений с Pascal или C++, у нас есть хорошая новость. Основной инструмент для работы в Data Science — Python, один из самых простых для понимания и работы языков программирования. «Простое лучше, чем сложное, а сложное лучше, чем запутанное», гласят принципы Python. Так что не пугайтесь: это будет вам под силу.
Ну и третье — не последнее, но очень важное: придется освежить в голове знания основ высшей математики и статистики. Возможно, даже выучить что-то новое для себя. Если вы освоите эти три пункта хотя бы на твердую четверку — считайте, что вам открыт путь в мир больших данных и больших зарплат. Но это далеко не финиш: войдя в эту реку однажды, плыть по течению не получится. Нужно будет все время грести — учить новые фреймворки, читать документацию и знакомиться с инновационными подходами к данным.
Как учиться
Казалось бы, цели намечены, а задачи ясны — но с чего начать и как выстроить план обучения? Даже человека, который уже немного знаком с программированием и компьютерными науками, переизбыток фреймворков, туториалов и библиотек может попросту ввести в ступор. Обучающих видео и статей на разных ресурсах тоже не счесть — но нырять в это все в случайном порядке, то уже через пару дней можно и не вспомнить, зачем все это началось.
Структурированный подход — вещь неочевидная, но очень важная. Отдельные элементы нужных знаний можно сравнить с кирпичами, которые сами по себе просты. Но возвести из этих кирпичей хороший дом без подробного предварительного плана попросту невозможно: получится что-то не очень пригодное для жилья.

Поэтому если уж вы всерьез решили освоить эту специальность, то лучше не пытаться с наскоку пересмотреть все видео по теме на Youtube, а пройти структурированный курс. При этом не придется переживать о том, что вы чего-то не знаете: школа GeekBrains обучает Data Science с нуля — даже тех, для кого «питон» это такая змея, а «интеграл» — группа Бари Алибасова.
Программа этого курса, несмотря на ее объем и насыщенность информацией, достаточно проста для понимания: знания в ней даются от простых к сложным, от базовых понятий к продвинутым инструментам анализа. После обучения в GeekBrains у вас в голове будет по полочкам разложено все, что нужно для работы: как писать запросы к базам данных, как создавать облачные сервера, как искать информацию, тестировать гипотезы и находить корреляции в данных.
Что можно делать
Как мы уже говорили, Data Scientist’ы нужны почти в любых сферах деятельности. Поэтому выбор карьерных путей в этой профессии невероятно широк. Data Science — междисциплинарная наука, поэтому позволяет охватить сразу несколько жизненных интересов.

Если вам интересна медицина – вы можете разрабатывать системы для предварительной постановки диагноза и моделирования развития пандемий. Следите за политикой – можете участвовать в создании программ для анализа и прогнозирования результатов выборов. Любите машины? Создавайте комплексы сбора данных для беспилотных автомобилей.
Немаловажно, что спрос на Data Scientist’ов постоянно растет, и без работы вы не останетесь. К тому же в GeekBrains гарантируют выпускникам своего курса трудоустройство по полученной специальности в компании с мировым именем. Для этого основная часть курса состоит из практических задач — чтобы вы, придя на новую работу, сразу могли заняться делом, а не «забывать все то, чему вас учили».
Способность договариваться с сородичами, будь то танец пчел или предупреждающий крик примата, хорошо изучена. Но то, как животные координируют действия с представителями других видов, долго оставалось загадкой. Международная группа ученых собрала воедино все известные случаи такой межвидовой коммуникации и выяснила, что во время эволюции выработался гибкий язык сигналов.
Канадские исследователи установили, что регулярный прием добавок кальция, витамина D или их комбинации практически не снижает риск переломов и падений у большинства пожилых людей. Врачи, профессиональные ассоциации и официальные руководства по всему миру продолжают массово назначать эти препараты для защиты скелета, а объемы их выписки в последние годы только росли.
Биологи доказали, что способность млекопитающих восстанавливать утраченные конечности и их части не исчезла в ходе эволюции, а просто заблокирована на генетическом уровне. Во время экспериментов на животных авторы работы успешно вырастили заново кости, суставы, связки и сухожилия, которые обычно не восстанавливаются после ампутации.
Ученые РГУ нефти и газа (НИУ) имени И.М. Губкина разработали алгоритм, который сокращает обработку полученных в процессе внутритрубной диагностики газопроводов данных в десятки раз — с нескольких часов до минут. Опытно-промышленная эксплуатация системы на объектах Единой системы газоснабжения России (ЕСГ) запланирована до конца 2026 года.
Ученые НИУ ВШЭ совместно с коллегами из российских университетов выяснили, какие мутации в гене ACVRL1 опасны для пациентов с легочной артериальной гипертензией. Они смоделировали, как изменения в гене влияют на связывание АТФ с белком — процесс, от которого зависит передача сигналов, необходимых для работы сосудов. Оказалось, что 20 из 32 вариантов могут нарушать передачу сигнала и провоцировать болезнь.
Исследователи НИУ ВШЭ выяснили, как российские интернет-пользователи проверяют сомнительную информацию и что заставляет их это делать. Оказалось, что более половины, заподозрив обман, пытаются отыскать первоисточник. А определяющими факторами в деле проверки становятся возраст, место жительства, социальное положение, навыки работы с информацией и использование ИИ.
Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии