>
>
>
Новое слово: big data

Новое слово: big data

08.12.2015
5
Фото: Pixabay.com

Информация — уже известная и недавно появившаяся — всегда была неотъемлемой частью развития мира. Однако никогда прежде ее объем не был настолько велик. Соцсети, гаджеты, видеорегистраторы, приборы для мониторинга окружающей среды, спутники — продолжать этот список можно бесконечно. Подсчитано, что до 90% из имеющихся сегодня данных было произведено за несколько последних лет и только 10% — за всю предыдущую историю человечества.

Одна из главных задач сейчас — «обуздать» растущий информационный поток: научиться обрабатывать и структурировать данные, а также извлекать из них пользу. Именно за это отвечает то, что принято обозначать емким термином big data.

Само определение big data — в дословном переводе с английского «большие данные» — появилось в 2008 году. Журнал Nature выпустил спецномер, где рассказывалось о беспрецедентном росте объемов информации и том, к чему это приведет. Феномен информационного бума журналисты описали термином big data. Однако сегодня «биг дата» — понятие более широкое: это и собственно большие массивы данных, и ускорение процесса накопления информации, и «инструменты», которые позволяют их обрабатывать.

Материалы по теме
Топ проектов красноярских ученых в сфере биотехнологий
Наука и жизнь: новые органы, наноалмазы и лекарства от рака
Новое слово: биотехнологии
Что нас спасет в XXI веке

Изначально о big data говорили как о направлении, интересном преимущественно государству, науке и бизнесу. Предполагалось, что госструктурам «большие данные» помогут лучше понимать происходящее в различных сферах и прогнозировать развитие ситуации. Скажем, сводить к минимуму последствия от природных катаклизмов — своевременно на основе прогнозов переселять людей в безопасные места. Ученым ранее неструктурированная и неизвестная информация позволит делать новые открытия. Для бизнеса же это возможность лучше организовать работу и «просчитать» своего клиента. Предугадать — например, на основе предыдущих покупок и/или активности в соцсетях — какой товар или услуга понадобятся ему в ближайшее время.

Однако сегодня «большие данные» все чаще связывают с таким понятием как «качество жизни» — возможностью каждого отдельного человека сделать на основе обобщенной и структурированной информации наилучший выбор. Сэкономить свое время, как минимум, или обезопасить свою жизнь, как максимум. Частное проявление того, как работает big data — информация о дорожных пробках на конкретных магистралях и решение поехать домой по объездной дороге. Но этот пример — лишь вершина айсберга. Так, в Intel на основе общедоступных данных разработали программу, которая составляет карту расположения растений-аллергенов. Учитывая эти данные, аллергики могут составить маршрут так, чтобы избежать лишних рисков.

Другое многообещающее направление — использование «биг дата» для контроля состояния здоровья. Носимые гаджеты уже умеют замерять пульс и отсчитывать число пройденных шагов. В скором времени они заменят градусник, смогут в непрерывном режиме отслеживать работу сердца и других органов.

В обобщенном виде эта информация позволит еще лучше прогнозировать и лечить болезни.

Годовая зарплата квалифицированного аналитика данных начинается от $100 тыс (7 млн. рублей) в год.

Виртуальное турагентство Olset уже использует данные из всех возможных источников, чтобы определить предпочтения человека в выборе стран и мест отдыха. На основе этой информации в компании выстраивают маршрут и бронируют отели для клиентов.

Разумеется, big data как новая и важная отрасль невозможна без кадров. Главная роль в этой области отводится аналитикам данных (data scientists) — тем, кто будет не столько обобщать и структурировать информацию, сколько делать на ее основе прогнозы. Работа эта требует широкий круг знаний — от математики и статистики до навыков программирования. Пока российские вузы только запускают связанные с «большими данными» магистерские программы, американские уже выпускают таких специалистов. 

Наталья Мороз, интернет-газета Newslab.ru

Рекомендуем почитать