Yvision.kzYvision.kz
kk
Разное
Разное
399 772 постов41 подписчиков
Всяко-разно
1
03:39, 07 апреля 2017

Что лучше: бизнес аналитика или научная аналитика?

Blog post image

В нашем центре (Казахстанский центр государственно-частного партнерства) успешно применяются как бизнес-аналитика, так и научная аналитика.

А знаете, в чем главное отличие между этими двумя видами аналитической деятельности?

В бизнесе, прежде всего, важна рентабельность инвестиций, вложенных в аналитическую деятельность. Важно то, чтобы значимые бизнес-решения принимались на основе анализа данных. Поэтому наши сотрудники постоянно работают над совершенствованием методологий анализа данных, изучая, в том числе, методологии анализа больших данных.

Кстати, термин Big Data является, пожалуй, одним из самых каверзных в аналитическом мире.Людям зачастую кажется, что большие данные обязательно БОЛЬШИЕ и что каждый большой массив данных может считаться Big Data. Однако, ключевыми характеристиками для больших данных, как правило, считаются «три V»: объем (volume), скорость (velocity) и многообразие (variety).

А вы сталкиваетесь с Big Data в своей работе?

Blog post image

Дополнение 12 апреля 2017 года

А вы знаете, что около 90% данных, существующих на сегодняшний день, было создано только за последние два года (согласно IBM)? А значит Big Data - это не слепое следование тренду, а требование времени, необходимость и не только для бизнеса, но и для госсектора.

А вот и пример того, как большие данные применяются на практике администрацией Лондона, обеспокоенной впечатляющими темпами прироста населения (за счет мигрантов, главным образом) и угрозой транспортного коллапса.

Tranport for London (TfL), местный государственный орган, ответственный за развитие общественного транспорта в городе, осуществляет свою деятельность на основе Big Data.

TfL вложили немалые инвестиции в совершенствование процессов сбора и анализа данных, информационную инфраструктуру и обучение людей. Собранные и проанализированные данные используются для управления самой большой в Англии Smart-системой продажи билетов, отслеживания заторов на дорогах, наличия велосипедов на велостанциях (и не только).

Властями была также разработана модель прогнозного анализа, которая использует данные об использовании городских земель для создания прогнозов о том, где в будущем возрастет потребность в услугах общественного транспорта.

На основании этих данных госорганом были выявлены приоритеты в модернизации транспортной инфраструктуры Лондона, как например, строительство двух туннелей, соединяющих некоторые удаленные районы города с его экономическим центром.

И это далеко не пределы возможностей использования Big Data...

Дополнение от 20 апреля 2017 года

Примеры использования Big Data в государственном секторе

1. Национальная метеорологическая служба США собирает терабайты данных из датчиков по всему миру. Ученые могут применить технологию Big Data для того, чтобы лучше понять глобальное изменение климата. А госорганы могут использовать эти данные для прогнозирования резких изменений климата и подготовки к их последствиям. Также Big Data можно применить для прогноза урожайности посевов и спроса на воду в сельском хозяйстве.

2. Используя данные полученные из больниц, отчетов об авариях и социальных служб правительство может оценить нужды здравоохранения. Географические данные могут быть проецированы на социально-экономические для того, чтобы определить, где может возникнуть потребность на медицинскую помощь и другие социальные услуги больше чем обычно. Также можно точнее оценить медицинские и социальные риски, связанные с особенностями и условиями каждого региона. Центр по Контролю и Предотвращению болезней США применяет Big Data на регулярной основе для предсказания эпидемии гриппа и отслеживания шаблонов других болезней.

Дополнение от 24 апреля 2017 года

Что получил Пакистан от внедрения технологий Big Data?

Началось все с создания базы мульти-биометрических данных граждан NADRA (National Database & Registration Authority). Сегодня система NADRA содержит 121 млн фотографий и 503 млн отпечатков пальцев граждан, а также информацию про семейное положение, образование, постоянный адрес и другую информацию.

На начальном этапе создания системы анализ собранных данных и их сопоставление с данными имеющимися в госструктурах позволил выявить граждан получавших по 2 и 3 пенсии и пособии, а также людей за плату отбывавших наказание вместо настоящих преступников. Анализ списков избирателей показал, что почти половина из 37 миллионов записей дублируются.

В результате дальнейшего анализа данных было выяснено, что миллионы людей не платят налоги. На тот момент только около 800 тыс. граждан из более чем 120 миллионного населения страны платили налоги. 2.4 миллиона людей имевших дорогие автомобили, дома и банковские счета не имели ИНН (Идентификационный номер налогоплательщика) и не платили налоги, а 1.2 миллиона людей имели, но не платили.

Дополнение от 26 апреля 2017 года

3 факта, которые вы должны знать про науку о данных (Data Science)
• Данные никогда не бывают чистыми

Аналитика без настоящих данных всего лишь скопление гипотез и теории. Данные помогают протестировать их и найти те, которые будут полезны для конечного пользователя. Однако, в реальном мире данные почти никогда не бывают чистыми. Даже в организациях с сильными центрами обработки данных.

• Нельзя не «замарать» руки

Поскольку данные не бывают чистыми и требуют обработки, не существует набора скриптов и кнопок, используя которые можно получить готовую модель. Каждый случай с данными и каждая проблема являются уникальными. Нет замены изучению данных и тестированию моделей. Вам придется «замарать» ваши руки.

• Большинство задач не требуют глубокого исследования

Суть в том, что для решения большинства задач не требуются продвинутые аналитические способности. Решение проблем реального мира включают больше понимания реального мира и сути проблемы, чем выдающихся способностей в статистике. Часто простые модели очень хорошо срабатывают при условии, что проблема хорошо сформулирована.

 
1
362
0