Предыдущая запись в основном была посвящена работе с данными в случае создания инфографики-«объяснялки». Совсем другая история, если выполняемая визуализация подразумевает работу с существенным объемом численных данных. Аналитический этап создания инфографики в таком случае может существенно расшириться.
Я долго размышлял, какой пример здесь продемонстрировать и пришел к выводу, что нужно показать один из наиболее приятных для глаза (по совместительству один из моих любимых) видов визуализации массива данных — диаграмма в параллельных координатах. Этот специфический тип диаграммы может встречаться под следующими названиями: потоковая диаграмма, Санки (Sankey), аллювиальная диаграмма, Финео (Fineo) и даже космографик (сosmograph).
Специально не демонстрирую данный вид визуализации уже на этом этапе повествования, т.к. планирую показать процесс создания этой диаграммы «от и до». К тому же метод визуализации должны диктовать сами данные. Именно от них мы и будем отталкиваться.
Пример 1 | Визуализация бюджета Астаны
От заказчика получаем данные по бюджетным программам районов на 2013-15 годы.
Нас интересует только 2013 г. Анализируем цифры, проверяем, чтобы не было противоречий в логике суммирования по группам/подгруппам/программам и т.д. Аггрегируем информацию по функциональным группам и сводим в одну компактную таблицу в разбивке по районам города.
Как видим, в таблицу также включены доли районов в каждой из бюджетных программ. Однако, ключевыми элементами здесь являются, как вы уже скорее всего догадались, отрезки, сопоставленные с каждой из ячеек с числовым значением. Толщина отрезка соответствует доле района.
Следующим шагом является расстановка осей координат. Название диаграммы говорит само за себя: параллельные координаты. В нашем случае координаты две: районы, бюджетные программы. Каждой бюджетной программе соответствует каждый из трех районов.
Дальше, по сути, дело техники. Даем каждой из соединительных линий соответствующую толщину из приведенной выше таблицы.
Думаю, вы уже поняли, какая ось на этой диаграмме содержит координату бюджетных программ, а какая районов. Слева — программы, справа — районы.
Вот как выглядит вышеописанная технология.
В итоге получаем вот такую визуальную статистику. (Кликните по картинке для увеличения.)
Пока я все это писал, увидел, что мы допустили одну досадную и довольно существенную ошибку на финальной стадии работы с данными. Ошибка не является критической и ее легко исправить. Не буду указывать на саму ошибку. Кто увидит, в чем дело, тот большущий молодец:) А если еще и догадаетесь, как эту ошибку исправить в одно действие, — снимаю шляпу!
Это был пример создания визуализации данных в параллельных координатах «вручную», без какой либо автоматизации.
Далее речь пойдет о визуализации с помощью специализированных программных средств.
Пример 2 | Статистика легкового транспорта в Астане
Итак, есть данные:
Забегая немного вперед, скажу, что визуализировать будем с помощью онлайн сервиса RAW. Но, как и любое другое средство автоматизации, на выходе этот сервис выдает только то, что ему «скормишь» в виде входной информации. Поэтому информацию будем готовить для использования онлайн.
В первоначальном виде массив данных никуда не годится. Т.к. мы планируем создать визуализацию в параллельных координатах, нам прежде всего необходимо понять, где эти координаты в нашей исходной таблице. Все просто – оси координат две: 1-я ось представляет собой список регионов, а 2-я – объем двигателя. Количество автомобилей для каждой точки покажем толщиной линии. Теперь нужно создать мини-базу данных для загрузки в онлайн-сервис. Смысл этого действия заключается в том, чтобы упростить нашу таблицу до простейшего массива.
Вот часть такого массива.
Скармливаем подготовленный массив онлайн-сервису.
Выбираем нужный нам вид диаграммы.
Настраиваем логику диаграммы.
Получаем результат.
А дальше — забирем результат в векторном виде (благо в этом сервисе такая возможность предусмотрена) и дорабатываем в Иллюстраторе.
В итоге работа имеет следующий вид:
(Кликните по картинке для увеличения.)
Таким образом, я продемонстрировал два разных подхода к визуализации однотипных данных. Только в первом случае мы все делали вручную, а во втором случае использовали онлайн-сервис.
В обоих случаях неизменным остается одно: вводная информация требует существенного анализа и проработки перед началом процесса визуализации.
В заключение хотел бы отметить, что диаграмма в параллельных координатах, которую я сегодня показал, является важным инструментом визуальной аналитики и используется, к примеру, железнодорожниками для наглядного отображения графика движения поездов, который является святая святых для всех работников железнодорожного транспорта.
А вот как строили потоковые диаграммы в начале 20-го века.
Брали сотни (и даже тысячи) длинных узких полосок бумаги и отсчитывали нужное количество для каждой точки на осях координат.
Затем фотографировали, ретушировали,
и размещали в издании.
Приведены изображения из книги Graphic Presentation. Willard Cope Brinton. 1939, New York City, Brinton Associates. p. 78.
Больше инфографики — на www.infographics.kz
Перейти к другим записям в этом блоге:
Анатомия инфографики (часть 1)