Товарищу Менделееву о методологии и обработке данных

У меня перед глазами 21 страница «болванки» методологии большого-большого исследования по сельскому хозяйству Казахстана. Получилось так, что члены команды работали над ней по отдельности и с...

У меня перед глазами 21 страница «болванки» методологии большого-большого исследования по сельскому хозяйству Казахстана.

Получилось так, что члены команды работали над ней по отдельности и с перерывами. Попутно возникало множество вариантов методологии для «внешнего мира»: презентации для заказчиков, схемы для публикации в журнале, схемы после обсуждений с экспертами, огромные модели отрасли с перечислением всех объектов, субъектов государства, бизнеса, населения и т.д.

В итоге – после тупого сведения всей инфы в один файл получился документ, в котором об одном и том же говорится шесть раз.

Плюс ко всему в папке «Методология» с нашим бредом соседствуют указания российского минсельхоза, минсельхоза США, пары-тройки международных организаций и десятка исследовательских институтов. 50% информации на английском языке.

Сижу и думаю – мне нужны три вещи:

  1. универсальная категоризация данных о сельскохозяйственных отраслях
  2. гео-информационная система, чтобы нанести всю статистику.
  3. система анализа данных из класса Business Intelligence. По прошлогодним данным лидером здесь был Oracle. В российских системах нашла «Семантический архив». Основные ее функции – доставлять информацию с заданных сайтов, хранить в категоризированном виде (свойства проставляет оператор), строить связи между объектами и отчеты.

С дней стажерства шеф постоянно требовал от нас, чтобы мы выработали в команде единый понятийно-категориальный аппарат. Раньше словосочетание было просто абракадаброй, сейчас же яснее представляешь, что организация данных в категории, методы обобщения, причинно-следственных связей и т.п. у людей совершенно разные и очень устойчивые. Для новостных, аналитических, исследовательских агентств, особенно с наставнической системой обучения, очень важно выработать единые понятия и категории – что такое субъект рынка, что такое модель рынка, что такое инфраструктура, что такое концепция материала или исследования и т.д. В одном руководстве Reuters около 500 страниц!

В общем, 21 страница смешанной болванки открыла целый пласт методологической работы, и мы завидуем товарищу Дмитрию Ивановичу, которому удалось-таки свести химические элементы в одну таблицу, пусть по легенде и во сне.

А пока делюсь «поисковыми заметками».

  1. Английский язык расширяет базу знаний, наверное, вдвое.
  2. Еще больше информации доступно, если научиться искать – через гугл, документы/PDF/презентации, гулять по ссылкам и палить названия организаций и их отчетов. Я искала мировую карту импорта/экспорта и только, гуляя от отчета к отчету по названиям организаций, добралась до FAOstat, где она и нашлась.
  3. Чтобы решить проблему, нужно встать на уровень выше. Кажется, так сказал Эйнштейн. Работает и наоборот. Понять экономику региона иногда достаточно, поговорив с другом, который там родился и вырос. Для этого же мы собираемся объездить регионы Казахстана и идти снизу вверх – от самозанятых до крупных предприятий. Во-первых, поймем, как все на самом деле. Во-вторых, перепроверим данные статистических агентств.

UPD: на mediapedia.ru можно скачать "догму" Ведомостей, Практическую журналистику и еще много чего поковыряться.

Оцените пост

0
Дальше