Возможно, кто-то из Вас уже ранее слышал этот термин «журналистика данных» или «data driven journalism». Если нет, то всячески рекомендую начать со статьи Евгении Шевниной в Mediapedia, заметку в блоге NewMediaLine — 10 фактов о журналистике данных, а также статью в блоге Сергея Рачинского —Журналистика баз данных: Модный тренд или будущее профессии?
Итак.
Что же такое журналистика данных?
Журналистика данных — это совмещение журналистом роли переводчика с экономического/государственного/цифрового языка в язык понятный всем и, одновременно, роли аналитика представляющего материалы в предельно наглядной форме. Это могут быть списки, графики, интерактивные карты, специальные веб-компоненты которые позволяют отображать данные разными специальными способами и так далее. Во всех случаях текст здесь является вспомогательным, а не основным инструментом. Эта особенность существенно меняет и форму подачи материалов. Информацию гораздо сложнее сделать эмоциональной, но и одновременно она куда более наглядна, поскольку один список или одна картинка, один график могут быть куда более наглядными чем тысячи слов.
Зачем это нужно?
Первая и ключевая причина — это наглядность подобного способа представления информации. Это позволяет охватить и удержать аудиторию которая не всегда готова вчитываться в большие тексты, но хорошо понимает их визуальное представление. Это одновременно, и упрощение подачи материалов, и усложнение процесса их подготовки. Журналистика данных — это новый тренд, явление которое сейчас проявляется в очень многих странах мира, в виде отдельных проектов крупных медиахолдингов и в виде личных датаблогов посвященных визуализации различной общественно значимой информации. Иначе говоря, для многих журналистов — это возможность получить признание и занять пока ещё пустующие ниши в медиапространстве. Учитывая что журналистика данных сейчас на подъеме и к не приходят все большее число СМИ, это может более чем востребовано в ближайшем будущем.
Пример: Guardian Datablog
В качестве заметного примера можно привести блог данных газеты Guardian в Великобритании. Этот блог, который можно назвать также отдельной редакторской колонкой, существует уже более 2-х лет,в нем опубликовано более 1000 постов на тему открытых данных, визуализации существующей информации, графики и списки сделанные редакцией и многое другое.
Это блог который и изначально вел один журналист Симон Роджерс (Simon Rodgers), а теперь туда пишет более 5 журналистов Guardian и пишут ежедневно, от 2-х до 4-х публикацией в сутки.
Из последних примеров — список заключенных Guantanomo и дефицит бюджета Великобритании
Пример: Los Angeles Times: Data Desk
У Los Angeles Times есть свой проект по данным который называется Data Desk. Это в меньшей степени работа журналистов и в большей степени редактора и команды программистов поскольку в Data Desk публикуются данные и списки, они накладываются на карту Калифорнии или делаются в иной интерактивной форме. Фактически — это сервисы, над открытыми данными. В некоторых из них они берут информацию из существующих общественных проектов и сужают срезы только до Лос Анжелеса или до Калифорнии.
В чем сложности и ограничения
Главное ограничение — это необходимость навыков работы с рядом аналитических и технических инструментов. Это включает такие инструменты как Excel, Google Docs, IBM ManyEyes, Wordle и многие другие. Далеко не все журналисты обладают навыками работы с этими инструментами и большинство из тех кто такими навыками обладают понимают то как необходимо подавать материалы в понятном медиа-формате.
Второе ограничение — это сравнительно невысокая доступность баз данных по России. У нас далеко не столь много общедоступной информации в структурированном виде чем в Великобритании или в США. У нас нет общероссийского государственного портала по открытым данным, нет специальных разделов с открытыми данными на сайтах органов власти и так далее. Зачастую даже если информация есть, её необходимо искать и преобразовывать.
Впрочем, на мой взгляд, это не неразрешимая задача. Данных у нас немало, особенно данных касающихся различных финансовых вопросов — бюджетов, индикаторов Центробанка и даже статистики по сдаче ЕГЭ.
Поэтому главное ограничение всё таки человеческое, чтобы вести темы в журналистике данных нужны заинтересованные в этой теме журналисты.
Как начать?
Я знаю что некоторые издания в России публикуют инфографику и результат анализа некоторых госданных, но, пока это происходит несистемно. Не в сфокусиронованном формате на открытые данные, на публичность государства, на понятность того что пишется.
Если Вы журналист, то задуматься и попробовать вести блог в формате журналистики данных. Предложить такой формат Вашей редакции. Вполне может быть что этот формат окажется востребованным аудиторией.
Если Вы редактор, то вполне возможно что журналистика данных — это именно то чего нехватает Вашему изданию и этот пост хорошая точка для старта.
Важно задать правильный формат изначально. Установить формат именно как журналистики данных, делать это в контексте открытых данных во всем мире.
С чего начать
В августе 2010 года в Европе прошла конференция по Data Driven Journalism и её отчет доступен онлайнhttp://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf
В этом документе есть много примеров того как журналистика данных работает и используется по всему миру. Там же немало ссылок на инструменты которые журналист данных может использовать в своей работе.
А также существует немало инструментов доступных онлайн, я перечислю ключевые из них:
1. Google Docs — https://docs.google.com/
Сервис работы с документами и таблицами от Google. Помимо того что позволяет публиковать таблицы из Excel’я онлайн, для всеобщего доступа, там также есть возможность строить графики на основе этой информации.
2. Wordle — http://www.wordle.net
Wordle — это сервис по созданию «карт текста». Вы загружаете туда документ, а он подсчитывает частоту упоминаемости слов и наглядно отображает их в виде инфографики.
Пример визуализации ответов Медведева с его пресс-конференции я приводил совсем недавно.
3. IBM ManyEyes — http://www-958.ibm.com/software/data/cognos/manyeyes/
IBM ManyEyes — это сервис визуализации данных в форме различных графиков, наложения их на карты (мира или США) и построения ряда редких и наглядных графиков вроде Bubble Chart.
В 2010 году я публиковал бюджет Москвы на ManyEyes и скажу Вам что для визуализации сравнений — это бесподобный инструмент и не самый сложный.
Приложение. Ссылки
Каталоги открытых данных
- OpenGovData.ru (Россия) — http://www.opengovdata.ru
- DataGov.ru (Россия) — http://www.datagov.ru (создан чтобы стать data.gov.ru)
- Data.gov (US), http://www.data.gov/
- Data.gov.uk (UK) http://data.gov.uk/
- Worldbank, Data http://data.worldbank.org/
- Scraperwiki, http://scraperwiki.com/
- Open Knowledge Foundation, http://okfn.org/
Ссылки по визуализации
- Visual Complexity, http://www.visualcomplexity.com/vc/
- Flowing Data, http://flowingdata.com/
- Well-formed Data, http://well-formed-data.net/
- Information Aesthetics, http://infosthetics.com/
- Good Magazine, http://www.good.is/
- University of Amsterdam, http://www.digitalmethods.net/
- Simple Complexity, http://simplecomplexity.net/
- A Beautiful WWW, http://abeautifulwww.com/
- Infografistas, http://infografistas.blogspot.com/
- Visual Editors, http://www.coolinfographics.com/
- Cool Infographics, http://www.coolinfographics.com/
- Datenjournalist. German blog on ddj. http://www.datenjournalist.de/
Инструменты, большая подборка
- Document Cloud, http://www.documentcloud.org/home
- Google Code Playground: Helps to explore Google data and tools.http://code.google.com/apis/ajax/playground/
- Zemanta, http://www.zemanta.com/
- Open Calais, http://www.opencalais.com/
- API Playground — helping journalists to understand API Data. http://apiplayground.org/
- Gapminder Desktop, http://www.gapminder.org/desktop/
- Yahoo Pipes, http://pipes.yahoo.com/pipes/
- Tableau, http://www.tableausoftware.com/public/
Руководства/Рекомендации
- OUseful.info, http://blog.ouseful.info/
Оригинал статьи: ivan.begtin.name
Источник: Редакторский портал