Twitter, самая популярная социальная сеть для поиска информации о «горячих» новостях, продолжает расти, и поиск нужного сигнала в этом информационном шуме становится всё более сложным делом.

В потоке обновлений твитов последние фото домашних любимцев следуют за инстаграмными закатами, фотографиями протестов на Украине и снимком Джастина Бибера, сделанным в полицейском участке. Для журналистов умение найти нужную информацию о «горячих» новостях среди 500 миллионов ежедневных твитов становится большим преимуществом.

Dataminr for News, новый инструмент, разработанный в результате совместной работы Twitter, CNN и Dataminr — компании, специализирующейся на анализе информации в социальных сетях. Технология, которую использует Dataminr, решает проблему работы с переизбытком информации в Twitter «с помощью алгоритма обнаружения, оценки, классификации и оповещения клиентов о наиболее важной информации в режиме реального времени», — говорится в пресс-релизе компании.

Базирующаяся в Нью-Йорке аналитическая компания делает такого рода работу для предприятий финансового сектора и государственных учреждений с 2009 года. Теперь Dataminr сотрудничает с Twitter и CNN, которые в течение нескольких месяцев принимали участие в тестировании данного инструмента, чтобы приспособить его к нуждам редакций и журналистов.

Но каким образом Dataminr ищет нужное в информационном шуме? В своем выступлении на мероприятии Twitter, DevNest, генеральный директор Dataminr Тед Бейли пояснил, что сервис использует около 18 различных сигналов, извлечённых из Twitter и его метаданных, чтобы определять потенциально «горячие» темы и посылать информацию о них своим пользователям.

Показательный случай произошёл в 2011 году в связи со смертью Усамы бен Ладена — событием, наиболее интенсивно обсуждаемым за всю историю сайта Twitter. Dataminr отправил оповещение об этом событии в 10:20 вечера по восточному времени, на 23 минуты раньше, чем о нём сообщили новостные агентства. Как объяснил Бейли, в этом случае было использовано три сигнала (объем сообщения, классификация настроения и лингвистический анализ), основывающихся на 19 твитах, отправленных до того, как новость была подтверждена.

Объем твитов предупреждает Dataminо о появлении «горячей» темы. Хотя 19 твитов — это, кажется, не так уж и много, но на момент, когда это произошло, бен Ладен не был в числе широко обсуждаемых тем, пояснил Бейли, так что тогда такое количество твитов было необычным.

Такой внезапно возникший интерес к личности бен Ладена привлёк внимание, но этого ещё было не достаточно для посылки предупреждения, поэтому был сделан лингвистический анализ. Они также искали — и нашли — настроение, которое Бейли определяется как внезапно возникшую «эмоциональную реакцию».

После того как информация, достойная освещения в СМИ, обнаружена, сведения о ней отправляются пользователям через приложение, уведомления по электронной почте, через текстовые сообщения. Предупреждения также могут быть совмещены с существующими в конкретной редакции программными решениями.

Источник: http://ijnet.org/ru/blog/249548