Развитие этих технологий привело к качественным измерениям в структуре всего процессcа информирования общественности на всех его звеньях, в результате чего ситуация требует кардинального пересмотра основных механизмов, лежащих в основе функционирования медийных средств. Информационные агентства собирали информацию, занимались ее первичной обработкой и «обогащением» справочными данными, иногда аналитикой, распространяли подписчикам. Агентства снабжают своих подписчиков информацией на условиях, которые на сегодняшний день выглядят по меньшей мере странно. В частности, типичным условием относительно использования их материалов является запрет на размножение и распространение их любыми способами. При этом агентства можно условно разделить на два класса: агентства влияния и агентства коммерческие. Пожалуй, можно остановиться на такой модели, понимая, ее ограниченность. Агентства влияния «открыто» распространяли свою информацию практически бесплатно и очень быстро освоили Интернет для этих целей, ценя каждую перепечатку своих информационных продуктов. Коммерческие агентства продолжают предоставлять информацию в «закрытом» режиме зачастую теряя подписчиков, либо находят спонсоров, становясь агентствами влияния. При этом новостная информация зачастую неправомерно закрывается агентствами со ссылкой на законодательство об авторских правах. В статье 8 Закона РФ «Об авторском праве и смежных правах» говорится о том, что «сообщения о событиях и фактах, имеющие информационный характер» не охраняются авторским правом. В аналогичном Законе Украины в статье 10 также предусмотрено, что сообщения о новостях или текущих событиях не охраняются авторским правом. Вместе с тем, новые тенденции начинают прокладывать себе дорогу, не дожидаясь официальных решений, что неизбежно приводит перераспределению не только ресурсов, но и функциональных ролей участников коммуникации. Сегодня Интернет превратился в мощнейший источник новостей, завоевывая все новых пользователей. Новостная составляющая Интернет растет по экспоненциальному закону, как и все веб-пространство. Поэтому для выработки обоснованных рекомендаций желательно было бы вначале разобраться в том, что и как происходит в действительности. Для точного выяснения текущего состояния дел (по крайней мере, выраженного цифрами, от которых можно отталкиваться в дальнейшем) в ElVisti было проведено исследование того, в какой мере материалы, доступные сегодня платным подписчикам основных агентств, публикуются в открытом доступе на веб-сайтах. Ценность информационных сообщений во многом определяется оперативностью, поэтому отдельной задачей была также оценка запаздывания публикаций в Интернет по сравнению с временем рассылки соответствующих сообщений. В ходе эксперимента рассматривались материалы четырех ведущих информационных агентств, рассылающих в Украине новости за плату. Исследовался массив сообщений агентств по общеполитической тематике, поступающие в течение 5-25 ноября 2007 года. Их объем оказался равным 8955 документов. Эти сообщения сравнивались с текстами, сканируемыми из открытого сегмента Интернет в течение всего ноября 2007 года с помощью системы контент-мониторинга InfoStream. Разработанная в ElVisti система InfoStream в настоящее время сканирует и предоставляет доступ к более чем 50 тыс. новостных сообщений в сутки из более чем 3000 источников. Количество таких сообщений составило свыше 1 млн. Каждая из новостей из ИА проверялась на «плагиат» (программой поиска дублей) путем анализа фрагмента корпуса новостей из Интернет. В результате проведенных исследований удалось получить такие данные:
На графике распределения сообщений информационных агентств по времени задержки публикаций четко видны экстремальные отклонения в начальной и конечной области. Отклонение в начальной области характеризует большое время задержки включения в ленты агентств материалов, размещенных, как правило, на сайтах органов государственной власти (инертность агентств, отсутствие у них средств мониторинга веб-пространства). Отклонения в конечной области объясняются задержками перепечаток на веб-сайтах сообщений, получивших со временем некоторое новое продолжение. Вместе с тем, центральная область графика (от 1000-го по 5000-е сообщение) имеет стабильный характер со средним значением около получаса. Массовый характер перепечаток, позволяет делать выводы о том, что все сообщения, интересные администраторам соответствующих веб-сайтов, были перепечатаны. По видимому, примерно 38 % сообщений агентств оказались им недостаточно интересными. В сязязи с полученными данными становится понятен ответ на вопрос, кто же является первоисточником информации, публикуемой в лентах информационных агентств. Распределение времени задержки публикаций показывает: ~30 % случаев – источник – это Интернет; ~60 % случаев – перепечатка материалов ИА со средним запаздыванием в 0.5 часов. Возникает вопрос, какова роль аналитики, выпускающего лица информационного агентства в представлении материалов. Как человек своим интеллектом может повысить стоимость информационного материала? По-видимому, прежде всего благодаря здравому смыслу, аналитик может отличить новость от «утки». Чаще всего. Приведем исключение, подтверждающее правило. Не так давно многие электронные СМИ и уважаемые ИА разместили долгожданную сенсацию о том, что человек уже был на Марсе, представив фотографию со ссылкой на материалы NASA. С течением времени фотография обростала новыми деталями и фигурами. Что самое интересное, на сайте NASA этой фотографии нет!
Кроме того, человеку, как правило, присуще умение сориентироваться, выбрать наиболее существенное. Системы контент-мониторнига, интеграторы веб-ресурсов вполне могут рассматриваться как модель информационного агентства, основанную на искусственном интеллекте. Приведем некоторые свойства и различия:
Можно привести типичный отрицательный пример использования систем контент-мониторинга – «утку» об отставке министра финансов Украины летом 2005 года. Информация была отсканирована с веб-сайтов в большом количестве и с деталями, признана многими системами контент-мониторинга достоверной. Вместе с тем, платные агентства ее не выдали. В реальности оказалось, что это явный пример дезинформации. Позитивные моменты естественного интеллекта, с которым можно ассоциировать информационные агентства, определяют неизбежность аналитики. При принятии важных решений определяющим свойством информационных продуктов оказывается достоверность. Кроме того, такая возможность, как выявление действительно новых событий сегодня лучше всего реализуется человеком. Вместе с тем, возникает вопрос, что же будет, если Text Mining разовьется в условиях лавинообразного роста непрофессиональных публикаций и перепечаток? Результаты проведенных исследований заставляют задуматься, за что же платят подписчики информационным агентствам сегодня, когда большая часть информации с минимальной задержкой доступна в Интернет, а полноту могут обеспечить системы контент-мониторинга? По видимому, за аналитический подбор этой информации, репрезентативность и достоверность. То есть информационное агентство, если оно желает выжить в современных условиях, должно уделять повышенное внимание именно аналитической обработке информации, превращаясь в агентство информационно-аналитическое. Естественно, полученные результаты могут учитываться также разработчиками информационно-поисковых систем и систем контент-мониторинга. Усиление аналитической составляющих таких систем уже сегодня позволяет им выступать на рынке рядом с крупнейшими информационными агентствами. |