Дмитрий Ландэ,
заместитель директора
Информационного центра "ЭЛВИСТИ"
Интернет более чем за 25 лет своего существования вышел за пределы военных лабораторий США (где он родился в рамках проекта ARPANET) и научных кругов и стал одним из самых известных феноменов современности.
Благодаря чему же произошло это, почему из сотен компьютерных сетей именно Интернет получил такое развитие? Ответов несколько:
В основном Интернет используют для решения пяти основных задач, реализации пяти основных потребностей - общения, информирования, обучения, бизнеса и развлечения.
Это первая функция, которая появилась в Сети, и конечно же, начало всему положила электронная почта - E-mail, которая и сегодня является самым популярным сервисом. Множество почтовых программ - Outlook Express, Netscape Messenger, The BAT и др. установлены на миллионах компьютеров и служат основным средством общения для сотен тысяч людей. С развитием интерактивных возможностей Интернет получил развитие протокол ICQ (от англ. - I seek you), позволяющее находиться в постоянном диалоговом общении людям, находящимся даже на разных континентах. Другой способ общедоступного диалогового общения - Chat, очень популярный у молодежи, посещающей специальных Chat-серверы и порталы.
Нельзя не упомянуть IP-телефонию и возможности голосового общения, когда сеть Интернет используется для передачи и последующего воспроизведения оцифрованных звуковых сигналов.
Конечно же, - это также одна из первых по времени возникновения функций Сети. Все начиналось с обмена сообщениями с целью взаимного информирования и возникновения технологии обмена сообщениями между заинтересованными группами людей. Первая из таких технологий Usenet используется до настоящего времени. Технология Usenet обеспечивает возможность публикации и чтения в Сети сообщений более чем в десяти тысячах тематических разделах (так называемых, телеконференциях).
С появлением гипертекстовых технологий WWW (Worl Wide Web) в начале 90-х годов, функция информирования стала развиваться в основном на этой платформе, появились электронные СМИ (два вида - традиционные СМИ, публикующие свои материалы в Интернет и "чистые" Интернет-СМИ, информация которых доступна только в Сети). Функцию информирования решают также многочисленные электронные библиотеки (достаточно вспомнить библиотеку Машкова, включающую десятки гигабайт текстовой информации), реферативные базы данных, электронные галереи, фотоальбомы и многие другие электронные издания. Сегодня объем информации в Сети настолько велик, что для навигации в его ресурсах должны использоваться тематические каталоги и поисковые системы, которые также далеко не всегда являются эффективными.
Одна из популярных в украинской части Интернет поисковых систем находится по адресу http://uaport.net. Она охватывает около 15 тысяч украинских WWW-серверов, а также содержит раздел, в котором охватываются (интегрируются) новости из нескольких сотен Интернет-изданий, доступ к материалам которых доступен в режиме поиска.
Интернет является идеальной средой для проведения дистанционного обучения, получения новых знаний, контроля.
В Сети размещены десятки энциклопедий (например, Британника и энциклопедия Кирилла и Мефодия). Достаточно большой интерес у пользователей вызывают интерактивные курсы иностранных языков, представленные, например, на сайтах радиостанций "Немецкая волна" и BBC. Упомянутые уже функции общения и информирования позволяют учащимся обмениваться вопросами как друг с другом (всем работающим в Интернет известны коллекции рефератов, курсовых работ, дипломов и даже диссертаций), так и с преподавателями.
Сегодня это возможность публикации и доступ к базам данных прайс-листов (в Украине известны такие серверы, как "Цены для всех" http://price4all.visti.net, "FoodPortal" http://www.foodportal.com.ua/, Галицкие контракты, газета Бизнес, Хот-лайн и др.), создания и обеспечение доступа к электронным витринам предприятий и торговых организаций, электронные магазины.
В настоящее время и в Украину приходит получившая во всем мире технология электронных расчетов. В мае 2002 года в промышленную эксплуатацию введена НСМЭП - Национальная система массовых электронных платежей, созданная под эгидой Национального банка Украины.
Сегодня в Сети представлены сотни тысяч компьютерных игр, некоторые из которых загружаются на компьютеры пользователей и выполняются как Windows- (или, к примеру, Linux-) приложения, а другие выполняются непосредственно во время сеансов связи с Интернет (например, построенные на базе флеш-технологий). Разработаны и постоянно совершенствуются потоковые технологии трансляции мультимедийной информации (аудио, видео).
В Интернет представлены тысячи Web-сайтов популярных музыкантов, актеров, художников, с которых возможен свободный доступ как к фрагментам произведений, так и к полным версиям. Однако, пожалуй, одна из самых больших проблем современной Сети - это соблюдение прав авторов и владельцев произведений.
Интернет ресурсы сегодня - это прежде всего объемы - свыше 8 млрд. документов на 20 млн. Web-страниц. По заявлению аналитической компании Cyveillance (http://www.cyveillance.com), темпы роста Сети составляют 7 млн. новых страниц в день. По прогнозам, "центр роста" Интернет сейчас уходит из США. Динамика роста объемов информационных ресурсов в Сети настолько велика (для сравнения, можно отметить - количество Web-серверов в 1998 году было еще 1 млн.), что задача обеспечения навигации в ресурсах Internet кажется далеко не очевидной. Сегодня каждый пользователь на собственном опыте чувствует в действии один из самых больших парадоксов Internet - "полезной информации в WWW становится все больше, но найти что-то необходимое все сложнее".
Количество новостных сообщений, публикуемых в сети Internet во всем мире, превышает 1 000 000 в сутки. Крупнейшие сетевые интеграторы новостей обрабатывают ежесуточно десятки тысяч сообщений. Ситуация резкого роста темпов производства информации породила ряд проблем:
Вследствие этого традиционные информационно-поисковые системы постепенно стали утрачивать свою актуальность. Возникла необходимость создания новых сетевых служб, интегрирующих информационные потоки.
Существует несколько подходов к решению названной проблемы. Один из таких подходов предложен в Информационном центре "ЭЛВИСТИ", где разработана потоковая технология интеграции новостей InfoStream. Система, построенная на базе этой технологии, включает три типовые составляющие: stream-центр сбора и обработки информации, stream-центр интерактивного доступа к информационным базам данных и stream-центр контент-мониторинга.
Первая составляющая обеспечивает автоматический сбор данных с определенного заранее перечня источников с помощью программы-робота, настройку информационных роботов на отдельные сайты, классификацию данных и их избирательное распределение. Вторая составляющая служит для автоматизированного создания документальных баз данных и обеспечения доступа пользователей и администраторов информационных ресурсов к этим базам данных. Третья составляющая - stream-центр контент-мониторинга обеспечивает обобщение информационного потока, построение тематических дайджестов, выявление присутствия в потоке отдельных понятий (феноменов), а также анализ взаимосвязи этих понятий.