Мета роботи - представити методику визначення ступеня
под╕бност╕ м╕ж текстовими документами, що базу╓ться на використанн╕
направлених зважених мереж терм╕н╕в, де вузлами таких мереж -
ключов╕ терм╕ни тексту, а ребра - семантико-семантичн╕ зв'язки м╕ж
цими терм╕нами у текст╕.
Побудова мереж терм╕н╕в зд╕йсню╓ться в дек╕лька етап╕в, що
включають попередню обробку текстових даних, виокремлення
ключових терм╕н╕в, застосування алгоритму графа горизонтально╖
видимост╕ для встановлення ненаправлених зв'язк╕в м╕ж терм╕нами, а
також подальше встановлення напрямк╕в зв'язк╕в та ╖х вагових значень.
Подальше пор╕вняння за допомогою м╕ри Фробен╕уса матриць
направлених зважених мереж, що отриман╕ для р╕зних текст╕в, дозволя╓
визначити семантичну близьк╕сть в╕дпов╕дних текст╕в. Представлена
методика може бути використана у процес╕ обробки ╕нформац╕йних
запит╕в п╕д час ╕нформац╕йного пошуку, даючи змогу визначити ступ╕нь
в╕дпов╕дност╕ документа до ╕нформац╕йних потреб користувача та
п╕двищити пертинентн╕сть.
|