Ланде Д.В.,
Дмитренко О.О.
Використання направлених зважених мереж терм╕н╕в для визначення ступеня под╕бност╕ текст╕в //

М╕жнародна наукова-техн╕чна конференц╕я "╤нтелектуальн╕ технолог╕╖ л╕нгв╕стичного анал╕зу": Тези допов╕дей. - К.: НАУ, 2021. - C. 7.

     

Мета роботи - представити методику визначення ступеня под╕бност╕ м╕ж текстовими документами, що базу╓ться на використанн╕ направлених зважених мереж терм╕н╕в, де вузлами таких мереж - ключов╕ терм╕ни тексту, а ребра - семантико-семантичн╕ зв'язки м╕ж цими терм╕нами у текст╕.

Побудова мереж терм╕н╕в зд╕йсню╓ться в дек╕лька етап╕в, що включають попередню обробку текстових даних, виокремлення ключових терм╕н╕в, застосування алгоритму графа горизонтально╖ видимост╕ для встановлення ненаправлених зв'язк╕в м╕ж терм╕нами, а також подальше встановлення напрямк╕в зв'язк╕в та ╖х вагових значень.

Подальше пор╕вняння за допомогою м╕ри Фробен╕уса матриць направлених зважених мереж, що отриман╕ для р╕зних текст╕в, дозволя╓ визначити семантичну близьк╕сть в╕дпов╕дних текст╕в. Представлена методика може бути використана у процес╕ обробки ╕нформац╕йних запит╕в п╕д час ╕нформац╕йного пошуку, даючи змогу визначити ступ╕нь в╕дпов╕дност╕ документа до ╕нформац╕йних потреб користувача та п╕двищити пертинентн╕сть.