Дмитро Ланде. Формування та використання семантичних мереж для нав╕гац╕╖ в енциклопедичних даних /
Розд╕л монограф╕╖ "Укра╖нська енциклопедистика в умовах во╓нного стану. Питання теор╕╖ та практики:".
- Ки╖в : Державна наукова установа "Енциклопедичне видавництво", 2024. - С. 147-151.
ISBN 978-617-8272-07-4


Сучасн╕ енциклопед╕╖, що представлен╕ в ╤нтернет╕, по сут╕ ╓ семантичними мережами, оск╕льки ╖х статт╕ зв'язан╕ г╕перпосиланнями. Як правило, кожна стаття в енциклопед╕╖ не ╕сну╓ ╕зольовано, а пов.язана з ╕ншими через г╕перпосилання, що створю╓ складну мережу знань. Це да╓ змогу користувачам швидко переходити в╕д одн╕╓╖ теми до ╕ншо╖, що робить нав╕гац╕ю ╕нформац╕╓ю б╕льш ефективною та зручною.

Проте сучасн╕ технолог╕╖, так╕ як велик╕ л╕нгв╕стичн╕ модел╕, або LLMs (в╕д англ. - Large Language Model)24 в╕дкривають нов╕ можливост╕ для покращення семантичного ╕ндексування енциклопед╕й. В╕дом╕ велик╕ л╕нгв╕стичн╕ модел╕, як╕ можуть бути застосован╕ до цього процесу, включають, наприклад, GPT-4 в╕д OpenAI25, BERT в╕д Google26, Meta Llama27. Ц╕ модел╕ здатн╕ анал╕зувати велик╕ обсяги тексту, розум╕ти контекст ╕ знаходити смислов╕ зв'язки м╕ж р╕зними частинами ╕нформац╕╖.

Використання таких моделей для семантичного ╕ндексування, зокрема, "Велико╖ укра╖нсько╖ енциклопед╕╖" дозволить виявляти додатков╕ вузли-поняття та зв'язки м╕ж ними. Семантичне ╕ндексування за допомогою LLMs дозволить не лише створити б╕льш точну ╕ детальну карту знань, але й знайти нов╕, ран╕ше нев╕дом╕ зв'язки м╕ж поняттями-статтями, що може сутт╓во покращити як╕сть ╕ зручн╕сть нав╕гац╕╖ в енциклопедичних даних.

PDF
HOME