В цiй роботi розглядається одна з найбiльш актуальних проблем комп'ютерного аналiзу природньої мови
- форму-
вання термiнологiчних онтологiй предметних областей на основi текстових корпусiв заданої тематики. Мережа
термiнiв, вузли якої вiдповiдають окремим словам та словосполученням у текстi, а ребра
- зв'язкам мiж ними,
розглядатися в якостi онтологiчної моделi. Для побудови направленої мережi iз термiнiв, що вiдповiдають певним
поняттям обраної предметної областi, в цiй роботi застосовується новий пiдхiд до побудови мереж на основi часового
ряду - модифiкований алгоритм графа горизонтальної видимостi (Directed Horizontal Visibility Graph algorithm
- DHVG). Також запропоновано новий метод розрахунку вагових значень зв.язкiв у направленiй мережi термiнiв.
Апробацiю запропонованого методу було здiйснено на основi текстового корпусу з iнформацiйних повiдомлень
за темою COVID-19. Також було розглянуто корпус тiєї ж теми, сформований з анотацiй наукових статей,
що були вивантаженi з вiльної доступної пошукової системи Google Scholar. Результатом роботи стало вiзуальне
представлення мереж термiнiв для текстових корпусiв за темою COVID-19.
Ключовi слова: предметна область, термiнологiчна онтологiя, граф горизонтальної видимостi, направлена зважена
мережа термiнiв, COVID-19
|