Д.В. Ланде,
О.О. Дмитренко
Методика виокремлення ключових сл╕в ╕ словосполучень та побудови направлених зважених мереж терм╕н╕в ╕з застуванням Part-of-speech tagging
//
╤нформац╕йн╕ технолог╕╖ ╕ безпека. Матер╕али XХ М╕жнародно╖ науково-практично╖ конференц╕╖ ╤ТБ-2020. - Ки╖в: ╤нжин╕ринг. - C.
140-144. ISBN: 978-966-2344-77-6.
[an error occurred while processing this directive][an error occurred while processing this directive]
File not found.
[an error occurred while processing this directive]
У ц╕й робот╕ запропонований новий метод виокремлення ключових сл╕в ╕ словосполучень з тематичних ╕нформац╕йних поток╕в та новий метод встановлення напрямк╕в зв.язк╕в м╕ж вузлами у ненаправлених мережах терм╕н╕в ╕з застосуванням б╕льш широко╖ обробки природно╖ мови, що базу╓ться на розбитт╕ на частини мови (Part-of-speech tagging). Представлено ╕дею встановлення вагових значень зв.язк╕в м╕ж вузлами у направлен╕й мереж╕ терм╕н╕в. Також представлена ц╕л╕сна методика комп.ютерно╖ обробки текстових корпус╕в та побудови направлених зважених мереж терм╕н╕в (ключових сл╕в та словосполучень), виокремлених за допомогою попереднього процесу класиф╕кац╕╖ сл╕в за частинами мови та в╕дпов╕дним маркуванням . Part-of-Speech tagging, та подальшого статистичного зважування. Апробац╕ю запропоновано╖ методики було проведено на приклад╕ алегорично╖ пов╕ст╕-казки .Маленький принц. (англ. .The Little Prince.) Антуана де Сент-Екзюпер╕. Застосовуючи запропонований метод було виокремлено ключов╕ терм╕ни та побудовано направлену зважену мережу з╕ сл╕в та словосполучень, як╕ в╕дпов╕дають окремим ключовим поняттям у досл╕джуваному твор╕.
Ключов╕ слова: текстовий корпус, обробка природньо╖ мови, Part-of-speech (PoS) tagging, терм╕нолог╕чна онтолог╕я, мережа терм╕н╕в.
|