Д.В. Ландэ, А.А. Снарский. Подход к созданию терминологических онтологий
// Онтология проектирования, 2014. - N 2(12). - С. 83-91.

[an error occurred while processing this directive][an error occurred while processing this directive] File not found. [an error occurred while processing this directive]













Описывается методика построения сети естественных иерархий терминов на основе анализа массива текстов по выбранной проблематике. Данная сеть формируется в автоматическом режиме на основе обучающей коллекции текстов и может рассматриваться как основа для построения терминологических онтологий. Методика базируется на применении компактифицированных графов горизонтальной видимости для терминов - отдельных слов, биграмм и триграмм, а также на установлении связей между терминами. Предложенная авторами сеть естественных иерархий терминов охватывает связи типа "общее-частное" и может рассматриваться как основа построения сети с ассоциативными связями. Рассмотрена сеть естественных иерархий терминов, сформированная на основе полных текстов научно-популярных статей. Предложено использование алгоритма HITS для данной сети, с помощью которого обеспечивается выбор наилучших "авторов" - узлов, на которые введут ссылки, и "посредников" - узлов, от которых идут ссылки цитирования.

The technique for creating networks of natural hierarchies of terms based on the analysis of chosen sets of texts on selected issues is offered. The network is formed automatically on the basis of the teaching collection of texts and can be considered as the basis for the design of terminological ontologies. The technique is based on the methodology of horizontal visibility graphs for individual words, bigrams and trigrams, as well as establishing links between the terms. The network of natural hierarchies of terms covers connection "general-private" type and can be considered as a basis of creation of networks with associative links. Designed and investigated language network, formed on the basis of full texts of popular scientific papers is reviewed. Use of HITS algorithm for this network is proposed. The named algorithm makes the choice of the best "authors" . nodes that have the most citations, and "intermediaries" . nodes that establish the biggest number of citation links is offered.


PDF
DOMIK