Дмитрий Ландэ, Цзыцзян Ян, Шивэй Чжу,
Цзяньпин Го, Моцзи Вэй
Автоматическое реферирование
китайской правовой информации
// Ре╓страц╕я, збер╕гання ╕ обробка даних, 2018. - Т. 20. - N 3. - С. 67-82.
DOI: doi.org/10.35681/1560-9189.2018.20.3.158214
[an error occurred while processing this directive][an error occurred while processing this directive]
File not found.
[an error occurred while processing this directive]
Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке.
Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения
уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте
документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления
наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического
реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и
дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа
оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает
2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации.
Ключевые слова: автоматическое реферирование, правовая информация, китайский язык, косинусная мера, мера Дженсена-Шеннона.
|