Дмитрий Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй
Автоматическое реферирование китайской правовой информации

// Ре╓страц╕я, збер╕гання ╕ обробка даних, 2018. - Т. 20. - N 3. - С. 67-82.

Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает 2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации.
Ключевые слова: автоматическое реферирование, правовая информация, китайский язык, косинусная мера, мера Дженсена-Шеннона.

 

PDF
HOME