Д.В. Ланде, В.В. Юзефович
Лінгвістичний підхід до прогнозування часових рядів

// Реістрація, зберігання і обробка даних, 2022, Т. 24, N 1. - C. 13-22.
DOI: https://doi.org/10.35681/1560-9189.2022.24.1.262673

 

Запропоновано методи прогнозування динамічних часових рядів (у тому числі й нестаціонарних), що базуються на лінгвістичному підході, а саме: дослідженні входжень і повторюваності так званих N-грам, які застосовуються в комп'ютерній лінгвістиці при створенні статистичних перекладачів, виявленні плагіату, дублікатів документів. На відміну від застосування в лінгвістиці, метод може бути розширений урахуванням кореляцій послідовностей сталих словосполучень, а також трендів. При цьому запропоновані методи не вимагають попереднього дослідження та визначення характеристик часових рядів і складного налаштування вхідних параметрів моделі прогнозування. Запропоновані методи дозволяють з високим рівнем здійснювати короткострокові та середньострокові прогнози динамічних часових рядів, яким притаманні тренди та циклічність, зокрема, рядів динаміки публікацій у системах контент-моніторингу. Перевага підходу - відсутність вимог до стаціонарності часових рядів і мала кількість параметрів налаштування.

Ключові слова: часовий ряд, прогнозування, метод N-грам, квантування, тренд, модель, критерій подібності, кореляція, лінійна регресія

PDF
HOME