Д.В. Ланде, В.В. Юзефович
// Реістрація, зберігання і обробка даних, 2022, Т. 24, N 1. - C. 13-22. |
Запропоновано методи прогнозування динамічних часових рядів (у тому числі й нестаціонарних), що базуються на лінгвістичному підході, а саме: дослідженні входжень і повторюваності так званих N-грам, які застосовуються в комп'ютерній лінгвістиці при створенні статистичних перекладачів, виявленні плагіату, дублікатів документів. На відміну від застосування в лінгвістиці, метод може бути розширений урахуванням кореляцій послідовностей сталих словосполучень, а також трендів. При цьому запропоновані методи не вимагають попереднього дослідження та визначення характеристик часових рядів і складного налаштування вхідних параметрів моделі прогнозування. Запропоновані методи дозволяють з високим рівнем здійснювати короткострокові та середньострокові прогнози динамічних часових рядів, яким притаманні тренди та циклічність, зокрема, рядів динаміки публікацій у системах контент-моніторингу. Перевага підходу - відсутність вимог до стаціонарності часових рядів і мала кількість параметрів налаштування. Ключові слова: часовий ряд, прогнозування, метод N-грам, квантування, тренд, модель, критерій подібності, кореляція, лінійна регресія |