Д.В. Ланде, В.В. Юзефович
Л╕нгв╕стичний п╕дх╕д до прогнозування часових ряд╕в

// Ре╕страц╕я, збер╕гання ╕ обробка даних, 2022, Т. 24, N 1. - C. 13-22.
DOI: https://doi.org/10.35681/1560-9189.2022.24.1.262673

 

Запропоновано методи прогнозування динам╕чних часових ряд╕в (у тому числ╕ й нестац╕онарних), що базуються на л╕нгв╕стичному п╕дход╕, а саме: досл╕дженн╕ входжень ╕ повторюваност╕ так званих N-грам, як╕ застосовуються в комп'ютерн╕й л╕нгв╕стиц╕ при створенн╕ статистичних перекладач╕в, виявленн╕ плаг╕ату, дубл╕кат╕в документ╕в. На в╕дм╕ну в╕д застосування в л╕нгв╕стиц╕, метод може бути розширений урахуванням кореляц╕й посл╕довностей сталих словосполучень, а також тренд╕в. При цьому запропонован╕ методи не вимагають попереднього досл╕дження та визначення характеристик часових ряд╕в ╕ складного налаштування вх╕дних параметр╕в модел╕ прогнозування. Запропонован╕ методи дозволяють з високим р╕внем зд╕йснювати короткостроков╕ та середньостроков╕ прогнози динам╕чних часових ряд╕в, яким притаманн╕ тренди та цикл╕чн╕сть, зокрема, ряд╕в динам╕ки публ╕кац╕й у системах контент-мон╕торингу. Перевага п╕дходу - в╕дсутн╕сть вимог до стац╕онарност╕ часових ряд╕в ╕ мала к╕льк╕сть параметр╕в налаштування.

Ключов╕ слова: часовий ряд, прогнозування, метод N-грам, квантування, тренд, модель, критер╕й под╕бност╕, кореляц╕я, л╕н╕йна регрес╕я

PDF
HOME