Запропоновано методику формування, кластеризац╕╖ та в╕зуал╕зац╕╖ спрямованих кореляц╕йних мереж. Зв'язки м╕ж вузлами таких мереж в╕дпов╕дають модиф╕кованим певним чином значенням крос-кореляц╕й м╕ж векторами - наборами пара-метр╕в, що в╕дпов╕дають цим вузлам. Для побудови мережевих структур для кожного вузла (тематики) формуються вектори - масиви чисел, в╕дпов╕дн╕ деяким часовим рядах. В якост╕ при-кладу розглядаються часов╕ ряди, що формуються серв╕сом Google Books Ngram Viewer. Кожному року ставиться у в╕дпов╕дн╕сть число - к╕льк╕сть появ поняття в публ╕кац╕ях, як╕ охоплюються системою Google Books. Розм╕рн╕сть цього вектора в╕дпов╕да╓ к╕лькост╕ рок╕в, довжин╕ ╕нтервалу часу, протягом якого анал╕зувався масив публ╕кац╕й.
Мета роботи - представити методику формування, кластеризац╕╖, ранжирування вузл╕в ╕ в╕зуал╕зац╕╖ так званих спрямованих кореляц╕йних мереж, графових структур, зв'язку м╕ж вузлами (поняттями, сутностями) яких в╕дпов╕дають значенням кореляц╕й м╕ж наборами параметр╕в, як╕ в╕дпов╕дають цим поняттям.
Наведений п╕дх╕д, на в╕дм╕ну в╕д ╕снуючих ма╓ так╕ переваги, як ╕нту╖тивн╕, близьк╕ до реальност╕ правила визначення ваги вузл╕в ╕ зв'язк╕в; над╕йна математична основа кореляц╕йного анал╕зу; обл╕к невикористовуваних ран╕ше параметр╕в, часових ряд╕в динам╕ки публ╕кац╕й, як╕ в╕дпов╕дають сутностям ╕ дозволяють групувати сутност╕ по тенденц╕ям ╖х розвитку в час╕; об'╓ктивн╕сть ╕ в╕дносна простота реал╕зац╕╖. Наведена методика може базуватися на даних, отриманих, наприклад, в╕д систем контент-мон╕торингу, використовуватися в анал╕тичних системах р╕зного призначення з метою узагальнення безл╕ч╕ сутностей без явно виражених зв'язк╕в м╕ж ними.
|