cover-18-1

Dmytro Lande, Oleksandr Puchkov, Ihor Subach.
Cистема анал╕зу великих обсяг╕в даних з питань к╕бербезпеки ╕з соц╕альних мед╕а
// Information Technology and Security. Том 8, N 1 (2020). - C. 4-18.
DOI: doi.org/10.20535/2411-1031.2020.8.2.222597

Запропоновано та об╜рунтовано п╕дходи до побудови системи мон╕торингу та анал╕зу соц╕альних мед╕а з питань к╕бербезпеки, як╕ базуються на концепц╕╖ обробки великих обсяг╕в даних, складних мереж, добування знань ╕з текстових масив╕в. Детально розглянут╕ компоненти технолог╕╖ Elastic Stack, ╕нформац╕йно-пошукова система Sphinx, графова система управл╕ння базами даних Neo4j та система анал╕зу граф╕в Gephi. Основна ╕дея створення системи анал╕зу великих обсяг╕в даних з питань к╕бербезпеки ╕з соц╕альних мед╕а - це одночасне застосування метод╕в ╕ засоб╕в ╕нформац╕йного пошуку, анал╕зу даних та агрегування ╕нформац╕йних поток╕в.

Система забезпечу╓ реал╕зац╕ю таких функц╕й: формування баз даних шляхом збору ╕нформац╕╖ з визначених ╕нформац╕йних ресурс╕в; налаштування модул╕в автоматичного сканування ╕ первинно╖ обробки ╕нформац╕╖ з веб сайт╕в ╕ соц╕альних мереж; ведення повнотекстових баз даних з ╕нформац╕╖; виявлення дубл╕кат╕в, схожих за зм╕стом ╕нформац╕йних пов╕домлень; повнотекстовий пошук; анал╕з текстових пов╕домлень, визначення тональност╕, формування анал╕тичних зв╕т╕в; ╕нтеграц╕ю з географ╕чною ╕нформац╕йною системою; анал╕з та в╕зуал╕зац╕ю даних; досл╕дження динам╕ки тематичних ╕нформац╕йних поток╕в; прогнозування розвитку под╕й на основ╕ анал╕зу динам╕ки публ╕кац╕й в соц╕альних мед╕а; забезпечення доступу багатьох користувач╕в до функц╕ональних компонент╕в системи. Практичне значення отриманих результат╕в поляга╓ в створенн╕ д╕ючого макету системи контент-мон╕торингу ╕ анал╕зу соц╕альних мед╕а з питань к╕бербезпеки, який придатний до застосування як компоненти у склад╕ систем п╕дтримки прийняття р╕шень щодо ╕нформац╕йно╖ та к╕бербезпеки. Розглянуто ╕нтерфейс макету системи, в якому доступн╕ функц╕╖ пошуку, анал╕зу та прогнозування появлення ╕нформац╕╖ в соц╕альних мед╕а. Центральне м╕сце ╕нтерфейсу займа╓ дайджест ╕з найб╕льш релевантних потребам користувача пов╕домлень. В анал╕тичному режим╕ реал╕зовано низку ╕нструмент╕в для граф╕чного представлення анал╕зованих даних, як╕ в╕дображуються у вигляд╕ часового ряду к╕лькост╕ релевантних запиту пов╕домлень на добу, а також перегляду головних сюжет╕в за темою, кластер╕в, згрупованих за в╕дпов╕дн╕стю заздалег╕дь визначеним опорним словам. У систем╕ передбачен╕ режими формування мереж ╕з понять, що в╕дпов╕дають окремим пов╕домленням (персон, бренд╕в) та ╕нформац╕йних джерел, як╕ дозволяють ранжувати за рейтингом поняття та досл╕джувати вза╓мозв.язки м╕ж ними.

Text in PDF

DWL HOME