Ланде Д.В.
Формування текстового корпусу Telegram-канал╕в
// Ре╓страц╕я, збер╕гання ╕ обробка даних. Щор╕чна п╕дсумкова наукова конференц╕я присвячена 35 р╕чниц╕ утворення ╤нституту проблем ре╓страц╕╖ ╕нформац╕╖ НАН Укра╖ни: зб╕рник
/ - Ки╖в: ╤ПР╤ НАН Укра╖ни, 2022. - С. 105-106.

В робот╕ представлено пропону╓ться метод автоматичного екстрагування ╕ виявлення об'╓кт╕в предметно╖ област╕ (зокрема, к╕бербезпеки) в ╕нформац╕йних потоках, анал╕зу ╖х вза╓мозв'язк╕в ╕ в╕зуал╕зац╕╖. Засоби виявлення об.╓кт╕в як ╕менованих сутностей будуються на основ╕ концепц╕й машинного навчання. У подальшому вивча╓ться динам╕ка згадувань цих об'╓кт╕в, п╕сля чого досл╕джуються вза╓мозв'язки об'╓кт╕в, визначаються ╖х окрем╕ кластери. Запропоновано форму в╕зуального в╕дображення ╕нформац╕йного потоку в розр╕з╕ об'╓кт╕в ╕ дат, що ╓ прямокутною таблицею (д╕аграма Wordlet), ком╕рки яко╖ заповнен╕ чисельними значеннями, що в╕дпов╕дають частотам появи найменувань об'╓кт╕в в ╕нформац╕йних потоках у розр╕з╕ дат.

Розглянутий п╕дх╕д може застосовуватись для вир╕шення питань анал╕зу та в╕зуал╕зац╕╖ розпод╕лу об'╓кт╕в для будь-яких в╕д╕браних ╕нформац╕йних масив╕в у розр╕з╕ питань, що ц╕кавлять досл╕дника та мають значн╕ часов╕ рамки.

PDF

HOME