Ланде Д.В.
Формування текстового корпусу Telegram-каналів
// Реєстрація, зберігання і обробка даних. Щорічна підсумкова наукова конференція присвячена 35 річниці утворення Інституту проблем реєстрації інформації НАН України: збірник
/ - Київ: ІПРІ НАН України, 2022. - С. 105-106.

В роботі представлено пропонується метод автоматичного екстрагування і виявлення об'єктів предметної області (зокрема, кібербезпеки) в інформаційних потоках, аналізу їх взаємозв'язків і візуалізації. Засоби виявлення об.єктів як іменованих сутностей будуються на основі концепцій машинного навчання. У подальшому вивчається динаміка згадувань цих об'єктів, після чого досліджуються взаємозв'язки об'єктів, визначаються їх окремі кластери. Запропоновано форму візуального відображення інформаційного потоку в розрізі об'єктів і дат, що є прямокутною таблицею (діаграма Wordlet), комірки якої заповнені чисельними значеннями, що відповідають частотам появи найменувань об'єктів в інформаційних потоках у розрізі дат.

Розглянутий підхід може застосовуватись для вирішення питань аналізу та візуалізації розподілу об'єктів для будь-яких відібраних інформаційних масивів у розрізі питань, що цікавлять дослідника та мають значні часові рамки.

PDF

HOME