Методика частотного аналізу тексту за допомогою алгоритма Count-Min Sketch

Вантажиться...
Ескіз
Дата
2022
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Розглянуто недоліки хеш-таблиць щодо зберігання великих потокових текстових даних. Для їх подолання запропоновано використання модифікованого хешування даних на основі імовірнісного алгоритму Count-Min-Sketch. Розроблено методику його використання для зберігання великих текстових даних та їх подальшого частотного аналізу з метою отримання списку ключових слів. Для реалізації вибраного алгоритму використовувалась мова програмування Java, а в якості середовища розробки - IntelliJ IDEA 2022.
Опис
Акішев О. О. Методика частотного аналізу тексту за допомогою алгоритма Count-Min Sketch / О. О. Акішев, О. О. Арсірій // Інформаційні технології і автоматизація – 2022 : матеріали XV Міжнар. наук.-практ. конф., Одеса, 20–21 жовт. 2022 р. / Одес. нац. технол. ун-т. Ін-т комп'ютер. систем і технологій "Індустрія 4.0" ім. П. Н. Платонова ; орг. ком.: Б. В. Єгоров (голова) та ін. – Одеса, 2022. – С. 17–19 : рис. – Бібліогр.: 3 назв.
Ключові слова
частотний аналіз тексту, алгоритм Count-Min Sketch
Бібліографічний опис