Парсинг тексту: використання потужностей NLP задля підвищення точності отримуваних даних

Вантажиться...
Ескіз
Дата
2023
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Підсумовуючи, варто зазначити, що використання наявних потужностей NLP, зокрема NER і GTT, може стати вирішальним фактором у підвищенні точності отримуваних результатів, порівняно з такими підходами, як rule-based approach. Аналіз текстів судових рішень (далі — СР) є невіддільною частиною процесів оцінювання якості, ефективності та прозорості судочинної системи України — за різними параметрами. Утім, тексти СР, як і будь-яких інших правових документів, є доволі специфічними для сприйняття. У таких документах використовуються спеціалізована лексика й терміни, складні синтаксичні структури, а також існує певний стандарт в оформленні змісту, який є відмінним від звичних. Ці фактори ускладнюють мануальний процес аналізу подібних текстів. Наразі найбільш поширеним способом отримання сирих текстів СР з бази ЄДРСР [1] є відкритий офіційний ресурс ЄДРСР ДСАУ [2] (релевантні пошукові запити, що стосуються СР, надають попередньо згаданий ресурс першим у вибірці, що свідчить про його популярність).
Опис
Пелович Д. В. Парсинг тексту: використання потужностей NLP задля підвищення точності отримуваних даних / Д. В. Пелович, О. Р. Смиш // Стан, досягнення та перспективи інформаційних систем і технологій: матеріали XXIII Всеукр. наук.-техн. конф. молодих вчених, аспірантів та студентів, Одеса, 20–21 квіт. 2023 р. / Одес. нац. технол. ун-т . – Одеса, 2023. – С. 100-101. – Бібліогр.: 11 назв.
Ключові слова
парсинг тексту, аналіз текстів, судові рішення
Бібліографічний опис