Выбор БД
Тип поиска
Сортировать по:
1. Статья
bookCover
Айрапетян Жирайр Сережаевич.
Метод максимального правдоподобия для обобщения нечетких множеств в таксономия / Айрапетян Жирайр Сережаевич, Фролов Дмитрий Сергеевич , Миркин Борис Григорьевич
// Математические основы информатики и информационно-коммуникационных систем". - Тверь : Тверской государственный университет, 2021. - С. 96-101. - Библиогр.: с. 100 (4 назв.).
Авторы: Айрапетян Жирайр Сережаевич, Фролов Дмитрий Сергеевич , Миркин Борис Григорьевич
Ключевые слова: Экономика, Высшая школа экономики, Алгоритмы, Иерархическая таксономия, Спектральная кластеризация
Ссылка на ресурс: http://texts.lib.tversu.ru/texts/151504t.pdf
Подробнее
Аннотация: В работе предлагается новый метод обобщения тематической текстовой коллекции, оснащенной таксономией предметной области. С помощью спектральных методов кластеризации из текстовой коллекции извлекаются нечеткие множества листьев таксономии, соответствующие понятиям, одновременно используемым в статьях коллекции. Эти нечеткие множества обобщаются путем их подъема в дереве таксономии с использованием критерия максимального правдоподобия. Оптимальный подъем подразумевает нахождение вершины или множества вершин в дереве таксономии, наиболее плотно покрывающих листовые понятия из обобщаемого множества. Наш метод включает два основных этапа: (1) извлечение кластеров из текстовой коллекции и (2) обобщение этих кластеров. В данной работе модернизируются оба этапа. Алгоритмы применены к структурному анализу и описанию текстовой коллекции из 17 тыс. аннотаций научных статей в области Наук о данных, опубликованных в журналах издательства Шпрингер. Таксономия Наук о данных, используемая в данной работе, является шестиуровневой иерархической таксономией, разработанной вручную международной Ассоциацией Вычислительной Техники и Вычислительных Систем (ACM-CSS [4]).