Новый подход к квантификации результатов кластерного анализа
УДК 519.6 + 519.25
Аннотация
В работе предложен единый подход к нескольким вариантам решения задачи о квантификации кластеров заранее построенного кластерного разбиения конечного множества. В результате применения любого из предлагаемых подходов каждый кластер получает, вообще говоря, векторные метки. Для этого применяется методика, близкая к анализу латентных классов. В первой группе методов, латентно-объектной, каждый объект отождествляется с вектором, координаты которого равны значениям наблюдаемых показателей этого объекта. Во второй, латентно-показательной, каждый показатель заменяется вектором своих значений на всех объектах данного кластера. После этого из пучка полученных на данном кластере векторов выделяется центральный, наиболее близкий ко всем векторам пучка. При латентно-объектном подходе он и объявляется векторной меткой кластера. При латентно-показательном подходе метки разных кластеров получаются имеющими разные размерности. Описаны возможные методы приведения их в единую, числовую, форму. Даны также рекомендации по сокращению размерности латентно-объектных меток. Рассмотрен числовой пример.
Скачивания
Metrics
Литература
Samuels J.A. One-Hot Encoding and Two-Hot Encoding: An Introduction. London: Imperial college London. 2024. 5 P. DOI: : 10.13140/RG.2.2.21459.76327
Manning c.D., Raghavan P., Schutze H. Introduction to Information Retrieval. cambridge: University Press. 2009. 581 p. DOI: : 10.1017/cBO9780511809071
Moreo A., Francisco M., Sebastiani F. Multi-label Quantification // AcM Transactions on Knowledge Discovery from Data. 2024. Vol. 18. No 1. DOI: : 10.48550/ arXiv.2211.08063
Bunse M., Moreo A., Sebastiani F., Senz M. Ordinal Quantification Through Regularization // Data Mining and Knowledge Discovery. 2024. Vol 38. No 6. P. 4076-4121. DOI: : 10.1007/978-3-031-26419-1-3
cheung Kwok-Wai, Tsui Kwok-ching, Liu Jiming. Extended Latent class Models for collaborative Recommendation // IEEE Transactions on Systems, Man, and cybernetics — Part A: Systems and Humans. 2004. Vol. 34. No 1. P. 143-148. DOI: : 10.1109/TSMcA.2003.818877
Rindskopf D. Latent Class Analysis. In: The SAGE Handbook of Quantitative Methods in Psychology. N.Y.: Sage. 2009. P. 226-244. DOI: : 10.4135/9780857020994
Дронов С.В., Шеларь А.Ю. Латентный кластерный анализ для случая двух кластеров // МАК: «Математики — Алтайскому краю» : сборник трудов Всероссийской конференции по математике. Барнаул: Изд-во Алтайского гос. университета. 2018. С. 23-26.
Дронов С.В., Еськов С.Ю. Геометрический подход в post-hoc задаче кластерного анализа // Труды семинара по геометрии и математическому моделированию. 2024. Т. 10. С. 48-53.
Dronov S.V., Sazonova A.S. Two Approaches to Cluster Variable Quantification // Model Assisted Statistics and Applications. 2015. Vol. 10. P. 155-162. DOI: : 10.3233/ MAS-140314
Gewers EL. et al. Principal Component Analysis: A Natural Approach to Data Exploration // ACM Computing Surveys. 2021. Vol. 54. No 4. P. 1-34. DOI: : 10.1145/3447755
Copyright (c) 2025 Сергей Вадимович Дронов, Юлия Алексеевна Дударева, Святослав Юрьевич Еськов

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.



