К проблеме оцифровки кластерной переменной, согласованной с результатами post-hoc анализа
Аннотация
Рассмотрим задачу изучения и классификации каких-либо объектов, заданных набором своих числовых (формирующих) показателей. Пусть наблюдаемые объекты разбиты на кластеры, а формирующие показатели упорядочены по степени их влияния на имеющуюся кластерную структуру, т.е. решена post-hoc задача кластерного анализа. Рассматривается задача оцифровки нечисловой кластерной переменной, которая для каждого из рассматриваемых объектов представляет собой обозначение того кластера, к которому данный объект принадлежит. При этом нашей целью является присвоение каждому из кластеров числовой метки таким образом, чтобы эти метки оказались наилучшим образом согласованы с post-hoc упорядочиванием формирующих показателей. В отличие от ранее предлагавшихся методов решения подобной задачи указанное присвоение происходит без применения каких-либо итерационных процедур, – формулы для меток получены в аналитическом виде. Обсуждаются различия предлагаемого и существовавших ранее методов, даются некоторые рекомендации по переводу получающихся меток в целочисленные. Высказываются предложения по возможному использованию результатов производимой оцифровки, в том числе и в задачах доказательной медицины. Приведен пример подобного использования к обработке реальных данных медицинского обследования.
DOI 10.14258/izvasu(2015)1.2-19
Скачивания
Metrics
Литература
Дронов С.В. Одна кластерная метрика и устойчивость кластерных алгоритмов // Известия Алт. гос. ун-та. - 2011. - №1/2 (69).
Dronov S.V., Dementjeva E.A. A new approach to post-hoc problem in cluster analysis // Model Assisted Statistics and Applications. - 2012. - Vol. 7, №1.
Бобрышева М.С., Дронов С.В. Разметка кластеров, согласованная с post-hoc ранжированием формирующих показателей // Труды молодых ученых Алтайского госуниверситета : материалы XL науч. конф. студентов, аспирантов и учащихся лицейных классов. - Барнаул, 2013. - Вып. 10.



