Оценка информативности признаков в модели прогнозирования трудоустройства выпускников
УДК 519.67 +004.852
Аннотация
Статья посвящена решению проблемы формирования пространства информационных признаков для модели прогнозирования трудоустройства выпускников по их успеваемости. Сформировано несколько вариантов признакового пространства с использованием разных методов автоматизированного отбора информационных признаков. Под оценкой информативности признаков в данной работе понимается определение степени их влияния на уровень потенциала трудовой активности выпускников вуза и соискателей работы. Эффективность методов автоматизированного отбора информационных признаков определялась эмпирическим путем: на сформированных выборках проводились эксперименты по обучению с использованием градиентного бустинга и случайных лесов.
Наибольшая точность прогноза была достигнута при формировании признакового пространства с помощью одномерного отбора и обучения методом случайных лесов. Полученные результаты могут использоваться при разработке автоматизированной информационной системы оценки потенциалов трудовой активности выпускников вузов и соискателей работы.
Скачивания
Metrics
Литература
Мутанов Г.М., Мамыкова Ж.Д., Бобров Л.К. Роль и место дата-центра в ИТ-инфраструктуре университета // Вестник НГУ Серия : Информационные технологии. 2014. Т. 12. Вып. 2.
Федотов А.М. и др. Концептуальная модель научно-образовательной информационной системы // Вестник НГУ. Серия : Информационные технологии. 2015. Т. 13. Вып. 3.
Смыкова Н.В., Авдеев А.С., Томашев М.В. Отбор информативных признаков для прогнозирования трудоустройства выпускников вуза // Наука и бизнес: пути развития. 2018. № 12 (90).
Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от данных к знаниям. СПб., 2013.
Мюллер А. Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными. М., 2017.
Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. СПб., 2018.
Таскин А.С. Тест обобщающей способности линейных методов прогнозирования // Вестник НГУ Серия : Информационные технологии. 2013. Т. 11. Вып. 2.
Анисимов Д.С., Рязанов М.А., Шаповал А.И. Подход к обработке многомерных данных пептидных микрочипов // Известия Алт. гос. ун-та. 2015. № 1/2(85).
Ketkar N. Deep Learning with Python: A Hands-on Introduction. Bangalore, Karnataka, India. 2017.
Scikit-learn. Machine Learning in Python. URL: http:// scikit-learn.org/stable.
Пальчунов Д.Е., Яхъяева Г.Э. Нечеткие логики и теория нечетких моделей // Алгебра и логика. 2015. T. 54. № 1.
Большакова Е.И. и др. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. М., 2011.