Машинные методы тематического моделирования коллекции учебных текстов на естественном языке

УДК 519.67+004.942

  • Наталья Сергеевна Бабкина Алтайский государственный университет (Барнаул, Россия) Email: inf.asu@gmail.com
  • Алия Багдатовна Нугуманова Восточно-Казахстанский государственный университет им. С. Аманжолова (Усть-Каменогорск, Казахстан) Email: anugumanova@vkgu.kz
  • Николай Михайлович Оскорбин Алтайский государственный университет (Барнаул, Россия) Email: osk46@mail.ru
  • Ольга Николаевна Половикова Алтайский государственный университет (Барнаул, Россия) Email: ponolgap@gmail.com
  • Лариса Ленгардовна Смолякова Алтайский государственный университет (Барнаул, Россия) Email: knaus.larisa@gmail.com
Ключевые слова: анализ текстовых данных, тематическое моделирование, тестирование информационных технологий

Аннотация

Представлены результаты разработки информационных технологий машинных методов анализа текстовых данных и оценки погрешностей классификации на этапах тематического моделирования. Исследование проводится на примере задачи обработки текстовых данных коллекции выпускных квалификационных работ кафедры информатики, которые подготовлены и защищены в последние годы студентами ФМиИТ АлтГУ.

Основные результаты работы состоят в следующем: выбраны актуальные направления использования машинных методов и задач тематического моделирования в учебном процессе; проведено обоснование общего алгоритма решения задачи тематического анализа коллекций учебных материалов; разработаны информационные технологии тематического моделирования и получены оценки погрешностей анализа на совокупности тестовых документов. Показано, что использование машинных методов тематического моделирования и информационных технологий их поддержки возможно как в учебном процессе, так и при подготовке учебно-методических материалов.

Скачивания

Данные скачивания пока недоступны.

Metrics

Загрузка метрик ...

Биографии авторов

Наталья Сергеевна Бабкина, Алтайский государственный университет (Барнаул, Россия)

ведущий программист кафедры информатики

Алия Багдатовна Нугуманова, Восточно-Казахстанский государственный университет им. С. Аманжолова (Усть-Каменогорск, Казахстан)

PhD, заведующая лабораторией цифровых технологий и моделирования

Николай Михайлович Оскорбин, Алтайский государственный университет (Барнаул, Россия)

доктор технических наук, профессор, профессор кафедры теоретической кибернетики и прикладной математики

Ольга Николаевна Половикова, Алтайский государственный университет (Барнаул, Россия)

кандидат физико-математических наук, доцент кафедры информатики

Лариса Ленгардовна Смолякова, Алтайский государственный университет (Барнаул, Россия)

старший преподаватель кафедры информатики

Литература

Ерланова Р.Е. и др. Тематическое моделирование текстовых учебных материалов по информатике средствами языка R // Известия АлтГУ. 2018. № 4(102). DOI: 10.14258/izvasu(2018)4-12.

Махина Е. Д., Пальчунов Д. Е. Программная система для определения речевых действий в текстах естественного языка // Вестник НГУ. Серия : Информационные технологии. 2018. Т. 16. № 4. DOI: 10.25205/1818-7900-2018-16-4-95-106.

Коляда А.С. и др. Применение латентного размещения Дирихле для анализа публикаций из наукометрических баз данных // Pratsi. 2014. № 1 (43).

Леонова Ю. В., Федотов А.М. Извлечение знаний и фактов из текстов диссертаций и авторефератов // Системный анализ и информационные технологии : Тр. V Меж. конф. Красноярск, 2013. Т. 1.

Dezhao S., Schilder F., Smiley C., Brew C., Zielund T., Bretz H., Martin R., Dale C., Pomerville S., Duprey J., Miller T., and Harrison J. TR Discover: a natural language interface for querying and analyzing interlinked datasets. Proc. 14th Intern. conf. on the Semantic Web: ISWC 2015. Springer Intern. Publ., 2015.

Chen F. Topic Modeling of Document Metadata for Visualizing Collaborations over Time / P. Chiu, S. Lim // Proc. of the Int. Conf. on Intelligent User Interfaces (IUI), 2016. DOI: 10.1145/2856767.2856787.

Бабкина Н.С., Смолякова Л.Л. Проблемы реализации тематического моделирования в учебном процессе : сб. научн. ст. Межд. конф «Ломоносовские чтения на Алтае: фундаментальные проблемы науки и техники». 2018. URL: https://sites.google.com/site/lomchten/ .

Федотов А.М., Прозоров О.В., Федотова О.А., Бапанов А.А. О подходе к тематической классификации документов // Вестник НГУ. Серия : Информационные технологии. 2017. Т. 15. № 1.

Половикова О.Н., Бабкина Н.С., Смолякова Л.Л. Анализ проблематики тематического моделирования // МАК : «Математики — Алтайскому краю» : сб. трудов Всерос. конф. по математике с междунар. участием. Барнаул, 2018.

Леонова Ю.В., Федотов А.М., Федотова О.А. О подходе к классификации авторефератов диссертаций по темам // Вестник НГУ Серия : Информационные технологии. 2017. Т. 15. № 1. DOI: 10.25205/1818-7900-2017-15-1-47-58.

Опубликован
2020-03-06
Как цитировать
Бабкина Н. С., Нугуманова А. Б., Оскорбин Н. М., Половикова О. Н., Смолякова Л. Л. Машинные методы тематического моделирования коллекции учебных текстов на естественном языке // Известия Алтайского государственного университета, 2020, № 1(111). С. 68-71 DOI: 10.14258/izvasu(2020)1-10. URL: http://izvestiya.asu.ru/article/view/%282020%291-10.

Наиболее читаемые статьи этого автора (авторов)