Computer Methods for Thematic Modeling of Textbooks Collection in Natural Language

УДК 519.67+004.942

  • N.S. Babkina Altai State University (Barnaul, Russia) Email: inf.asu@gmail.com
  • A.B. Nugumanova Sarsen Amanzholov East Kazakhstan State University (Ust-Kamenogorsk, Kazakhstan) Email: anugumanova@vkgu.kz
  • N.M. Oskorbin Altai State University (Barnaul, Russia) Email: osk46@mail.ru
  • O.N. Polovikova Altai State University (Barnaul, Russia) Email: ponolgap@gmail.com
  • L.L. Smolyakova Altai State University (Barnaul, Russia) Email: knaus.larisa@gmail.com
Keywords: text data analysis, thematic modeling, information technology testing

Abstract

The paper presents the development results of computer methods for analyzing text data and assessing classification inaccuracies at the stages of thematic modeling. This study uses as an example the task to process textual data of a collection of graduate qualification works prepared and defended by students of Altai State University, Faculty of Mathematics and IT in recent years.

The main results obtained in the paper are listed as follows. Relevant application areas and directions for computer methods and thematic modeling in the educational process are identified. Justification of the general algorithm for solving the problem of the thematic analysis of collections of educational materials is carried out. Information technologies for thematic modeling are developed, and estimation of analysis errors on a set of test documents is obtained. It is shown that computer-based methods of thematic modeling and information technology to support them can be used both in the educational process and in the development of educational and methodological documents.

Downloads

Download data is not yet available.

Metrics

Metrics Loading ...

Author Biographies

N.S. Babkina, Altai State University (Barnaul, Russia)

ведущий программист кафедры информатики

A.B. Nugumanova, Sarsen Amanzholov East Kazakhstan State University (Ust-Kamenogorsk, Kazakhstan)

PhD, заведующая лабораторией цифровых технологий и моделирования

N.M. Oskorbin, Altai State University (Barnaul, Russia)

доктор технических наук, профессор, профессор кафедры теоретической кибернетики и прикладной математики

O.N. Polovikova, Altai State University (Barnaul, Russia)

кандидат физико-математических наук, доцент кафедры информатики

L.L. Smolyakova, Altai State University (Barnaul, Russia)

старший преподаватель кафедры информатики

References

Ерланова Р.Е. и др. Тематическое моделирование текстовых учебных материалов по информатике средствами языка R // Известия АлтГУ. 2018. № 4(102). DOI: 10.14258/izvasu(2018)4-12.

Махина Е. Д., Пальчунов Д. Е. Программная система для определения речевых действий в текстах естественного языка // Вестник НГУ. Серия : Информационные технологии. 2018. Т. 16. № 4. DOI: 10.25205/1818-7900-2018-16-4-95-106.

Коляда А.С. и др. Применение латентного размещения Дирихле для анализа публикаций из наукометрических баз данных // Pratsi. 2014. № 1 (43).

Леонова Ю. В., Федотов А.М. Извлечение знаний и фактов из текстов диссертаций и авторефератов // Системный анализ и информационные технологии : Тр. V Меж. конф. Красноярск, 2013. Т. 1.

Dezhao S., Schilder F., Smiley C., Brew C., Zielund T., Bretz H., Martin R., Dale C., Pomerville S., Duprey J., Miller T., and Harrison J. TR Discover: a natural language interface for querying and analyzing interlinked datasets. Proc. 14th Intern. conf. on the Semantic Web: ISWC 2015. Springer Intern. Publ., 2015.

Chen F. Topic Modeling of Document Metadata for Visualizing Collaborations over Time / P. Chiu, S. Lim // Proc. of the Int. Conf. on Intelligent User Interfaces (IUI), 2016. DOI: 10.1145/2856767.2856787.

Бабкина Н.С., Смолякова Л.Л. Проблемы реализации тематического моделирования в учебном процессе : сб. научн. ст. Межд. конф «Ломоносовские чтения на Алтае: фундаментальные проблемы науки и техники». 2018. URL: https://sites.google.com/site/lomchten/ .

Федотов А.М., Прозоров О.В., Федотова О.А., Бапанов А.А. О подходе к тематической классификации документов // Вестник НГУ. Серия : Информационные технологии. 2017. Т. 15. № 1.

Половикова О.Н., Бабкина Н.С., Смолякова Л.Л. Анализ проблематики тематического моделирования // МАК : «Математики — Алтайскому краю» : сб. трудов Всерос. конф. по математике с междунар. участием. Барнаул, 2018.

Леонова Ю.В., Федотов А.М., Федотова О.А. О подходе к классификации авторефератов диссертаций по темам // Вестник НГУ Серия : Информационные технологии. 2017. Т. 15. № 1. DOI: 10.25205/1818-7900-2017-15-1-47-58.

Published
2020-03-06
How to Cite
Babkina N., Nugumanova A., Oskorbin N., Polovikova O., Smolyakova L. Computer Methods for Thematic Modeling of Textbooks Collection in Natural Language // Izvestiya of Altai State University, 2020, № 1(111). P. 68-71 DOI: 10.14258/izvasu(2020)1-10. URL: http://izvestiya.asu.ru/article/view/%282020%291-10.
Section
Математика и механика

Most read articles by the same author(s)