决策与信息

计算机软件及计算机应用论文_面向动态数据流

文章摘要:传统机器学习模型大多依赖封闭世界假设,难以持续挖掘开放环境下动态文本数据流的语义信息。本文考虑动态数据流的粒特征变化,提出了一种基于三支多粒度学习思想的主题建模方法(Three-way Multi-granularity Topic Model,3WMTM)。根据“文本-主题-词汇”的粒度参数演化机理,构建了主题模型的动态多粒度分析框架,在主题不断新增背景下自适应更新阈值。实验结果表明,3WMTM算法在动态环境下能够维持较好的决策精度,即统计上无显著差异;并且3WMTM算法能够在每个决策阶段立即给出判断,因此在决策成本上优于现有模型。

文章关键词:开放动态环境,三支多粒度学习,主题模型,主题新增,

项目基金:国家重点研发计划课题(2019YFB210180),国家自然科学基金(61773324;61876157),教育部人文社会科学青年基金(20YJC630191),