欢迎访问发表云网!为您提供杂志订阅、期刊投稿咨询服务!

面向微博热点话题发现的改进BBTM模型研究

黄畅; 郭文忠; 郭昆 福州大学数学与计算机科学学院; 福州350116; 福州大学网络计算与智能信息处理重点实验室; 福州350116; 福州大学空间数据挖掘与信息共享教育部重点实验室; 福州350116
热点话题发现   微博   主题模型  

摘要:针对目前基于主题模型的微博短文本热点话题发现存在特征稀疏、高维度以及需要人工指定主题数目等问题,提出一种基于改进突发词对主题模型(bursty biterm topic model,BBTM)的热点话题发现方法(hot topic-hot biterm topic model,H-HBTM)。首先,利用词的突发概率进行特征选择,过滤非突发词。其次,结合微博文本的突发特性和传播特性计算微博词对的热值突发概率,将热值突发概率作为BBTM的先验概率。最后,利用基于密度的方法自适应选择BBTM的最优话题数目,确定最优BBTM,实现热点话题发现。在真实微博数据集上的实验表明,H-HBTM可以在不需要预先设定主题数目的情况下,自动发现最优话题模型,并且H-HBTM发现的热点话题的质量高于基于BBTM、词对主题模型以及潜在狄立克雷分配的方法。

简介:《计算机科学与探索》(CN:11-5602/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机科学与探索

北大期刊 下单

关注 17人评论|0人关注
服务与支持