信息网络安全 ›› 2016, Vol. 16 ›› Issue (4): 61-68.doi: 10.3969/j.issn.1671-1122.2016.04.010
Hongfu ZHOU(), Lu JIA, Tingting ZHANG, Jian LI
摘要:
文章以sina微博为研究对象,分析研究了微博舆情分析中提取微博信息转发路径的方法,并获得在微博信息转发过程中起关键作用的微博用户。系统主要使用网络爬虫框架进行数据采集,采用多账户多线程分布式技术,可以绕过sina微博反爬虫机制的功能,具有较高的稳定性和高效性。在研究转发路径提取方法整个过程中,需要经历爬取微博转发网页信息、提取转发信息、转发信息预处理、构造转发路径树等步骤。通过对微博转发路径信息的提取和组织成树形结构信息,就可以实现在网页中显示微博的转发图。最后通过对PageRank算法的改进,实现了计算用户传播影响力的算法设计,能够快速评估在微博整个转发传播过程中用户的转发影响力。
中图分类号: