学位论文 > 优秀研究生学位论文题录展示

基于科技文献的时序主题链构建方法研究

作 者: 张红卫
导 师: 吴江宁
学 校: 大连理工大学
专 业: 管理科学与工程
关键词: 时序主题链 转移概率 主题交叉融合特征 主题演化 科技文献
分类号: G353.1
类 型: 硕士论文
年 份: 2013年
下 载: 37次
引 用: 0次
阅 读: 论文下载
 

内容摘要


科技文献是科学研究和技术研究成果的最终形式之一,是传递情报信息和交流学术思想的重要载体。阅读科技文献是科研人员获取知识的重要渠道,也是科研人员进行学术研究和科学决策的重要基础。主题是科技文献内容的提示符,是文献所包含的学术思想及学术观点的凝练和总结。主题是随着时间不断演化的,演化过程包括新主题的产生、旧主题的消亡、某个主题向其他主题的渗透或收敛等现象。展示科技文献中主题的演化过程有助于科研人员把握研究的脉络,并辅助科研人员进行科学决策。本研究以主题演化分析为主线,用时序主题链的方式来展现科技文献中主题随时间变化的事实。提出了时序主题链的模型和构建方法,并基于科技文献进行了实证研究,而且对实证研究中的主题交叉融合特征进行了量化研究。第一,针对带有时间标签的文本集合,提出了时序主题链模型及其构建方法。将互信息的思想引入主题词的提取过程,以更好的表示主题含义;考虑到新主题更容易、更快地传承下去,在构建转移概率公式时引入了衰减因子,并利用艾宾浩斯遗忘规律进行度量;构建时序主题链时,搜索各个主题的来源和去向,以完整的展示主题的发展脉络。第二,针对科技文献数据,利用所提出的时序主题链构建方法进行实证研究。结果表明,时序主题链可以展示主题随时间变化的过程,并能揭示主题演化过程中不同主题间的隐含关系。第三,以实证研究中的时序主题链为研究对象,分析主题演化过程中的交叉融合特征,并提出量化方法。时序主题链中存在融合式结构,此结构能揭示不同主题相互渗透、相互作用的交叉融合特征。为研究不同主题间发生交叉融合的概率大小或难易程度,利用融合式结构对主题融合度进行量化。时序主题链可以揭示文献中各个主题的发展脉络和不同主题间隐含的关系,主题交叉融合特征分析有助于发现创新切入点和解决问题的思路,对科研人员具有重要的引导和启示意义。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-20
  1.1 研究背景及意义  9-11
    1.1.1 研究背景  9-10
    1.1.2 研究意义  10-11
  1.2 国内外研究现状  11-18
    1.2.1 主题发现  11-15
    1.2.2 主题演化  15-18
  1.3 研究内容与论文结构  18-20
2 时序主题链模型  20-29
  2.1 模型描述  20-21
  2.2 主题抽取方法  21-23
    2.2.1 LDA主题抽取算法  21-23
    2.2.2 主题词提取方法  23
  2.3 转移概率计算方法  23-25
    2.3.1 主题相似度  24
    2.3.2 衰减因子  24-25
  2.4 时序主题链构建步骤  25-29
    2.4.1 基本步骤  26-27
    2.4.2 构图策略  27-29
3 管理领域典型期刊文献的时序主题链构建  29-39
  3.1 文献数据  29-30
    3.1.1 数据特征  29-30
    3.1.2 数据采集  30
  3.2 文献预处理  30-32
    3.2.1 分词  30-31
    3.2.2 特征选择  31-32
  3.3 主题抽取  32-34
  3.4 时序主题链构建  34-39
4 基于时序主题链的主题交叉融合特征分析  39-50
  4.1 主题交叉融合特征  40
  4.2 主题融合度  40-42
    4.2.1 含义  40-41
    4.2.2 度量方法  41-42
  4.3 实证结果分析  42-50
结论  50-52
参考文献  52-56
攻读硕士学位期间发表学术论文情况及参加项目情况  56-57
致谢  57-58

相似论文

  1. 马尔可夫链预测模型及一些应用,O211.62
  2. 基于网页分块的主题爬虫方法研究,TP391.3
  3. 基于改进转移概率矩阵的计算信用VaR的MonteCarlo模拟法,F224;F832.51
  4. 科技文翻译之实、准、简—译Harmony有感,H059
  5. 信用等级转移概率预测模型的构建与应用,F224
  6. 新疆地区沥青路面交竣工评价指标关联性及PCI分级研究,U416.217
  7. 蚁群优化算法及其应用研究,TP301.6
  8. 20世纪以来中国音乐科技文献研究,J609.2
  9. 山西高校科技文献平台异构数据整合研究,G250.7
  10. 基于语义的科技文献检索技术研究,TP391.3
  11. 秦汉时期音乐科技史料研究,J60-05
  12. 魏晋南北朝时期音乐科技史料研究,J609.2
  13. 宋元时期音乐科技史料研究,J609.2
  14. 网络科技文献推荐系统的设计与实现,G353
  15. 基于科技文献的科研合作网络微观分析与研究,G311
  16. 中国能源消费结构转移的Markov链研究,F426.2
  17. 面向海量文献信息的可交互可视化分析系统的研究与实现,TP311.52
  18. 科技文献的文本特征抽取研究与应用,TP391.1
  19. 股票收益率的统计分析及其股价预测,F224
  20. 双Poisson模型的破产概率研究,O211.67
  21. 山西省医学科技文献资源平台的建设与思考,G253

中图分类: > 文化、科学、教育、体育 > 科学、科学研究 > 情报学、情报工作 > 情报资料的处理 > 情报资料的分析和研究
© 2012 www.xueweilunwen.com