学位论文 > 优秀研究生学位论文题录展示

基于用户个性挖掘的Web社区营销研究

作 者: 余伟
导 师: 李石君
学 校: 武汉大学
专 业: 计算机应用技术
关键词: 社区排序 模糊搜索 用户特征挖掘 用户兴趣挖掘 社区用户交互 时间一致性 时间感知
分类号: TP393.09
类 型: 博士论文
年 份: 2011年
下 载: 236次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着Web社区的蓬勃发展,基于Web社区的网络营销越来越受到企业的关注。调查数据统计,截至2010年底,全国社区用户数量达到2.94亿,占全国网民总数的70.3%,2010年全国互联网广告市场份额达321.20亿元。但是消费者的购买行为在日益发展的社会形态中发生变化,传统的互联网广告已经不能够取得人们的信任,用户往往通过在互联网上搜索相关信息和评论来进行决策。社区营销成为时下网络营销推广的产物,利用Web社区进行口碑传播在消费者决策中扮演了极其重要的角色。对于消费者来说,其对人际信息的信任程度远高于对广告的信任。因此基于Web社区进行网络营销成为了品牌低成本、高效率的信息推广方式。Web社区营销发展时间较短,尚未形成有效的理论和统一的方法。Web社区营销的核心是互动和精准营销,本文就如何选择合适的社区进行社区营销;如何让用户在社区中检索到合适的主题;如何挖掘虚拟用户的真实特征属性和兴趣爱好;如何发现社区中失效的主题四个角度展开研究,解决了Web社区营销中的一些基本技术问题,形成了基本理论,主要研究内容如下:(1)针对如何选择Web社区,提出了基于数据质量评估和抽样方法的Web社区排序理论。通过建立数据质量,给出了评价社区数据源优劣的量化标准,从而使得评价标准可以度量和扩展,这种方法解决了传统排序算法中排序标准不能完整的反映真实评价的问题;而通过合适的抽样方法,从庞大的社区主题中随机抽取样本,使样本能够反映总体的特性,解决了社区中主题数量庞大不好度量的问题。(2)针对社区中资源的模糊搜索,提出了基于Trie树的新型模糊算法。当用户只记得某个单词的一部分时,用户只需输入该部分,通过本文的系统仍然可以找到需要的结果。并且具有交互功能:用户每输入一个字母,系统就会实时的提示用户可能目标词。为了实现高效性从而不影响用户满意度,本文提取了一种基于Trie树的算法。实验表明该算法能高效的实现本系统。(3)针对用户的特征属性和兴趣爱好挖掘,本文提出了基于本体语义分析的用户特征属性和兴趣爱好挖掘方法。通过建立用户的行为模型和特征模型,建立特征属性的属性集和推断规则集,建立不确定性的推断方法,来根据用户的行为特征和言论推断用户的特征属性和兴趣爱好。实验结果表明该方法具有良好的扩展性和准确性,解决了Web社区营销中目标的精准定位的问题。(4)为提高挖掘用户特征属性和兴趣爱好的效率,提出了基于交互关系的用户特征挖掘方法。本文通过大量社区用户数据统计和分析,研究了Web社区中用户之间的交互行为和兴趣相似度,建立了基于假设检验的理论评价方法,证明了社会学家关于“交往亲密的朋友具有更多的兴趣相似性”的观点在虚拟Web社区中同样具有适用性。在此基础上构造了快速挖掘Web社区中兴趣相似用户集合的算法,并通过置信度量和算法检验,证明了此算法在快速实现Web社区中兴趣相似的用户挖掘是有效的。(5)针对社区中主题失效的问题,提出了社区中主题网页时间一致性的建模、度量、推理和发现方法。网页的时间一致性是指网页所述的时间与实际时间相符,它是评价网络信息质量的一项重要指标,关系到网页内容的时效性和精准性。大量时间敏感度较高的网页中均存在时间的不一致性,严重影响了用户对网页内容的理解和决策行为。本文首先针对主题网页的时间维度进行了建模,包括对网页信息的时间敏感性分析、基于时间序列的网页分类和网页的时间维度抽取;然后针对网页时间一致性进行了度量与推理,包括对网页事件的时间不致性分类、网页事件的时间不一致性建模和主题网页中不一致的发现。通过此方法可以实现自动过滤Web社区中的时间不一致的主题,提高用户的使用感受。本文的研究为Web社区营销提供了理论支撑和技术支持,解决了如何从众多Web社区中进行甄别和排序;实现了社区主题的模糊查询方法;解决了如何精确挖掘用户特性特征和属性;实现了网络社区中过时主题信息的建模和发现方法。

全文目录


摘要  5-7
ABSTRACT  7-13
第一章 绪论  13-30
  1.1 研究背景及目的  13-19
    1.1.1 关于Web社区营销  13-17
    1.1.2 社区营销的主要方法  17-19
  1.2 国内外研究现状  19-24
    1.2.1 Web社区发现  19-20
    1.2.2 社区用户研究  20-21
    1.2.3 热门话题发现和排序  21
    1.2.4 社区排序  21-22
    1.2.5 时间一致性  22-24
    1.2.6 社区其他相关研究  24
  1.3 主要工作与创新点  24-26
  1.4 研究价值与意义  26-27
  1.5 内容组织结构  27-30
第二章 社区数据源排序  30-45
  2.1 引言  30
  2.2 社区数据源与数据质量  30-36
    2.2.1 社区的质量标准  30-32
    2.2.2 质量模型  32-33
    2.2.3 质量向量的标准化处理  33
    2.2.4 质量向量的权重计算  33-34
    2.2.5 权重向量的确定  34-36
    2.2.6 按数据质量进行排序  36
  2.3 抽样分析方法  36-40
    2.3.1 抽样过程  37-40
    2.3.2 抽样估计  40
    2.3.3 抽样抉择  40
  2.4 试验与结果  40-43
    2.4.1 样本点的抽样  41-42
    2.4.2 权重向量的求解  42-43
    2.4.3 估计量计算与排序  43
  2.5 结论  43-45
第三章 社区中资源的模糊搜索  45-58
  3.1 引言  45-46
  3.2 定义和理论  46-48
  3.3 算法  48-54
    3.3.1 基于游标的单个查询  48-52
    3.3.2 基于增量/缓存算法的单个查询  52-53
    3.3.3 排序  53-54
  3.4 试验与结果  54-57
    3.4.1 计算整个字符串的效率  54-55
    3.4.2 检索成功概率  55-56
    3.4.3 保存键入效果  56
    3.4.4 在Oracle中进行比较  56-57
  3.5 结论  57-58
第四章 基于本体语义分析的社区用户个性挖掘  58-71
  4.1 引言  58
  4.2 用户模型  58-61
    4.2.1 用户行为模型  58-60
    4.2.2 用户特征模型  60
    4.2.3 用户兴趣模型  60-61
  4.3 用户特征推断  61-66
    4.3.1 社区用户的描述逻辑  61
    4.3.2 概念集和关系集  61-62
    4.3.3 属性集和值集合  62-63
    4.3.4 推理规则  63-65
    4.3.5 结果推断  65-66
  4.4 实验  66-69
    4.4.1 数据集  66-67
    4.4.2 规则集  67
    4.4.3 规则计算与结果  67-69
  4.5 结论  69-71
第五章 基于交互关系的社区用户兴趣特征挖掘  71-87
  5.1 引言  71
  5.2 相关工作  71-72
  5.3 数据集  72-76
    5.3.1 两种交互行为(Conversation Behavior)  72
    5.3.2 基本定义  72-73
    5.3.3 实验数据集  73-74
    5.3.4 社区用户兴趣特征数据  74-75
    5.3.5 用户对  75-76
  5.4 统计分析方法  76-78
    5.4.1 独立交互行为与相似度相关的显著性检验  76-77
    5.4.2 交互度与相似度的单调关系的显著性检验  77-78
  5.5 基于兴趣的社区用户挖掘  78-80
    5.5.1 挖掘算法  78-79
    5.5.2 算法检验  79-80
  5.6 实验  80-85
    5.6.1 用户间的独立交互和兴趣相似度关系  80-81
    5.6.2 用户间的交互度和兴趣相似度关系  81
    5.6.3 交互行为1和交互行为2的关系  81-82
    5.6.4 总交互度与相似度的分布  82-84
    5.6.5 用户挖掘  84-85
    5.6.6 实验结果  85
  5.7 结论  85-87
第六章 社区主题的时间一致性研究  87-105
  6.1 引言  87-89
  6.2 总体方案  89
  6.3 WEB时间建模  89-95
    6.3.1 社区信息的时间敏感性分析  89-90
    6.3.2 时间知识概念模型的构建  90
    6.3.3 基于事件的时间序关系的网页分类  90-95
  6.4 WEB时间不一致建模  95-98
    6.4.1 网页不一致性分类  95
    6.4.2 时间不一致性模型  95-98
  6.5 WEB时间不一致推理  98-100
    6.5.1 网页的时间不一致性存在空间  98-99
    6.5.2 不一致存在空间与不一致问题的对应关系  99-100
    6.5.3 不一致问题推理  100
  6.6 网站过时网页的自动发现  100-101
    6.6.1 网页信息的时间敏感性分析  100-101
    6.6.2 时间信息抽取与时间不一致模式识别  101
  6.7 时间感知搜索模型改进  101-103
    6.7.1 时间词库  101-102
    6.7.2 约束函数的建立  102
    6.7.3 匹配约束函数  102-103
  6.8 实验  103-104
  6.9 结论  104-105
第七章 总结与展望  105-108
  7.1 总结  105-106
  7.2 展望  106-108
参考文献  108-112
致谢  112-113
攻读博士学位期间的科研成果  113

相似论文

  1. 时空结合的深度视频估计及相关研究,TP391.41
  2. 基于STN的行动计划时间表示和冲突处理研究,E07
  3. ATRs-EDB系统的实时数据定义与操作,TP311.13
  4. 时间感知Web服务交互适配技术研究,TP393.09
  5. 情绪对时间感知影响的神经心理学研究,R749.4
  6. 分布式工作流的事件处理机制研究,F270.7
  7. 基于关键词扩展的智能模糊查询算法的研究,TP391.3
  8. 招标智能办公系统的研究与应用,F284
  9. 混合P2P系统的设计和搜索机制研究,TP393.02
  10. 基于HLA的多模复合精确末制导仿真系统设计与实现,TP391.9
  11. HLR数据一致性的研究与实现,TP392
  12. 基于形状特征的运动目标分类方法研究,TP391.41
  13. 基于主题的新闻搜索引擎的研究与实现,TP391.3
  14. 基于HLA的分布式虚拟靶试系统及仿真一致性研究,TP391.9
  15. 引入时间特性的角色访问控制,TP393.08
  16. 动态对策的最优联盟结构,O225
  17. 动态对策中解的时间一致性,O225
  18. 国家实物战略储备,F062.6
  19. 视频语义标注的若干问题研究,TP391.41
  20. 最优利率规则:一般理论与应用,F224

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com