学位论文 > 优秀研究生学位论文题录展示

基于Android平台的微博系统研究与应用

作 者: 王承志
导 师: 李浩鸣; 纪世章
学 校: 湖南大学
专 业: 软件工程
关键词: 微博系统 个性化推荐 聚类分析 Android开发
分类号: TP393.092
类 型: 硕士论文
年 份: 2012年
下 载: 105次
引 用: 0次
阅 读: 论文下载
 

内容摘要


微博中圈子很重要,在圈子中,大家对彼此的关注度强于圈子外,产生的话题相关性也比圈子外高。圈子的构建技术与个性化推荐息息相关。个性化推荐的友好程度决定了用户对微博的直接体验。个性化推荐中采用得最广泛的方法是聚类分析。然而传统的长文本聚类算法未能考虑微博数据稀疏性的特点,普通的短文本聚类算法又未能结合微博数据自身的特点。针对微博数据的特点,本文提出了一种微博向量构建方法,该方法考虑微博的话题与文本内容,采用向量空间模型,分别从话题和微博文本计算其相似度。在计算微博文本相似度时对相似度计算公式进行了调整,当词语位于话题中时其重要程度大幅提升。最后,对话题相似度和微博文本相似度进行归一化处理,得到两条微博的相似度。在相似度计算的基础上,本文提出了一种微博聚类算法。该算法基于标签词汇发现技术,通过标签词汇,不断的将微博数据集划分为不同的簇,使得一个簇包含标签词汇,另一个簇完全不包含标签词汇。反复运用迭代分割法,得到最终的聚类结果。本文采用NLPIR微博内容语料库中的部分数据对MBCA算法进行测试,以FScore值为评估标准,与开源聚类工具包CLUTO中的其他聚类算法进行了对比分析,实验结果表明,MBCA算法的性能优于其他短文本聚类算法。在上述工作的基础上,基于Android平台,采用MBCA聚类算法设计和实现了一款简单的微博系统。软件在基于Android平台的各个版本的模拟器以及ME525等真机上运行状况良好,推荐列表合适,证明了软件设计良好,同时也验证了MBCA算法的合理性。

全文目录


摘要  5-6
Abstract  6-10
插图索引  10-11
附表索引  11-12
第1章 绪论  12-18
  1.1 本文研究背景  12-14
  1.2 国内外研究现状  14-16
  1.3 研究的主要内容  16-17
  1.4 本文结构  17-18
第2章 ANDROID 平台及微博简单分析  18-28
  2.1 Android 平台  18-23
    2.1.1 Android 基本概念  18
    2.1.2 Android 系统架构  18-22
    2.1.3 Android 平台的特点  22-23
  2.2 微博  23-27
    2.2.1 典型的微博  23-24
    2.2.2 微博的传播特性  24-26
    2.2.3 微博客核心——个性化推荐  26-27
  2.3 本章小结  27-28
第3章 聚类分析微博系统中的应用  28-44
  3.1 聚类分析预处理  28-32
    3.1.1 文本分词  28-30
    3.1.2 文本特征提取  30-32
  3.2 常用的聚类方法  32-34
    3.2.1 K-Means 算法  32-33
    3.2.2 DBSCAN 算法  33-34
    3.2.3 AGNES 算法  34
  3.3 微博聚类算法  34-38
    3.3.1 微博相似度  34-36
    3.3.2 聚类标准  36
    3.3.3 聚类核心发现  36-37
    3.3.4 微博聚类算法 MBCA  37-38
  3.4 算法验证  38-42
    3.4.1 算法评估标准  38-39
    3.4.2 算法测试数据集  39
    3.4.3 算法性能对比  39-42
  3.5 本章小结  42-44
第4章 基于 ANDROID 平台的微博系统设计与实现  44-56
  4.1 系统分析  44-47
    4.1.1 系统需求分析  44
    4.1.2 业务流程分析  44-45
    4.1.3 功能分析  45-47
  4.2 系统设计  47-51
    4.2.1 数据库设计  47-50
    4.2.2 功能模块设计  50-51
  4.3 系统实现  51-55
  4.4 本章小结  55-56
结论  56-58
参考文献  58-62
致谢  62

相似论文

  1. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  2. 大学生综合素质测评研究,G645.5
  3. 21个荷花品种遗传多样性的ISSR分析,S682.32
  4. 土壤环境功能区划研究,X321
  5. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  6. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  7. 基于多因素模糊聚类的底板突水危险性预测研究,TD745
  8. 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
  9. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  10. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  11. 青海杜鹃属植物种质资源现状及园林应用,S685.21
  12. 基于DEA模型的我国R&D投入产出效率评估研究,G322
  13. “超值天下”系统中订票记录的聚类分析,F274;F224
  14. 基于粒度下的蛋白质序列的分析,Q51
  15. 重庆市生物多样性保护投入产出效率评价研究,X321
  16. 基于感性工学的激光打标机创新设设设究,TG96
  17. 高血压前期证候特征研究,R259
  18. 城市公共汽车行驶工况构建与研究,U469.72
  19. 基于聚类分析方法的交通事故黑点的鉴别,U491.31
  20. 基于Web数据挖掘的网页优化设计应用研究,TP393.092
  21. 基于聚类算法的银行卡客户分类分析系统的设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com