学位论文 > 优秀研究生学位论文题录展示
基于Android平台的微博系统研究与应用
作 者: 王承志
导 师: 李浩鸣; 纪世章
学 校: 湖南大学
专 业: 软件工程
关键词: 微博系统 个性化推荐 聚类分析 Android开发
分类号: TP393.092
类 型: 硕士论文
年 份: 2012年
下 载: 105次
引 用: 0次
阅 读: 论文下载
内容摘要
微博中圈子很重要,在圈子中,大家对彼此的关注度强于圈子外,产生的话题相关性也比圈子外高。圈子的构建技术与个性化推荐息息相关。个性化推荐的友好程度决定了用户对微博的直接体验。个性化推荐中采用得最广泛的方法是聚类分析。然而传统的长文本聚类算法未能考虑微博数据稀疏性的特点,普通的短文本聚类算法又未能结合微博数据自身的特点。针对微博数据的特点,本文提出了一种微博向量构建方法,该方法考虑微博的话题与文本内容,采用向量空间模型,分别从话题和微博文本计算其相似度。在计算微博文本相似度时对相似度计算公式进行了调整,当词语位于话题中时其重要程度大幅提升。最后,对话题相似度和微博文本相似度进行归一化处理,得到两条微博的相似度。在相似度计算的基础上,本文提出了一种微博聚类算法。该算法基于标签词汇发现技术,通过标签词汇,不断的将微博数据集划分为不同的簇,使得一个簇包含标签词汇,另一个簇完全不包含标签词汇。反复运用迭代分割法,得到最终的聚类结果。本文采用NLPIR微博内容语料库中的部分数据对MBCA算法进行测试,以FScore值为评估标准,与开源聚类工具包CLUTO中的其他聚类算法进行了对比分析,实验结果表明,MBCA算法的性能优于其他短文本聚类算法。在上述工作的基础上,基于Android平台,采用MBCA聚类算法设计和实现了一款简单的微博系统。软件在基于Android平台的各个版本的模拟器以及ME525等真机上运行状况良好,推荐列表合适,证明了软件设计良好,同时也验证了MBCA算法的合理性。
|
全文目录
摘要 5-6 Abstract 6-10 插图索引 10-11 附表索引 11-12 第1章 绪论 12-18 1.1 本文研究背景 12-14 1.2 国内外研究现状 14-16 1.3 研究的主要内容 16-17 1.4 本文结构 17-18 第2章 ANDROID 平台及微博简单分析 18-28 2.1 Android 平台 18-23 2.1.1 Android 基本概念 18 2.1.2 Android 系统架构 18-22 2.1.3 Android 平台的特点 22-23 2.2 微博 23-27 2.2.1 典型的微博 23-24 2.2.2 微博的传播特性 24-26 2.2.3 微博客核心——个性化推荐 26-27 2.3 本章小结 27-28 第3章 聚类分析在微博系统中的应用 28-44 3.1 聚类分析预处理 28-32 3.1.1 文本分词 28-30 3.1.2 文本特征提取 30-32 3.2 常用的聚类方法 32-34 3.2.1 K-Means 算法 32-33 3.2.2 DBSCAN 算法 33-34 3.2.3 AGNES 算法 34 3.3 微博聚类算法 34-38 3.3.1 微博相似度 34-36 3.3.2 聚类标准 36 3.3.3 聚类核心发现 36-37 3.3.4 微博聚类算法 MBCA 37-38 3.4 算法验证 38-42 3.4.1 算法评估标准 38-39 3.4.2 算法测试数据集 39 3.4.3 算法性能对比 39-42 3.5 本章小结 42-44 第4章 基于 ANDROID 平台的微博系统设计与实现 44-56 4.1 系统分析 44-47 4.1.1 系统需求分析 44 4.1.2 业务流程分析 44-45 4.1.3 功能分析 45-47 4.2 系统设计 47-51 4.2.1 数据库设计 47-50 4.2.2 功能模块设计 50-51 4.3 系统实现 51-55 4.4 本章小结 55-56 结论 56-58 参考文献 58-62 致谢 62
|
相似论文
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 大学生综合素质测评研究,G645.5
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 土壤环境功能区划研究,X321
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于多因素模糊聚类的底板突水危险性预测研究,TD745
- 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 青海杜鹃属植物种质资源现状及园林应用,S685.21
- 基于DEA模型的我国R&D投入产出效率评估研究,G322
- “超值天下”系统中订票记录的聚类分析,F274;F224
- 基于粒度下的蛋白质序列的分析,Q51
- 重庆市生物多样性保护投入产出效率评价研究,X321
- 基于感性工学的激光打标机创新设设设究,TG96
- 高血压前期证候特征研究,R259
- 城市公共汽车行驶工况构建与研究,U469.72
- 基于聚类分析方法的交通事故黑点的鉴别,U491.31
- 基于Web数据挖掘的网页优化设计应用研究,TP393.092
- 基于聚类算法的银行卡客户分类分析系统的设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com
|