学位论文 > 优秀研究生学位论文题录展示
位置相关Web搜索的检索技术研究
作 者: 周英华
导 师: 龚育昌
学 校: 中国科学技术大学
专 业: 计算机应用技术
关键词: 位置相关Web搜索 网页的地理范围 混合索引结构 图像匹配算法 局部描述子
分类号: TP391.3
类 型: 博士论文
年 份: 2006年
下 载: 526次
引 用: 2次
阅 读: 论文下载
内容摘要
随着Web信息的爆炸性增长,如何从Web上及时有效地查找到真正所需要的信息,已经成为研究者面临的难题。Web信息检索在这种背景下应运而生并得到迅速发展。越来越多的应用要求返回给用户的检索结果不仅是内容相关的,还必须是与用户当前或提供的地理位置相关的。位置相关的Web搜索能提高搜索结果的准确性,在很多方面具有广泛的应用。 根据查询的用户接口和不同的应用需求,位置相关的Web搜索包括两类典型应用:基于文本的和基于图像的。基于文本的搜索主要是“找出某一位置内或附近的对象”。查询中包括确定的位置信息,该位置信息可以用简单的方式进行描述,如利用文字或者地理坐标等。基于图像的搜索主要是判断“在哪里”,即判断用户感兴趣的对象所在的位置,当用户不能用简单的文字描述该位置或者不知道如何描述的时候,用移动设备拍摄图像并发送搜索请求,服务器通过在图像数据库中进行图像匹配,返回给用户相关的网页或者信息。 本文针对以上两类位置相关的Web搜索进行了研究,分析了在检索过程中各自面临的难点问题,提出了相应的解决策略,以及相关的索引结构和图像匹配算法,给出了系统级解决方案,并构造了系统原型,验证了所提出的策略和相关技术的有效性。 本文的主要研究内容及其创新点如下: 1.提出了一种新的混合索引结构,解决了已有基于文本的位置相关Web搜索的索引所面临的问题。已有的方式是将用户输入的地理词看作普通的文本关键字,利用关键词匹配的方式检索出包含这个词的网页。这种方法的缺陷是:忽略了涉及到某个地方但是没有包含其地名的网页,忽略了同名或者别名的现象,以及忽略了基本的空间关系和地理相关性。所提出的混合索引结构克服了上述缺陷,并提高了检索的效率。理论上的代价
|
全文目录
摘要 3-5 Abstract 5-8 目录 8-12 第一章 绪论 12-20 1.1 研究背景 12-17 1.1.1 Web信息检索 12-13 1.1.2 基于位置的服务 13-14 1.1.3 位置相关的Web搜索 14-15 1.1.4 位置相关的Web搜索的典型应用 15-17 1.2 本论文的工作 17-19 1.2.1 研究工作 17-19 1.2.1.1 基于文本的位置相关Web搜索的检索技术 17-18 1.2.1.2 基于图像的位置相关Web搜索的检索技术 18-19 1.2.2 论文组织 19-20 第二章 Web信息检索技术 20-34 2.1 引言 20-21 2.2 Web信息的查询与检索 21-29 2.2.1 数据及其文档形式 21-23 2.2.2 多媒体数据内容的描述模型 23-24 2.2.3 查询与用户接口 24-26 2.2.4 文本索引和搜索 26-27 2.2.5 基于内容的多媒体信息检索 27-29 2.3 Web搜索引擎的扩展 29-30 2.4 Web地理信息检索 30-32 2.4.1 地理辞典生成 31 2.4.2 地理信息抽取 31-32 2.4.3 索引结构 32 2.4.4 检索结果排序 32 2.4.5 用户界面 32 2.5 小结 32-34 第三章 基于文本的位置相关Web搜索 34-67 3.1 引言 34-35 3.2 已有工作 35-38 3.2.1 Google 36 3.2.2 Yahoo-Overture 36-37 3.2.3 GeoSearch 37-38 3.2.4 Geotags.com 38 3.2.5 Northern Light 38 3.2.6 Spirit Project 38 3.3 基于文本的位置相关Web检索中的关键问题 38-41 3.3.1 网页地理范围的定义和抽取 38-40 3.3.2 索引和查询 40 3.3.3 排序算法 40-41 3.4 位置相关查询的定义 41-48 3.4.1 查询类型 41-42 3.4.2 查询结构 42-43 3.4.3 一种基于对象关系的查询代数的定义 43-48 3.4.3.1 stor-algebra的数据结构 43-45 3.4.3.2 stor-algebra的代数操作 45-48 3.5 一种基于文本的位置相关Web搜索引擎TLEngine的原型实现 48-65 3.5.1 系统框架 48-50 3.5.2 地理辞典 50 3.5.3 网页地理范围的分类和抽取 50-56 3.5.3.1 网页地理范围的类别定义 50-52 3.5.3.2 网页地理范围的抽取 52-56 3.5.4 排序 56-61 3.5.4.1 位置相关性 57-58 3.5.4.2 文本相关性 58-61 3.5.4.3 位置相关性和文本相关性的组合模式 61 3.5.5 查询界面 61-62 3.5.6 索引结构 62-63 3.5.7 数据集和测试结果 63-65 3.6 小结 65-67 第四章 TLEngine中的一种混合索引结构 67-85 4.1 引言 67 4.2 相关工作 67-72 4.2.1 文本索引技术 67-70 4.1.1.1 签名文件 69 4.1.1.2 后缀树或后缀数组 69 4.1.1.3 倒排表 69-70 4.1.2 空间索引技术 70-72 4.1.2.1 R树和R~*树 71-72 4.1.3 索引混合模式 72 4.3 地理范围的表示 72-73 4.4 一种新的混合索引结构 73-80 4.4.1 倒排表和R~*-tree相互独立的索引 74-76 4.4.2 倒排表—R~*-tree索引结构 76-78 4.4.3 R~*-tree—倒排表索引结构 78-79 4.4.4 三种混合结构的分析比较 79-80 4.5 实验 80-84 4.5.1 实验设置和数据集 80-81 4.5.2 实验结果 81-83 4.5.3 基于R~*-tree和Grid结构的混合索引的比较 83-84 4.6 小结 84-85 第五章 基于图像的位置相关Web搜索 85-103 5.1 引言 85-86 5.2 已有工作 86-87 5.3 基于图像的位置相关Web搜索的关键问题 87-94 5.3.1 特征提取 89-90 5.3.2 图像匹配算法 90-91 5.3.3 近邻查询 91-92 5.3.4 高维索引 92-94 5.4 本文的解决方案 94-101 5.4.1 系统解决方案 95-97 5.4.2 特征抽取 97-98 5.4.3 索引 98 5.4.4 数据集和原型实现 98-101 5.5 小结 101-103 第六章 基于visual parts的图像匹配算法 103-115 6.1 引言 103-104 6.2 相关工作背景 104-106 6.2.1 Scale-invariant Feature Transform(SIFT) 104-105 6.2.2 Visual Parts 105 6.2.3 高维索引和相似查询 105-106 6.3 一种基于Visual parts的图像匹配算法 106-110 6.3.1 Visual parts的抽取 106-108 6.3.2 Visual parts的匹配 108-110 6.4 实验 110-113 6.4.1 数据集和设置 110 6.4.2 查询时间分析 110-111 6.4.3 准确率和查全率的分析 111-113 6.5 小结 113-115 第七章 结束语 115-119 7.1 论文工作总结 115-117 7.2 特色和贡献 117 7.3 进一步工作 117-119 参考文献 119-131 攻读博士学位期间发表的学术论文 131-132 攻读博士学位期间申请的专利 132-133 攻读博士学位期间参加的科研项目 133-134 致谢 134
|
相似论文
- 基于X光图像的轮胎内部缺陷检测技术研究,TP274.51
- Web网页的时态文本索引研究,TP393.092
- 遥感图像匹配方法研究,TP751
- 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
- 用于检索的人脸特征提取与匹配算法研究,TP391.41
- 基于FPGA的高速图像预处理技术的研究,TP391.41
- 2D人脸模板保护算法研究,TP391.41
- 导弹虚拟试验可视化技术研究,TP391.9
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- 图像拼接技术研究,TP391.41
- 高效精确字符串匹配算法的研究与实现,TP391.41
- 基于词义及语义分析的问答技术研究,TP391.1
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 舌体特征的提取及融合分类方法研究,TP391.41
- 统计机器翻译中结构转换技术的研究,TP391.2
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
- 基于句法特征的代词消解方法研究,TP391.1
- 空中目标与背景的红外图像仿真技术研究,TP391.41
- 基于EPC C1G2协议的超高频RFID系统设计及仿真,TP391.44
- 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
- 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|