学位论文 > 优秀研究生学位论文题录展示

位置相关Web搜索的检索技术研究

作 者: 周英华
导 师: 龚育昌
学 校: 中国科学技术大学
专 业: 计算机应用技术
关键词: 位置相关Web搜索 网页的地理范围 混合索引结构 图像匹配算法 局部描述子
分类号: TP391.3
类 型: 博士论文
年 份: 2006年
下 载: 526次
引 用: 2次
阅 读: 论文下载
 

内容摘要


随着Web信息的爆炸性增长,如何从Web上及时有效地查找到真正所需要的信息,已经成为研究者面临的难题。Web信息检索在这种背景下应运而生并得到迅速发展。越来越多的应用要求返回给用户的检索结果不仅是内容相关的,还必须是与用户当前或提供的地理位置相关的。位置相关的Web搜索能提高搜索结果的准确性,在很多方面具有广泛的应用。 根据查询的用户接口和不同的应用需求,位置相关的Web搜索包括两类典型应用:基于文本的和基于图像的。基于文本的搜索主要是“找出某一位置内或附近的对象”。查询中包括确定的位置信息,该位置信息可以用简单的方式进行描述,如利用文字或者地理坐标等。基于图像的搜索主要是判断“在哪里”,即判断用户感兴趣的对象所在的位置,当用户不能用简单的文字描述该位置或者不知道如何描述的时候,用移动设备拍摄图像并发送搜索请求,服务器通过在图像数据库中进行图像匹配,返回给用户相关的网页或者信息。 本文针对以上两类位置相关的Web搜索进行了研究,分析了在检索过程中各自面临的难点问题,提出了相应的解决策略,以及相关的索引结构和图像匹配算法,给出了系统级解决方案,并构造了系统原型,验证了所提出的策略和相关技术的有效性。 本文的主要研究内容及其创新点如下: 1.提出了一种新的混合索引结构,解决了已有基于文本的位置相关Web搜索的索引所面临的问题。已有的方式是将用户输入的地理词看作普通的文本关键字,利用关键词匹配的方式检索出包含这个词的网页。这种方法的缺陷是:忽略了涉及到某个地方但是没有包含其地名的网页,忽略了同名或者别名的现象,以及忽略了基本的空间关系和地理相关性。所提出的混合索引结构克服了上述缺陷,并提高了检索的效率。理论上的代价

全文目录


摘要  3-5
Abstract  5-8
目录  8-12
第一章 绪论  12-20
  1.1 研究背景  12-17
    1.1.1 Web信息检索  12-13
    1.1.2 基于位置的服务  13-14
    1.1.3 位置相关的Web搜索  14-15
    1.1.4 位置相关的Web搜索的典型应用  15-17
  1.2 本论文的工作  17-19
    1.2.1 研究工作  17-19
      1.2.1.1 基于文本的位置相关Web搜索的检索技术  17-18
      1.2.1.2 基于图像的位置相关Web搜索的检索技术  18-19
  1.2.2 论文组织  19-20
第二章 Web信息检索技术  20-34
  2.1 引言  20-21
  2.2 Web信息的查询与检索  21-29
    2.2.1 数据及其文档形式  21-23
    2.2.2 多媒体数据内容的描述模型  23-24
    2.2.3 查询与用户接口  24-26
    2.2.4 文本索引和搜索  26-27
    2.2.5 基于内容的多媒体信息检索  27-29
  2.3 Web搜索引擎的扩展  29-30
  2.4 Web地理信息检索  30-32
    2.4.1 地理辞典生成  31
    2.4.2 地理信息抽取  31-32
    2.4.3 索引结构  32
    2.4.4 检索结果排序  32
    2.4.5 用户界面  32
  2.5 小结  32-34
第三章 基于文本的位置相关Web搜索  34-67
  3.1 引言  34-35
  3.2 已有工作  35-38
    3.2.1 Google  36
    3.2.2 Yahoo-Overture  36-37
    3.2.3 GeoSearch  37-38
    3.2.4 Geotags.com  38
    3.2.5 Northern Light  38
    3.2.6 Spirit Project  38
  3.3 基于文本的位置相关Web检索中的关键问题  38-41
    3.3.1 网页地理范围的定义和抽取  38-40
    3.3.2 索引和查询  40
    3.3.3 排序算法  40-41
  3.4 位置相关查询的定义  41-48
    3.4.1 查询类型  41-42
    3.4.2 查询结构  42-43
    3.4.3 一种基于对象关系的查询代数的定义  43-48
      3.4.3.1 stor-algebra的数据结构  43-45
      3.4.3.2 stor-algebra的代数操作  45-48
  3.5 一种基于文本的位置相关Web搜索引擎TLEngine的原型实现  48-65
    3.5.1 系统框架  48-50
    3.5.2 地理辞典  50
    3.5.3 网页地理范围的分类和抽取  50-56
      3.5.3.1 网页地理范围的类别定义  50-52
      3.5.3.2 网页地理范围的抽取  52-56
    3.5.4 排序  56-61
      3.5.4.1 位置相关性  57-58
      3.5.4.2 文本相关性  58-61
      3.5.4.3 位置相关性和文本相关性的组合模式  61
    3.5.5 查询界面  61-62
    3.5.6 索引结构  62-63
    3.5.7 数据集和测试结果  63-65
  3.6 小结  65-67
第四章 TLEngine中的一种混合索引结构  67-85
  4.1 引言  67
  4.2 相关工作  67-72
    4.2.1 文本索引技术  67-70
      4.1.1.1 签名文件  69
      4.1.1.2 后缀树或后缀数组  69
      4.1.1.3 倒排表  69-70
    4.1.2 空间索引技术  70-72
      4.1.2.1 R树和R~*树  71-72
    4.1.3 索引混合模式  72
  4.3 地理范围的表示  72-73
  4.4 一种新的混合索引结构  73-80
    4.4.1 倒排表和R~*-tree相互独立的索引  74-76
    4.4.2 倒排表—R~*-tree索引结构  76-78
    4.4.3 R~*-tree—倒排表索引结构  78-79
    4.4.4 三种混合结构的分析比较  79-80
  4.5 实验  80-84
    4.5.1 实验设置和数据集  80-81
    4.5.2 实验结果  81-83
    4.5.3 基于R~*-tree和Grid结构的混合索引的比较  83-84
  4.6 小结  84-85
第五章 基于图像的位置相关Web搜索  85-103
  5.1 引言  85-86
  5.2 已有工作  86-87
  5.3 基于图像的位置相关Web搜索的关键问题  87-94
    5.3.1 特征提取  89-90
    5.3.2 图像匹配算法  90-91
    5.3.3 近邻查询  91-92
    5.3.4 高维索引  92-94
  5.4 本文的解决方案  94-101
    5.4.1 系统解决方案  95-97
    5.4.2 特征抽取  97-98
    5.4.3 索引  98
    5.4.4 数据集和原型实现  98-101
  5.5 小结  101-103
第六章 基于visual parts的图像匹配算法  103-115
  6.1 引言  103-104
  6.2 相关工作背景  104-106
    6.2.1 Scale-invariant Feature Transform(SIFT)  104-105
    6.2.2 Visual Parts  105
    6.2.3 高维索引和相似查询  105-106
  6.3 一种基于Visual parts的图像匹配算法  106-110
    6.3.1 Visual parts的抽取  106-108
    6.3.2 Visual parts的匹配  108-110
  6.4 实验  110-113
    6.4.1 数据集和设置  110
    6.4.2 查询时间分析  110-111
    6.4.3 准确率和查全率的分析  111-113
  6.5 小结  113-115
第七章 结束语  115-119
  7.1 论文工作总结  115-117
  7.2 特色和贡献  117
  7.3 进一步工作  117-119
参考文献  119-131
攻读博士学位期间发表的学术论文  131-132
攻读博士学位期间申请的专利  132-133
攻读博士学位期间参加的科研项目  133-134
致谢  134

相似论文

  1. 基于X光图像的轮胎内部缺陷检测技术研究,TP274.51
  2. Web网页的时态文本索引研究,TP393.092
  3. 遥感图像匹配方法研究,TP751
  4. 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
  5. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  6. 基于FPGA的高速图像预处理技术的研究,TP391.41
  7. 2D人脸模板保护算法研究,TP391.41
  8. 导弹虚拟试验可视化技术研究,TP391.9
  9. 基于用户兴趣特征的图像检索研究与实现,TP391.41
  10. 图像拼接技术研究,TP391.41
  11. 高效精确字符串匹配算法的研究与实现,TP391.41
  12. 基于词义及语义分析的问答技术研究,TP391.1
  13. 基于三维重建的焊点质量分类方法研究,TP391.41
  14. 舌体特征的提取及融合分类方法研究,TP391.41
  15. 统计机器翻译中结构转换技术的研究,TP391.2
  16. 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
  17. 基于句法特征的代词消解方法研究,TP391.1
  18. 空中目标与背景的红外图像仿真技术研究,TP391.41
  19. 基于EPC C1G2协议的超高频RFID系统设计及仿真,TP391.44
  20. 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
  21. 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com