内容简介
本书作为有心进入搜索引擎业的读者的第二本基础书籍,承接其兄弟篇,讲解了开源搜索引擎的搭建过程中所要解决的基本问题,将搜索引擎这一高起点的技术讲解得清晰透彻,使其变得极为好学,没有任何神秘可言。本书共包括5章,可以分成两个部分。
第一部分(第1章):建立搜索引擎的方案。这部分用数少的文字总结建立搜索引擎的主要方案,即:常规的数据库搜索、文件搜索,基于数据库全文索引机制的搜索,利用外部非开源web搜索服务进行的搜索,以及利用开源搜索引擎实现的搜索。
第二部分(第2--5章):架设网络搜索引擎。从第2章起,陆续介绍数据抓取、数据解析、建立索引和执行搜索这四项内容,它们是创建网络搜索平台所要解决的基本问题;第5章,介绍基于Hyper EStraier搜索引擎框架来搭建桌面搜索引擎和Web搜索引擎的方法,给出了相关的案例。