价值中国 - 财经商业新媒体
读书
正在读取登录信息...
图书详细信息 推荐图书 | 最新书评
搜索引擎零距离——基于Ruby+Java搜索引擎原理与实现

作者:王亮 编著

出版社:清华大学出版社

出版日期:2009年06月
个人简介
王亮,主持或参与过多个大中型索引擎开发与运营,具有丰富的搜索引擎算法理论知识与实际开发运营经验。曾任职于爱立信、Smarter.com、上海网村、上海迈众,2009年创立上海睿驿信息技术有限公司并任CEO,致力于提供搜索引擎相关的产品和服务。
内容简介
随着网络信息资源的急剧增长,人们越来越多地关注如何快速有效地从海量的网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。搜索引擎技术解决了用户检索网络信息的困难,目前搜索引擎技术正成为计算机科学界和信息产业界争相研究、开发的对象。
本书的作者是一位资深的搜索引擎开发人员,书中对数据获取(网络信息挖掘)与数据检索(搜索引擎)两个方面作了深入的介绍。本书首先提出了一套“网络数据挖掘”的完整理论,并给出一个实际的智能爬虫系统,通过理论与实际的完整呈现,使读者能够对“网络数据挖掘”有一个比较具体的认识,然后介绍了一个专用程序语言IRS,并给出了这个语言的编译器以及虚拟机的实现方法。本书还通过对多个开源搜索引擎项目抽丝剥茧的细致分析,引出搜索引擎的一些基本原理与开发方法,并介绍了一个商业化搜索引擎的实例。本书的最后还结合一个Java框架介绍了一些软件设计思想。
本书涉及网络数据挖掘、搜索引擎原理、编译原理、数据库原理、正则表达式、软件工程、设计模式、Ruby语言、HTTP协议等计算机科学与技术的知识,适合搜索引擎开发人员作为参考,也适合有一定计算机基础的读者阅读,以扩展视野。
本书的内容中,既有教科书式的理论阐述,也有“七天入门”式的实例解析,还有《Linux内核情景分析》风格的细致的代码分析,甚至还有一些英语文献翻译,从初学者到有一定经验的搜索引擎开发人员,各个层次的读者都能找到一些适合自己阅读的章节。
发表书评
本书标签
为此书添加标签:(多个标签用空格分隔)
图书购买信息
请对此书作出评价
请您登录后为此书评分



目前还没有人对此书评分
新书快递
广东联合出版公司 | 机械工业出版社 | 南京大学出版社 | 清华大学出版社 | 时代光华 | 人民邮电出版社 | 文汇出版社 | 中国经济出版社 | 中国青年出版社 | 中信出版社
浙江大学出版社 | 作家出版社 | 湛庐文化 | 长江文艺出版社 | 华章经管 | 经济日报出版社 | 中国城市出版社 | 财政出版社 | 中华工商联合出版社 | 新星出版社
重庆出版集团 | 人民文学出版社 | 中资海派 | 电子工业出版社世纪波公司 | 中国电力出版社 | 道中财富 | 含章行文 | 同舟人文化 | 华章同人