这是·木研究如何实现具有Webj间能力的씨络机器人的书。该书从 Internet编稈的基木原理出发,深人浅出、循序渐进地阐述了络机器人程 Jr Spider,、Bot、 Aggreg alori的現术,并分析了每种程序的仇点及通用场合。本书提供了大氧的有效源代码,并対这些代码进行了详细的分析。通过木书的介绍,你可以很力便地利这些技术,设计并实现网络妯蛛或圆络信息搜嗦器等机器人程序。
译者序
目前. Intemet经成为人们工作、生活和娱乐的·部分,它就像浩瀚的知识海洋、任T由人fI由地遨游。当你在上时,你足否知道还有一类特殊的씨络用户也在 Intemet状默地工作着,它们就是网络机器人。这些机器人按照设计者预定的方式,在.씨络中容校,同时收集关心的信息。热『门的投素引擎站点就是很好的实例,很多搜索引的后台工作方式就是使用若「个씨络机器人宇动收集各站点信息,然后进行分类和整理,将整理结粜提供给用,以方便用戸户査找他们感兴趣的内容、由于网络机器人的实用性,引起了很多程序员特別是Web程序员的兴趣。
为此,我们翻译了这木介绍如何实現具有Web访回能力的络机器人的书,日的是希帮助读者了解网络机器人,并能利用本书介绍的技术,设计和实現円己的网络机器人。本书深人浅出、循序渐进地述了씨络机器人程序的实现技术。它从 Internets绵程的基本原理H发,首先介绍了Java套接字编程技术,然后详细地分析了网络机器人如何解析HTTP协议和HTML语言,以及从中提取有用倍息的过程,并通过实际例程,深入剖析了访间web씨站的网络机器人程序 Spider(网络蜘妹程序)、Bot(씨络机器人程序)和 Aggregator(씨络信息搜柴器)的实现,最后本书提醒程序员要负责仁地使用网络机器人程序,同时向读者描述了씨络机器人程序未来的发展趋势。本书提供了大量的有效源代码,并对这些代码进行了详尽的分析。另外,本书的选配光盘中还提供了书中所有源程序和完整的Bot程序包。利用这些技术和资源,读者可以方便地设计并实现网络蜘蛛或网络信息搜索器等机器人程序本书由童光丰、李纯、刘润於和张文阳人合译。时,本书的翻译出版τ作还待到许多人上的大力支持,在此表示感谢。
最近;,希望读者阅读本书后能有所收溢。由于T技术发展的日新刀异,新的技术术语层H不穷,民译考水平有限以及时间仓促,因此,本书许多译名仅供读者参考。译者円知を业水平及驾驭中英文的能力有限,译文中定有欠妥或错误之处,恳请读者给以指正