搜索引擎的分类是什么啊?
1全文搜索引擎是目前广泛应用的主流搜索引擎,国内则有著名的百度。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
2目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。
3元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
4垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。
5集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。
6门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。
7免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。
所谓搜索引擎,就是Internet网上用来查找文件、档案的一个智能化的机器人。我们现在所说的搜索引擎都是基于WWW的,也就是基于网页的检索。现在,根据这种智能化机器人的工作方式,很多人又把它称作爬行蜘蛛,或机械手。
但是,这些其实并不是互联网上最早的信息检索服务器。在整个Internet有一些称为文件、档案服务器的计算机,这种服务器是Internet上,用来查找其标题,满足特定条件的所有文档的自动搜索服务的工具。
为了从匿名FTP服务器上下载一个文件,必须知道这个文件的所在地,即必须知道这个匿名FTP服务器的地址,及文件所在的目录名。所以,这种信息检索服务器,就是帮助用户在遍及全世界的无数个FTP服务器中,寻找文件的工具。它另外还被称作文档查询服务器。用户只要给出所要查找文件的全名或部分名字,文档查询服务器就会帮用户查出,在哪些FTP服务器上存放着这样的文件。
使用信息检索服务器,进行查询要查找的文件名或部分文件名,必须知道某个或几个信息检索服务器的地址。才能帮助你找到你需要的文件,或目录的匿名FTP主机的名字。也就是说,当你想要检索一个你需要了解的文件或目录时,你要做的事情是告诉信息检索服务器。你要检索什么,信息检索服务器将按照你提供的要求进行检索,然后显示每一个包含有那份文件或目录的匿名FTP主机的名字。信息检索服务器最后会把检索者检索的文件详细的告诉你目录路径。这样,你就可以轻易地从相应的FTP主机中,取得你所需要的FTP文件。
信息检索服务器经历了长达20年左右的发展,逐步改进,完善。名称也逐步被统称为爬行蜘蛛,机械手,搜索引擎。
搜索引擎的分类
从搜索引擎的工作原理上来区分,搜索引擎有三种基本类型;
第一类是纯技术型的全文检索搜索引擎,如google yahoo等,其原理是通过机器手(即Spider程序)到各个网站收集,存储信息,并建立索引数据库供用户查询。
第二类称为分类目录搜索引擎,这种搜索引擎并不采集网站的任何信息,而是利用各网站向搜索引擎提交网站信息时,填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。
第三类称为元搜索引擎 ,元搜索引擎(MetaSearch)的特点是在接受用户查询请求时,同时在其他多个引擎上进行搜索,把多个独立搜索引擎的搜索结果整合、控制、优化,再把搜索结果输出到客户端。元搜索引擎不需要庞大的网页数据库,而能够搜索到更加丰富、准确的内容。利用其它独立搜索引擎整合、控制、优化搜索结果的技术称为“元搜索技术(Meta-Searching Technique)”,是元搜索引擎的核心技术。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,有的则按自定的规则将结果重新排列组合。
参考 百度,谷歌,雅虎,搜搜,搜狗,有道,必应
Web通过超文本的方式,把Internet上不同计算机中的信息有机的结合在一起,并通过超文本传输协议(HTTP)从一台Web服务器转到另一台Web服务器上检索信息或链接其他Internet资源,用户只要单击这些超文本或超媒体,就能立即跳到与之相关的内容。由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。∮∵慲怑鎃☆ 的感言: 谢谢咯!
while(true){
ServerSocket ss = new ServerSocket(10001);
Socket s = ssaccept();//accept()处于阻塞 一直等待数据到来
InputStream in = sgetInputStream();
byte[] buf = new byte[1024];
int len = inread(buf);
Systemoutprintln(new String(buf,0,len));
sclose();
}
0条评论