关于建筑智能化设计标准标准

关于建筑智能化设计标准标准,第1张

智能建筑设计标准

编号为GB/T50314--2000

关于发布国家标准《智能建筑设计标准》的通知

建标[2000]161号

根据建设部《一九九八年工程建设标准定额制订修订计划》(建标[1998]244号)的要求,由建设部会同有关部门共同制定的《智能建树设计标准》,经有关部门会审,批准为推荐性国家标准,编号为GB/T50314--2000,至2000年10月1日起施行。

本标准由建设部负责管理,上海现代建筑设计(集团)有限公司负责具体解释工作,建设部标准定额研究所组织中国计划出版社出版发行。

中华人民共和国建设部

二○○○年七月三日

中国建筑标准设计研究所

中国建筑东北设计研究院

新疆建筑设计研究院

邮电部北京设计院

江苏省土木建筑学会

公安部科技局

主要起草人员:温伯银 沈育祥 徐钟芳 瞿二澜 赵济安 成红文 邵民杰 陈众励 洪元颐 章纽惠 徐兴声

刘希清 濮容生 陈崇光 吴艳芳 黄与群 薛颂石 郭锡坤 张文才 潘云刚 李雪佩 孙 兰 李天恩 郭晓岩

朱甫泉 冯 斋 张 宜 陆伟良

1总则

101 为了规范智能建筑工程设计,提高智能建筑的设计质量,制定本标准。

102 本标准适用于智能办公楼、综合楼、住宅楼的新建扩建、改建工程,其他工程项目也可参照使用。

103 智能建筑中各智能化系统应根据使用功能、管理要求和建设投资等划分为甲、乙、丙三级(住宅除外),且各级均有扩性、开放性和灵活性。智能建筑的等级按有关评定标准确定。

104 智能建筑设计,必须遵循国家有关方针,做到技术先进,经济合理,实用可靠。

105 智能建筑工程设计,除应执行本标准外,尚应符合国家现行有关标准的规定。

2 术语和符号

201 智能建筑(IB)Intelligent Building

它是以建筑为平台,兼备建筑设备、办公自动化及通信网络系统,集结构、系统、服务、管理及它们之间的最优化组合,向人们提供一个安全、高效、舒适、便利的建筑环境。

202 建筑设备自动化系统(BAS)building Automation Sys-tem

建筑物或建筑群的电力、照明、给排水、防火、保安、车库管理等设备或系统,以集中监视、控制和管理为目的,构成综合系统。

203 通信网络系统(CNS)Communication Network System

它是楼内的语音、数据、图像传输的基础,同时与外部通信网络(如公用电话网、综合业务数字网、计算机互联网、数据通信网及卫星通信网等)相联,确保信息畅通。

204 办公自动化系统(OAS)Office Automation System

办公自动化系统是应用计算机技术、通信技术、多媒体技术和行为科学等先进技术,是人们的部分办公业务借助于各种办公设备,并有这些办公设备与办公人员构成服务于某中办公目标的人机信息系统。

205 综合布线系统(GCS)Generic Cabling System

综合布线系统是建筑物或建筑群内部之间的传输网络。它能使建筑物或建筑群内部的语音、数据通信设备、信息交换设备、建筑物物业管理及建筑物自动化管理设备等系统之间彼此相联,也能使建筑物内通信网络设备与外部的通信网络相联。

206 系统集成(SI)Systems Integration

它是将智能建筑内不同功能的智能化子系统在物理上、逻辑上和功能上连接在一起,以实现信息综合、资源共享。

3 通信网络系统

31 一般规定

311 通信网络系统应能为建筑物或建筑群的拥有者(管理者)及建筑物内的各个使用者提供有效的信息服务。

312 通信网络系统应能对来自建筑物或建筑群内外的各种信息予以接收、存贮、处理、交换、传输并提供决策支持的能力

313 通信网络系统提供的各类业务及其业务接口,应能通过建筑物内布线系统引至各个用户终端。

32 设计要素

321 应将公用通信网上光缆、铜缆线路系统或光缆数字传输系统引入建筑物内,并可根据建筑物内使用者的需求,将光缆延伸至用户的工作区。

322 应设置数字化、宽带化、综合化、智能化的用户接入网设备。

323 建筑物内宜在底层和的地下一层(当建筑物有地下多层时)设置通信设备间。

324 应根据建筑物自身的类型和用户接入公用通信网的条件,适度超前的配置相应的通信系统,其接口应符合通信行业的有关规定。

325 建筑物内或建筑群区域内可设置为小蜂窝数字区域无绳电话系统。在系统覆盖的范围内提供双向通信。

326 建筑物的下层及上部其他区域由于屏蔽效应除向移动通信盲区时,在行业主管部门的同意下,设置移动通信中继系统。

327 建筑物相关对应部门应设置或预留VSAT卫星系统天线与室外单元设备安装的空间及通信设备机房的位置。

328 建筑物内应设置有线电视系统(含闭路电视系统)及广播电视系统。电视系统的设计应按电视图像双向传输的方式,并可采用光纤和同轴电缆混合网(HFC)组网。

329 建筑物应根据实际需求或预留会议电视室,可配置双向传输的会议电视系统,并提供与公用或专用会议电视网连接的通信路由。

3210 根据实际需求,建筑物内可设置多功能会议室。可选择配置多语种同声传译扩音系统或桌面会议型扩声系统,并配置带由于计算机互连接口的大屏幕投影电视系统。

3211 建筑物内设置的公共广播系统,应与大楼紧急广播系统相连。

3212 建筑物底层大厅及公共部位应设置多部公用的直线电话和内部电话。

3213 建筑物内应设置综合布线系统,向使用者提供宽带信息传输的物理链路。

3214 建筑物内所设置的通信设备,除能向用户提供模拟话机Z接口外,还应提供传送速率为64Kbit/s、n64Kbit/s、2048Kbit/s以及2048Kbit/s以上的传输信道。

33设计标准

331 甲级标准应符合下列条件:

1 将公用通信网上光缆线路系统或光缆数字传输系统引入建筑物内。并可根据用户的实际需求,将光缆延伸至用户的工作区。

2 光缆宜从两个不同的路由进入建筑物。

3 接入网及其配置的通信系统对于光缆数字传输系统设备容量的要求应满足承载各种信息业务所需的数字电路、专用电路及其传输线路,并以2048Kbit/s端口的通路数确定。设计时应按200个插口的信息插座配置一个2048Kbit/s传输速率的一次群接口。

4 应根据用户的需求和实际情况,选择配置相对应的通信设施。

5 建筑物内电话用户对数的配置应满足实际需求,并预留足够的容量。

6 建筑物中为小蜂窝数字无线电话系统,应在建筑物内设置一定数量的收发基站,确保用户在任何的地点进行双向通信。

7 建筑物的下层及上部其他区域由于屏蔽效应出现移动通信盲区时,应设置移动通信中继收发通信设备,供楼内各层移动通信用户与外界进行通信。

8 VAST卫星通信系统在满足用户业务需求的情况下,可设置多个端站和设备机房,或预留端站天线安装的空间和设备机房位置,供用户接收和传输单向或双向的数据和话音业务。

9 有线电视系统(含闭路电视系统)应向收看用户提供当地多套开路电视和多套自制电视节目,并可与广播电视有线卫星系统联通,向用户提供卫星电视节目,同时预留与当地有线电视网互联的接口。

10 建筑物内有线电视系统应采用电视图像双向传输的方式。

11 建筑物内应设置一间会议电视室,配置双向传输的会议电视系统设备。

12 建筑物内应设置一间或一间以上的多功能会议室和多间商务会议室,相应的选择多语种同声传译扩音系统、桌面型会议扩声系统及带由于计算机接口互连的大屏幕投影电视系统。

13 公共广播系统应设置独立的、多音源的波音柜,向建筑物内公共场所提供音乐节目和公共广播信息,并应和紧急广播系统相连。

14底层大厅等公共部位,应设置多部公用的直线电话和内部电话。

15 应设置综合布线系统。

332 乙级标准应符合下列条件:

1 将公用通信网上光缆、铜缆线路系统或光缆数字传输系统引入建筑物内。并可根据用户的实际需求,将光缆延伸至用户的工作区。

2 光缆、铜缆宜从两个不同的路由进入建筑物。

3 接入网及其配置的通信系统对于光缆数字传输系统设备容量的需求,应满足承载各种信息业务所需的数字电路、专用电路及其传输线路,并以2048Kbit/s端口的通路数确定。设计时应按250个插口的信息插座配置一个2048Kbit/s传输速率的一次群接口。

4 应根据用户的需求和实际情况,选配相对应的通信设施。

5 建筑物内的电话用户线对数的配置应满足实际需求,并预留足够的容量。

6 建筑物地下及上部其他区域由于屏蔽效应出现移动通信盲区时,应设置移动通信中继收发通信设备,供楼内各层移动通信用户与外界进行通信。

7 VAST卫星通信系统在满足用户业务需求的情况下,可设置多个端站和提供设备机房,或预留端站天线安装的空间和设备机房位置,供用户接收和传输单向或双向的数据和话音业务。

8 有线电视系统(含闭路电视系统)应向收看用户提供当的多套开路电视和多套自制电视节目,并可与广播电视卫星系统联通,以向用户提供卫星电视节目,同时预留与当地有线电视网互联的接口。

9 建筑物内有线电视系统宜采用电视图像双向传输方式。

10 建筑物内应设置一间多功能会议室和多间商务会议室,相应的选择配置多语种同声传译扩音系统、桌面型会议扩声系统及带由于电脑接口互连的大屏幕投影电视系统。

11 公共广播系统应设置独立的、多音源的播音柜,向建筑物内公共场所提供音乐节目和公共广播信息,并应和紧急广播系统相连。

12 底层大厅等公共部位,应设置多部公用的直线电话和内线电话。

13 应设置综合布线系统。

333 丙级标准应符合下列条件:

1 将公用通信网上光缆、铜缆线路系统或光缆数字传输系统引入建筑物内。

2 光缆、铜缆可从一个路由进入建筑物。

3 接入网及其配置通信系统对于光缆数字传输系统设备容量的需求,应满足承载各种信息业务所需的数字电路、专用电路及其传输线路,并以204Kbit/s团口的通路数确定。设计时应按300个插口的信息插座配置一个2048Kbit/s传输速率的一次群接口。

4 应根据用户的需求和实际情况,选配相对应的通信设施。

5 建筑物内电话用户线对数的配置应满足实际需求。

6 预留多个VAST卫星通信系统接收天线的基底及安装的空间,供日后发展使用。

7 有线电视系统应向收看用户提供当地多套开路电视节目,同时预留与当地有线电视网互联的接口。

8 建筑物内宜设置多功能会议室,选配会议扩声系统及开由于电脑接口互连的大屏幕投影电视系统。

9 应设置公用广播系统,可兼作紧急广播系统。

10 底层大厅等公共部位,应设置公用的直线电话和内线电话。

11 应设置综合布线系统。

4 办公自动化系统

41一般规定

411 办公自动化系统应能为建筑物的拥有者(管理者)级建筑物内的使用者,创造良好的信息环境并提供快捷有效的办公信息服务。

412 办公自动化系统应能对来自建筑物内外的各类信息,予以收集、处理、存储、检索等综合处理,并提供人们进行办公事务决策和支持的功能。

42 设计要素

421 根据各类建筑物的使用功能需求,建立通用办公自动化系统和专用办公自动化系统。通用办公自动化系统应具有以下功能:建筑物的物业管理营运信息、电子帐务、电子邮件、信息踏步、信息检索、引导、电子会议以及文字处理、文档等的管理。对于专业型办公建筑,其办公自动化系统除具有上述功能外,还应按其特定的业务需求,建立专用办公自动化系统。对于智能建筑办公自动化系统的设计,将以满足通用办公自动化的要求,由能为专用办公自动化系统打下基础作为设计的主要内容。

422 办公自动化系统应建立在计算机网络基础上,实现信息资源共享。同时应具有广域网连接的能力,实现与国际互联网的连接。

423 办公自动化系统,应具有良好的系统安全防范措施。

424 办公自动化系统应实现以下主要功能:

1 物业管理营运信息子系统,应能对建筑物内各类设施的资料管理、运行状况及维护进行管理。

2 办公和服务管理子系统应具有进行文字处理、文档管理、各类公共服务的计费管理、电子帐务、人员管理等功能。

3 信息服务子系统应具有公用信息库,向建筑物内公众提供信息采集、装库、检索、查询、发布、引导等功能。

4 智能卡管理子系统应能识别身份、门钥、信息系统密钥等,并进行各类计费。

425 应设立计算机网络管理系统,对计算机网络进行维护和监控,及时排除网络故障。

426 办公自动化系统的基础设施的信息环境条件应符合本标准第3章的要求。

43 设计标准

431 甲级标准应符合下列条件:

1 办公自动化系统服务器,应能作为公共信息库、网页服务器、电子邮件服务器等的载体。

2 建立传输速率在100Mbit/s以上的计算机主干网络系统,且宜与国际互联网连接。

3 在建立与建筑物外网络连接时,应由功能完善的各种系统安全防护措施。

4 办公自动化系统应具有建筑物的物业管理营运信息子系统、办公管理子系统、服务管理子系统、智能卡管理子系统、共用信息库管理子系统和电子会议、电子公告信息服务等子系统。

432 乙级标准应符合下列条件:

1 办公自动化系统服务器,应能作为公共信息库、网页服务器、电子邮件服务器等的载体。

2 建立传输速率不小于100Mbit/s的计算机主干网络系统,且宜与国际互联网连接。

3 在建立与建筑物外网络连接时,应由对非法入侵有防止功能的各种系统安全防范措施。

4 办公自动化系统应具有建筑物的物业管理营运信息子系统,办公管理子系统和公用信息库管理等子系统。

433 丙级标准应符合下列条件:

1 办公自动化系统服务器,应能作为公共信息库、网页服务器、电子邮件服务器等的载体。

2 建立传输速率为10Mbit/s以上的计算机局域网络系统,具有与广域网连接的能力。

3 应有必要的信息安全防范措施。

4 办公自动化系统应具有建筑物的物业管理营运信息子系统及办公管理子系统。

5 建筑设备监控系统

51 一般规定

511 对建筑物内各类设备的监视、控制、测量,应做到运行安全、可靠、节省能源、节省人力。

512 建筑设备监控系统的网络结构模式应采用集散或分布式控制的方式,由管理层网络与监控层网络组成,实现对设备运行状态的监控和控制。

513 建筑设备监控系统应实时采集,记录设备运行的有关数据,并进行分析处理。

514 建筑设备监控系统应满足管理的需要。

52 设计要素

521 对空调系统设备、通风设备及环境及监测系统等运行工况的监视、控制、测量、记录。

522 对供配电系统、变配电设备、应急(备用)电源设备、直流电源设备、大容量不停电电源设备监视、测量、记录。

523 对动力设备和照明设备进行监视和控制。

524 对给排水系统的给排水设备、饮水设备及污水处理设备等运行工况的监视、控制、测量、记录。

525 对热力系统的热源设备等运行工况的监视、控制、测量、记录。

526 对公共安全防范系统、火灾自动报警与消防联动控制系统运行工况进行必要的监视及联动控制。

527 对电梯及自动扶梯的运行监视。

53 设计标准

531 甲级标准应符合下列条件:

1 压缩式制冷系统应具有下列功能:

1)启停控制和运行状态显示;

2)冷冻水进出口温度、压力测量;

3)冷却水进出口温度、压力测量;

4)过载报警;

5)水流量测量及冷量记录;

6)运行时间和启动次数记录;

7)制冷系统启停控制程序的设定;

8)冷冻水旁通阀压差控制;

9)冷冻水温度再设定;

10)台数控制;

11)制冷系统的控制系统应留有通信接口;

2 吸收式制冷系统应具有下列功能:

1)启停控制与运行状态显示;

2)运行模式、设定值的显示;

3)蒸发器、冷凝器进出口水温测量;

4)制冷剂、溶液蒸发器和冷凝器的温度及压力测量;

5)溶液温度压力、溶液浓度值及结晶温度测量;

6)启动次数、运行时间显示;

7)水流、水温、结晶保护;

8)故障报警;

9)台数控制;

10)制冷系统的控制系统应留有通信接口。

注:仅限于制冷系统控制器能与BA系统以通信方式交换信息是实现。

3 蓄冰制冷系统应具有下列功能:

1)运行模式(主机供冷、融冰供冷与优化控制)参数设置及运行模式的自动转换;

2)蓄冰设置融冰速度控制,主机供冷量调节,主机与蓄冷设备供冷能力的协调控制;

3)蓄冷设备蓄冰量显示,个设备启停控制与顺序启停控制。

4 热力系统应具有下列功能:

1)蒸汽、热水出口压力、温度、流量显示;

2)锅炉气泡水位显示及报警;

3)运行状态显示;

4)顺序启停控制;

5)油压、气压显示;

6)安全保护信号显示;

7)设备故障信号显示;

8)燃料耗量统计记录;

9)锅炉(运行)台数控制;

10)锅炉房可燃物、有害物质浓度监测报警;

11)烟气含氧量检测及燃烧系统自动调节;

12)热交换器能按设定出水温度自动控制进汽和水量;

13)热交换器进汽和水阀与热水循环泵联锁控制;

14)热力系统的控制系统应留有通信接口。

5 冷冻水系统应具有下列功能:

1)水流状态显示;

2)水泵过载报警

3)水泵启停控制及运行控制显示;

6 冷却系统应具有下列功能:

1)水流状态显示;

2)冷却水泵过载报警;

3)冷却水泵启停控制及运行状态显示;

4)冷却塔风机运行状态显示;

5)进出口水温测量及控制;

6)水温再设定;

7)冷却塔风机启停控制;

8)冷却塔风机过载报警;

7 空气处理系统应具有下列功能:

1)风机状态显示;

2)送回风温度测量;

3)室内温、湿度测量;

4)过滤器状态显示及报警;

5)风道风压测量;

6)启停控制;

7)过载报警;

8)冷热水流量调节;

9)加湿控制;

10)风门控制;

11)风机转速控制;

12)风机、风门、调节阀之间的联锁控制;

13)室内CO2浓度监测;

14)寒冷地区换热器防冻控制;

15)送回风机与消防系统的联动控制。

8 变风量(VAV)系统应具有下列功能:

1)系统总风量调节;

2)最小风量控制;

3)最小新风量控制;

4)再加热控制;

5)变风量(VAV)系统的控制装置应有通信接口。

9 排风系统应具有下列功能:

1)风机状态显示;

2)启停控制;

3)过载报警;

10 风机盘管应具有下列控制功能:

1)室内温度测量;

2)冷热水阀开关控制;

3)风机变速与启停控制。

11 整体式空调机应具有下列功能:

1)室内温、湿度测量;

2)启停控制。

12 给水系统应具有下列功能:

1)水泵运行状态显示;

2)水流状态显示;

3)水泵启停控制;

4)水泵过载报警;

5)水箱高低液位显示及报警。

14 供配电设备监视系统应具有下列功能:

1)变配电设备各高低压主开关运行状况监视及故障报警;

2)电源及主供电回路电流值显示;

3)电源电压值显示;

4)功率因数测量;

5)电能计量;

6)变压器超温报警;

7)应急电源供电电流、电压及频率监视;

8)电力系统计算机辅助监控系统应留有通信接口。

15 照明系统应具有下列功能:

1)庭院灯控制;

2)泛光照明控制;

3)门厅、楼梯及走道照明控制;

4)停车场照明控制;

5)航空障碍灯状态显示、故障报警;

6)重要场所可设智能照明控制系统。

16 应对电梯、自动扶梯的运行状态进行监视。

17 应留有与火灾自动报警系统、公共安全防范系统和车库管理系统通信接口。

532 乙级标准应符合下列条件:

1 压缩式制冷系统应具有下列功能:

1)启停控制和运行状态显示;

2)冷冻水进出口温度、压力测量;

3)冷却水进出口温度、压力测量;

4)过载报警;

5)水流量测量;

6)运行时间和启动次数记录;

7)制冷系统启停控制程序的设定;

8)冷冻水旁通阀压差控制;

9)制冷系统的控制系统应留有通信接口。

2 吸收式制冷系统应具有下列功能:

1)启停控制与运行状态显示;

2)运行模式、设定值的显示;

3)蒸发器、冷凝器进出口水温测量;

4)制冷剂或溶液蒸发器和冷凝器的温度和压力测量;

5)溶液温度压力、溶液浓度值及结晶温度测量;

6)启动次数、运行时间显示;

7)水流、水温、结晶保护;

8)故障报警;

9)制冷系统的控制系统应留有通信接口。

注:仅限于制冷系统控制器能与BA系统以通信方式交换信息时显示。

3 蓄冰制冷系统应具有下列功能:

1)运行模式(主机供冷、融冰供冷与优化控制)参数设置及运行模式的自动转换;

2)蓄冰设备融冰速度控制,主机供冷量调节,主机与蓄冷设备供冷能力的协调控制;

3)蓄冰设备蓄冰量显示,各设备启停控制与顺序启停控制。

4 热力系统应具有下列功能:

1)蒸汽、热水出口压力、温度、流量显示;

2)锅炉汽泡水位显示;

3)运行状态显示;

4)顺序启停控制;

5)油压、气压显示;

6)安全保护信号显示;

7)设备故障信号显示;

8)热交换器能按设定出水温度自动控制进汽或水量;

9)热力系统的控制系统应留有通信接口。

5 冷冻水系统应具有下列功能:

1)水泵过载报警;

2)水泵启停控制及运行状态显示;

6冷却系统应具有下列功能:

1)冷却水泵过载报警;

2)冷却水泵启停控制及运行状况显示;

3)冷却塔风机运行状态显示;

4)进出口水温测量及控制;

5)冷却塔风机启停控制;

6)冷却塔风机过载报警。

7 空气处理系统应具有下列功能:

1)风机状态显示;

2)送回风温度测量;

3)室内温、湿度测量;

4)过滤器状态显示;

5)风道风压测量;

6)启停控制;

7)过载报警;

8)冷热水流量调节;

9)加湿控制;

10)风门控制;

11)风机转速控制;

12)风机、风门、调节阀之间的联锁控制;

13)寒冷地区换热器防冻控制;

14)送回风机与消防系统的联动控制。

8 变风量(VAV)系统应具有下列功能:

1)系统总风量调节;

2)最小风量控制;

3)最小新风量控制;

4)再加热控制;

5)变风量(VAV)系统的控制装置应有通信接口。

9 排风系统应具有下列功能:

1)风机状态显示;

2)启停控制;

3)过载报警。

10 给水系统应具有下列功能:

1)水泵运行状态显示;

2)水泵启停控制;

3)水泵过载报警;

4)水箱高低液位显示及报警。

11 供配电设备监视系统应具有下列功能:

1)变配电设备各高低压主开关运行状况监视及故障报警;

2)电源及主供电回路电流值显示;

3)电源电压值显示;

4)功率因数测量;

5)电能计量;

6)变压器超温报警;

7)应急电源供电电流、电压及频率监视;

8)电力系统计算机辅助监控系统应留有通信接口。

12 应留有与火灾自动报警系统、公共安全防范系统和车库管理系统通信接口。

533 丙级标准应符合下列条件:

1 压缩式制冷系统应具有下列功能:

1)启停控制和运行状态显示;

2)冷冻水进出口温度、压力测量;

3)冷却水进出口温度、压力测量;

4)过载报警;

5)水流量测量;

6)运行时间和启动次数记录;

7)制冷系统启停控制程序的设定;

8)冷冻水旁通阀压差控制。

2 吸收式制冷系统应具有下列功能:

1)启停控制与运行状态显示;

2)运行模式、设定值的显示;

3)蒸发器、冷凝器进出口水温测量;

4)启动次数、运行时间显示;

5)故障报警;

3 热力系统应具有下列功能:

1)蒸汽、热水出口压力、温度、流量显示;

2)锅炉汽泡水位显示;

3)运行状态显示;

4)顺序启停控制;

5)油压、气压显示;

6)安全保护信号显示;

7)设备故障信号显示;

8)热交换器能按设定出水温度自动控制进汽或水量。

4 冷冻水系统应具有水泵启停控制及运行状态显示功能。

5 冷却系统应具有下列功能:

1)冷却水泵启停控制及运行状态显示;

2)冷却塔风机运行状态显示;

3)进出口水温测量及控制;

4)冷却塔风机启停控制。

6 空气处理系统应具有下列功能:

1)风机状态显示;

2)送回风温度测量;

3)室内温、湿度测量;

4)过滤器状态显示;

5)启停控制;

6)冷热水流量调节;

7)加湿控制;

8)风门控制;

9)风机、风门、调节阀之间的联锁控制;

10)寒冷地区换热器防冻控制;

11)送回风机与消防系统的联动控制。

7 给水系统应具有下列功能:

1)水泵运行状态显示;

2)水泵启停控制;

3)水箱高低液位显示及报警。

8 供配电设备监视系统应具有下列功能:

1)变配电设备各高低压主开关运行状况监视及故障报警;

2)电源及主供电回路电流值显示;

3)电源电压值显示;

4)功率因数测量;

5)电能计量;

6)应急电源供电电流、电压及频率监视。

1,垂直搜索

垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索、购物搜索等等)。

在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。

2,集合式搜索

集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。

3,门户搜索

门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。

扩展资料:

搜索引擎作用:

搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的 一个有效工具”。高效的站内检索可以让用户快速准确地找到目标信息,从而更有效地促进产品/服务的销售,

而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效的网络营销策略具有重要价值。

⒈从网络营销的环境看,搜索引擎营销的环境发展为网络营销的推动起到举足轻重的作用;

⒉从效果营销看,很多公司之所以可以应用网络营销是利用了搜索引擎营销;

⒊就完整型电子商务概念组成部分来看,网络营销是其中最重要的组成部分,是向终端客户传递信息的重要环节。

 互联网始于1969年(己酉年)的美国,又称因特网,是全球性的网络,是一种公用信息的载体,这种大众传媒比以往的任何一种通讯媒体都要快。接下来我为大家整理了因特网对人类的作用,希望对你有帮助哦!

  l News Newsgroups are specialzied forums in which users with a common interest can exchagne messages Thousands of newsgroups exist on Internet,on technical and nontechnical topics,including computers, science, ecreation, and politics

2E-mail With Internet, people can compose, send, and receive electronic mails Many people get dozens of messages a day and consider it as their primary way of interacting with the outside world, far outdistancing the telephone and snail mail

3 Remote login Using the Telnet,Rlogin, or other programs, the user anywhere on Internet can log into any other machine on which he has an account

4 File transfer Using the FTP program, it is possible to copy files from one machine on Internet to another Vast numbers of articles, databases, and other information are available in this way

 The Network Computer

 The network computer, also known as the Internet toaster,Internet appliance or Internet device,is the low cost,no maintenance desktop device It allows users to effortlessly connect to Internet and network resources From there, they can share any resource and perform all computing tasks that they currently do on their PCs

 The network computer offers simplicity Stripped of the hardware and software that complicate the PC life and only capable of network access and display, the network computer relies on the network for virtually all software, services, processing, data, and resources It eliminates the continuous cycle of desktop hardware and software upgrades, pushing that burden instead on to the network

 Need the latest word processor or spreadsheet Run it off the server, Want to save your work Just send it off to the network, where it will be stored secured, and backed up

 Firewall: a Measure of Network Security

 With the popularity of Internet,it is increasingly difficult to guarantee the network security Sometimes the network was breached because of not only hackers' visit but also authorized users' care out of ordinary Firewall just is an effective measure of network security It will ensure that all communications conform to your Security policy

 Once two lads broke into the university network,created a bulletin board,loaded popular commercial software on it and invited users across Internet to download the packages Thanks to a firewall, network administrators found the system breached They checked the audit and found the students' IP addresses, names and location The police arrested the two hackers

 Electronic Bulletin Boards

 Another interesting application for Internet is the electronic bulletin board which is also called bulletin board service, BBS for shortIt allows users to post and retrieve messages that are not directed to a specific user, much like announcements are posted on an office bulletin board BBS has been used for everything from dating service and want ads to highly specialized applications such as the exchange of research data in a narrow scientific field

 E-mail

 One important application for Internet is communication between computer users by the electronic mail, or E-mail E-mail allows users to electronically transmit and receive messages, text, or data E-mail functions futher like a mailbox: the user can send messages whether or not the intended receiver is currently on the network and the message is stored, along with a signal for the receiver that indicates that there is a message waiting

 E-mail has replaced the telephone for many messages Users can respond when it is convenient,without being interrupted, and can get their message either on-screen or in the printed form

  1、新闻。 新闻组是供具有共同爱好的用户交流信息的限定范围的论坛。在因特网上,有上千个技术性和非技术性的新闻组,涉及计算机、科学、娱乐和政治等专题。

  2、电子函件。 在因特网上,人们可以创作、发送和接收电子函件。许多人每天收到成打的电子函件信息,这大大超过电话和蜗牛式的普通邮件,他们把它看作与外界交流的主要方式。

  3、远程登录 。在因特同任何地方的用户都可以使用Telnet、Rlogin或其他的程序登录到他具有帐号的其他计算机上。

4、文件传输。 在因特网上,使用FTP程序可以从一台计算机向另一台计算机拷贝文件。大量的文章、数据库及其他信息都可以通过这种方式传输。

 网络计算机

 网络计算机,也叫“因特网烤炉”、因特网装置、因特网设备,是一种价格低廉、无需维护的台式装置。它可以让用户不费力气就能接到因特网和网络资源上。从这种台式装置上,他们就能分享到任何资源,完成所有目前需要在PC机上进行的计算任务。

 网络计算机提供了简洁性,去掉了使PC应用复杂化的软硬件,只留下网络访问与显示功能,实际上,网络计算机在软件、服务、处理、数据和资源上全部都依赖网络。这就消除了周而复始的台式软硬件升级,而是把这个负担放到了网络上。

 需要最新的字处理软件或电子表格软件将它从服务器上下载来运行即可。需要把你做的工作保存起来吗只需把它送上网络,在那它被安全地存储并作好备份。

 防火墙:一项网络安全措施

 随着因特网的普及,网络的安全性越来越难以保证,网络遭破坏的事件时有发生。这既有“黑客”们的“光顾”,也有合法授权用户的“特别关照”。而防火墙就是保证网络安全的一种有效措施。它可以保证所有的通信符合安全政策。

 曾有两位年轻人非法侵入了大学网络,创建了一个公告牌,并在上面装入了流行的商业软件,还邀请因特网上的用户下载这些软件包。幸好有了防火墙,网络管理员发现系统遭到了破坏。他们检查了审计记录,找到了这两名学生的IP地址、姓名及地点。警察就逮捕了这两名“黑客”。

 电子公告板

 因特网的另一个有趣的应用是电子公告板,又称公告服务,简称BBS。它允许用户的投递或回收消息,这些消息不是针对某一个具体的用户发送的,它就像在办公室的公告牌上发布通知一样。BBS被广泛应用在从日常服务、招聘广告到非常专业的领域中,例如在一个非常狭窄的科学领域中交换调查数据。

 电子函件

 因特网的一个重要应用是计算机用户间利用电子函件相互通信。电子函件使用户可以用电子手段传递和接收消息、文本和数据。电子函件的功能非常类似于邮箱:无论接收者是否在网络上,用户都可以向他发送消息,该消息被保存起来,同时向接收者发送一个信号表明有一个消息在等待处理。

 电子函件传送消息已经代替了电话。用户可以在方便的时候再去对它作出反应,而不会被打扰,并可以在屏幕上显示消息或把它打印出来。

索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。 搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。 早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。 随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。 然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索“电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、 标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接。 这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000‘000个网页。我们可以从http://googlestanfordedu/ 下载。 设计搜索引擎是一项富有挑战性的工作。搜索引擎为上亿个网页建立索引,其中包含大量迥然不同的词汇。而且每天要回答成千上万个查询。在网络中,尽管大型搜索引擎非常重要,但是学术界却很少研究它。此外由于技术的快速发展和网页的大量增加,现在建立一个搜索引擎和三年前完全不同。 本文详细介绍了我们的大型搜索引擎,据我们所知,在公开发表的论文中,这是第一篇描述地如此详细。除了把传统数据搜索技术应用到如此大量级网页中所遇到的问题,还有许多新的技术挑战,包括应用超文本中的附加信息改进搜索结果。 本文将解决这个问题,描述如何运用超文本中的附加信息,建立一个大型实用系统。任何人都可以在网上随意发布信息,如何有效地处理这些无组织的超文本集合,也是本文要关注的问题。 关键词 World Wide Web,搜索引擎,信息检索,PageRank, Google 1 绪论 Web 给信息检索带来了新的挑战。Web上的信息量快速增长,同时不断有毫无经验的新用户来体验Web这门艺术。人们喜欢用超级链接来网上冲浪,通常都以象Yahoo这样重要的网页或搜索引擎开始。大家认为List(目录)有效地包含了大家感兴趣的主题,但是它具有主观性,建立和维护的代价高,升级慢,不能包括所有深奥的主题。基于关键词的自动搜索引擎通常返回太多的低质量的匹配。使问题更遭的是,一些广告为了赢得人们的关注想方设法误导自动搜索引擎。 我们建立了一个大型搜索引擎解决了现有系统中的很多问题。应用超文本结构,大大提高了查询质量。我们的系统命名为google,取名自googol的通俗拼法,即10的100次方,这和我们的目标建立一个大型搜索引擎不谋而合。 11网络搜索引擎—升级换代(scaling up):1994-2000 搜索引擎技术不得不快速升级(scale dramatically)跟上成倍增长的web数量。1994年,第一个Web搜索引擎,World Wide Web Worm(WWWW)可以检索到110,000个网页和Web的文件。到1994年11月,顶级的搜索引擎声称可以检索到2‘000’000(WebCrawler)至100‘000’000个网络文件(来自 Search Engine Watch)。可以预见到2000年,可检索到的网页将超过1‘000’000‘000。同时,搜索引擎的访问量也会以惊人的速度增长。在1997年的三四月份,World Wide Web Worm 平均每天收到1500个查询。 在1997年11月,Altavista 声称它每天要处理大约20’000’000个查询。随着网络用户的增长,到2000年,自动搜索引擎每天将处理上亿个查询。我们系统的设计目标要解决许多问题,包括质量和可升级性,引入升级搜索引擎技术(scaling search engine technology),把它升级到如此大量的数据上。 12 Google:跟上Web的步伐(Scaling with the Web)建立一个能够和当今web规模相适应的搜索引擎会面临许多挑战。抓网页技术必须足够快,才能跟上网页变化的速度(keep them up to date)。存储索引和文档的空间必须足够大。索引系统必须能够有效地处理上千亿的数据。处理查询必须快,达到每秒能处理成百上千个查询(hundreds to thousands per second)。随着Web的不断增长,这些任务变得越来越艰巨。然而硬件的执行效率和成本也在快速增长,可以部分抵消这些困难。 还有几个值得注意的因素,如磁盘的寻道时间(disk seek time),操作系统的效率(operating system robustness)。在设计Google的过程中,我们既考虑了Web的增长速度,又考虑了技术的更新。Google的设计能够很好的升级处理海量数据集。它能够有效地利用存储空间来存储索引。优化的数据结构能够快速有效地存取(参考42节)。进一步,我们希望,相对于所抓取的文本文件和HTML网页的数量而言,存储和建立索引的代价尽可能的小(参考附录B)。对于象Google这样的集中式系统,采取这些措施得到了令人满意的系统可升级性(scaling properties)。 1 3设计目标 131提高搜索质量我们的主要目标是提高Web搜索引擎的质量。1994年,有人认为建立全搜索索引(a complete search index)可以使查找任何数据都变得容易。根据Best of the Web 1994 -- Navigators ,“最好的导航服务可以使在Web上搜索任何信息都很容易(当时所有的数据都可以被登录)”。然而1997年的Web就迥然不同。近来搜索引擎的用户已经证实索引的完整性不是评价搜索质量的唯一标准。用户感兴趣的搜索结果往往湮没在“垃圾结果Junk result”中。实际上,到1997年11月为止,四大商业搜索引擎中只 有一个能够找到它自己(搜索自己名字时返回的前十个结果中有它自己)。导致这一问题的主要原因是文档的索引数目增加了好几个数量级,但是用户能够看的文档数却没有增加。用户仍然只希望看前面几十个搜索结果。因此,当集合增大时,我们就需要工具使结果精确(在返回的前几十个结果中,有关文档的数量)。由于是从成千上万个有点相关的文档中选出几十个,实际上,相关的概念就是指最好的文档。高精确非常重要,甚至以响应(系统能够返回的有关文档的总数)为代价。令人高兴的是利用超文本链接提供的信息有助于改进搜索和其它应用 。尤其是链接结构和链接文本,为相关性的判断和高质量的过滤提供了大量的信息。Google既利用了链接结构又用到了anchor文本(见21和22节)。 132搜索引擎的学术研究随着时间的流逝,除了发展迅速,Web越来越商业化。1993年,只有15%的Web服务是来自com域名。到1997年,超过了60%。同时,搜索引擎从学术领域走进商业。到现在大多数搜索引擎被公司所有,很少技公开术细节。这就导致搜索引擎技术很大程度上仍然是暗箱操作,并倾向做广告(见附录A)。Google的主要目标是推动学术领域在此方面的发展,和对它的了解。另一个设计目标是给大家一个实用的系统。应用对我们来说非常重要,因为现代网络系统中存在大量的有用数据(us because we think some of the most interesting research will involve leveraging the vast amount of usage data that is available from modern web systems)。例如,每天有几千万个研究。然而,得到这些数据却非常困难,主要因为它们没有商业价值。我们最后的设计目标是建立一个体系结构能够支持新的关于海量Web数据的研究。为了支持新研究,Google以压缩的形式保存了实际所抓到的文档。设计google的目标之一就是要建立一个环境使其他研究者能够很快进入这个领域,处理海量Web数据,得到满意的结果,而通过其它方法却很难得到结果。系统在短时间内被建立起来,已经有几篇论文用到了Google建的数据库,更多的在起步中。我们的另一个目标是建立一个宇宙空间实验室似的环境,在这里研究者甚至学生都可以对我们的海量Web数据设计或做一些实验。 2 系统特点 Google搜索引擎有两个重要特点,有助于得到高精度的搜索结果。 第一点,应用Web的链接结构计算每个网页的Rank值,称为PageRank,将在98页详细描述它。 第二点,Google利用超链接改进搜索结果。 21 PageRank:给网页排序 Web的引用(链接)图是重要的资源,却被当今的搜索引擎很大程度上忽视了。我们建立了一个包含518‘000’000个超链接的图,它是一个具有重要意义的样本。这些图能够快速地计算网页的PageRank值,它是一个客观的标准,较好的符合人们心目中对一个网页重要程度的评价,建立的基础是通过引用判断重要性。因此在web中,PageRank能够优化关键词查询的结果。对于大多数的主题,在网页标题查询中用PageRank优化简单文本匹配,我们得到了令人惊叹的结果(从googlestanfordedu可以得到演示)。对于Google主系统中的全文搜索,PageRank也帮了不少忙。 211计算PageRank 文献检索中的引用理论用到Web中,引用网页的链接数,一定程度上反映了该网页的重要性和质量。PageRank发展了这种思想,网页间的链接是不平等的。 PageRank定义如下: 我们假设T1…Tn指向网页A(例如,被引用)。参数d是制动因子,使结果在0,1之间。通常d等于085。在下一节将详细介绍d。C(A)定义为网页A指向其它网页的链接数,网页A的PageRank值由下式给出: PR(A) = (1-d) + d (PR(T1)/C(T1) + + PR(Tn)/C(Tn)) 注意PageRank的形式,分布到各个网页中,因此所有网页的PageRank和是1。 PageRank或PR(A)可以用简单的迭代算法计算,相应规格化Web链接矩阵的主特征向量。中等规模的网站计算26‘000’000网页的PageRank值要花费几小时。还有一些技术细节超出了本文论述的范围。 212直觉判断 PageRank被看作用户行为的模型。我们假设网上冲浪是随机的,不断点击链接,从不返回,最终烦了,另外随机选一个网页重新开始冲浪。随机访问一个网页的可能性就是它的PageRank值。制动因子d是随机访问一个网页烦了的可能性,随机另选一个网页。对单个网页或一组网页,一个重要的变量加入到制动因子d中。这允许个人可以故意地误导系统,以得到较高的PageRank值。我们还有其它的PageRank算法,见98页。 另外的直觉判断是一个网页有很多网页指向它,或者一些PageRank值高的网页指向它,则这个网页很重要。直觉地,在Web中,一个网页被很多网页引用,那么这个网页值得一看。一个网页被象Yahoo这样重要的主页引用即使一次,也值得一看。如果一个网页的质量不高,或者是死链接,象Yahoo这样的主页不会链向它。PageRank处理了这两方面因素,并通过网络链接递归地传递。 & nbsp; 22链接描述文字(Anchor Text)我们的搜索引擎对链接文本进行了特殊的处理。大多数搜索引擎把链接文字和它所链向的网页(the page that the link is on)联系起来。另外,把它和链接所指向的网页联系起来。这有几点好处。 第一,通常链接描述文字比网页本身更精确地描述该网页。 第二,链接描述文字可能链向的文档不能被文本搜索引擎检索到,例如图像,程序和数据库。有可能使返回的网页不能被抓到。注意哪些抓不到的网页将会带来一些问题。在返回给用户前检测不了它们的有效性。这种情况搜索引擎可能返回一个根本不存在的网页,但是有超级链接指向它。然而这种结果可以被挑出来的,所以此类的问题很少发生。链接描述文字是对被链向网页的宣传,这个思想被用在World Wide Web Worm 中,主要因为它有助于搜索非文本信息,能够用少量的已下载文档扩大搜索范围。我们大量应用链接描述文字,因为它有助于提高搜索结果的质量。有效地利用链接描述文字技术上存在一些困难,因为必须处理大量的数据。现在我们能抓到24‘000’000个网页,已经检索到259‘000’000多个链接描述文字。 23其它特点除了PageRank和应用链接描述文字外,Google还有一些其它特点。 第一,所有hit都有位置信息,所以它可以在搜索中广泛应用邻近性(proximity)。 第二,Google跟踪一些可视化外表细节,例如字号。黑体大号字比其它文字更重要。 第三,知识库存储了原始的全文html网页。 3有关工作 Web检索研究的历史简短。World Wide Web Worm()是最早的搜索引擎之一。后来出现了一些用于学术研究的搜索引擎,现在它们中的大多数被上市公司拥有。与Web的增长和搜索引擎的重要性相比,有关当今搜索引擎技术的优秀论文相当少。根据Michael Mauldin(Lycos Inc的首席科学家)) ,“各种各样的服务(包括Lycos)非常关注这些数据库的细节。”虽然在搜索引擎的某些特点上做了大量工作。具有代表性的工作有,对现有商业搜索引擎的结果进行传递,或建立小型的个性化的搜索引擎。最后有关信息检索系统的研究很多,尤其在有组织机构集合(well controlled collections)方面。在下面两节,我们将讨论在信息检索系统中的哪些领域需要改进以便更好的工作在Web上。 31信息检索信息检索系统诞生在几年前,并发展迅速。然而大多数信息检索系统研究的对象是小规模的单一的有组织结构的集合,例如科学论文集,或相关主题的新闻故事。实际上,信息检索的主要基准,the Text Retrieval Conference(),用小规模的、有组织结构的集合作为它们的基准。 大型文集基准只有20GB,相比之下,我们抓到的24000000个网页占147GB。在TREC上工作良好的系统,在Web上却不一定产生好的结果。例如,标准向量空间模型企图返回和查询请求最相近的文档,把查询请求和文档都看作由出现在它们中的词汇组成的向量。在Web环境下,这种策略常常返回非常短的文档,这些文档往往是查询词再加几个字。例如,查询“Bill Clinton”,返回的网页只包含“Bill Clinton Sucks”,这是我们从一个主要搜索引擎中看到的。网络上有些争议,用户应该更准确地表达他们想查询什么,在他们的查询请求中用更多的词。我们强烈反对这种观点。如果用户提出象“Bill Clinton”这样的查询请求,应该得到理想的查询结果,因为这个主题有许多高质量的信息。象所给的例子,我们认为信息检索标准需要发展,以便有效地处理Web数据。 32有组织结构的集合(Well Controlled Collections)与Web的不同点 Web是完全无组织的异构的大量文档的集合。Web中的文档无论内在信息还是隐含信息都存在大量的异构性。例如,文档内部就用了不同的语言(既有人类语言又有程序),词汇([email]地址,链接,邮政编码,电话号码,产品号),类型(文本,HTML,PDF,图像,声音),有些甚至是机器创建的文件(log文件,或数据库的输出)。可以从文档中推断出来,但并不包含在文档中的信息称为隐含信息。隐含信息包括来源的信誉,更新频率,质量,访问量和引用。不但隐含信息的可能来源各种各样,而且被检测的信息也大不相同,相差可达好几个数量级。例如,一个重要主页的使用量,象Yahoo 每天浏览数达到上百万次,于此相比无名的历史文章可能十年才被访问一次。很明显,搜索引擎对这两类信息的处理是不同的。 Web与有组织结构集合之间的另外一个明显区别是,事实上,向Web上传信息没有任何限制。灵活利用这点可以发布任何对搜索引擎影响重大的信息,使路由阻塞,加上为牟利故意操纵搜索引擎,这些已经成为一个严重的问题。这些问题还没有被传统的封闭的信息检索系统所提出来。它关心的是元数据的努力,这在Web搜索引擎中却不适用,因为网页中的任何文本都不会向用户声称企图操纵搜索引擎。甚至有些公司为牟利专门操纵搜索引擎。 4 系统分析(System Anatomy)首先,我们提供高水平的有关体系结构的讨论。然后 ,详细描述重要的数据结构。最后,主要应用:抓网页,索引,搜索将被严格地检查。 Figure 1 High Level Google Architecture 41Google体系结构概述这一节,我们将看看整个系统是如何工作的(give a high level),见图1。本节不讨论应用和数据结构,在后几节中讨论。为了效率大部分Google是用c或c++实现的,既可以在Solaris也可以在Linux上运行。 Google系统中,抓网页(下载网页)是由几个分布式crawlers完成的。一个URL服务器负责向crawlers提供URL列表。抓来的网页交给存储服务器storeserver。然后,由存储服务器压缩网页并把它们存到知识库repository中。每个网页都有一个ID,称作docID,当新URL从网页中分析出时,就被分配一个docID。由索引器和排序器负责建立索引index function。索引器从知识库中读取文档,对其解压缩和分析。每个文档被转换成一组词的出现情况,称作命中hits。Hits纪录了词,词在文档中的位置,最接近的字号,大小写。索引器把这些hits分配到一组桶barrel中,产生经过部分排序后的索引。索引器的另一个重要功能是分析网页中所有的链接,将有关的重要信息存在链接描述anchors文件中。该文件包含了足够的信息,可以用来判断每个链接链出链入节点的信息,和链接文本。 URL分解器resolver阅读链接描述anchors文件,并把相对URL转换成绝对URL,再转换成docID。为链接描述文本编制索引,并与它所指向的docID关联起来。同时建立由docID对组成的链接数据库。用于计算所有文档的PageRank值。用docID分类后的barrels,送给排序器sorter,再根据wordID进行分类,建立反向索引inverted index。这个操作要恰到好处,以便几乎不需要暂存空间。排序器还给出docID和偏移量列表,建立反向索引。一个叫DumpLexicon的程序把这个列表和由索引器产生的字典结合在一起,建立一个新的字典,供搜索器使用。这个搜索器就是利用一个Web服务器,使用由DumpLexicon所生成的字典,利用上述反向索引以及页面等级PageRank来回答用户的提问。 42主要数据结构经过优化的Google数据结构,能够用较小的代价抓取大量文档,建立索引和查询。虽然近几年CPU和输入输出速率迅速提高。磁盘寻道仍然需要10ms。任何时候Google系统的设计都尽可能地避免磁盘寻道。这对数据结构的设计影响很大。 421大文件大文件BigFiles是指虚拟文件生成的多文件系统,用长度是64位的整型数据寻址。多文件系统之间的空间分配是自动完成的。BigFiles包也处理已分配和未分配文件描述符。由于操纵系统不能满足我们的需要,BigFiles也支持基本的压缩选项。 422知识库 Figure 2 Repository Data Structure 知识库包含每个网页的全部HTML。每个网页用zlib(见RFC1950)压缩。压缩技术的选择既要考虑速度又要考虑压缩率。我们选择zlib的速度而不是压缩率很高的bzip。知识库用bzip的压缩率接近4:1。而用zlib的压缩率是3:1。文档一个挨着一个的存储在知识库中,前缀是docID,长度,URL,见图2。访问知识库不需要其它的数据结构。这有助于数据一致性和升级。用其它数据结构重构系统,我们只需要修改知识库和crawler错误列表文件。 423文件索引文件索引保存了有关文档的一些信息。索引以docID的顺序排列,定宽ISAM(Index sequential access mode)。每条记录包括当前文件状态,一个指向知识库的指针,文件校验和,各种统计表。如果一个文档已经被抓到,指针指向docinfo文件,该文件的宽度可变,包含了URL和标题。否则指针指向包含这个URL的URL列表。这种设计考虑到简洁的数据结构,以及在查询中只需要一个磁盘寻道时间就能够访问一条记录。还有一个文件用于把URL转换成docID。它是URL校验和与相应docID的列表,按校验和排序。要想知道某个URL的docID,需要计算URL的校验和,然后在校验和文件中执行二进制查找,找到它的docID。通过对这个文件进行合并,可以把一批URL转换成对应的docID。URL分析器用这项技术把URL转换成docID。这种成批更新的模式是至关重要的,否则每个链接都需要一次查询,假如用一块磁盘,322‘000’000个链接的数据集合将花费一个多月的时间。 424词典词典有几种不同的形式。和以前系统的重要不同是,词典对内存的要求可以在合理的价格内。现在实现的系统,一台256M内存的机器就可以把词典装入到内存中。现在的词典包含14000000词汇(虽然一些很少用的词汇没有加入到词典中)。它执行分两部分—词汇表(用null分隔的连续串)和指针的哈希表。不同的函数,词汇表有一些辅助信息,这超出了本文论述的范围。 425 hit list hit list是一篇文档中所出现的词的列表,包括位置,字号,大小写。Hit list占很大空间,用在正向和反向索引中。因此,它的表示形式越有效越好。我们考虑了几种方案来编码位置,字号,大小写—简单编码(3个整型数),紧凑编码(支持优化分配比特位),哈夫曼编码。Hit的详细信息见图3。我们的紧凑编码每个hit用2字节。有两种类型hit,特殊hit和普通hit。特殊hit包含URL,标题,链接描述文字,meta tag。普通hit包含其它每件事。它包括大小写特征位,字号,12比特用于描述词在文档中的位置(所有超过4095的位置标记为4096)。字号采用相对于文档的其它部分的相对大小表示,占3比特(实际只用7个值,因为111标志是特殊hit)。特殊hit由大小写特征位,字号位为7表示它是特殊hit,用4比特表示特殊hit的类型,8比特表示位置。对于anchor hit八比特位置位分出4比特用来表示在anchor中的位置,4比特用于表明anchor出现的哈希表hash of the docID。短语查询是有限的,对某些词没有足够多的anchor。我们希望更新anchor hit的存储方式,以便解决地址位和docIDhash域位数不足的问题。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 关于建筑智能化设计标准标准

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情