就职于Citadel是一种什么体验?
2005年本科毕业时,权衡了美国PhD与国内工作后,我选择了后者;于是进入了贝尔实 验室(朗讯)。朗讯是一个好的起点平台,宽松的环境,严谨的流程,优厚的薪水与出 差补助,领先的技术,友好的氛围。近日,与昔日同事闲聊时,很多人都感叹在社会上 晃荡了许久,换了一些工作,最怀念的是朗讯清晰的工作流程与友善的管理氛围。 作为500强的朗讯,其技术的确是全球领先的。朗讯的服务器与对冲基金使用的大同小 异;朗讯的系统涉及到与第三方各种系统的集成,这恰好与对冲基金多服务器的结构形 成了对应。Citadel美国总部面试我时,听说我曾就职于朗讯,当时面试官的喜悦即溢 于言表。 2005-2007,在朗讯工作的两年里,我很开心,虽然只在北京停留了3个月,其余全部在 国外出差;但这种经历让我成长。朗讯拓宽了我的视野,将我从一个没有出过国门 的大学毕业生塑造成有远见并思路清晰的社会人。 2007年,我做技术有些腻了,毕竟,技术领域里,重复性的劳动比较多。脑子有些木 了,于是想去学学数学,锻炼一下思维和头脑;反复斟酌之下,选择了一个数学与计算 机结合的专业——统计。于是,改行申请美国大学统计系的研究生。 进入UCLA,是我另一个幸运。UCLA的学术水平绝对可称一流,这在我毕业后更有着深刻 地体会。2009年末,我在香港大学金融系做研究员,在我第一个金融模型的实现中,全 部采用UCLA课堂上老师教授的Optimization方法以及编程语言,关键的部分也是源于我 UCLA同学硕士论文给我的提示。如果不是UCLA的学习,我至少还要多花一个月时间查阅 资料,编写算法。常有人抱怨,硕士期间没有学到东西,其实不然,这些收获,只有在 进入日后的工作中才能体会出来。
LZ你这个问题我应该这么回答你:
PVE: LR FS SS 这3个职业SS应该算比较好的,因为在ICC后期装备成型火法虽然伤害很高但续航哪个我是不敢恭维的,破甲LR输出也是很犀利,但为什么说SS比较好点,因为在急速享受加成后SS的DOT明显高调化,而且在这3个职业里面从0装备到有装备到成型,SS算是比较好拿的,LR因为大多数团队都只带一个LR,而那个LR一般都是稳定LR所以LR有点难度(至少在我的服务器里面从WLK开的首杀里面基本都只有1个LR,偶尔会出现2个LR)FS装备和SS差不多,但FS得那个竞争激烈我就不说了,我说的是公会里主力团FS的位置谢谢。
PVP:LR FS SS
先说LR,LRWLK风光无限,野兽菜刀,PHD(死骑,NQ,LR)等等组合让LR风光无限大放异彩,但WLK一过就比较龟儿子了。
FS:恩其实命运和潜行者差不多,都需要比较好的操作,操作不怎么好的FS基本遇到LR,DK,ZS,SS这些职业基本都比较悲剧,一个FS经常被LR压制都只能在柱子后面龟缩跑位。
SS:下水道技能的加入,确实极大的加强了SS的生存力,加上DOT现在享受急速效果,4DOT的威力相信大家自己心里都是很清楚那个无语的掉血。面对高端MS SS无力,当然也只限于高端MS。
WAS61中,在使用IBM JDK的平台上,可以直接使用以下的方法,随时生成所需的heapdump文件。如果在性能诊断顾问程序配置里面选中了"启用自动堆转储收集,则可以自动在WebSphere profile所在的路径下(例如/opt/IBM/WebSphere/WAS61/profiles/AppSrv01)生成heapdump文件,备用户进行分析。
在使用IBM SDK的平台上,例如AIX, Linux和Windows,在启用了性能诊断顾问工具后,如果探测到有内存泄漏发生,WebSphere会自动生成两个heapdump文件,供后续分析使用。
我们在任何时候,可以随时手动生成所需的heap dump文件。在WAS61 profile的bin目录下,首先运行wsadmin 脚本客户端,然后可以调用generateHeapDump操作来完成。
关键步骤:
1 找到JVM对象名字。
<wsadmin> set objectName
WebSphere:type=JVM,process=<WebSphere服务器名字>,node=<节点名字>,]
2 对JVM MBean调用generateHeapDump操作。
<wsadmin> $AdminControl invoke $objectName generateHeapDump
例如:
[root@csspvm bin]# pwd
/opt/IBM/WebSphere/WAS61/profiles/AppSrv01/bin
[root@csspvm bin]# /wsadminsh -username root -password demo4you
WASX7209I: Connected to process "server1" on node csspvmNode02 using SOAP
connector; The type of process is: UnManagedProcess
WASX8011W: AdminTask object is not available
WASX7029I: For help, enter: "$Help help"
wsadmin>set objectName [$AdminControl queryNames
WebSphere:type=JVM,process=server1, node=csspvmNode02,]
WebSphere:name=JVM,process=server1,platform=proxy,node=csspvmNode02,
j2eeType=JVM,J2EEServer=server1,
version=6100,type=JVM,mbeanIdentifier=JVM,cell=csspvmNode02Cell,spec=10
wsadmin>$AdminControl invoke $ objectName generateHeapDump
/opt/IBM/WebSphere/WAS61/profiles/AppSrv01//heapdump200609040756503576phd
wsadmin>quit
理想情况下,在探测到问题时,尽快生成一个初始的heap dump,然后密切监控内存使用情况,等到泄漏了足够的内存的时候,再生成另外一个heap dump,这样可以对比分析以更准确地找到泄漏的原因。
注: 生成HeapDump文件的过程是比较耗资源的,所以请只在必须的时候做这样的操作。
英文姓名:prefix + first name + last name + suffix
suffix
英 [ˈsʌfɪks] 美 [ˈsʌfɪks]
n后缀(加在词尾,用以构成新词,如quickly中的-ly或sadness中的-ness)
复数: suffixes
记忆技巧:suf 下 + fix 固定 → 固定在〔单词〕下面〔末尾〕→ 后缀
noun:
(grammar 语法) 后缀(加在词尾,用以构成新词,如quickly中的-ly或sadness中的-ness)
a letter or group of letters added to the end of a word to make another word, such as -ly in quickly or -ness in sadness
扩展资料:
近义词:postfix
后缀;后置;邮件服务器;邮件系统;后序
noun
an affix that is added at the end of the word
Synonym:
suffix
The three most common forms of notation in arithmetic expressions are infix, prefix, and postfix notations
算术表达式中最常见的表示法形式有中缀、前缀和后缀表示法。
pSpace在企业信息化的作用
对于现代工业企业,如何能使决策者随时查看生产过程数据,以便快速地做出更为灵活的商业决策,是企业信息化建设的关键,在企业MES所关注的各项资源中,生产过程信息依然是重要的资源,如果不能解决生产过程信息实时有效上传的问题,将仍然无法充分利用和保障MES及ERP管理系统的投资。
企业MES核心是实时历史数据库,实时数据库可用于工厂过程的自动采集、存储和监视,可在线存储每个工艺过程点的多年数据,可以提供清晰、精确的操作情况画面,用户既可浏览工厂当前的生产情况,也可回顾过去的生产情况,可以说,实时数据库对于流程工厂来说就如同飞机上的“黑匣子”。
工厂的历史数据对公司来说是很有价值的,实时数据库的核心就是数据档案管理,它采集并存储与流程相关的上千点的数据,多年应用历史数据库管理的经验告诉我们,现在很难知道将来进行分析时哪些数据是必须的。
因此,保存所有的数据是防止丢失所需信息的最好方法。
此外,要改进产品,必须具备与之相关物料的信息,并了解当前和过去的操作状态。
实时数据库采集、存储流程信息,用来指导工艺改进、降低物料、增加产量。
实时数据库为最终用户提供了快捷、高效的工厂信息,由于工厂实时数据存放在统一的数据库中,工厂中的所有人,无论在什么地方都可看到和分析相同的信息,客户端的应用程序可使用户很容易对工厂级实施管理,诸如工艺改进、质量控制、故障预防维护等。
通过实时数据库可集成产品计划、维护管理、专家系统、化验室信息系统、模拟与优化等应用程序,在业务管理和实时生产之间起到桥梁作用。
北京三维力控推出的pSpaceTM就是这样一个极具竞争力的软件产品,pSpaceTM作为企业级实时历史数据库,通过极高速度的数据采集、大量历史数据存储和大量实时过程数据的发布,实现企业信息集成的基础平台,它为企业实现底层监控、信息集成提供了全方位的软件解决方案。
pSpace可以构成一个复杂的企业信息化系统,企业信息化系统是采用了实时历史数据库技术的计算机系统,该系统不仅仅是一组对数据进行处理的软件,也不只是一个数据库。
一个实时历史数据库系统是一个实际可运行的,按照数据方式存储、维护和向应用程序提供数据或信息支持的系统,它是存储介质、处理对象和管理系统的 体,由数据库、硬件、软件几部分组成,pSpace是企业信息化的核心处理软件平台。
pSpace 企业级实时历史数据库为完全的分布式结构,可任意组建应用模式,支持C/S和B/S应用;它可以提供丰富的企业级信息系统客户端应用和工具;大容量支持企业级应用,内部实现高数据压缩率,可实现历史数据的大量存储,灵活的扩展结构可满足各种需求,具备广泛的安全性和可跟踪性。
pSpace实时历史数据库能完成来自DCS、FCS和其它控制系统的实时数据的采集、存储、压缩,实时数据和历史数据的检索、统计、分析、建模,并进行曲线、图表显示,实现了流程工业中典型的应用功能,如工艺流程图展现、历史曲线分析、历史报警分析、EXCEL报表插件等,能为其他管理软件提供高效的数据接口,将连续存储的历史数据与这些管理软件进行双向通讯,pSpace是一个具有标准接口的、可二次开发的平台。
实时数据库结构:
一个实时数据库系统的优劣,主要体现在它提供的功能是否齐备,系统性能是否优越,能否完成有效的数据存取,各种数据操作、查询处理、存取方法、完整性检查,保证相关的事务管理,事务的概念、调度与并发控制、执行管理及存取控制,安全性检验。
以下是力控的系统结构图系统组成:由采集站DA、数据服务器、 WEB服务器、客户端组成,同时和关系数据库进行有效的数据交换,DCS的数据经过DA进行采集,由DA SERVER送到数据服务器,数据服务器再有效的送给其它客户端。
pSpace实时数据库服务器主要由以下几部分构成:
pSpace Server:
负责整个pSpaceTM应用系统的实时数据处理、历史数据存储、统计数据处理、数据服务请求、事件触发器管理、调度管理、资源管理、系统配置等。
pSpace Data Service:
为第三方厂家的软件访问pSpaceTM Server时提供数据服务功能,包括:OPC Server、DDE Server、ODBC Router、Base API接口等
pSpace COM SDK:
COM SDK为用户开发基于pSpaceTM Server的应用程序提供基于COM对象的编程接口。
pSpace Visual ActiveX:
是一组开放的控件,如:数据控件、文本控件、棒图控件、趋势控件等,控件可以直接访问实时数据库和关系数据库的数据。
pSpace DA Server数据采集器:
pSpaceTM DA server是数据采集站的设备通讯管理服务程序,用于系统和DCS、PLC等数据源之间的数据交换,具有自动网络通信负荷平衡功能和断线数据缓冲功能。
pSpace的Web服务器
使用IIS作为Web管理服务器,用图形客户端生成Web网页;
使用pSpace Visual ActiveX自行创建Web服务器和Web网页;
使用pSpace Webserver,用图形客户端生成Web网页;
pSpace 客户端
监控组态软件:力控Forcecontrol系列;
Microsoft Excel:采用标准EXCEL加载宏方式通过网络访问数据库;
“瘦”客户端:Microsoft Inter Explorer 50或以上版本的浏览器;
Visual ActiveX:pSpace可视化控件工具包是为建立客户端连接而提供的客户端产品;它包括一组ActiveX控件,如:数据控件、文本控件、棒图控件、趋势控件等;
二次开发工具及访问接口
标准访问接口供客户端程序调用或第三方软件访问使用,因此接口的完整性、开放性决定实时数据库二次开发的性能的优劣,pSpace访问接口及开发工具主要包括以下几种:
1)DBI API
DBI是一套实时数据库访问接口,给用户提供底层编程接口,通过它可以与客户端连接,对数据库进行数据读写,满足继线重连功能,可以获取数据库结构信息,动态控制变化数据集,DBI接口采用了快速数据访问机制,数据访问吞吐量可达到11万次/秒,可以适合过程仿真、优化控制、专家诊断等多种行业应用。
2)COM SDK
SDK是为用户开发基于pSpaceTM Server的应用程序提供基于COM对象的编程接口,用COM SDK编写的一个实例可以同时连接多个Server,也可以用COM SDK同时建立多个实例,提供面向对象的类库供用户开发应用程序,用户使用该工具编程可以提高开发效率,该工具可以在VC++,VB,VBScript,等开发环境下使用。
3)OLE DB Provider
应用程序提供pSpace Server数据库的ADO访问接口。
4)DAI SDK
pSpace的数据源采集接口的开放工具,DAI采集接口软件都可以单独运行在一台网络结点机,并可在远程对其进行配置与监控,具备以下功能:
DAI 可以直接利用原有的力控组态软件的驱动程序;
DAI 具备断线缓存功能;另外DAInterface还要增加几个接口;
DAI 支持XML、CSV文件接口,可采集离线数据源。
实时数据库性能指标:
从实时数据库运行环境来看,实时数据库系统的除了自身的软件性能外,还取决于所使用的操作系统、硬件环境等。
单台服务器容量可达12,0000点以上;
历史数据库支持unix linux windows等64位操作系统;
完整的事件记录系统,所有操作员的动作均被检查并记录,可作为跟踪依据;
功能强大的压缩算法:按高压缩格式保存数据,采用死区和变化率压缩,压缩比为1:30;
支持优化旋转门算法对历史数据进行压缩;
专用的磁盘存贮算法来保证对长年形成的海量历史数据的快速查询;
支持的浮点型、布尔型、字符串型、等常见数据类型及“任意”类型;
数据库吞吐量支持每秒写入/查询20,000个数据点;
支持历史数据库在线备份,多服务器并发处理;
支持数据库冗余;
IO数据采集断线重连:通讯故障能够自动恢复,I/O时间同步;自动补偿 PC 时钟偏差。
构建企业信息门户
力控pSpace可以为企业在创建基于Inter/Intra的网络信息门户时提供完整的软件解决方案,同时支持PDA掌上终端访问力控的WEB服务器。
对pSpaceTM Server的数据进行Web管理有以下几种方式:
使用IIS作为Web管理服务器,将通用流程画面转换为Web网页,整个系统与WIN系统无缝集成,基于WEB组态的工具控件包通过相应的检索便可以进行查询,能够直接生成WEB页面;
使用组态软件创建Web服务器和Web网页然后发布;
用户使用pSpaceTM Visual ActiveX自行创建Web服务器和Web网页;
用户可以使用自己熟悉的网站开发工具如:FrontPage、Dreamweaver、ASP等创建主页,设立网站,并在网页中嵌入pSpace Visual ActiveX中的控件建立pSpaceTM Server的数据显示。
特点如下:
Web页面与过程画面的高度同步
pSpace Web Server实现了服务器端与客户端画面的高度同步, 在浏览器上可以同时浏览多个过程画面, 看到的图形界面与通用组态软件生成的过程画面效果完全相同,数据采用变化传输的方式,具有更快的运行与数据更新速度。
企业级Web服务器
pSpace Web Server专为构建企业级Web服务器而设计,具备高容量的数据吞吐能力和良好的健壮性,力控Web Server支持多达500的客户端的同时访问。
完善的安全机制
pSpace Web Server提供完善的安全管理机制。
只有授权的用户才能修改过程参数。
使用pSpace Web Server时,管理员尽可安心,不必担心非法或未授权的修改。
客户端
力控实时历史数据库管理系统提供了基本的客户端组态工具,开放的接口可以高级应用中的资产管理、设备诊断等管理客户端的开发,每个客户端应用软件都可以与pSpace Server运行在同一台计算机上,也可以分布式地运行在其它网络结点机上。
1)管理工具Admin
pSpace系统配置工具。
包括:在线配置数据库点、采集接口、监控服务器和采集器状态,启、停远程服务等。
2)Forcecontrol组态软件
完成生产调度系统的实时监控,曲线分析、生产报表、报警、事件等。
3)Excel Add-In:Excel加载宏,完成功能包括:
查询原始数据;
查询当前数据;
利用索引点查询过滤数据;
查询数据的采样值;
查询统计值(最小值、最大值、平均值、标准方差、累计值、计数值);
显示、导入、导出标签;
导入、导出数据;
显示、导入、导出消息;
显示采集接口;
4)pBatch
批量生产工艺数据的检索和表示,可跟踪与批量生产相关的各种信息。
5)Alarm Server
报警服务器。
6)SNMP Agent:
网络管理工具,可以在线诊断网络设备。
上层应用工具
报表工具:
可以在力控®的万能报表工具中获取实时数据库的各种过程数据,完成数据的查询与计算;建立易用、灵活、强大的报表系统。
设备运行诊断工具:
生产设备运行诊断工具可以方便地了解运行设备故障事件发生的时间、地点、状态和原因,从而降低设备维护成本。
趋势组记录工具:
提供了非常丰富的趋势记录功能,实时趋势和历史趋势记录允许趋势曲线多层重叠,可以通过颜 分好数据和坏数据,可以显示数据的采样周期、数值精度和曲线变化情况。
图形分析工具:
包括直方图、饼图、面积图等十种图形分析工具,非常方便数据的显示与比较。
图形具有透明性,从而更加容易地观察到数据之间的差别。
趋势曲线放大镜:
利用趋势曲线的放大镜工具,可以放大任何时间的实时和历史曲线,非常方便地分析时间序列的数据。
通过趋势曲线的滚动按钮,可以前后滚动查看趋势曲线的变化情况。
成本核算工具:
内嵌成本核算模板工具,包括核算体系(生产基本单位核算、财务核算及其报表)、预算和考核体系、信息实时查询(收率、消耗、能耗等)、成本统计报表。
质量分析工具:
提供质量分析模板工具,将生产过程的实时数据和质量点的采样数据进行比较,在线进行评估,以便生产管理人员及时掌握各个产品的质量数据。
长期保存质检数据,便于质量分析。
安全性及用户管理
网络安全
在进行项目设计时,在数据采集站可进行双网卡配置以保证生产网和管理网的物理隔离,DA SERVER采集站软件设计中可以保证数据单项传输,防止管理网的干扰生产网。
用户管理
实时数据库提供了完备的安全保护机制,以保证生产过程的安全可靠,用户管理具备多个级别,并可根据级别限制对重要工艺参数的修改,以有效避免生产过程中的误操作。
实时数据库提供了安全区的概念,同级别,不同安全区的数据不可以互相操作,保证了数据的分布式的管理。
提供基于远程的用户管理,增加更多的用户级别及安全区,管理所有用户的远程登陆信息。
加密管理:
支持工程加密,用户可以通过加密锁自己定义工程密码,没有此加密锁任何非法用户无法侵入,保护了自己的工程结构;
操作事件:
可以详细的记录操作事件和系统事件,方便事故追忆;
开机自动运行设置、有效的屏蔽系统键盘,可以防止非法用户入侵;
数据采集器DA SERVER
DA SERVER 是Server 与各种数据源之间的接口,DA SERVER具有自动网络通信负荷平衡功能和断线数据缓冲功能,DA SERVER可以和Server运行在同一服务器内,也可以运行在不同的前端机上,通过TCP/IP与Server通信。
DA SERVER主要有以下几种:
DA SERVER:专用的数据采集服务器,通过它中心服务器可以采集各种DCS、PLC、FCS等I/O设备的数据,DA SERVER可以集成HMI/SCADA组态软件的数据采集接口,对于已经安装运行了组态软件的SCADA工作站,通过该数据采集器可以很方便地将SCADA数据采集到Server中。
MOPC:通过该数据采集器,Server可以采集其他各种第三方的OPC Server的数据。
性能
支持通过RS232、RS422、RS485、电台、电话轮巡拨号、以太网、移动GPRS、CDMA、GSM网络等方式和设备进行通讯;
开发环境下具备在线诊断设备通讯功能,可以动态的打开、关闭设备,通讯故障后具备自动恢复功能;
支持控制设备和控制网络冗余,控制设备进行切换时,通讯会自动切换;
支持多种协议的设备挂在一条通讯链路上与DA SERVER进行通讯,方便电台等远程通讯;
支持与设备采取主从、主主、从主等多种交互机制来进行通讯,比如对MODBUS标准协议设备,支持主与从2种方式与设备通讯;
可以采集带时间戳的数据,毫秒级数据采集速率,实现历史数据向实时数据库的回插功能,可以采集记录仪、录波器数据,支持SOE,完成事件监视。
支持的设备种类
支持主流的DCS、PLC、DDC、现场总线、智能仪表等1000多种厂家设备的通讯;也可以按照用户提出的通信协议和硬件接口,在较短时间内开发新的驱动程序。
无所不在的移动通讯
所有设备的驱动程序支持通过移动GPRS、CDMA网络与控制设备进行通讯,DA SERVER节点与其远程DA SERVER节点也可以进行移动通讯;
DA SERVER移动数据服务器与远程设备的通讯为并发处理、完全透明的解决方案,消除了一般软件采用虚拟串口方式造成数据传输不稳定的隐患,有效的流量控制机制保证了远程应用中节省通讯费用;
支持设备主动通过GPRS上传数据的方式进行数据传输。
典型企业信息化应用
胜利油田油气集输公司是胜利油田从事油气集输的专业化生产企业,主要担负胜利油田原油外输、天然气生产集输及轻烃生产任务。
管理着9个气田,187口气井,24座集配气站,总长240公里的天然气输气管道和220公里的输油管道,8座大中型输油站库,2座压气站和3套轻烃回收装置。
所辖13个三级单位,具有点多、线长、面广、易燃易爆、高温高压的特点。
该系统对油田的原油库和压气站等身产装置进行网络信息处理。
该信息系统集成了多种设备,信息集成使用了OPC、DDE、ODBC、PROFIBUS、MODBUS、RS485等多种网络采集方式进行数据处理,是一个典型的分布式采集,集中管理的大型网络信息化系统。
胜利油田原油库控制系统主要选用了SIEMENS 控制系统,在压气站中, 50万岗位使用Honeywell的S9000型号的DCS控制系统;SW64岗位是美国库伯公司的RR控制器;二次增压岗位使用日本Omron的控制器;离心机岗位是横河CS1000型号的DCS控制系统;配气岗位是美国SIXNET公司的ST-GT-1210控制器;热煤炉岗位控制系统是三菱的PLC;配电岗位设有许继的配电保护及监控系统。
pSpace在应用中有效的集成了以上系统,从监测和考核原材料及水、电、气、风的用量入手,减少能耗物耗,对优化生产过程,提高生产运行效率起到了关键的作用。
典型先进控制方案
pSpace支持与国外的各种数据库进行数据交互,比如INFOPLUS、PI、PHD等,通过pSpace SERVER可以在国内外的各种平台上进行上层应用、专家诊断、先进控制等,下面是一个电厂设备诊断的应用,pSpace SERVER通过各种接口将现有SIS系统、小神探系统、新增的断路器和各种辅机监测系统集成为一个整体,其中,状态检修系统需要的绝大部分实时数据都取自SIS系统的PI实时数据库,因此,PI数据库和力控实时数据库之间的接口是整个系统集成的关键,接口Gateway的性能将直接决定整个状态检修系统的性能。
简单回答:不同搜索引擎搜索同样东西搜出来的内容或顺序有差异,主要是因为搜索结果排序算法的不同。
事实上,同一个搜索引擎,不同时间点的搜索,其结果也有很大可能会不同。
详细回答:
所谓搜索引擎就是一个软件系统,它提供一个网页界面,通过浏览器提交一个词语或者短语,可以很快返回一个可能和用户输入内容相关的结果列表。
这里有一个问题:
当用户提交查询的时候,搜索引擎并不是即刻在Web上“搜索”一通,发现那些相关的网页,呈现结果列表给用户;而是事先已经“搜集”了一批网页,以某种方式存放在系统中,此时的搜索只是在系统内部进行而已。
事实上现代搜索引擎一般采用三段式的工作流程,即:网页搜集、预处理和查询服务。它们是三个相对比较独立的子系统。
网页搜集:最简单粗暴的方法就是爬取所有的网页,存储下来。但这样是不现实的,首先,海量的网页是动态变化的。有研究指出50%网页的平均生命周期大约为50天([Cho,2002] J Cho, "Crawling the Web: Discovery and maintenance of large- scale Web data," Stanford University,PhD, 2002)。其次爬取所有的网页成本比较大。所以一般会采取动态爬取网页策略:定期搜集或增量搜集或两者兼有(这涉及到网页更新时效性的问题)。
这也出现了一些网页可以在某个搜索引擎找到但在某个搜索引擎找不到的情况,然后用户就会觉得不同的搜索引擎搜出来的东西会有所不同。
预处理:包括:①关键词的提取;②重复或转载网页的消除;③链接分析;④网页重要程度的计算。
网页重要程度跟用户查询相关的结果列表是有很大的关系的,但是既然在预处理阶段形成的,那就是和用户查询无关啊,那怎么体现网页的重要程度呢?一般认为“被引用多的就是重要的”,就像参考文献一样。作为Google创立核心技术的PageRank就是这种思路的成功体现(Sepandar Kamvar, Taher Haveliwala, Gene Golub, Adaptive methods for the computation of PageRank, Linear Algebra and its Applications 386 (2004) 51–65Google有几篇公开的搜索引擎技术论文的,有兴趣的话可以去看看)。
当然重要程度还有其他的指标。
查询服务:包括:①查询方式与匹配;②结果排序;③文档摘要。
查询方式与匹配,对于一般用户来说,最自然的方式就是“要搜索什么就输入什么”。比如,同样输入“清华大学”或者其他什么大学,高考生可能就是希望能搜索到高考的讯息,学者可能希望搜索到关于清华的一些新闻(我瞎猜的)。但是搜索引擎怎么知道他们想要什么呢?怎么给他们最匹配的搜索结果呢?这就要靠自然语言处理了,搜索引擎根据用户平时上网的一些习惯或以往的搜索记录,建立一个用户行为日志数据库,可以帮助用户更快搜索到自己想要的东西(这也取决于自然语言处理的算法)。
结果排序,用户提交查询词之后,会得到一个查询结果集合,搜索引擎会根据查询词与查询结果之间的相关度,再结合之前所说的种种与结果有关的重要性指标,形成一个最终的搜索结果排序。
所以,不同的搜索引擎里面涉及的技术、算法不一样,搜索结果也会不一样。
另:Google、百度等搜索引擎除了提供无需付费的排序结果,还有自己的竞价排名程序,依据点击才有花费,竞价排名程序在搜索引擎的返回结果中放置广告。
注:以上只是最简单的搜索引擎工作原理的分析,没有包含各式各样的搜索引擎,还没有分析分布式服务器的情况(可能会存在同一时间同一个搜索词在同一个搜索引擎下返回的列表却是不一样的结果)。内容转载自:https://wwwzhihucom/question/22739929
很多人创业,只是因为“不想给别人打工”。又有人说了:那些互联网的大佬为什么创业就能成功,他们真的是可复制的么?
马云:
哪怕所有人都反对我也要干
在辞职之前,马云便开始了创业。
当时在杭州,需要翻译的人很多,然而那么大的一个杭州却没有一家翻译机构,身为英语教师的马云看到这种情况,就决定利用自己英语的优势来创办一个翻译社。
1994年,杭州第一家正式在工商局注册的翻译公司――海博翻译社成立了。“海博”是英语希望“hope”的音译。
当时经营挺艰难,一个月的营业额是200多块人民币,可光房租就要700元。第一年实在不行了,马云就背着口袋到义乌、广州去进货,卖礼品、包鲜花,用这些钱养了翻译社3年,才开始收支平衡。
马云后来说“我一直的理念,就是真正想赚钱的人必须把钱看轻,如果你脑子里老是钱的话,一定不可能赚钱的。”
后来在西雅图会过朋友后,马云去了一家很不起眼的公司,在那里,他第一次接触了互联网。那家公司的人告诉马云,想查什么在电脑上一敲就能出来。“我甚至害怕触摸电脑的按键。我当时想,谁知道这玩艺儿多少钱呢?我要是把它弄坏了就赔了。”
马云如此回忆当时的心情。但嗅觉灵敏的马云有一种发自内心的直觉,他觉得互联网这东西将来肯定有戏,互联网将改变世界!
1995年3月夜,“我请了24个朋友来我家商量。我整整讲了两个小时,他们听得稀里糊涂,我也讲得糊里糊涂。最后说到底怎么样?其中23个人说算了吧,只有一个人说你可以试试看,不行赶紧逃回来。我想了一个晚上,第二天早上决定还是干,哪怕24个人全反对我也要干。”
马化腾:
曾经缺钱想把QQ卖掉
1998年,离开润讯通信的马化腾带着炒股赚来的一笔资金和5位同学共同创办了腾讯计算机系统有限公司,带着对互联网事业的热诚,初生的腾讯开始在寻呼与网络中寻找发展空间。
那一年互联网产业在中国正处在蓬勃初期,网民才300万,不到现在的零头。同许多刚开始创业的互联网公司一样,资金和技术曾经成为腾讯公司最大的问题,公司经营一度举步维艰。“我们曾为凑出必须的营运资金而四处奔波、夜不能寐”,马化腾后来说。为了能让腾讯存活下来,马化腾和几位创始者开始做系统集成、网页、程序设计来赚钱,带着产品去向运营商推销,被人拒之门外是家常便饭。
1999年2月,腾讯开发了网络即时通信工具――腾讯QQ。马化腾把QQ放到互联网上供用户免费使用,不到一年就发展了500万用户。然而,QQ的大量下载和暴增的用户量这时却成了公司的“包袱”,对于这家“缺钱”的初创企业来说,别说更新设备,就连一两千元的服务器托管费也是巨大的压力。
在新兴互联网市场中淘金,是一项艰苦的工作。当时在深圳,像腾讯这样的公司有上百家,马化腾当时的期望,只是公司能生存下来。
在朋友的劝说下,马化腾开始想要卖掉QQ。然而在谈判中,一些ICP要求独家买断,这让本想靠QQ软件多卖几家公司赚钱的马化腾非常犹豫。QQ卖不掉,但用户增长却很快,运营投入越来越大,马化腾只好四处筹钱。最后一连谈了4家都没有达到底线,马化腾决定留下QQ自己养大。这一留也成就了马化腾。
张朝阳:
草船借箭宣传公司
之前我在美国麻省理工学院做博士后研究,当时很多同学在美国觉得很孤独,早早结婚过稳定的生活,每天回家过日子或者去实验室念书,很快就拿到PHD。我和他们不一样,耗费了很多时间在玩上面,导致我拿PHD的时间有点长,但是坏事变成好事了。95年年底,我提着破箱子拿着一千美元一个月的工资回国了。
96年底我终于帮ISI搭好架子,我必须开始自己创业。我到麻省理工跟一些教授如尼葛洛庞帝谈融资,第一次融资成功是96年10月份,第一笔资金20多万美元。
当时基本是全国媒体都到场,我要利用这次机会让他们宣传宣传我们。有人提问,这次为什么到中国来?尼葛洛庞帝回答说,我这次首先做了一个重要的投资,这个投资就是由张朝阳创办的爱特信公司,我想看看这个公司怎么样。
这个基本是草船借箭的故事,用4人的力量调动了瀛海威公司40个人的市场部的力量,尼葛洛庞帝的访问也成为中国数字化元年。
所以,创业并不是你想象的那么简单。现在很多年轻人一毕业就梦想着去一个国企或大的外企,因为有保障;而有些人则喜欢挑战,选择去创业。
但是无论选择稳定还是创业,只要适合自己,自己开心,也就够了!
更多财税新观点敬请关注郭掌柜企业管家:guo71-com
0条评论