数据仓库与数据库有什么联系

数据仓库与数据库有什么联系,第1张

数据

数据库发展阶段大致划分为如下几个阶段:

人工管理阶段;

文件系统阶段;

数据库系统阶段;

高级数据库阶段。

当人们从不同的角度来描述这一概念时就有不同的定义(当然是描述性的)。例如,称数据库是一个“记录保存系统”(该定义强调了数据库是若干记录的集合)。又如称数据库是“人们为解决特定的任务,以一定的组织方式存储在一起的相关的数据的集合”(该定义侧重于数据的组织)。更有甚者称数据库是“一个数据仓库”。当然,这种说法虽然形象,但并不严谨。

严格地说,数据库是“按照数据结构来组织、存储和管理数据的仓库”。在经济管理的日常工作中,常常需要把某些相关的数据放进这样“仓库”,并根据管理的需要进行相应的处理。例如,企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表2063中,这张表就可以看成是一个数据库。有了这个"数据仓库"我们就可以根据需要随时查询某职工的基本情况,也可以查询工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行,那我们的人事管理就可以达到极高的水平。此外,在财务管理、仓库管理、生产管理中也需要建立众多的这种"数据库",使其可以利用计算机实现财务、仓库、生产的自动化管理。

JMartin给数据库下了一个比较完整的定义:数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务;数据的存储独立于使用它的程序;对数据库插入新数据,修改和检索原有数据均能按一种公用的和可控制的方式进行。当某个系统中存在结构上完全分开的若干个数据库时,则该系统包含一个“数据库集合”。

· 数据库的优点

使用数据库可以带来许多好处:如减少了数据的冗余度,从而大大地节省了数据的存储空间;实现数据资源的充分共享等等。此外,数据库技术还为用户提供了非常简便的使用手段使用户易于编写有关数据库应用程序。特别是近年来推出的微型计算机关系数据库管理系统dBASELL,操作直观,使用灵活,编程方便,环境适应广泛(一般的十六位机,如IBM/PC/XT,国产长城0520等均可运行种软件),数据处理能力极强。数据库在我国正得到愈来愈广泛的应用,必将成为经济管理的有力工具。

数据库是通过数据库管理系统(DBMS-DATA BASE MANAGEMENT SYSTEM)软件来实现数据的存储、管理与使用的dBASELL就是一种数据库管理系统软件。

· 数据库结构与数据库种类

数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。而不同的数据库是按不同的数据结构来联系和组织的。

1数据结构模型

(1)数据结构

所谓数据结构是指数据的组织形式或数据之间的联系。如果用D表示数据,用R表示数据对象之间存在的关系集合,则将DS=(D,R)称为数据结构。例如,设有一个电话号码簿,它记录了n个人的名字和相应的电话号码。为了方便地查找某人的电话号码,将人名和号码按字典顺序排列,并在名字的后面跟随着对应的电话号码。这样,若要查找某人的电话号码(假定他的名字的第一个字母是Y),那么只须查找以Y开头的那些名字就可以了。该例中,数据的集合D就是人名和电话号码,它们之间的联系R就是按字典顺序的排列,其相应的数据结构就是DS=(D,R),即一个数组。(2)数据结构种类

数据结构又分为数据的逻辑结构和数据的物理结构。数据的逻辑结构是从逻辑的角度(即数据间的联系和组织方式)来观察数据,分析数据,与数据的存储位置无关。数据的物理结构是指数据在计算机中存放的结构,即数据的逻辑结构在计算机中的实现形式,所以物理结构也被称为存储结构。本节只研究数据的逻辑结构,并将反映和实现数据联系的方法称为数据模型。

目前,比较流行的数据模型有三种,即按图论理论建立的层次结构模型和网状结构模型以及按关系理论建立的关系结构模型。

2层次、网状和关系数据库系统

(1)层次结构模型

层次结构模型实质上是一种有根结点的定向有序树(在数学中"树"被定义为一个无回的连通图)。例如图2064是一个高等学校的组织结构图。这个组织结构图像一棵树,校部就是树根(称为根结点),各系、专业、教师、学生等为枝点(称为结点),树根与枝点之间的联系称为边,树根与边之比为1:N,即树根只有一个,树枝有N个。这种数据结构模型的一般结构见图2065所示。

图2064 高等学校的组织结构图 图2065 层次结构模型

图2065中,Ri(i=1,2,…6)代表记录(即数据的集合),其中R1就是根结点(如果Ri看成是一个家族,则R1就是祖先,它是R2、R3、R4的双亲,而R2、R3、R4互为兄弟),R5、R6也是兄弟,且其双亲为R3。R2、R4、R5、R6又被称为叶结点(即无子女的结点)。这样,Ri(i=1,2,…6)就组成了以R1为树根的一棵树,这就是一个层次数据结构模型。

按照层次模型建立的数据库系统称为层次模型数据库系统。IMS(Information Manage-mentSystem)是其典型代表。

(2)网状结构模型

在图2066中,给出了某医院医生、病房和病人之间的联系。即每个医生负责治疗三个病人,每个病房可住一到四个病人。如果将医生看成是一个数据集合,病人和病房分别是另外两个数据集合,那么医生、病人和病房的比例关系就是M:N:P(即M个医生,N个病人,P间病房)。这种数据结构就是网状数据结构,它的一般结构模型如图2067所示。在图中,记录Ri(i=1,2,8)满足以下条件:

①可以有一个以上的结点无双亲(如R1、R2、R3)。

②至少有一个结点有多于一个以上的双亲。在"医生、病人、病房"例中,"医生集合有若干个结点(M个医生结点)无"双亲",而"病房"集合有P个结点(即病房),并有一个以上的"双亲"(即病人)。

图2066 医生、病房和病人之间的关系

图2067 网状结构模型

按照网状数据结构建立的数据库系统称为网状数据库系统,其典型代表是DBTG(Data Base Task Group)。用数学方法可将网状数据结构转化为层次数据结构。

(3)关系结构模型

关系式数据结构把一些复杂的数据结构归结为简单的二元关系(即二维表格形式)。例如某单位的职工关系就是一个二元关系(见表2068)。这个四行六列的表格的每一列称为一个字段(即属性),字段名相当于标题栏中的标题(属性名称);表的每一行是包含了六个属性(工号、姓名、年龄、性别、职务、工资)的一个六元组,即一个人的记录。这个表格清晰地反映出该单位职工的基本情况。

表2068 职工基本情况

通常一个m行、n列的二维表格的结构如表2069所示。

表中每一行表示一个记录值,每一列表示一个属性(即字段或数据项)。该表一共有m个记录。每个记录包含n个属性。

作为一个关系的二维表,必须满足以下条件:

(1)表中每一列必须是基本数据项(即不可再分解)。(2)表中每一列必须具有相同的数据类型(例如字符型或数值型)。(3)表中每一列的名字必须是唯一的。(4)表中不应有内容完全相同的行。(5)行的顺序与列的顺序不影响表格中所表示的信息的含义。

由关系数据结构组成的数据库系统被称为关系数据库系统。

在关系数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些关系表格的分类、合并、连接或选取等运算来实现数据的管理。dBASEII就是这类数据库管理系统的典型代表。对于一个实际的应用问题(如人事管理问题),有时需要多个关系才能实现。用dBASEII建立起来的一个关系称为一个数据库(或称数据库文件),而把对应多个关系建立起来的多个数据库称为数据库系统。dBASEII的另一个重要功能是通过建立命令文件来实现对数据库的使用和管理,对于一个数据库系统相应的命令序列文件,称为该数据库的应用系统。因此,可以概括地说,一个关系称为一个数据库,若干个数据库可以构成一个数据库系统。数据库系统可以派生出各种不同类型的辅助文件和建立它的应用系统。

· 数据库的要求与特性

为了使各种类型的数据库系统能够充分发挥它们的优越性,必须对数据库管理系统的使用提出一些明确的要求。

1建立数据库文件的要求

(1)尽量减少数据的重复,使数据具有最小的冗余度。计算机早期应用中的文件管理系统,由于数据文件是用户各自建立的,几个用户即使有许多相同的数据也得放在各自的文件中,因而造成存储的数据大量重复,浪费存储空间。数据库技术正是为了克服这一缺点而出现的,所以在组织数据的存储时应避免出现冗余。

(2)提高数据的利用率,使众多用户都能共享数据资源。

(3)注意保持数据的完整性。这对某些需要历史数据来进行预测、决策的部门(如统计局、银行等)特别重要。

(4)注意同一数据描述方法的一致性,使数据操作不致发生混乱。如一个人的学历在人事档案中是大学毕业,而在科技档案中却是大学程度,这样就容易造成混乱。

(5)对于某些需要保密的数据,必须增设保密措施。

(6)数据的查找率高,根据需要数据应能被及时维护。

2数据库文件的特征

无论使用哪一种数据库管理系统,由它们所建立的数据库文件都可以看成是具有相同性质的记录的集合,因而这些数据库文件都有相同的特性:

(1)文件的记录格式相同,长度相等。

(2)不同的行是不同的记录,因而具有不同的内容。

(3)不同的列表示不同的字段名,同一列中的数据的性质(属性)相同。

(4)每一行各列的内容是不能分割的,但行的顺序和列的顺序不影响文件内容的表达。

3文件的分类

对文件引用最多的是主文件和事物文件。其他的文件分类还包括表文件、备份文件、档案的输出文件等。下面将讲述这些文件。

(1)主文件。主文件是某特定应用领域的永久性的数据资源。主文件包含那些被定期存取以提供信息和经常更新以反映最新状态的记录。典型的主文件有库存文件、职工主文件和收帐主文件等。

(2)事务文件。事务文件包含着作为一个信息系统的数据活动(事务)的那些记录。这些事务被分批以构成事务文件。例如,从每周工资卡上录制下来的数分批存放在一个事务文件上,然后对照工资清单文件进行处理以便打印出工资支票和工资记录簿。

(3)表文件。表文件是一些表格。之所以单独建立表文件而不把表设计在程序中是为了便于修改。例如,一个公用事业公司的税率表或国内税务局的税率就可以存储在表中文件。

(4)备用文件。备用文件是现有生产性文件的一个复制品。一旦生产性文件受到破坏,利用备用文件就可以重新建立生产性文件。

(5)档案文件。档案文件不是提供当前处理使用的,而是保存起来作为历史参照的。例如,国内税务局(IRS)可能要求检查某个人最近15年的历史。实际上,档案文件恰恰是在给定时间内工作的一个"快照"。

(6)输出文件。输出文件包含将要打印在打印机上的、显在屏幕上的或者绘制在绘图仪上的那些信息的数值映象。输出文件可以是"假脱机的"(存储在辅存设备上),当输出设备可用时才进行实际的输出。

数据仓库

1

数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合

数据仓库,英文名称为Data Warehouse,可简写为DW。

数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

◆面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。

◆集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

◆相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

◆反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

数据仓库是一个过程而不是一个项目。

数据仓库系统是一个信息提供平台,他从业务处理系统获得数据,主要以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中获取信息和知识。

从功能结构化分,数据仓库系统至少应该包含数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三个关键部分。

什么是数据仓库

(转载自北大高科网站,http://wwwpku-htcom/)

目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家WHInmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

根据数据仓库概念的含义,数据仓库拥有以下四个特点:

1、面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。

2、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

3、相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

4、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。

整个数据仓库系统是一个包含四个层次的体系结构,具体由下图表示。

数据仓库系统体系结构

·数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等等;

·数据的存储与管理:是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)。

·OLAP服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为:ROLAP、MOLAP和HOLAP。ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。

·前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以数据挖掘及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。

目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家WHInmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。多维

数据仓库的组成

数据仓库数据库

是整个数据仓库环境的核心,是数据存放的地方和提供对数据检索的支持。相对于操纵型数据库来说其突出的特点是对海量数据的支持和快速的检索技术。

数据抽取工具

把数据从各种各样的存储方式中拿出来,进行必要的转化、整理,再存放到数据仓库内。对各种不同数据存储方式的访问能力是数据抽取工具的关键,应能生成COBOL程序、MVS作业控制语言(JCL)、UNIX脚本、和SQL语句等,以访问不同的数据。数据转换都包括,删除对决策应用没有意义的数据段;转换到统一的数据名称和定义;计算统计和衍生数据;给缺值数据赋给缺省值;把不同的数据定义方式统一。

元数据

元数据是描述数据仓库内数据的结构和建立方法的数据。可将其按用途的不同分为两类,技术元数据和商业元数据。

技术元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库是用的数据。包括:数据源信息;数据转换的描述;数据仓库内对象和数据结构的定义;数据清理和数据更新时用的规则;源数据到目的数据的映射;用户访问权限,数据备份历史记录,数据导入历史记录,信息发布历史记录等。

商业元数据从商业业务的角度描述了数据仓库中的数据。包括:业务主题的描述,包含的数据、查询、报表;

元数据为访问数据仓库提供了一个信息目录(informationdirectory),这个目录全面描述了数据仓库中都有什么数据、这些数据怎么得到的、和怎么访问这些数据。是数据仓库运行和维护的中心,数据仓库服务器利用他来存贮和更新数据,用户通过他来了解和访问数据。

访问工具

为用户访问数据仓库提供手段。有数据查询和报表工具;应用开发工具;管理信息系统(EIS)工具;在线分析(OLAP)工具;数据挖掘工具。

数据集市(DataMarts)

为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据(subjectarea)。在数据仓库的实施过程中往往可以从一个部门的数据集市着手,以后再用几个数据集市组成一个完整的数据仓库。需要注意的就是再实施不同的数据集市时,同一含义的字段定义一定要相容,这样再以后实施数据仓库时才不会造成大麻烦。

数据仓库管理:安全和特权管理;跟踪数据的更新;数据质量检查;管理和更新元数据;审计和报告数据仓库的使用和状态;删除数据;复制、分割和分发数据;备份和恢复;存储管理。

信息发布系统:把数据仓库中的数据或其他相关的数据发送给不同的地点或用户。基于Web的信息发布系统是对付多用户访问的最有效方法。

设计数据仓库的九个步骤

1)选择合适的主题(所要解决问题的领域)

2)明确定义fact表

3)确定和确认维

4)choosingthefacts

5)计算并存储fact表中的衍生数据段

6)roundingoutthedimensiontables

7)choosingthedurationofthedatabase

8)theneedtotrackslowlychangingdimensions

9)确定查询优先级和查询模式。

技术上

硬件平台:数据仓库的硬盘容量通常要是操作数据库硬盘容量的2-3倍。通常大型机具有更可靠的性能和和稳定性,也容易与历史遗留的系统结合在一起;而PC服务器或UNIX服务器更加灵活,容易操作和提供动态生成查询请求进行查询的能力。选择硬件平台时要考虑的问题:是否提供并行的I/O吞吐?对多CPU的支持能力如何?

数据仓库DBMS:他的存储大数据量的能力、查询的性能、和对并行处理的支持如何。

网络结构:数据仓库的实施在那部分网络段上会产生大量的数据通信,需不需要对网络结构进行改进。

实现上

建立数据仓库的步骤

1)收集和分析业务需求

2)建立数据模型和数据仓库的物理设计

3)定义数据源

4)选择数据仓库技术和平台

5)从操作型数据库中抽取、净化、和转换数据到数据仓库

6)选择访问和报表工具

7)选择数据库连接软件

8)选择数据分析和数据展示软件

9)更新数据仓库

数据抽取、清理、转换、和移植

1)数据转换工具要能从各种不同的数据源中读取数据。

2)支持平面文件、索引文件、和legacyDBMS。

3)能以不同类型数据源为输入整合数据。

4)具有规范的数据访问接口

5)最好具有从数据字典中读取数据的能力

6)工具生成的代码必须是在开发环境中可维护的

7)能只抽取满足指定条件的数据,和源数据的指定部分

8)能在抽取中进行数据类型转换和字符集转换

9)能在抽取的过程中计算生成衍生字段

10)能让数据仓库管理系统自动调用以定期进行数据抽取工作,或能将结果生成平面文件

11)必须对软件供应商的生命力和产品支持能力进行仔细评估

主要数据抽取工具供应商:PrismsolutionsCarleton'sPASSPORTInformationBuildersInc's

EDA/SQLSASInstituteInc

1[单选题]某异地开发的信息系统集成项目以程序流程图、数据流程图等为主要分析设计工具。由于用户身处异地,现场参与系统开发成本较高,因此项目组采用了先开发一个简化系统,待用户认可后再开发最终系统的策略。该信息系统集成项目的开发方法属于____。

 A结构化方法与原型法的组合应用

 B结构化方法与面向对象方法的组合应用

 C原型法与面向对象方法的组合应用

 D原型法与形式化方法的组合应用

 参考答案:A

 2[单选题]关于电子标签(RFID)与条形码(barCode)标签的叙述;正确的是__________ 。

 A电子标签建置成本低

 B条形码标签容量小,但难以被复制

 C电子标签容量大,可同时读取多个标签并且难以被复制

 D电子标签通信距离短,但对环境变化有较高的忍受能力

 参考答案:C

 1[单选题] 以下关于数据仓库的描述中,正确的是__________。

 A从结构的角度看,数据仓库主要有数据挖掘、数据集市和企业仓库3种模型

 B数据挖掘就是要智能化和自动化地把数据转换为有用的信息和知识

 C联系分析处理(OLAP)技术绕过DBMS直接对物理数据进行读写以提高处理效率

 D数据仓库是从数据库中导入大量的数据,并对结构和存储进行组织以提高查询效率

 参考答案:B

 要点解析:从结构的角度看,数据仓库主要有企业仓库、数据集市和虚拟仓库等3种模型。其中,企业仓库用于收集跨越整个企业的各个主题的所有信息,它提供整个企业范围的数据集成。而数据集是包含对特定的用户有用的、企业范围数据的一个子集,其范围限于所选定的主题。虚拟仓库是操作型数据库上视图的集合。因此选项A的描述是错误的。

 数据挖掘就是要智能化和自动化地把数据转换为有用的信息和知识。目前,常用的数据挖掘方法有关联分析、序列模式分析、分类分析和聚类分析等。由此可见,选项B的描述是正确的。 OLAP(On—line analytical processing)是联系分析处理的英文缩写。它仍使用DBMS存取数据,即选项C的描述是错误的。

 数据仓库不是用做日常查询,也不是汇总和统计,它主要用于提取数据中的潜在信息和知识。因此选项D的描述是错误的。

 2[单选题] 企业信息资源管理(IRM)不是把资源整合起来就行了,而是需要一个有效的信息资源管理体系,其中最为关键的是__________。

 A准确地把握用户需求B从事信息资源管理的人才队伍建设C信息资源的标准和规范D有效、强大的市场分析

 参考答案:B

 要点解析:企业信息资源管理不是把资源整合起来就行了,而是需要一个有效的信息资源管理体系,其中最为关键的是从事信息资源管理的人才队伍建设。其次是架构问题;再次是环境要素,主要是标准和规范,信息资源管理最核心的基础问题就是信息资源的标准和规范。在信息资源建设阶段,规划是以建设进程为主线,在信息资源管理阶段,规划应是以架构为主线,主要涉及的是这个信息化运营体系的架构,这个架构要消除以往分散建设所导致的信息孤岛,实现大范围内的信息共享、交换和使用,提升系统效率,达到信息资源的增值。

 3[单选题]某招标公司在为委托方的项目进行公开招标的过程如下: ①3月 15日在互联网上公开了招标事项,写明投标的截止日期是4月 1日上午 9时整 ②从本地公证处请了 2名工作人员对招标过程进行公证 ③邀请相关行业的专家和委托方代表各 5人成立评审委员会 ④唱标结束后,请所有投标人离场,待评审委员会得出结论后再通知相关人员 ⑤确定中标单位后,立即向所有参加投标的企业退还投标保证金 上述过程中不正确的包括 __(43)__。

 A①③⑤B①②③C①②④D②③⑤

 参考答案:A

 4[单选题] 某招标公司在为委托方的项目进行公开招标的过程如下:

 ①3月15日在互联网上公开了招标事项,写明投标的截止日期是4月1日上午9时整;

 ②从本地公证处请了2名工作人员对招标过程进行公证;

 ③邀请相关行业的专家和委托方代表各5人成立评审委员会;

 ④唱标结束后,请所有投标人离场,待评审委员会得出结论后再通知相关人员;

 ⑤确定中标单位后,立即向所有参加投标的企业退还投标保证金。

 上述过程中不正确的包括__________ 。

 A①③⑤B①②③C①②④D②③⑤

 参考答案:A

 要点解析:根据我国《招标投标法》第十五条条文规定:“招标代公理机构应当在招标人委托的范围内办理招标事宜,并遵守本法关于招标人的规定。”

 《招标投标法》第二十四条条文规定:“招标人应当确定投标人编制投标文件所需要的合理时间;但是,依法必须进行招标的项目,自招标文件开始发出之日起至投标提交投标文件截止之日止,最短不得少于20曰。”据此,若3月15日在互联网上公开招标事项,则该项目的投标截止日期应不早于4月3日下午17时整。因此将“①……写明投标的截止曰期是4月1日上午9时整”的做法有误。

 《招标投标法》第三十六条条文规定:“开标时,由投标人或者其推选的代表检查投标文件的密封情况,也可以由招标人委托的公证机构检查并公证;……”据此,“②从本地公证处请了2名工作人员对招标过程进行公证”的做法是可行的。

 《招标投标法》第三十七条条文规定:“评标由招标人依法组建的评标委员会负责。依法必须进行招标的项目,其评标委员会由招标人的代表和有关技术、经济等方面的专家组成,成员人数为5 人以上单数,其中技术、经济等方面的专家不得少于成员总数的2/3。……”据此,“③邀请相关行业的专家和委托方代表各5人成立评审委员会”的做法有误。因为该评审委员会总人数为10人,为偶数而非奇数;并且委托方代表占总人数的50%,超过了1/3。

 《招标投标法》第三十八条条文规定:“招标人应当采取必要的措施,保证评标在严格保密的情况下进行。任何单位和个人不得非法干预、影响评标的过程和结果。”据此,“④唱标结束后,请所有投标人离场,待评审委员会得出结论后再通知相关人员”的做法是可行的。

 “确定了中标单位”仅是招标投标过程中一个关键性的事件,它并意味着整个招标投标过程进入了收尾阶段。《招标投标法》第四十五条条文规定:“中标人确定后,招标人应当向中标人发出中标通知书,并同时将中标结果通知所有未中标的投标人。……”《招标投标法》第四十六条条文规定:“招标人和中标人应当自中标通知书发出之日起30曰内,按照招标文件和中标人的投标文件订立书面合同。……”很有可能出现的一种情况是:中标人虽然接收到了中标通知书,但是由于种种原因而不履行与招标人订立的合同。若确定中标单位后就立即向中标单位退还投标保证金,则在后期中标单位不履约的情况下就缺少了最直接的经济制裁手段。据此第⑤点的做法不妥,至少不能退还中标单位的投标保证金。通常,对于未中标的投标保证金,应当在发出中标通知书后一定时间内,尽快退还给相关投标人。

 5[单选题]某企业在招标时,首先通过某种资格审查选择部分供应商,并以邮件问询的方式确定它们是否有兴趣参与竞标,然后将采购文件包发给所有有兴趣的供应商,并对供应商反馈的投标文件进行评估,最终将中标消息通知给中标的供应商。以下关于本次招标过程的判断,正确的是 ____。

 A项目招标之前该企业不应当事先进行资格筛选

 B意见征询不应通过邮件的方式进行

 C中标结果不应仅凭评估分数确定

 D在选定供应商后,招标结果不应只反馈给中标供应商

 参考答案:D

 6[单选题] 某企业在招标时,首先通过某种资格审查选择部分供应商,并以邮件问询的方式确定它们是否有兴趣参与竞标,然后将采购文件包发给所有有兴趣的供应商,并对供应商反馈的投标文件进行评估,最终将中标消息通知给中标的供应商。以下关于本次招标过程的判断,正确的是__________ 。

 A项目招标之前该企业不应当事先进行资格筛选

 B意见征询不应通过邮件的方式进行

 C中标结果不应仅凭评估分数确定

 D在选定供应商后,招标结果不应只反馈给中标供应商

 参考答案:D

 要点解析:根据我国《招标投标法》第十条条文规定:“招标分为公开招标和邀请招标。公开招标,是指招标人以招标公告的方式邀请不特定的法人或者其他组织投标。邀请招标,是指招标人以投标邀请书的方式邀请特定的法人或者其他组织投标。”

 《招标投标法》第十六条条文规定:“招标人采用公开招标方式的,应当发布招标公告。依法必须进行招标的项目的招标公告,应当通过国家指定的报刊、信息网络或者其他媒介发布。”而“邮件”属于“其他媒介”之一,因此意见征询可以通过邮件的方式进行。因此,选项8的观点有误。

 《招标投标法》第十八条条文规定:“招标人可以根据招标项目本身的要求,在招标公告或者投标邀请书中,要求潜在投标人提供有关资质证明文件和业绩情况,并对潜在投标人进行资格审查;国家对投标人的资格条件有规定的,依照其规定。……”据此,选项A的观点有误。

 《招标投标法》第四十条条文规定:“评标委员会应当按照招标文件确定的评标标准和方法,对投标文件进行评审和比较;设有标底的,应当参考标底。评标委员会完成评标后,应当向招标人提出书面评标报告,并推荐合格的中标候选人。”

 通常,建设方在招标过程中会制定一个招标评分标准,用于对所有合格的投标文件进行商务、技术指标/性能等方面进行量化评分,以保证中标结果较为公平、公正。因此,选项C的观点有误。

 《招标投标法》第四十五条条文规定:“中标人确定后,招标人应当向中标人发出中标通知书,并同时将中标结果通知所有未中标的投标人。……’’据此,选项D的观点正确,即应该将中标消息通知曾发送过采购文件包的所有供应商。

 7[单选题]某系统集成项目组需要在Windows 2008 Server操作系统平台上应用c++语言编写相应的应用构件。该项目组宜选用__________作为构件标准。

 AEJBBCOM+CCORBADODBC

 参考答案:B

 要点解析:组件对象模型(COM)是个开放的组件标准,有很强的扩充和扩展能力。 COM将组件的概念融入到Windows应用中。COM+可以将它理解为COM的新发展,或者为:oM更高层次上的应用。它的底层结构仍然以COM为基础,几乎包容了COM的所有内容。COM+倡导了一种新的概念,它将COM组件软件提升到应用层而不再是底层的软件结构,通过操作孬统的各种支持,使组件对象模型建立在应用层上,把所有组件的底层细节留给操作系统。依题意,若某项目组需要在Windows操作系统平台上用C++语言编写应用构件,则该项目组宜选用cOM+作为构件标准。

 EJB用于封装业务,而业务可分为业务实体和业务过程。在J2EE模型当中,中间层的业务功能通过EJB构件实现,使用JSP实现业务逻辑处理结果的动态发布,构成动态的HTML页面,中问层也可以使用Servlet实现更为灵活的动态页面。

 CORBA(公共对象请求代理架构)是由对象管理组织(OMG)制订的一种标准的面向对象的应用程序体系规范。CORBA架构是OMG为解决分布式处理环境(DCE)中硬件和软件系绩的互连而提出的一种解决方案。

 开放数据库互连(Open Database Connectivity,ODBC)是微软公司提出的数据库访问接口标准。它定义了访问数据库的API(应用程序编程接口)一个规范。数据库访问中间件通过一个抽象层访问数据库,从而允许使用相同或相似的代码访问不同的数据库资源。其典型的技术有Windows平台的ODBC和Java平台的JDBC等。

 8[单选题] 通常,软件开发过程包括需求分析、概要设计、详细设计、编码、测试、运行维护等阶段。待开发软件的顶层结构设计一般在__________中完成

 A需求分析阶段B概要设计阶段C详细设计阶段D代码编写阶段

 参考答案:B

 要点解析:软件开发过程可划分为若干子过程,每个子过程有明确的任务。 需求分析子过程需确定软件的功能、性能、数据和界面等要求。

 概要设计子过程中开发人员要把确定的各项功能需求转换为需要的体系结构,主要任务包括总体结构设计(也称为顶层设计)、数据结构及数据库设计、编写概要设计文档、评审(包括是否实现了需求分析中规定的功能、性能等要求,设计方法的可行性,各部分之间的一致性等)。其中,总体结构设计的基本任务是采用某种设计方法,将一个复杂的软件系统划分成模块;确定每个模块的功能;确定模块之间的协调关系;确定模块之间的接[51;评价模块结构的质量。

 详细设计子过程的主要任务是对每个模块完成的功能进行具体描述,要把功能描述转变为精确的、结构化的过程描述。

 编写代码子过程就是将每个模块的控制结构转换为计算机可接受的程序代码,即写成某种特定程序设计语言表示的源程序清单。

 9[单选题] 在软件开发项目中,关键路径是项目事件网络中__________ ,组成关键路径的活动称为关键活动。

 A最长的回路B最短的回路C源点和汇点间的最长路径D源点和汇点间的最短路径

 参考答案:C

 10[单选题] 某大学校园网对校内提供多媒体课件服务和视频点播(VOD)服务,对外提供Web服务,同时进行网络流量监控。通常,__________接收的数据流量。

 A多媒体课件服务器BVOD服务器CWeb服务器D网络流量监控服务器

 参考答案:D

 要点解析:依题意,通常视频点播(VOD)服务器发出的数据流量,而网络流量监控服务器接收到的数据流量。

  11[单选题]螺旋模型的开发过程具有周期性重复的螺旋线状,每个开发周期由4个象限组成,分别标志着开发周期的4个阶段。螺旋模型之所以特别适用于庞大而复杂的、高风险的系统开发,是因为它强调其中的__(2)__阶段。

 A制定计划B风险分析C实施工程D客户评估

 参考答案:B

 12[单选题]信息系统的生命周期大致可分成4个阶段,即系统规划阶段、系统开发阶段、系统运行与维护阶段、系统更新阶段。系统调查和可行性研究、系统逻辑模型的建立、系统设计、系统实施和系统评价等工作属于__________。

 A系统规划阶段B系统开发阶段C系统运行与维护阶段D系统更新阶段

 参考答案:B

 要点解析:信息系统的生命周期大致可分成4个阶段,即系统规划阶段、系统开发阶段、系统运行与维护阶段、系统更新阶段。每个阶段都有明确的任务,任务完成后都将交付给下一阶段一定规格的文档,作为下一阶段开发的依据。

 总体规划时信息系统生命周期的第一阶段,是系统开发过程的第一步。总体规划阶段的主要目标就是制定信息系统的长期发展方案,决定信息系统在整个生命周期内的发展方向、规模和发展进程。一个比较完整的总体规划应当包括信息系统的开发目标、总体架构、组织结构和管理流程、实施计划、技术规范等。这个阶段的主要认识是:①制订信息系统的发展战,以使信息系统的战与整个组织的战和目标协调一致;②确定组织的主要信息需求,形成信息系统的总体结构方案,安排项目开发计划;③制订系统建设的资源分配计划,即指定为实现开发计划而需要的硬件资源、软件资源、数据通信设备、人员、技术、服务和资金等计划,提出整个系统的建设概算。

 系统开发阶段通常包括系统调查和可行性研究、系统逻辑模型的建立、系统设计、系统实施和系统评价等工作。

 在开发的前期进行各项调查的目的是明确系统的开发目标和规模,它是对系统进行可行性研究的基础。可行性分析是在进行初步调查后所进行的对系统开发必要性和可能性的研究,通常可从技术可行性、经济可行性和社会可行性3方面来论证。

 13[单选题]某大型软件公司早期开发的××管理信息系统已被广泛使用。该公司为了获得更多的收益,已对外公布近期将有创新性的软件版本上市。面对这紧迫的开发期限,项目组最可能选择__________过程开发模型。

 A瀑布B快速原型C螺旋D增量

 参考答案:D

 要点解析:该管理信息系统(旧版本)已被广泛使用,创新性软件版本将在“近期”上市。项目开发团队面临着“紧迫的开发期限”、创新或技术上突破等问题,因此建议该项目开发团队选择增量过程开发模型。因为项目开发时间要求太紧,有可能完成不了所有的创新性功能,但该新版本管理信息系统软件是基于旧版本改进开发的,而非“全面推倒重来”。

 14[单选题] 以下关于电子商务的描述中,错误的是__________。

 A电子商务的核心问题是“数据信息”,信息流是电子商务系统最基本的、必不可少的

 B电子商务项目不仅仅是技术革新项目,而是一个管理变革项目

 C利用电子商务系统向消费者在线销售产品,已经超越了传统的零售方式

 D加快建立我国电子商务支撑体系的内容包括:政策法规体系、信用体系、安全认证体系、在线支付体系、现代物流体系、标准规范体系等

 参考答案:C

 要点解析:电子商务的过程与传统商务的过程是一致的,包括识别商品、选择、协商、购买、递送、售后服务等过程,这些过程有些可以电子化,有些不能(如递送、售后服务等、,因此利用电子商务系统向消费者在线销售产品,并没有超越传统的零售方式。

 电子商务的核心问题是“数据信息”。在电子商务系统所涉及的四种“流”(信息流、资金流、商流和物流)中,信息流是最基本的、必不可少的。

 从根本意义上说,电子商务项目的实施不仅仅是一个软件工程和网络工程项目等,也不仅仅是技术革新项目,而是一个管理变革项目,它需要工作人员观念的转变、业务流程的优化和再造等。 《国务院办公厅关于加快电子商务发展的若干意见》(国办发(2005)2号)文件中指出,应加快建立我国电子商务支撑体系的内容包括:政策法规体系、信用体系、安全认证体系、在线支付体系、现代物流体系、标准规范体系等。

 15[单选题]2011年3月全国两会召开期间发布的《中华人民共和国国民经济和社会发展第十二个五年规划纲要》有如下内容:“推动物联网关键技术研发和重点领域的应用示范”。从技术架构上看,物联网可分为三层:感知层、网络层和应用层。其中网络层可包括____。

 A各种传感器以及传感器网关,包括二氧化碳浓度传感器、温度传感器、湿度传感器、二维码标签、RFID标签和读写器、摄像头、GPS等

 B互联网,有线、无线通信网,各种私有网络,网络管理系统和云计算平台等

 C用户(人、组织和其他系统)的接口

 D网络应用程序

 参考答案:B

 16[单选题]在下列应用场景中,属于SaaS(软件即服务)模式的是____。

 A供应商通过Internet提供软件,消费者从供应商处租用基于Web的软件来管理企业经营活动

 B供应商开拓新的IT基础设施业务,消费者通过Internet从计算机基础设施获得服务

 C消费者从供应商处购买软件的License

 D消费者从互联网下载和使用免费软件

 参考答案:A

 参考解析:SaaS是Software-as-a-service(软件即服务)。SaaS在业内的叫法是软件运营,或称软营。是一种基于互联网提供软件服务的应用模式。一种随着互联网技术的发展和应用软件的成熟,在21世纪开始兴起的完全创新的软件应用模式,是软件科技发展的趋势。 它是一种通过Internet提供软件的模式,厂商将应用软件统一部署在自己的服务器上,客户可以根据自己实际需求,通过互联网向厂商定购所需的应用软件服务,按定购的服务多少和时间长短向厂商支付费用,并通过互联网获得厂商提供的服务。用户不用再购买软件,而改用向提供商租用基于Web的软件,来管理企业经营活动,且无需对软件进行维护,服务提供商会全权管理和维护软件,软件厂商在向客户提供互联网应用的同时,也提供软件的离线操作和本地数据存储,让用户随时随地都可以使用其定购的软件和服务。对于许多小型企业来说,SaaS是采用先进技术的途径,它消除了企业购买、构建和维护基础设施和应用程序的需要。

 7[单选题] 在下列应用场景中,属于SaaS(软件即服务)模式的是__________ 。

 A供应商通过Internet提供软件,消费者从供应商处租用基于Web的软件来管理企业经营活动

 B供应商开拓新的IT基础设施业务,消费者通过Intemet从计算机基础设施获得服务

 C消费者从供应商处购买软件的License

 D消费者从互联网下载和使用免费软件

 参考答案:A

 要点解析:云计算有SaaS、PaaS和IaaS三大服务模式。其中,SaaS(软件即服务) 是一种通过互联网提供软件服务的模式,在该模式中企业用户不用再购买软件,而采用向软件服务

 提供商租用软件的方式来完成本企业经营活动。在这种模式下,企业(或其他消费者)无须建设机房、购买软硬件、雇用IT运维人员,只需向软件服务提供商支付项目实施费和定期的软件租赁服务费,软件服务提供商负责管理和维护软件。据此,选项A中供应商提供的是运行在云计算基础设施上的应用程序,消费者可以在各种设备上通过瘦客户端界面(如浏览器)访问,消费者不需要管理(或控制)任何云计算基础设施(包括网络、服务器、操作系统、存储等),因此它属于SaaS 模式。

 PaaS(平台即服务)是指将软件研发的平台作为一种服务,以SaaS的模式提交给用户。它提供给消费者的服务是将客户采用的开发语言和工具(如Java、C++、python、NET等)开发的(或收购的)应用程序部署到供应商的云计算基础设施上去。消费者不需要管理(或控制)底层的云基础设施,包括网络、服务器、操作系统、存储等,但是客户可以控制部署的应用程序,也可以控制运行应用程序的托管环境配置。

 Iaas(基础设施即服务)提供给消费者的服务是对所有基础设施的利用,包括处理器、存储、网络和其他基本的计算资源,用户能够部署和运行任意软件,包括操作系统和应用程序。消费者不管理(或控制)任何云计算基础设施,但能控制操作系统的选择、存储空间、部署的应用,也有可能获得有限制的网络组件(如防火墙、负载均衡器等)的控制。

 18[单选题]团购是当前一种较为流行的电子商务模式,某团购网站通过自己强大的公关能力与企业合作,向用户提供价格较为低廉或折扣较高的产品,同时,为方便用户使用,该团购网站也提供了用户之间的转让平台。根据上述描述,该团购网站涉及的电子商务类型是____。

 AB2B和 B2CBB2C和 C2CCB2B和 C2CDB2B、B2C和 C2C

 参考答案:B

 19[单选题]信息标准化是解决信息孤岛的重要途径你,也是不同的管理信息系统之间数据交换和互操作的基础。作为信息化标准的一项关键技术,目前流行的____以开放的自我描述方式定义了数据结构,在描述数据内容的同时能突出对结构的描述,从而体现出数据之间的关系。这样组织的数据对于应用程序和用户都是友好的、可操作的。

 A可扩展标记语言(XML)B超文本标记语言(HTML)C通用标记语言(GML)DWeb服务描述语言(WSDL)

 参考答案:A

 20[单选题]一般来说,可复用的构件相对于在单一应用中使用的模块具有较高的质量保证,其主要原因是____。

 A可复用的构件在不断复用过程中,其中的错误和缺陷会被陆续发现,并得到及时排除

 B可复用的构件首先得到测试

 C可复用的构件一般规模较小

 D第三方的构件开发商能提供更好的软件维护服务

 参考答案:A

当前业界常见的服务器性能指标有:

TPC-C

TPC-E

TPC-H

SPECjbb2005

SPECjEnterprise2010

SPECint2006 及 SPECint_rate_2006

SPECfp2006 及 SPECfp_rate_2006

SAP SD 2-Tier

LINPACK

RPE2

一、TPC (Transaction Processing Performance Council) 即联机交易处理性能协会, 成立于1988年的非盈利组织,各主要软硬件供应商均参与,成立目标: 为业界提供可信的数据库及交易处理基准测试结果,当前发 布主要基准测试为:

TPC-C : 数据库在线查询(OLTP)交易性能

TPC-E : 数据库在线查询(OLTP)交易性能

TPC-H : 商业智能 / 数据仓库 / 在线分析(OLAP)交易性能

1TPC-C测试内容:数据库事务处理测试, 模拟一个批发商的订单管理系统。实际衡量服务器及数据库软件处理在线查询交易处理(OLTP)的性能表现 正规 TPC-C 测试结果发布必须提供 tpmC值, 即每分钟完成多少笔 TPC-C 数据库交易 (TPC-C Transaction Per Minute), 同时要提供性价比$/tpmC。如果把 TPC-C 测试结果写成为 tpm, TPM, TPMC, TPCC 均不属正规。

2TPC-E测试内容:数据库事务处理测试,模拟一个证券交易系统。与TPC-C一样,实际衡量服务器及数据库软件处理在线查询交易处理(OLTP)的性能表现。正规TPC-E测试结果必须提供tpsE值,即每秒钟完成多少笔TPC-E数据库交易(transaction per second),同时提供$/tpsE。测试结果写成其他形式均不属正规。

对比:TPC-E测试较TPC-C测试,在测试模型搭建上增加了应用服务器层,同时增加了数据库结构的复杂性,测试成本相对降低。截止目前,TPC-E的测试结果仅公布有50种左右,且测试环境均为PC服务器和windows操作系统,并无power服务器的测试结果。除此之外,TPC官方组织并未声明TPC-E取代TPC-C,所以,说TPC-E取代TPC-C并没有根据。

答案:C

数据仓库包括数据源、数据的存储与管理、OLAP 服务器与各种报表工具、查询工具、数据分析工具、数据挖掘工具及各种基于数据仓库或数据集市的应用开发工具。OLTP是传统的关系型数据库联机事务处理过程。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 数据仓库与数据库有什么联系

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情