1
概述
信息化的最大效益来自信息的最广泛共享、最快捷的流通和对信息进行深层次的挖掘。因此,信息化建设中的根本性问题,不是通信网络、计算机选型、建设网站等问题,而是如何将分散、孤立的各类信息变成网络化的信息资源,将众多“孤岛式”的信息系统进行整合,实现信息的快捷流通和共享。信息资源是企业最重要的资源之一,开发信息资源既是企业信息化的出发点,又是企业信息化的归宿。在信息化建设过程中,建设高质量的数据体系,是开发企业信息资源、建立全面支持企业信息化运行的IT资源平台的基本工作。数据体系的设计目标是规范、标准、可控、支持高效数据处理和深层数据分析的数据结构以及稳定、统一的数据应用体系及管理架构。
2 整合的数据环境
在软环境、硬环境全面提升的现代应用信息系统中,数据环境居于核心地位。信息工程方法论的奠基人James
Martin指出,数据位于现代数据处理系统的中心,应用是多变的,数据则是稳定的;中国系统工程学会信息系统工程专业委员会副主任高复先教授进一步指出,企业要实现信息化建设的跨越式发展,必须进行数据管理标准化的工作。可以看出,信息组织技术中的数据管理标准化、实体关系分析和数据结构规范化技术等等是非常重要的,其中含有的一些基本原理和规则,并不因为其他信息技术的发展而改变。对于企事业单位的信息化来说,必须要进行数据标准化、建立信息资源管理基础标准以解决“信息孤岛”问题。
数据组织的混乱状况将造成系统投资的极大浪费,而且使信息化建设无法跨上新台阶。缺乏标准化、分散建立的数据结构将导致大量复杂、混乱、不可控制的数据接口。举例说来,若是在未进行数据标准化的情况下开发了一个工资管理系统,职工张华在这个系统中的代号是0104。随后又另行开发了人事系统,因为是分别独立开发,张华在人事系统中的代号是1122。在接下去开发的社保系统中,张华也是用不同的代号。集成的时候发现了麻烦,弥补的办法是建立代号对照接口,而4个应用系统至少需要12个接口。如果应用系统变成了8个、16个,接口的数目会成指数增长,系统会因此变得复杂无比,甚至根本就没法运行
此类缺乏规划或规划失误的事情在现实中数不胜数。许多企业辛辛苦苦开发的MIS系统,只因为当初没有建立信息的基础标准,等到想再上一个台阶时,所有的业务清单和业务明细表的代码都得重新制订,积累多年的应用系统得推倒重来。只有建立标准化、集成化的数据结构,才能克服这种“接口”的桎梏。
目前,大多数企事业单位信息技术应用无论从深度还是广度上来说都处于相对低的阶段,在信息资源规划和数据体系建设方面则几乎是空白。另一方面,信息化建设战略要求在今后的几年中较快地建立起支撑企业信息化运转的数据整合平台。在这一过程中,数据体系的设计工作更具有不容低估的基础性作用。
结合单位的现实状况,数据体系设计工作的实质,是运用信息组织技术对以往结构不合理、冗余、混乱、分散或是未能收集整理利用的数据进行规范化的重组织工作,从而尽可能地减少数据接口,实现基于高档次数据环境的系统集成。可以说,数据体系建设工作的根本任务,是在整个单位范围内建立统一的、稳定的和规范的数据模型。
在标准化的基础上,可以形成基于主题的高水平数据应用环境。在这样的数据环境中,数据是面向业务主题的,而不是面向单证报表的;信息是共享的,而不是信息私有或部门所有的;一项数据一次一处输入系统,而不是多次多处输入系统。
同时,数据体系的建设也是实现信息平台与外部系统对接的必然要求。因此,数据标准化工作将充分参考单位已有的外部系统数据标准。
3 数据部署
数据部署是信息系统体系结构中一个至关重要的层面。良好的数据部署体系将为强大、灵活的信息系统应用提供基础性的依托平台。一般情况下,需要建立一个集中的高性能中心数据库,使用存储网络等先进存储技术统一维护企业数据,在条件允许的范围内建设全面集成的数据平台。
由于上文中所讨论过的原因,百分百的数据集成并不是十分现实的。对于单位中已经在使用的某些成熟系统,若是不宜直接替换,并且在技术上无法完全集成到新的数据平台之中,则可适度保留数据接口。
当今的存储软硬件技术及数据仓库、数据挖掘等前沿技术将有力地支持单位整体范围内的海量历史数据存储,并提供强大的底层数据组织和数据检索、分析功能以支持市场信息查询、统计决策分析、预测预警和战略数据地图等应用。
与数据相关的三个层面的工作应紧密配合。在逻辑数据结构层面,由数据管理员管理数据模型(数据逻辑结构),保证数据结构的合理性、一致性、可扩展性;在数据库内容层面,由数据库管理员管理、维护数据库结构(元数据)及内容(数据),优化数据应用效率,进行数据库级备份;在数据库运行平台层面,由系统管理员管理、维护数据库运行平台,保证其可用性,进行操作系统及硬件级备份。
4 数据体系建设的策略
数据体系建设中需要综合运用关键成功因素法、企业系统规划法等分析方法,一方面使用战略目标集转换法和关键成功因素法,自上而下分析企事业数据类别;另一方面借助系统规划和业务过程优化思想,梳理部分业务流程,自下而上提取基础数据;进而,提取并识别概念数据库、逻辑数据库、数据类、数据元素,建立数据模型,遵循关系数据库规范设计数据库结构,最终实现信息的全面性和数据的规范性。
一般而言,数据标准化有全面标准化和渐进式标准化两种策略。在全面标准化策略下,首先实施独立的、全面的数据标准化项目,可以在整个企事业范围内基本完成“信息资源规划(IRP)”工作,建立长期稳定的主题数据库体系,各子系统的建设在上述稳定的“信息资源平台”的基础上建设;在渐进式标准化策略下,则首先建立单位的数据标准化框架,配合试点子系统的运行,完成与试点子系统相关的业务数据以及部分管理数据的标准化工作,其后在遵循统一原则的前提下,各子系统项目分别完成相关的数据标准化工作,并将标准化成果纳入企业数据资源平台中。
一般情况下,数据体系建设应采取渐进式的策略,标准化进程与信息化项目建设进程同步进行,在保证见效速度的同时坚持标准化原则,以支持企业信息资源的充分共享与各子系统的整合,实现“速度与标准并重”。
5 数据模型的建立
数据和信息是两个密切相关的概念。数据是信息的载体和表示,信息是数据在特定场合下的具体含义,或者说信息是数据的语义。通俗点讲,数据模型就是对现实世界的模拟。数据模型包括两个层面:
(1)逻辑模型:也称信息模型或概念模型,它是按照用户的观点对数据和信息进行建模,通常用一些实体和关系来表示。它不依赖于某一个DBMS支持的数据模型。
(2)物理模型:它是面向实际的数据库实现的,表现为数据结构(用于描述系统的静态特性,研究与数据类型、内容、性质有关的对象,例如关系模型中的域、属性、关系等)、数据操作(主要有检索和更新(包括插入、删除、修改)两大类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则(如优先级)以及实现操作的语言)以及数据的约束条件(是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和存储规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。此外,数据模型还应该提供定义完整性约束条件的机制)。
数据模型的建立步骤如下:
(1)从现实世界中抽取各类实体,如“纳税人”就是一个实体;
(2)定义各个实体自身的属性,如纳税人编号、纳税人姓名、纳税人地址等都是实体“纳税人”的属性;
(3)定义各个实体之间关系,设计出实体-关系图(E-R图);
(4)根据E-R图把逻辑模型转换为符合相关模型类型的物理模型;
(5)物理模型数据结构的建立;
(6)物理模型数据操作的定义;
(7)物理模型的完整性定义和检查。
规划后的数据模型应该具有以下几个主要的特性:
(1)数据模型的先进性:规划后的数据模型应该符合当前的技术标准,适应企业3-5年的发展需要,就是说在3-5年之内具有先进性。
(2)可扩展性:数据模型必须具有可扩展性,根据企业的需要对模型进行扩展,支持企业的可持续发展。
(3)可靠性:设计的数学模型必须准确可靠,能够保证基于这些数据模型的信息系统的安全可靠运行。
(4)一致性:设计的数学模型在整个单位范围内是完全一致的,不能存在二义性。
6 数据编码标准的建立
在信息化推进过程中,除了建立合理、完整的数据模型之外,数据编码这项基础工作也是非常复杂的,其复杂程度超过软件厂商的想象,许多软件的应用并不是软件本身的问题,也不是用户不想应用,而是许多基础数据不能正确收集,其中编码是最大的问题。经验表明,一个单位应用信息化等是否成功,只要了解其数据编码工作是否真正做好即可,这项工作做好了,其它方面的问题就比较容易解决。
数据编码是建立单位信息的基础,也是关系到信息系统整体效果和成败的关键因素。为了适应单位实施信息系统的需要,必须对整个单位资产、组织机构、人员归属等进行统一编码。
在编码过程中,要遵循以下三个原则:首先要树立整个单位一体化的思想,要求所有的编码要站在单位的角度进行;其次,编码既要考虑到现有的需求,也要结合未来的需求;第三,编码要规范化。对于有国际、国家、行业标准的数据,要按照这些标准来进行数据编码;而对于没有这些标准的,企业自身定义的编码结果要按照规定的审批流程进行审批并形成标准。按照上面的方法一步步实施,通过一段时间的工作,相信一定能形成企业若干编码规范和编码审批规范,推动企业规范化管理,这对于企业信息化工作也是必不可少的。
|