本文的目标读者群是对基于IBM DB2通用数据库V8(UDB)使用DB2 Cube View应用编程接口(API)开发或者整合OLAP应用程序感兴趣的技术管理者和工作人员。 尤其是对于构建组件在DB2 Cube View和其它工具或元数据容器之间交换元数据的开发者。为简单起见,我们把交换元数据的软件看作是"元数据桥"或者仅仅是"桥"。
关系数据库、数据仓库和OLAP概念的背景知识有助于理解本文。
介绍
公司和用户需要有分析大量的数据集的能力,以及能够访问和报告更详细的数据。象DB2 UDB这样的高可升级性的数据库服务器扮演一个越来越重要的角色,传送企业OLAP解决方案。 使用DB2 Cube View,DB2 UDB提供一个更加强健的基础结构,能够在端对端的的数据仓库和业务智能配置中承担起大量数据的处理。
对于许多OLAP工具和应用程序,与DB2 Cube View整合需要构建一个元数据桥。 这个桥可以使用DB2 Cube View的基于XML的存储过程接口读取或者创建元数据。 我们在本文中将讲述如何使用这个接口去构建一个桥。
DB2 Cube View的概述
IBM DB2 Cube View是增强DB2 UDB作为开发和配置业务智能产品和应用程序的DB2通用数据库的一个附加特性。 尤其是,DB2 Cube View有助于加快基于DB2 UDB的OLAP解决方案和应用程序的开发和管理。
DB2 Cube View特性是如何做到这些的? 首先,它允许DB2 UDB是了解OLAP的。 不用Cube View,对于一个不熟悉数据库结构和内容的人来说,一个关系数据库看上去可能象一大堆有栏目的表。 DB2 Cube View元数据使你能在一个DB2数据库中更加完整的建立底层结构。
通常,一个数据仓库或者数据市场是设计来用于量纲分析。 在这种情况下,数据库通常由一个或多个星形(或者雪花型)图式组织成的表组成。 一个简单的星形图式由多个维量的表围绕的一个实际表组成。 比如,一个实际的表可以记录一个公司个别产品和存货位置的销售图表。 维度表(可以名为PRODUCTS和STORES)可以包含个别产品和存货位置的细节,可以连接到实际的表中。 元数据对象 DB2 Cube View元数据尤其擅长获得一个星形图式或者雪花图式(参见图1)所固有的结构。 元数据通过一套元数据对象提供相关数据的"维度视图"。 元数据对象被分层为从Attributes这样的简单对象到更复杂的对象,比如Joins、Hierarchies、Dimensions和Cube Models。 一个完全定义的Cube Model对象通常相当于一个星形(或者雪花)图式,并且使用一个通用的维数建模一套量度数。 那么毫无疑问,Cube Model封装其它DB2 Cube View元数据对象,比如Dimensions和Measures。
图1、引用一个关系星形图式的DB2 Cube View
总而言之,DB2 Cube View元数据使你能你的DB2数据库的多维管理结构和设计。元数据对象在IBM DB2 Cube Views Setup and User's Guide,第二章中被详细描述。
除了使得DB2感知OLAP以外,DB2 Cube View元数据至少还以两种方法使用:
· DB2 Cube View特性利用元数据最优化在DB2数据库中的SQL查询。
· 基于DB2 UDB的Products和应用程序可以使用元数据。
让我们简要地讨论这两种用法。
使用DB2 Cube View元数据用于最优化
DB2 Cube View可以通过创建相应的保持前集合体数据的物化查询表或者MQT加速SQL查询。MQT也被称为摘要表。 DB2优化程序可以根据情况重写到MQT的SQL查询(参见图2)。MQT通常在数量级上比底层的基本表小。这样,查询可以被重写,能够比运行在基本表上的SQL查询要快很多。.
DB2 Cube View有一个最优化顾问,基于元数据和用户输入,建议一套相应的MQT。请参阅DB2 Cube Views Setup and User 's Guide关于最优化的章节,获取更详细的信息。
图2、DB2优化程序在适当的时候编写到MQT的查询
元数据使用者
Cube View元数据还有其它的优点。 业务智能工具可以从DB2 UDB中读取元数据,来了解DB2表的维度结构。基于元数据,这些工具然后可以提供针对DB2 UDB数据的查询和报告解决方案。
使用DB2 Cube View元数据的工具和应用程序通常分成两类:
· 第一类应用程序"直接固定"到DB2 Cube View上。它们读取元数据并直接使用它来分析DB2数据库,通常通过使用元数据构建SQL查询。最常见的情况是,这些工具查询和报告DB2 Cube View Cube模型和Cube对象。
· 第二类工具把Cube View元数据从DB2传到它们自己的工具,然后基于它们的元数据查询DB2。这些工具必须把DB2 Cube View元数据映射为它们自己的元数据。映射的复杂性取决于元数据的类似性。
元数据生产者
注意并非所有对DB2 Cube View元数据感兴趣的应用程序都要读取它。另一类工具和应用程序产生元数据并把它推进DB2。维度元数据常常在数据库设计、提取-转换-载入(ETL)及其他数据库管理工具中产生。 通过把维度元数据传送到DB2 UDB,这些工具可以利用早先提到的最优化和管理等优点。
显然,工具和应用程序需要一个与DB2中的Cube View元数据交互的方法,以便读取、创建、修改和删除元数据对象。
DB2 Cube View提供一个API,用于进行这些操作,我们在后面会接触到。
|