畅享博客 > 航行日志——理论与实践并行 > 商业智能 > [讨论]数据仓库的开发流程
2007-2-15 9:18:05

[讨论]数据仓库的开发流程

        数据仓库系统是一种解决问题的过程,而不是一个可以买到的现成产品。不同企业会有不同的数据仓库。企业人员往往不懂如何建立和利用数据仓库,发挥其决策支持的作用,而数据仓库公司人员又不懂业务,不知道建立哪些决策主题,从数据源中抽取哪些数据。这需要双方互相沟通,共同协商开发数据仓库,因此是一个不断往复前进的过程。开发数据仓库的流程包括以下几步:

启动工程 
建立开发数据仓库工程的目标及制定工程计划。计划包括数据范围、提供者、技术设备、资源、技能、组员培训、责任、方式方法、工程跟踪及详细工程调度等。 

建立技术环境
选择实现数据仓库的软硬件资源,包括开发平台、DBMS、网络通信、开发工具、终端访问工具及建立服务水平目标(关于可用性、装载、维护及查询性能)等。 

确定主题进行数据建模
根据决策需求确定主题,选择数据源,对数据仓库的数据组织进行逻辑结构设计。 

设计数据仓库中的数据库 
基于用户的需求,着重于某个主题,开发数据仓库中数据的物理存储结构,即设计多维数据结构的事实表和维表。 

数据转换程序 
实现从源系统中抽取数据、清理数据、一致性格式化数据、综合数据、装载数据等过程的设计和编码。 

管理元数据
定义元数据,即表示、定义数据的意义及系统各组成部件之间的关系。元数据包括关键字、属性、数据描述、物理数据结构、源数据结构、映射及转换规则、综合算法、代码、缺省值、安全要求、变化及数据时限等。 

开发用户决策的数据分析工具
建立结构化的决策支持查询,实现和使用数据仓库的数据分析工具,包括优化查询工具、统计分析工具、C/S工具、OLAP工具及数据采掘工具等,通过分析工具实现决策支持需求。数据采掘是帮助用户发现数据内部未知的、潜在的关系,以及他们之间存在的趋向。因此,数据采掘在决策支持、市场策略和金融预测等方面都有广泛的应用。 

管理数据仓库环境
数据仓库必须像其他系统一样进行管理,包括质量检测、管理决策支持工具及应用程序,并定期进行数据更新,使数据仓库正常运行。


推荐到鲜果: 查阅更多相关主题的帖子: 数据仓库 商业智能

评论

您正在以 匿名用户 的身份发表评论  快速登录
(不得超过 50 个汉字)
       看不清,换一个
提示消息
(输入完内容可以直接按Ctrl+Enter提交)