基于用户的数据仓库参考模型研究
来源:华佗小知识
2012年9月 计算机工程与设计 COMPUTER ENGINEERING AND DESIGN Sept.2012 第33卷第9期 VoL 33 NO.9 基于用户的数据仓库参考模型研究 栗元邦,王黎明 (郑州大学信息工程学院,河南郑州450001) 摘要:为了使数据仓库的建立更加快捷有效,对数据仓库参考模型的建立问题进行了研究。对现有数据仓库参考模型进 行了分析,指出基于数据的数据仓库参考模型和基于目标的数据仓库参考模型有着各自的不足,提出了一个基于用户需求 的数据仓库参考模型;该模型以用户需求为基础,以企业的业务流程为指导,使得数据仓库建立后有更好的适应性和稳定 性。又对用户需求的获取进行了探讨,给出了一个获取用户需求的有效方法,用一个实例验证了提出的数据仓库参考模型 的有效性。 关键词:数据仓库;参考模型;建模;用户需求;需求获取 中图法分类号:TP31 文献标识号:A 文章编号:1000—7024(2012)09—3447—04 Research on user-driven reference model for data warehouse LI Yuan-bang.WANG Li—ming (School of Information Engineering,Zhengzhou University,Zhengzhou 450001,China) Abstract:To make the establishment of the data warehouse fast and efficient,the built of the reference model for the data ware— house is studied.First,an analysis of the existing methods is made,it is pointed out that both the data-driven reference model and the goal-driven reference model for the data warehouse has their disadvantage,and an user-driven reference model is pro- posed for the data warehouse.The model is based on the user requirements,and is directed by the business process of the enter— prise,SO it has batter adaptability and stability.Then on how to get the user requirements are discussed,and a method are given.Finally,an example is given to have a verification of the validity of this mode1. Key words:data warehouse;reference model;modeling;user requirements;requirements acquire 0引 言 数据仓库模型决定着数据仓库的内容和结构,对数据 仓库设计有着极其深刻的影响,在数据仓库中,概念模型 是一个基础,它对系统的成功起着关键的作用,是后续工 范的模型,并为在其上的结构和维度操作提出了一种规范 语义来描述。Joerg Becker:3]指出参考模型可以提高建设数 据仓库的效率,文中介绍了现存的数据仓库参考模型应用, 发现现有的模型对数据需求的定义并不充分,因此,他提 出通过配置规则来对数据仓库的建模技术进行扩展,Ralf 作的基础,可是在数据仓库的建立过程中,由于时间和成 本的限制,人们却没有把它很充分的做好,有时甚至直接 跳过,这可能会导致系统在开发过程中出现一系列的问题, 参考模型可以有效的解决这个问题,它提供了一个基本模 型,它可以通过扩充适应不同的问题,这样既有效的节约 了时间和成本,也使开发过程完整充实,保证了系统 的性能。 Knackstedf4-明等提到系统开发者和使用者由于教育和专业 背景的差异,在加上他们使用不同的专业术语,这会使得 交流非常的困难,因此指出了参考模型对于信息系统设计 的重要性,并且以概念模型为基础提出了一个数据仓库的 过程参考模型。 本文在分析总结现有数据仓库参考模型的基础上,提 出了一个基于用户需求的数据仓库参考模型,此参考模型 以用户需求为基础,它条理清楚,适应性较强,比较全面 的反映了现实中的需要。然后探讨了如何可以更好的获取 用户需求,总结提出了一种行之有效的方法,使开发者可 以更好的与用户沟通,从而保证需求的全面和准确。 许多学者对于参考模型的建立做了充分的研究,Mario Tucci_l1 等人指出了参考模型的重要性,它可以为整个的开 发过程提供一个框架和指导,使开发者在开发过程中有着 更清晰和明确的思路。tK Bebel[。]对数据仓库提出了一种规 收稿日期:2011—09—10;修订日期:2011—12—01 作者简介:栗元邦(1983一),男,河南方城人,硕士研究生,研究方向为数据仓库参考模型、维度建模;王黎明(1963一),男,河南浚县 人,博士,教授,研究方向为分布式人工智能、机器学习、数据挖掘。E-mail:liyuanyin6@163.corn 计算机工程与设计 1基于用户需求的数据仓库参考模型 1.1数据仓库参考模型的划分 2012芷 的出发点,从而来建立数据仓库的一种方法。 1.2基于用户需求的参考模型 基于数据的数据仓库参考模型虽然在建立数据仓库 的过程中使用起来相对比较方便,但是由于其设计方法 是以数据为中心的,是用一个数据模型去分辨数据库中 原来存在的数据和数据仓库中主题数据的共同性,而数 数据仓库参考模型可以有不同的划分方法,Lars B和 Matthias G[ ]提出可以将现存的方法分为3种:即基于数据 的数据仓库参考模型,基于目标的数据仓库参考模型和基 于用户需求的数据仓库参考模型。 所谓基于数据的数据仓库参考模型是指以现有的数据 据库中的数据在其组织,结构等方面有很大的差异,有 的数据甚至是有错误的,使得开发者在大量的数据中忙 碌,而没有一个明确的指导方向,从而导致花费了大量 的人力物力而效率不高,有时候甚至面临着开发者历经 辛苦后做出来的产品却因为不能满足需求而让用户不满 意的尴尬。 为基础,把原有的数据看成系统中心进行模型建设,对其 进行筛选,抽取和转化,从而建立起数据仓库。 所谓基于目标的数据仓库参考模型是指以客户的目标 期望作为设计的基础『7],设计过程是针对目标进行分析, 自上而下的进行分解,它是一个分解式的方法,采用先整 体后细节,然后对于每一目标逐步细化的设计过程。当数 据仓库建设完成以后,还可以利用用户的目标,校验系统 的整体设计是否合理,功能特征是否满足需要,系统的性 能是否达到了理想的性能状态,从而实现从下到上的回归。 现在,基于目标的数据仓库参考模型对于需求获取、 需求分解、数据组织等活动可以适用。其最重要的目的就 是利用目标作为系统建立的各种功能和性能需求规约。该 方法认为,一个有价值的软件系统需要满足组织环境的高 层目标。因此,研究工作的重点是如何通过组织目标分解, 将组织目标与软件系统的功能或非功能性需求相关联,进 而获取系统的需求规约。 目标通常可以被分成功能性目标和性能目标两种类型。 功能目标指的是系统需要完成的各种功能任务,它是决策 者要求必须做到的一类目标,通常代表着数据仓库必须实 现的最小需求,而性能目标指的是系统的各种性能指标, 对于基于目标型的参考模型,因为它的基本出发点是 目标。而决策管理者提出的目标大多数情况下通常是一些 短期的目标,因为短期目标见效迅速,比如在企业计划中 多是以年度为单位的,而一个年度目标对于一个数据仓库 来说显然是太短了。而且目标在一旦确定下来而进入到开 发过程中后,它是不能轻易进行改变的,这就使得整个的 数据仓库开发过程运作缺乏弹性,因为开发过程就是基于 目标而开始的,一旦目标发生变化,就会对整个的开发造 成影响,导致数据或者组织的修正甚至是变化,有时甚至 会面临着当开发进行到一定程度后,而因为决策者的改变 造成目标的修正甚至是变动,这时如果需要进行更改,所 需要做的工作量是非常大的。 因此,基于数据的数据仓库参考模型和基于目标的数 据仓库参考模型都有着各自的缺点,而基于用户需求的方 法可以避免这样的问题,基于用户需求的设计思想是要充 分的分析考虑用户的需求,然后根据用户需求来建立数据 也就是系统能在多大程度上完成各种功能目标,其完成的 结果是否令人满意,它的一些指标不一定是必须按规定完 成的,可以根据实际情况酌情处理。 基于用户需求的参考模型是指以用户的需求作为系统 定义 仓库,它是以用户的需求为中心,以现有的数据资源等为 辅助,然后再对其进行分析,综合从而建立数据仓库的一 种方法,本文在前人的基础上,提出了一种基于用户需求 的数据仓库参考模型,如图1所示。 l I 上 分绸概念模型卜 ; —叫分组逻辑模型l l 1分组应用I 1分组应用 业务层 l综合 l 合并l 厂 三三三- DW DW层 概念模型 —鉴±量—_.{ 逻辑模型 —!! 转化 I T ETL层 概念盯L 逻舯 l觌, l ETL I 外部数据 l 图1基于用户需求的参考模型 第33卷第9期 栗元邦,王黎明:基于用户的数据仓库参考模型研究 ・3449・ 图1中所示的基于用户需求的参考模型和其它的模型 对比起来有着自己显著的优点: (1)一个数据仓库的建立和使用是一个长期的过程, 基于用户需求的数据仓库参考模型建立的基本出发点是用 户的需求,这些需求反映着企业的主题和其基本流程,对 于一个成熟的企业来说,这些都是相对比较稳定的,所以 它对于数据仓库的建立比较适应。 (2)基于用户需求的数据仓库参考模型是从下到上根 据实际的情况进行分析,总结而建立的,这样在数据仓库 建立以后,当决策者目标发生改变时不会对其产生太大的 影响,使系统具有更强的适应性。 (3)本模型是在基于用户需求的基础上,根据建模的 过程,从用户需求,到概念模型,在到逻辑模型,一步步 来建立的,有着清晰的条理,可以为数据仓库建模过程提 供了一个有效的指导。 2用户需求的获取模型 对于基于用户的数据仓库参考模型来说,用户需求的 获取无疑是最重要的[8],然而,用户需求的获取也是一个 复杂的过程,BrowneE。]在研究过程中把它视为一个“障 碍”,它包括个人用户的,各个用户之间的,还有用户和负 责开发者之间的障碍,因为用户有些时候并不能明确的表 达自己的需求,而且需求的开发过程中也存在一定的不确 定性,这更加大了用户表达的难度,不同的用户对于系统 可能会有不同的要求,用户和开发者间专业知识和背景的 差别加大了彼此交流的难度。 为了更好的获取用户需求,本文在其他研究者工作的 基础上_】 ,总结了一种需求获取的方法: (1)将用户根据不同使用范围分为不同的族群,在族 群里选出对业务精通的代表来对公司情况以及系统需要实 现的主要功能进行描述,使开发者有一个大概的了解。 (2)开发人员在对系统有一定了解后深入到业务中去, 和用户的代表一起形成一个合作的整体来构成开发的核心, 确定系统的功能需求。 (3)开发者在对用户了解的基础上,根据用户的特征, 综合预算,技术,时间等因素,确定系统的性能需求。 (4)综合系统的功能需求和性能需求,在结合用户间 的关系,确定系统的整体需求。 (5)将需求反馈给用户,和用户一起商谈提出的需求 是否真实的反映了用户的需求,满足了该满足的功能,然 后根据用户的意见对需求进行修正,直至用户满意。 其过程参考模型如图2所示。 3案例分析 3.1系统概念设计 3.1.1系统模块划分 本章用提出的参考模型对一个进销存系统进行了实现, 在对用户进行充分的了解和沟通后,根据用户需求,确定 了一共分为基础设置,仓库管理,统计分析,客户关系, 数据管理,人员权限和系统设置7个模块,如图3所示。 其中基础设置包括仓库设置,物品类别设置,物品设置和 单位设置4个部分,是存储的基础;仓库管理包括入库, 出库,销售和单据明细查询4个部分;客户关系包括供应 商,客户分组和客户3个部分;数据管理包括数据备份和 恢复两个部分;人员权限模块包括操作员管理,权限设置 和修改口令三部分;系统模块主要是对用户使用系统的时 候提供帮助以及系统的退出。 一 用户 I- ● .J系统描述r叫— 系 J 专业需求 I 统 _J用户特征L — 需 求 U用户关系 图2用户需求获取过程参考模型 系统 垂l J垂I I纂I I Il 『I鑫I J垂 图3系统模块结构 3.1.2统计分析模块 统计分析模块是系统重要的模块,它对业务过程中入 库,出库,以及销售,供应商等的数据进行记录和统计, 从而为使用者提供决策所需要的依据,其结构如图4所示。 统计分析 萎j 3.2逻辑设计 在建立系统的逻辑模型的时候,决定设立供应商,物 品,操作员,仓库,客户,人库和出库7个事实表,并使 用星型模型来对其进行实现,因为星型模型效率较高,且 设计与实现相对比较简单,比如对于客户,其星型模型如 ・3450・ 计算机工程与设计 2012正 图5所示。 图5客户的星型模型 3.3物理设计与验证 因为PB语言使用方便,开发速度较快,本文采用PB 来对系统进行实现,并使用SQL Server来实现数据仓库。 在系统完成后,我们对系统功能做了验证,首先以各 个模块为单元,对于每一个模块进行功能测试,看能否正 常完成各自必须实现的功能,比如对于仓库管理模块,测 试它能否完成商品的入库,出库,以及单据的填写,修改 等操作,并对在操作过程中没有按照规定操作的情况也做 了测试,比如在输入格式出现错误等情况下系统能否正常 的运行。 在对各模块进行测试,验证其可以完成需求功能后, 又按照自底向上的集成方法对系统进行了集成测试,首先 把仓库管理模块和人员权限模块集成起来进行测试,看对 于仓库管理来说,是否只有有权限的人员才能对其进行特 定的操作,然后依次和其它模块进行集成,最后集合形成 完整的系统。 在系统完成后,在用户中选出代表对其进行了a测试, 由用户模拟实际中的运行环境对系统进行操作,并尽最大 努力涵盖所有可能的用户操作方式,然后对系统的性能和 可用性提出了意见,在对系统做了相应改进后提交公司进 行预运行,经过两个月后的使用后对用户做了一个调查, 结果14个使用者中有13人对系统表示满意,满意度达到 了93%,尤其是决策管理者觉得系统对公司很适应,为其 决策提供了有效的支持。事实证明,利用所提出基于用户 需求的参考模型建立起来的数据仓库系统还是比较成功的, 该模型可以为数据仓库建立提供方便,起到一定的参 考作用。 4结束语 文章提出了一种基于用户的参考模型,并分析了该模 型的优点,然后探讨了如何可以更好的了解用户需求,总 结提出了一种行之有效的方法,使开发者可以更好的与用 户沟通,从而保证需求的全面和准确。虽然提出的基于用 户的数据仓库参考模型在应用中取得了成功,但是该模型 还并不完善,需要进一步的验证和改进。 下一步工作主要分两个方面,第一是文章虽然对提出 的数据仓库参考模型进行了实现,但是该实例还不够充分, 还需要在更大更复杂的系统上对其进行验证。第二是对于 大型的企业,面对众多的员工,如何能更好的获取用户需 求,从而为系统的建立打下坚实的基础。 参考文献: E13 Mario Tucci,Romeo Bandinelli.Building a reference model for the PLM processes in engineering and contracting sector EJ 3. IFIP Advances in Information and Communication Technology, 2008,257;215-222. Ez]Bebel B,Wrembel R.Formal approach to modeling a multiver- sion data warehouse EJ].Bulletin of The Polish Academy of Sciences Technical Sciences,2006:54(1):51—62. E3]Joerg Becker,Ralf Knaekstedt.Reference modelign for data warehousign-state-of-the-art and proposals for the construction and application of configurable models for requirements defini— tion[J].Wirtschaftinformatik,2004,46(1):39—49. [4]Ralf Knackstedt,Karsten Klose.Process reference model for data warehouse development Ec-1.The 7th International oCn- ference on Enterprise Information Systems,2005:493—499. [5]Ralf Knackstedt,Karsten Klose.Configurative reference model-based development of data warehouse systems[c].In— formation Resources Management Association International Conference,2005:32—39. E6]Lars Burmester,Matthias Goeker ̄Method for user oriented modelling of data warehouse systems EC].International Con— ference on Enterprise Information Systems Analysis And Specifi— cation,2006:366—367. [7]Robert Winter,Bernhard StraucK A method for demand- driven information requirements analysis in data ware-housing projects[C].Proceedigns of the 36th Hawaii International Conference on System Sciences,2003:1-9. [8]lVlatthias Goeke ̄,Ralf Knacksted ̄Multidimensional reference rnodds for data warehouse development[C].International Con- ference on Enterprise Information Systems,2007:347—354. [9]Browne G,Rogich M.An empirical investigation of user re— quirements elicitation:Comparing the effectiveness of promp- ting techniques口].Management Information Systems,2001, 17(4):223—249. [1o]vinny.用户需求获取方法[口].http://vinnyoha blog.163. com/blog/static/ 1844/,201 0.
因篇幅问题不能全部显示,请点此查看更多更全内容