预览加载中,请您耐心等待几秒...
在线预览结束,喜欢就下载吧,查找使用更方便
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
SAS数据仓库方法论目录HYPERLINK"http://www.sasor.com/document/"\l"方法论浏览"A.快速建库方法论浏览HYPERLINK"http://www.sasor.com/document/"\l"什么是数据仓库"1.什么是数据仓库HYPERLINK"http://www.sasor.com/document/"\l"建立数据仓库的业务理由"2.建立数据仓库的业务理由HYPERLINK"http://www.sasor.com/document/"\l"建立数据仓库的技术理由"3.建立数据仓库的技术理由HYPERLINK"http://www.sasor.com/document/"\l"数据仓库的技术特征"4.数据仓库的技术特征HYPERLINK"http://www.sasor.com/document/"\l"确认业务需要和数据仓库的目标"5.确认业务需要和数据仓库的目标HYPERLINK"http://www.sasor.com/document/"\l"关键成功因素"6.关键成功因素HYPERLINK"http://www.sasor.com/document/"\l"方法论的细节"B.SAS快速建立数据仓库方法论的细节HYPERLINK"http://www.sasor.com/document/"\l"业务驱动"1.业务驱动HYPERLINK"http://www.sasor.com/document/"\l"收集需求的研讨会"2.收集需求的研讨会HYPERLINK"http://www.sasor.com/document/"\l"快速应用开发(RAD)"3.快速应用开发(RAD)HYPERLINK"http://www.sasor.com/document/"\l"方法论的框架"C.方法论的框架A.快速建库方法论浏览一个企业在开发和实施数据仓库时,使用一个高效和经验证的方法论是关键的,这一点已是十分清楚的了。考虑到这一点,多年来SAS研究、发展和改进了经验证的实施数据仓库的方法论,我们称之为快速建库方法论。本文件的这一节将描述这个方法论。1.什么是数据仓库?一个数据仓库通常是一个分散的数据存储,在其中信息是存为这样的一种形式,它适合于业务智能化和决策支持系统。数据可能是以不同形式存储的,它并不影响OLTP系统的运作。数据仓库的建立是用一种循环的逐步完善的过程而不是一步完善的。数据仓库通常是与解决企业不断改变的组织问题的全过程有关。数据仓库通常是围绕主题建立的。主题就是企业感兴趣的论题,比如部门、活动和操作结果。数据仓库的结构是由数据仓库应满足的应用决定的。快速提交信息是成功实施数据仓库的关键。由于这一点,就引入了象数据集市和信息集市这些概念。数据集市是数据仓库的一个子集,它通常更为概括,以满足对关心数据的查询有比数据仓库本身更快的速度。信息集市存储可用视窗器(viewer)显示的预处理的信息。在信息集市中常包含以下几类信息:报告输出(打印的文本、图形等)多媒体介质(录象和录音)内容的记录电子表单2.建立数据仓库的业务理由数据仓库为管理者和业务用户提供真正决策支持的基础。企业为这些业务用户存储了多年的信息,但是数据仓库提供专为他们设计的有构架的信息。数据仓库实施的最初阶段往往要解决现成的业务问题(即较为被动的),而以后的实施常是更为主动的。数据仓库的一个强项是它支持对数据的随时需要的查询和进行未计划的数据探索的需要。就是说,数据仓库给业务用户以不同方法分析数据的能力和自由度,而不受预先设定的一组报告的限制。3.建立数据仓库的技术理由建立数据仓库最共同的技术理由是企业现用的信息技术结构不能满意地满足业务需要。过去,信息技术集中于运作系统,它保证业务过程运行所必须的任务的自动化。但是,运作系统一般不能很好地满足决策支持的需要。一个运作系统典型的有多个事务处理(transaction)的应用构成,每个应用使部门的一个过程和功能自动化。在运作系统中,每个事务和每一分钟的业务细节都记录在与事务应用关联的数据库中。事务系统的设计要考虑将部门运作需要的细节信息有效地进入系统。有效性的要求导致应用开发者实现高度规范的数据和在存档发生之前就必须决定作为应用的一部分有多少数据可存储。虽然运作系统对日常业务活的支持是非常有效的,但他们对于运用常规的软件技术支持报表制作、决策和行政信息系统并不是很好的。他们的侧重点是在数据的存储,很少提供访问数据和将数据变为有用决策信息的工具。运作系统和数据仓库是完全不同的。内容是不同的,结构是不同的,硬件和软件的需求是不同的,管理是不同的和用