预览加载中,请您耐心等待几秒...
在线预览结束,喜欢就下载吧,查找使用更方便
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
中国矿业大学银川学院期末考试试题2010至2011学年第2学期考试科目数据仓库与数据挖掘学分丄年级2008系机电动力与信息工程系专业计算机一、填空题(15分)1•数据仓库的特点分别是___________、________、__________、反映历史变化。2•元数据是描述数据仓库内数据的结构和建立方法的数据。根据元数据用途的不同可将元数据分为________元数据和_________元数据两类。3.OLAP技术多维分析过程中,多维分析操作包括_________、___________、_________、_________等。4•基于依赖型数据集市和操作型数据存储的数据仓库体系结构常常被称为“_________________”架构,其中______________________是中心,源数据系统和数据集市在输入和输出范围的两端。5.ODS实际上是一个集成的、______________、_____________、_______、___________、详细的数据库,也叫运营数据存储。多项选择题(10分)6.在数据挖掘的分析方法中,直接数据挖掘包括(A分类B关联C估值D预言7•数据仓库的数据ETL过程中,ETL软件的主要功能包括()A数据抽取B数据转换C数据加载D数据稽核8.数据分类的评价准则包括()A精确度B查全率和查准率CF-MeasureD几何均值9•层次聚类方法包括()A划分聚类方法B凝聚型层次聚类方法C分解型层次聚类方法D基于密度聚类方法10.贝叶斯网络由两部分组成,分别是()A网络结构B先验概率C后验概率D条件概率表三、计算题(30分)11•一个食品连锁店每周的事务记录如下表所示,其中每一条事务表示在一项收款机业务中卖出的项目,假定=20%,SUpmincon=40%,fmin使用Apriori算法计算生成的关联规则,标明每趟数据库扫描时的候选集和大项目集。(15分)事务项目事务项目T1面包、果冻、花生酱T4啤酒、面包T2面包、花生酱T5啤酒、牛奶T3面包、牛奶、花生酱12.给定以下数据集(2,4,10,12,15,3,21,11,18,25,30),进行K-Means聚类,设定聚类数为2个,相似度按照欧式距离计算。(15分)四.设计题(45分)13.按照题目给定的3个数据文件,任选一个建立数据流图,要求至少包括记录选项、字段选项、图形结点各一个。任选关联规则Apriori算法、贝叶斯网络、K-Means聚类、决策树C5.0(C4.5)算法、神经网络中的一个进行挖掘,并给出数据流图。(10分)14.对以上数据流图中使用的每个结点做一简短说明。(10分)15.给出以上数据流图中模型的执行结果(生成模型完全展开后的数据),对于执行结果太多的,可节选部分结果。(10分)16.对以上模型生成的结果做一简要的分析,包括算法采用的基本原理、数学模型、算法步骤等。(15分)