预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共299页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

中文详细教程1、WEKA简介WEKA软件Explorer环境把“Explorer”界面分成8个区域KnowledgeFlow环境大家有疑问的,可以询问和交流2、WEKA数据集relationweatherattributeoutlook{sunny,overcast,rainy}attributetemperaturerealattributehumidityrealattributewindy{TRUE,FALSE}attributeplay{yes,no}datasunny,85,85,FALSE,nosunny,80,90,TRUE,noovercast,83,86,FALSE,yesrainy,70,96,FALSE,yesrainy,68,80,FALSE,yesrainy,65,70,TRUE,noovercast,64,65,TRUE,yessunny,72,95,FALSE,nosunny,69,70,FALSE,yesrainy,75,80,FALSE,yessunny,75,70,TRUE,yesovercast,72,90,TRUE,yesovercast,81,75,FALSE,yesrainy,71,91,TRUE,noWEKA数据文件关系声明属性声明数据类型数据信息稀疏数据3、数据准备数据资源、XLS、CSV、ARFF打开Excel得Iris、xls文件将iris、xls另存为iris、csv文件在weka得Explorer中打开Iris、csv文件将iris、csv另存为iris、arff文件4、数据预处理preprocess载入数据去除无用属性数据离散化在weka得Explorer中打开Iris、arff文件查看Iris数据集查看Iris数据属性分布图,选择属性通过观察发现petallength最能区分各类将属性petallength离散化离散化成10段数据查看离散化后得Iris数据集5、分类ClassifyWEKA中得典型分类算法选择分类算法选择分类算法选择模型评估方法选择模型评估方法Outputmodel、输出基于整个训练集得分类模型,从而模型可以被查看,可视化等。该选项默认选中。Outputper-classstats、输出每个class得准确度/反馈率(precision/recall)和正确/错误(true/false)得统计量。该选项默认选中。Outputevaluationmeasures、输出熵估计度量。该选项默认没有选中。Outputconfusionmatrix、输出分类器预测结果得混淆矩阵。该选项默认选中。Storepredictionsforvisualization、记录分类器得预测结果使得她们能被可视化表示。Outputpredictions、输出测试数据得预测结果。注意在交叉验证时,实例得编号不代表她在数据集中得位置。Cost-sensitiveevaluation、误差将根据一个价值矩阵来估计。Set…按钮用来指定价值矩阵。Randomseedforxval/%Split、指定一个随即种子,当出于评价得目得需要分割数据时,她用来随机化数据。文字结果分析文字结果主要指标输出图形结果Visualizeclassifiererrors、可视化分类错误实际类与预测类得散布图。其中正确分类得结果用叉表示,分错得结果用方框表示。Visualizetree可视化树可视化边际曲线(Visualizemargincurve)可视化阈值曲线(基于类)ROC曲线IRIS分类示例在weka得Explorer中打开Iris、arff文件在weka得Explorer中打开Iris、arff文件选择分类(Classify)数据挖掘任务选择分类算法选择决策树算法Trees->J48设置相关参数选择检验方法执行分类算法,建立决策树模型查看算法执行得输出信息查看决策树分类模型选择其她得分类算法选择贝叶斯分类算法bayes->Naivebayes选择检验方法执行分类算法,建立贝叶斯模型进行ROC分析选择其她得分类算法选择决策树用户自分类法trees->UserClssifier选择检验方法执行算法但击鼠标,确定分类边界查看相应得分类树预测指定属性值选择预测属性选择算法执行算法观察输出信息查看分类错误散点图点击实例,察看详细信息该实例petallength得实际值为5、1,预测值为5、89训练BANK-DATA分类模型示例浏览bank-data、xls数据数据准备—将数据另存为、csv格式数据准备—在WEKA中打开bank-data、csv数据准备—在WEKA中浏览数据数据准备—将数据另存为、arff格式在写字板中浏览bank