【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《数据仓库与数据挖掘课程设计指导书好好学习天天向上》,欢迎阅读!
助您高榜提名
一、 设计内容:
1. 选题范围
(1) A.基础选题:选择以现实中的各类数据为背景(如商业客户数据,商品数据等),运用SPSS Modeler等数据挖掘软件进行数据分析和模式挖掘。
(2) 扩展选题:选择以算法为主要研究对象,对数据挖掘相关算法(如关联规则、分类算法、聚 类算法等)进行程序设计并运用测试数据进行对比分析,同时对结果进行分析总结。
请在A或B范国内自行确定选题。
2. 要求
(1) 提出所要解决的问题,问题要符合实际:
(2) 根据主题,分别形成多个子问题,并且子问题必须用绕整体主题展开,不能偏离主题; (3) 掌握数据挖掘工具的基本操作功能,并将理论课程的算法应用于数据分析。
3. 主要内容
选题A:可以运用并种数据挖掘工具软件(如Microsoft Business Intelligence Development Studio (BIDS))、SPSS Modeler. Weka等)进行具有背景资料的数拯主题分析为主,数据挖掘报 告主要内容应具有:确左挖掘主题和方法、数据选择和预处理、挖掘方法实现、挖掘数据、模式 可视化表达与解释流程几部分。
选题B:以某一方而(如关联规则、聚类、分类)算法对比进行分析为主,则注重对比算法的 选择,测试数据的选择和处理以及相应的程序实现软件行。在设汁中体现聚类分析、分类发现和 关联规则等数据挖掘算法的使用环境、算法特点,并能进行算法复杂性的分析。 二、 设计步骤、要点与关键分析:
1. 设计步骤:
(1) 查找数据及背景资料,收集数据; (2) 熟悉相关算法及软件:
(3) 根据选题确定研究主题或所要对比的算法;
(4) 利用SPSS Modeler. Mat lab等软件进行数据挖掘或算法测试; (5) 进行结果分析,撰写出符合要求的综合实践报告。
2. 设计要点
选题A的主要设计要点:
(1) 确定挖掘主题和方法:根据挖掘的主题和目标,确定合适的挖掘方法。
(2) 数据选择和预处理:根据所收集数据,填充缺失值,平滑噪声数拯,消除异常值,解决数据 不一致等问题。
(3) 挖掘方法实现:规划挖掘过程,界而设讣,挖掘方法实现。 (4) 挖掘数据:对预处理后的数据进行算法选择及挖掘。
(5) 模式的可视化表达与解释:根拯应用领域的信息和知识需求,以直观有效的形式,如图表等 显示数据挖掘出的模式,用特左领域的知识加以解释,使得用户能够理解和接受。 选题B的主要设计要点:
(1) 需求和规格说明描述问题,简述题目要对比的算法,规定开发软件。 (2) 设计
1) 设计思想:程序结构(如类图),重要的数据结构。主要算法思想(文字描述为主,可以画框 图为辅)
2) 设计表示:各模块数据描述和算法描述,可以用表格形式表达。 3) 详细设计表示:主要算法的框架及实现此算法的成员函数接口。 (3) 用户手册:即使用说明(包括数据输入时的格式要求)。 (4) 调试:调试过程中遇到的主要问题是如何解决的。
(5) 运行结果:上而测试数据输入后程序运行的结果及算法对比结果。程序运行的时空效率分析: 测试数据集:运行实例:改进设想:经验和体会。
(6) 附录
1) 源程序淸单:打印文本和电子版文件,电子版文件是必须的。源程序要加注释。 2) 测试数据:即列岀测试数据集
注意事项:以上要求为一般的要求,针对具体问题和具体的开发过程,某些方面可以做适当的增减。 三、设计进度安排:
第1天:学习课程设计资料,依据个人兴趣决左设计题目,查阅相关专业词典、手册或其它工具 书,收集数据,确定预期研究主题。
第2-4天:撰写研究流程及方案,选择相关算法,操作数据软件收集数据,进行分析数据前的准 备工作。
第5天:处理数据,撰写分析过程,针对结果要求调整策略,并对结果进行对比分析。 第6-14天:按规范格式撰写并提交报告。
2019年12月12日提交课程设计文档(打印版)和设计过程文件(包括数拯文件、算法、模型 等与课程设计有关的文件),由学委收齐统一上交。 三、 课设分组
要求每班同学2-3人一组完成课程设讣,并以书面形式写岀具体分工。 四、 设计参考资料
[11麼开际.《数据仓库与数据挖掘》,北京:北京大学出版社,2008年11月 [2] Jiawei han.《数据挖掘:概念与技术》(第二版)机械工业岀版社2007年3月
[3] Gordon S. Linoff, Michael J. A. Berry.《数据挖掘技术:应用于市场营销、销售与客户关 系
管理(第3版)》,北京:军事医学科学出版社,2013年3月
[4] 王国平,郭伟宸等.UBM SPSS Modeler数据与文本挖掘实战》,北京:淸华大学出版社,2014 年11月
[5] 张大斌,《数据挖掘与商务智能实验教程》,华中师范大学出版社,2015年1月 [6] 薛薇,《基于SPSS Modeler的数据挖掘》,中国人民大学出版社,2014年10月 [8] 李春葆等,《数据仓库与数据挖掘实践》,电子工业出版社2014 [9] 张兴会,《数据仓库与数据挖掘技术》,淸华大学岀版社,2014. [10] 张兴会,《数据仓库与数据挖掘工程实例》,淸华大学出版社,2014.
[11] 袁梅宇,《数据挖掘与机器学习WEKA应用技术与实践》,淸华大学岀版社,2016.8 [12] 浙江大学,《概率论与数理统计》,淸华大学出版社2008 [13] 李航,《统计学习方法》,淸华大学出版社,2019.
本文来源:https://www.wddqxz.cn/255ef32da78da0116c175f0e7cd184254a351b39.html