【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《数据仓库与数据挖掘课程设计指导书好好学习天天向上》,欢迎阅读!
助您高榜提名
一、 设计内容:
1. 选题范围
〔1〕
A.根底选题:选择以现实中的各类数据为背景〔如商业客户数据,商品数据等〕,运用SPSS
Modeler等数据挖掘软件进行数据分析和模式挖掘。
〔2〕
扩展选题:选择以算法为主要研究对象,对数据挖掘相关算法〔如关联规那么、分类算法、
聚 类算法等〕进行程序设计并运用测试数据进行比照分析,同时对结果进行分析总结。
请在A或B范国内自行确定选题。
2. 要求
〔1〕 〔2〕 〔3〕
提出所要解决的问题,问题要符合实际:
根据主题,分别形成多个子问题,并且子问题必须用绕整体主题展开,不能偏离主题; 掌握数据挖掘工具的根本操作功能,并将理论课程的算法应用于数据分析。
3. 主要内容
选题A:可以运用并种数据挖掘工具软件〔如Microsoft Business Intelligence Development Studio 〔BIDS〕〕、SPSS Modeler. Weka等〕进行具有背景资料的数拯主题分析为主,数据挖掘报 告主要内容应具有:确左挖掘主题和方法、数据选择和预处理、挖掘方法实现、挖掘数据、模式 可视化表达与解释流程几局部。
选题B:以某一方而〔如关联规那么、聚类、分类〕算法比照进行分析为主,那么注重比照算法的 选择,测试数据的选择和处理以及相应的程序实现软件行。在设汁中表达聚类分析、分类发现和 关联规那么等数据挖掘算法的使用环境、算法特点,并能进行算法复杂性的分析。 二、 设计步骤、要点与关键分析:
1. 设计步骤:
〔1〕 〔2〕 〔3〕 〔4〕 〔5〕
查找数据及背景资料,收集数据; 熟悉相关算法及软件:
根据选题确定研究主题或所要比照的算法;
利用SPSS Modeler. Mat lab等软件进行数据挖掘或算法测试; 进行结果分析,撰写出符合要求的综合实践报告。
2. 设计要点
选题A的主要设计要点: 〔1〕 〔2〕
确定挖掘主题和方法:根据挖掘的主题和目标,确定适宜的挖掘方法。
数据选择和预处理:根据所收集数据,填充缺失值,平滑噪声数拯,消除异常值,解决数据
不一致等问题。
〔3〕 〔4〕 〔5〕
挖掘方法实现:规划挖掘过程,界而设讣,挖掘方法实现。 挖掘数据:对预处理后的数据进行算法选择及挖掘。
模式的可视化表达与解释:根拯应用领域的信息和知识需求,以直观有效的形式,如图表
等 显示数据挖掘出的模式,用特左领域的知识加以解释,使得用户能够理解和接受。 选题B的主要设计要点: 〔1〕 〔2〕
需求和规格说明描述问题,简述题目要比照的算法,规定开发软件。 设计
1〕 设计思想:程序结构〔如类图〕,重要的数据结构。主要算法思想〔文字描述为主,可以画框 图为辅〕
2〕 设计表示:各模块数据描述和算法描述,可以用表格形式表达。 3〕 详细设计表示:主要算法的框架及实现此算法的成员函数接口。 〔3〕 〔4〕 〔5〕
用户手册:即使用说明〔包括数据输入时的格式要求〕。 调试:调试过程中遇到的主要问题是如何解决的。
运行结果:上而测试数据输入后程序运行的结果及算法比照结果。程序运行的时空效率分
析: 测试数据集:运行实例:改良设想:经验和体会。
〔6〕
附录
1〕 源程序淸单:打印文本和电子版文件,电子版文件是必须的。源程序要加注释。 2〕 测试数据:即列岀测试数据集
考前须知:以上要求为一般的要求,针对具体问题和具体的开发过程,某些方面可以做适当的增减。 三、设计进度安排:
第1天:学习课程设计资料,依据个人兴趣决左设计题目,查阅相关专业词典、手册或其它工具 书,收集数据,确定预期研究主题。
第2-4天:撰写研究流程及方案,选择相关算法,操作数据软件收集数据,进行分析数据前的准 备工作。
第5天:处理数据,撰写分析过程,针对结果要求调整策略,并对结果进行比照分析。 第6-14天:按标准格式撰写并提交报告。
2021年12月12日提交课程设计文档〔打印版〕和设计过程文件〔包括数拯文件、算法、模型 等与课程设计有关的文件〕,由学委收齐统一上交。 三、 课设分组
要求每班同学2-3人一组完成课程设讣,并以书面形式写岀具体分工。 四、 设计参考资料
[11麼开际.?数据仓库与数据挖掘?,北京:北京大学出版社,2021年11月 [2] Jiawei han.?数据挖掘:概念与技术?〔第二版〕机械工业岀版社2007年3月
[3] Gordon S. Linoff, Michael J. A. Berry.?数据挖掘技术:应用于市场营销、销售与客户关 系
管理〔第3版〕?,北京:军事医学科学出版社,2021年3月
[4] 王国平,郭伟宸等.UBM SPSS Modeler数据与文本挖掘实战?,北京:淸华大学出版社,2021 年11月
[5] 张大斌,?数据挖掘与商务智能实验教程?,华中师范大学出版社,2021年1月 [6] 薛薇,?基于SPSS Modeler的数据挖掘?,中国人民大学出版社,2021年10月 [8] 李春葆等,?数据仓库与数据挖掘实践?,电子工业出版社2021 [9] 张兴会,?数据仓库与数据挖掘技术?,淸华大学岀版社,2021. [10] 张兴会,?数据仓库与数据挖掘工程实例?,淸华大学出版社,2021. [11] 袁梅宇,?数据挖掘与机器学习WEKA应用技术与实践?,淸华大学岀版社 [12] 浙江大学,?概率论与数理统计?,淸华大学出版社2021 [13] 李航,?统计学习方法?,淸华大学出版社,2021.
本文来源:https://www.wddqxz.cn/b65ec1109989680203d8ce2f0066f5335b8167ef.html