数据仓库与数据挖掘课程设计指导书好好学习天天向上

2022-04-08 11:59:28   文档大全网     [ 字体: ] [ 阅读: ]

#文档大全网# 导语】以下是®文档大全网的小编为您整理的《数据仓库与数据挖掘课程设计指导书好好学习天天向上》,欢迎阅读!
指导书,数据挖掘,天天向上,仓库,好好
助您高榜提名

一、 设计内容:

1. 选题范围

1

A.根底选题:选择以现实中的各类数据为背景〔如商业客户数据,商品数据等〕,运用SPSS

Modeler等数据挖掘软件进行数据分析和模式挖掘。

2

扩展选题:选择以算法为主要研究对象,对数据挖掘相关算法〔如关联规那么、分类算法、

类算法等〕进行程序设计并运用测试数据进行比照分析,同时对结果进行分析总结

请在AB范国内自行确定选题。

2. 要求

1 2 3

提出所要解决的问题,问题要符合实际:

根据主题,分别形成多个子问题,并且子问题必须用绕整体主题展开,不能偏离主题; 掌握数据挖掘工具的根本操作功能,并将理论课程的算法应用于数据分析。

3. 主要内容

选题A可以运用并种数据挖掘工具软件〔如Microsoft Business Intelligence Development Studio BIDS〕〕SPSS Modeler. Weka等〕进行具有背景资料的数拯主题分析为主,数据挖掘报 告主要内容应具有:确左挖掘主题和方法、数据选择和预处理、挖掘方法实现、挖掘数据、模式 可视化表达与解释流程几局部。

选题B以某一方而〔如关联规那么、聚类、分类〕算法比照进行分析为主,那么注重比照算法 选择,测试数据的选择和处理以及相应的程序实现软件行。在设汁中表达聚类分析、分类发现和 关联规那么等数据挖掘算法的使用环境、算法特点,并能进行算法复杂性的分析。 二、 设计步骤、要点与关键分析:

1. 设计步骤:

1 2 3 4 5

查找数据及背景资料,收集数据; 熟悉相关算法及软件

根据选题确定研究主题或所要比照的算法;

利用SPSS Modeler. Mat lab软件进行数据挖掘或算法测试; 进行结果分析,撰写出符合要求的综合实践报告

2. 设计要点

选题A的主要设计要点: 1 2

确定挖掘主题和方法:根据挖掘的主题和目标,确定适宜的挖掘方法。

数据选择和预处理:根据所收集数据,填充缺失值,平滑噪声数拯,消除异常值,解决数据

不一致等问题。


3 4 5

挖掘方法实现:规划挖掘过程,界而设讣,挖掘方法实现。 挖掘数据:对预处理后的数据进行算法选择及挖掘。

模式的可视化表达与解释:根拯应用领域的信息和知识需求,以直观有效的形式,如图表

显示数据挖掘出的模式,用特左领域的知识加以解释,使得用户能够理解和接受。 选题B的主要设计要点: 1 2

需求和规格说明描述问题,简述题目要比照的算法,规定开发软件 设计

1 设计思想:程序结构〔如类图〕,重要的数据结构。主要算法思想〔文字描述为主,可以画框 图为辅〕

2 设计表示:各模块数据描述和算法描述,可以用表格形式表达。 3 详细设计表示:主要算法的框架及实现此算法的成员函数接口。 3 4 5

用户手册:即使用说明〔包括数据输入时的格式要求〕。 调试:调试过程中遇到的主要问题是如何解决的。

运行结果:上而测试数据输入后程序运行的结果及算法比照结果。程序运行的时空效率分

: 测试数据集:运行实例:改良设想:经验和体会。

6

附录

1 程序淸单:打印文本和电子版文件,电子版文件是必须的。源程序要加注释。 2 测试数据:即列岀测试数据集

考前须知:以上要求为一般的要求,针对具体问题和具体的开发过程,某些方面可以做适当的增减。 三、设计进度安排:

1天:学习课程设计资料,依据个人兴趣决左设计题目,查阅相关专业词典、手册或其它工具 书,收集数据,确定预期研究主题。

2-4天:撰写研究流程及方案,选择相关算法,操作数据软件收集数据,进行分析数据前的准 工作

5天:处理数据,撰写分析过程,针对结果要求调整策略,并对结果进行比照分析。 6-14天:按标准格式撰写并提交报告

20211212日提交课程设计文档〔打印版〕和设计过程文件〔包括数拯文件、算法、模型 等与课程设计有关的文件〕,由学委收齐统一上交。 三、 设分组

要求每班同学2-3人一组完成课程设讣,并以书面形式写岀具体分工。 四、 计参考资料

[11麼开际.?数据仓库与数据挖掘?,北京:北京大学出版社,202111 [2] Jiawei han.?数据挖掘:概念与技术?〔第二版〕机械工业岀版社20073

[3] Gordon S. Linoff, Michael J. A. Berry.?数据挖掘技术:应用市场营销销售与客户关


管理〔第3版〕?,北京:军事学科学出版社,20213

[4] 王国平,郭伟宸等.UBM SPSS Modeler数据与文本挖掘实战?,北京:淸华大学出版社,2021 11

[5] 张大斌,?数据挖掘与商务智能实验教程?,华中师范大学出版社,20211 [6] 薛薇,?基于SPSS Modeler的数据挖掘?,中国人民大学出版社,202110 [8] 李春葆等,?数据仓库与数据挖掘实践?电子工业出版社2021 [9] 张兴会,?数据仓库与数据挖掘技术?,淸华大学岀版社,2021. [10] 张兴会,?数据仓库与数据挖掘工程实例?,淸华大学出版社,2021. [11] 袁梅宇,?数据挖掘与机器学习WEKA应用技术与实践?,淸华大学岀版社 [12] 浙江大学,?概率论与数理统计?,淸华大学出版社2021 [13] 李航,?统计学习方法?,淸华大学出版社,2021.


本文来源:https://www.wddqxz.cn/b65ec1109989680203d8ce2f0066f5335b8167ef.html

相关推荐