【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《R语言数据分析应用案例》,欢迎阅读!
r语言数据分析、展现与实例
近年来,由于存储设备的单位成本以惊人的速度下降(1G硬盘空间的成本现在只需要几美分,这在过去难以想象),我们可以轻而易举地积累起大量的数据。
电信运营商,可以记录用户通话、短消息、无线上网产生的每一条信令,省级运营商一小时写入存储设备的数据量可以达到几百G。电子商务网站,可以记录用户的每一次交易,甚至每一次点击,可以复原用户的完整访问路径找出用户 的兴趣点。城市监控体系,在各个重要路口,高速公路上的摄像头,每秒钟都在 产生海量的视频数据。在生命科学领域,对人体的DNA分析,一个个体就能 产生几个G数据,可以想象如果一个生物信息数据库里包含了成千万的个体数 据,信息量将会是怎样一个规模,如此等等,不胜枚举。我们毫无疑问,正处 于一个信息爆炸的时代。
很不幸的是,我们得到了大量的数据,而这些数据中的绝大部分,在它的生命周期里基本上都被闲置着,从来没有考虑过产生任何的价值,唯一的用途就是“保存备查”。尽管“啤酒与尿布”的故事,已经写入教科书有10多年了,几乎
每一个接受过专业教育的同仁都知道数据挖掘能产生的价值,但是直到今天,我 们对数据的处理依然停留在按预定指标进行统计这种很低的水平上。造成这种 情况的原因有很多。一方面,由于业务人员和IT人员的工作鸿沟,使到即使能 提出数据分析的需求都成了一个很大的困难。在各公司里保管数据的大多是IT 人员,他们对业务的了解可能并非很深入,而业务人员也鲜有对数据有深入认识 者,他们通常都缺乏必要的数学素质和知识基础去进行建模和深入的分析工作。
另一方面,数据分析专家具有深厚的数学处理能力,善于建模和构筑算法,但是由于无法得到合适的需求,他们的能力也无从施展。另外数学家、统计学家们很多并不熟悉现代的IT软硬件设备的特性,对于集群、分布式系统、大规模存储、云计算、数据库等认识几乎为零,对于算法的实现可能还停留在对着PC 写C语言程序的水平上,对于海量数据,无法利用现代化设备的能力,使到算 法是否能真正实现变成生产力存有很大的疑问。
现在这门《数据分析系列网络课程》正是要打破这种鸿沟。用新兴的互联网
教育模式,把各应用领域的业务专家、数据分析专家、IT专家推荐给学习者,向有志于学习数据分析知识发挥数据价值的朋友能得到低成本交流的机会。我们的目标是在中国传播“技术成就梦想,数据产生价值”的观念,使学习者能快速提升其个人能力,在新的挑战面前获取更多个人机会,企业能在保存的海量数据中炼出黄金。
R是一套完整的数据处理、计算和制图软件系统。是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。R既是功能强大的统计和分析软件,同时也是完美的数据可视化制作工具,丰富的图形函数和外置包,几乎无限的扩展能力,使到我们的想象空间永远都不会达到上限。
本文来源:https://www.wddqxz.cn/26355b4f8d9951e79b89680203d8ce2f0066652e.html