大数据时代读后感

2022-12-29 04:00:15   文档大全网     [ 字体: ] [ 阅读: ]

#文档大全网# 导语】以下是®文档大全网的小编为您整理的《大数据时代读后感》,欢迎阅读!
读后感,时代,数据
颠覆精确计算数据的浪潮

----评大数据时代的思维变革

吴凯



20159月,经李克强总理签批,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》,系统部署大数据发展工作《纲要》明确,推动大数据发展和应用,在未来510年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。

大数据这个词汇对于当下的新闻研究者并不陌生。是指无法在可承受的时间范围内用常软件工具进行捕捉、管理和处理的数据集合。集合大量,高速,多样,价值四大要素。舍恩伯格的《大数据时代》给我们非常详细的,系统的,包涵无数经典范例的介绍了这种时下发展势头迅猛,未来前途不可限量的新型概念。

在舍恩伯格的大数据思想中,大数据的冲击力极强的,不仅仅仅限于单个部门或者行业。不单被利用于一个行业或者只被掌握于几家公司。在《大数据时代》中,舍恩伯格把其具体分为三个大的论点进行分别论述,则是:

1大数据时代所带来的思维变革 2大数据时代所带来的商业变革 3大数据时代所带来的管理变革

本文主要评论的主体是舍恩伯格的理论的第一部分。则是大数据时代所带来的思维变革。 在这个方面。舍恩伯格非常明确的指出,大数据时代下,人们需要的是利用所有的数据,而不是仅仅的依靠一部分数据。笔者认为,在很长的一段时间内,人们对数据的准确程度已经到了一种近乎苛刻的程度。对于舍恩伯格的观点。这是一种截然相反的挑战。挑战的数十年,乃至数百年的人对准确的要求。他在著作中提到,我们应该试着习惯不是确凿的准确无疑,而是庞大而又冗杂的数据中寻找到其中的规律。接下来笔者按照书中所分章节进行逐一的分析。

1更多

舍恩伯格说:当数据处理技术已经发生了翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。作者非常形象的表明了在当代数据爆炸时代下,对庞大数据进行传统的抽样调查的结果已经变得不在可信,我们需要的结果,或许能从全部的数据中获得,并且更为准确。在过去,样本的整体数量不算非常的庞大,样本的随机性较小,选择的随机性比样本数量更重要,随之而来的便是非常有效的随机抽样调查方法。现如今,数据的日益增长使得该方法的绝对随机性变的包涵风险。许多学者,公司便专向研究是否能够把所有的数据进行整体的分析,显然结果是令人满意。或许在时间上,人力物力上花费了更多,但是事实证明这种调查方法在大数据时代下显得更为准确和有效。文中举出例子,苹果公司的前总裁斯蒂芬乔布斯在自身与癌症病魔抗争的过程中采用了一种不同的方法,成为了世界上第一个对自身所有DNA和肿瘤DNA进行排序的人,为此他支付了高达几十万美元的费用,而他得到的,是包括全部的庞大基因密码数据。并且,乔布斯利用这庞大的基因数据让医生通过特定的DNA进行用药,为此乔布斯开玩笑:我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人。虽然他的愿望未曾实现,但是,通过这种对


人的全部基因进行大量分析,“私人订制”的医疗已经成为未来的一种新型医疗模式。而且这种方式的确有效的帮助他生命延长了许多年。

这非常引人深思,研究对象从样本变成总体是,随之而来直观的是更多次的复杂的排列和计算,更长的工作时间,可是当在研究全部数据出现的大致趋势和结果,往往更加的趋于稳定,更大的杜绝了样本调查所谓的随机性。在笔者看来,在很长一段时间内,随机采样的确是非常好的办法,他在数据爆炸前的数据处理变的方便快捷,可当在技术支持的情况下。我们为何不选择更好的,更整体性,更准确的全面数据分析。所以,大数据的分析,总体代替样本是大势所趋。

2更杂

舍恩伯格在第二方面阐述了在大数据时代,既然要处理和接受全部的数据,那么,也必须接受海量数据内的不确定,和复杂。只有接受不确定性,我们才能打开从未涉足过的世界的窗户。

在作者的观点里,大数据通常用概论说话,而不是确凿无疑,整个社会习惯新思维需要非常长的时间。2006年谷歌开始涉足机器翻译,现如今收到了一致的好评,在翻译的正确性和流畅性上远远高于其他翻译软件他的秘诀就在于谷歌吸收了网络上所有的翻译,他既能从各色各样的语言网站上寻找对译文件,同时寻找联合国,欧盟等国际组织的报告及文件,甚至是其余的速度书籍的语言,面对如此混乱的输入源,较其他的翻译系统而言,谷歌通过多输入源,扩大了自己的翻译来源,虽然许多的小网站的用语甚至是出现了错误的,但是在大量的数据的支持下,他做的的确比其他的系统要更加的出色。这个例子充分的说明了,当今的时代,保持源头的单一,精确,不是提高系统质量的唯一途径,相反,你收集的越多,你的系统完善程度是更好的。当然,错误是不可避免的,但是利大于弊。从某种方面来说,多和杂,在现在的,即将变成主流。笔者在阅读中发现谷歌的例子充分的证明了舍恩伯格的远见,在一方面,这是一种退步,从百分之百的精确变成了百分之九十的正确。但是结果是好的。这就是大数据时代要求我们做的:重新审视精确性的优劣。

而在另一个方面,不精确是我们需要的,是节约时间和成本的正确选择,谷歌的邮箱会确切的标注很短时间收到的短信,比如“十一分钟之前”而当对方收到信息已经有一段时间了,则他会标注为“两个小时前,”或者是:“三天前”。则也是足够说明,精确或许真的有时候并不重要。

当然大数据的悄然流行,需要的是新的数据库的建立,是与之前无法想象的巨大的数据的储存。而作者也明确表示,大数据的数据库,并不是需要无线的空间,他就存在于多个地点,多个硬盘中,他们互不干涉,却相互联系,同时利用这互联网连接,同时更新,同时的获取着最新的数据。Hadoop就是最好的例子。Hadoop是以开源式的分布系统的基础架构,相比巨大的空间,巨大的硬盘,这显然更便捷,当他与VISA合作时,却能够将处理两年内730亿单交易的时间,从一个月缩减为1分钟,也许Hadoop不适合逻辑的记账,当时当允许少量错误的时候,他就是如此的给力。

言归至此,笔者非常同意作者的说提议,当代数字社会要求我们必须接搜混乱和不确定性,不在纠结百分之百的准确,在另一方面,这种改变,是我们在新数据时代成功的基础。

3更好

在第三个观点上,我非常不认同舍恩伯格所说的一句话:知道是什么就够,没必要知道为什么.。作者在这一方面思维个人认为有存在绝对化,作者认为,当今时代,我们不需要非得知道现象背后的原因,而是让数据自己发声音。美国的知名的亚马逊网站的推荐系统往往能够在不知道用户的任何嗜好的情况下,准确的(大致)的推算出用户可能喜欢的,或者


本文来源:https://www.wddqxz.cn/4e71493c172ded630a1cb68b.html

相关推荐