zyzyw 发布的文章

《知识的边界》:大数据时代知识的停止点

◎刘运辉

毫无疑问,信息超载作为一种生活方式,已经挟裹着众生的生活。戴维·温伯格《知识的边界》所尝试的,恰是在大数据时代,如何认知网络下的知识与科学。因为,不管确定“互联网+”,还是定义“互联网-”,都要面对今日“事实不再是事实”,而“专家随处可见”的现实。
显然需要理清思路,理性面对这一切。你要学会像戴维一样,冷静地打着比方,包括以转述的方式,向自己的见解缓步、轻松而去——
美国出版公司兰登书屋的创始人之一贝内特·瑟夫出版的一本书里就讲过这么个奇闻轶事:
一天,《哈波斯》杂志的卡斯·坎菲尔徳在编辑部接待一位长相甜美却个性坚决的妇女。这位女同胞很想讨论她自己正在创作的第一本小说。“一本小说应该是多长的篇幅?”她问道。
“这个问题没有确切的答案,”坎菲尔德解释道,“一些像《伊登·弗洛姆》这样的小说,大概只有4万字。而其他的小说,如《飘》,却可能达到30万字。”
“但,普通小说的平均长度大概是多少字?”妇女坚持问道。
“呃,我觉得大概是8万字吧。”坎菲尔德回答。
妇女跳了起来,并欢呼着。“感谢上帝!”她喊道。“我的小说完结了!”
戴维转述这则逸闻并不是让大家简单地笑上一笑。戴维想说的是,面对太多的信息而无法全部知道的事实,其实我们的战略一直是建立一个知识的停止点(stopping points)系统。这是个很有效的方法,很实用于保存和交流知识的纸质媒介。

戴维列举的另一伟大实例同样能说明问题。1836年,达尔文从“小猎犬号”航行归来,完成了将促进他进化论理论的观察。1838年,达尔文对自己的理论有了清晰的想法。1842年,他用铅笔写下了35页的“骨架”,但没有公开。1844年,他写了189页的手稿,没有公开,但指示妻子,如果他死了就将手稿出版。接下来的15年,他研究了藤壶,出版了8本书,生了9个孩子,并且经常和同事通信往来讨论。他还开始了实验科学。但他就是没有出版自己的进化论。他似乎在等着什么?有一天他收到了年轻的博物学家阿尔弗雷德·罗素·华莱士写来的一封信,此后华莱士又寄给了达尔文一份20页的文稿,里面提到的理论和达尔文的进化论基本相似。达尔文万分惊讶,他想成为这个理论的最早提出者,但不想欺骗华莱士,或者怕更为糟糕,让自己看起来是窃取了华莱士的观点。在听取两位亲密同事意见后,1858年7月,伦敦林奈学会安排宣读了华莱士的一篇文章,以及达尔文的两篇文章。林奈学会在自己的杂志上刊发这些文稿后,达尔文才开始在科学家圈内引起关注。这个鼓舞,让达尔文经过13个月的写作,完成了不朽的《物种起源》。达尔文和华莱士的故事,后世有多种解读。纸质出版模式静静地塑造了科学,这是一个例子。同时,那个停止点,格外清晰。
传统的知识是纸的意外产物。没有什么时候,我们对纸的认识这么明确过。纸上的知识,纸上的科学,曾经是一种出版的类型,它们经过层层过滤,才能在纸上“行走江湖”。但今天,纸质悄然换作网络。在此背景下,如有达尔文和华莱士的故事上演,恐怕要重新演绎,且绝不会如此安安静静,按部就班,起承转合。
能够明确的是,权威在网络化时代仍然会是一个停止点,但“权威已经不再是一个主要由有资质的人所构成、专门生产特级产品的特殊阶层了”。相反,权威更多地是由功能性来定义,如你的体验一般:权威是你在无数连接中访问的那个最后一个页面——是你决定不再继续去点击其他链接的那个页面。
正如戴维所打的比方一样:当知识变得网络化之后,房间里最聪明的那位,已经不是站在屋子前头给我们上课的那位,也不是房间里所有人的群体智慧。房间里最聪明的人,是房间本身:是容纳了其中所有的人与思想,并把他们与外界相联连的这个网。换句话说,互联网作为知识的基础设施,本身并不拥有创造知识的实体要件,知识不存在于书籍之中,也不存在于头脑之中,而是存在于网络本身。
以下事实正越来越清晰:传统的图书在表达观点的方式和呈现形态上,是将思想挤压到一条狭长的小径上,驱使读者沿着这条小径行进。网络化时代,从最为纯正的网络意义上,它的开放姿态,决定每个人都遭遇了网络所带来的心理颠覆——丰富性、链接、无需许可、公共性、未决性,但网络化的知识和科学,会让我们更加接近关于知识和科学的真理。但就在这浩若烟海之中,我们一样要找到知识的停止点,在心里给它个飞吻。
网络,如尼古拉斯·卡尔说的那样,重装了我们的大脑。在信息洪流之中,众生得以不必焦虑,并能轻松自在地在网络之上“笑傲江湖”的方式,或许是找到那一个个知识的停止点。从这个意义上,我们要再回看一下本文开始时戴维·温伯格转述的故事,大笑三声,一起释怀。

转载,摘自网络。

大数据(big data),是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。

对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
根据维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。[1]
随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
最小的基本单位是bit,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
它们按照进率1024(2的十次方)来计算:
8 bit = 1 Byte
1 KB = 1,024 Bytes
1 MB = 1,024 KB = 1,048,576 Bytes
1 GB = 1,024 MB = 1,048,576 KB
1 TB = 1,024 GB = 1,048,576 MB
1 PB = 1,024 TB = 1,048,576 GB
1 EB = 1,024 PB = 1,048,576 TB
1 ZB = 1,024 EB = 1,048,576 PB
1 YB = 1,024 ZB = 1,048,576 EB
1 BB = 1,024 YB = 1,048,576 ZB
1 NB = 1,024 BB = 1,048,576 YB
1 DB = 1,024 NB = 1,048,576 BB

1、要有阳光心态
这个世界,有两件事我们不能不做:一是赶路,二是停下来看看自己是否拥有一份好心态,好心态是人一生的好伴侣,让人愉悦和健康。
2、学会爱别人
没有爱的生活就象一片荒漠,赠人玫瑰,手有余香,“学会爱别人其实就是爱自己”,让爱如同午后阳光温暖每个人的心房。
3、懂得宽容感恩
多去理解尊重别人,常怀宽容感激之心,宽容是一种美德是一种智慧,海纳百川才那么广阔,感激你的朋友,是他们给了你帮助;感激你的敌人,是他们让你变的坚强。
4、切记祸从口出
管好自己的嘴,讲话不要只顾一时痛快、信口开河,“良言一句三冬暖,伤人一语六月寒”,说话要用脑子,敏事慎言,话多无益,不扬人恶,自然能化敌为友。
5、多储存人情
人情,人情,人之常情,要乐善好施,长于交往,“平时多烧香,急时有人帮”,所以“人情需要多储存”,就象银行存款,存的越多,时间越长,红利就越大。
6、遇事不要急躁
遇事不要急躁!不要急于下结论特别是生气时做决断,要学会换位思考,或者等一等、大事化小、小事化了,把复杂的事情尽量简单处理,千万不要把简单的事复杂化。
7、真正学会知足
真正学会知足,人生最大的烦恼是从最没意义的比较开始,这世界总有不如你的也总有比你强的人,当我哭泣我没有鞋子穿的时候,我发现有人却没有脚。
8、没必要生气计较
如果敌人让你生气,那说明你还没有胜他的把握,根本不必回头去看咒骂你的人是谁?如果有一条疯狗咬你一口,难道你也要趴下去反咬他一口吗?
9、享受工作的快乐
别把工作当负担,既然目前改不了行,也没有更好的工作,与其生气埋怨,不如积极快乐的去面对,当你把工作当作生活和艺术,你就会享受到工作的乐趣。
10、珍惜自己的生活
人活着一天,就是有福气,就该珍惜,人生短短几十年,不要给自己留下更多的遗憾,日出东海落西山,愁也一天,喜也一天;遇事不钻牛角尖,人也舒坦,心也舒坦。

摘自网络。

Love suffers long and is kind; love does not envy; love does not parade itself, is not puffed up;
爱是恒久忍耐,又有恩慈;爱是不嫉妒;爱是不自夸,不张狂;
Does not behave rudely, does not seek its own, is not provoked, thinks no evil;
不作害羞的事,不求自己的益处,不轻易发怒,不计算人的恶,
Does not rejoice in iniquity, but rejoices in the truth;
不喜欢不义,只喜欢真理;
Bears all things, believe that things, hopes all things, endures all things.
凡事包容,凡事相信,凡事盼望,凡事忍耐。
Love never fails.
爱是永不止息。

——<The Bible>

大家应该听说过著名的摩尔定律。摩尔定律是由英特尔创始人之一戈登·摩尔提出来的。其内容为:集成电路上可容纳的电晶体(晶体管)数目,约每隔24个月便会增加一倍;经常被引用的“18个月”,是由英特尔首席执行官大卫·豪斯所说:预计18个月会将芯片的性能提高一倍(即更多的晶体管使其更快)。
尽管这种趋势已经持续了超过半个世纪,摩尔定律仍应该被认为是观测或推测,而不是一个物理或自然法。预计摩尔定律将持续到至少2015年或2020年。
现在已经是2015年了,科技及芯片的发达程度应该已经超出了大部分人类工作的需求,势必造成资源的过剩,包括科技产品的产能和个人拥有的科技产品效能过剩。纵观世界范围内普通个人电脑,手持设备,智能手机等等产品已基本趋于饱和。基本人手都拥有一个高科技产品,唯一需要更换的理由就是产品的芯片效能无法满足目前工作的需要。就目前的科技产品发展的程度和高度,大部分产品的芯片应该可以满足的。所以高科技产品的市场可谓基本饱和,或者为饱和前状态。
So,预测个人PC,手持设备等电子产品的硬件出货量较以前应该会下降。到底会是何种表现,我们拭目以待。

原创文字,转载请注明出处。谢谢!