对大数据思维逻辑的反思

浏览: 2450

昨天出差长春并返连,坐车时间不低于七个小时, 只为一个持续一个小时并且仍然悬而未决的会议,貌似不值得......静静想一想,我们80%的工作都是在为20%的结果做准备。生活何尝不是呢,用了两个小时做饭,半个小时吃完了。


操作大数据主要通过数据统计—数据分析—数据挖掘等技术手段发现信息线索,并用逻辑化的数据拓展既有信息主题的广度与深度,最后以图表、数据为主,辅之以必要的少量文字的可视化方式加以呈现,从而致力于信息的客观、系统和可视体验。这是一种追求数字化、量化,把一切都还原为数学方程式的思维逻辑。 按照这种思维逻辑的设定,信息文本只要从纷繁芜杂的数据海洋(现象)中找到某种所谓的本质的东西,比如自然科学的公式,那么信息世界就尽可把握了。作为一种认知信息事物的程序,大数据思维认知的普遍性逻辑必然会抽离个别信息事物的具体性,其特征是一步一步地撇开个体信息事物身上道德的、功用的、审美的和哲学的等意义,以还原为最为抽象的同一性。这种逻辑必然会遗漏与特定本质属性缺乏关联的非本质信息属性,从而使个别信息事物的整体形象和全部意义无法得到认知与传播,最终导致反映的本质和客观性既不能深刻体现社会意义的原型结构,更不能折射超自然的、高位阶的社会信息需求。也就是说大数据本身是一种理性的表现,但还需要更大的理性——人文法则的观照。依人文科学乃至生活世界中的客观性,在于解释与反思一系列视域和融贯性内的诸种关系。一般认为,这些意义、关系越融贯为一体,生活世界和人文科学中的客观性便越是客观的、真实的、具体的。如何实现这些关系的内在融合,以实现信息客观性、真实性和具体性之人文内涵,必须澄清当下“大数据”给我们在如下关系领域内造成的混乱。

(一)重普遍性而轻个体性。

对于人文与科学态度的划分,就是以强调个体性还是强调普遍性为基本依据的。因为人文科学强调的是个体性的人生价值意义而自然科学强调的是普遍性的规律。从大数据的实践层面看,一般认为大数据的时代其实是弘扬理性精神的时代,但如果大数据分析和使用在于满足非正义的事情,那么,这正好说明大数据本身不完全等同于理性,更大的理性是人文法则。

(二)重关联性而轻因果性。

冰淇淋的销量和强奸案的发生率存在线性关系,即一个增长,另一个也增长。不过,两者之间显然没有因果关系,而只有相关关系。另一个变量,即天气变暖,才是两者之间的真正桥梁。所以,舍恩伯格这种放弃因果关系而只考察相关性的思路,与其说是一种进步,倒不如说是一种思维紊乱。因为它不利于我们消除不确定性而进行下一步预测,也无法采取行动。研究者辨明因果关系并非来自统计,而是来自研究者的理论和假设。但是大数据分析更关注数据的相关性测量和商业应用价值。大数据是发现那些不能靠直觉发现的信息和知识,甚至是违背直觉的,有时候越是出乎意料可能越有商业价值。

(三)重信号而轻噪声。

大数据重要的功能之一就是减少或消除不确定性,以预测未来事态。信息的指数型增长有时被人们视为万灵药,以至于人们根本分辨不清大数据中的信号和噪声。在任何一个数据丰富的领域,寻找预测模式都很容易。关键是要分辨出这些模式到底是噪声还是信号。我们对未来的预测,应该基于可能性,以概率的方法思考问题,在不断试错中进步。从某种意义上说,大数据思维也必然在预测和证实(证伪)之间有其独特的实践逻辑设计。但该认知逻辑必由两个组合的构成因素所支配:一个是信息实践成功的程度所必须的认知资源,如信息、时间和计算能力。另一个是信息实践推理主体所瞄准的认知目标的高度。由于这两个因素有程度之别,因此,某一具体的信息实践行为是一个相对的、可比较的概念,而不是一个绝对的、没有参照物的死物。按此观点,只有当大数据思维主体心中拥有的认知任务和其可利用的认知资源相匹配时,推理才是正确的。因此,数据驱动预测机制可能会成功,也可能会失败。一旦我们否认数据处理过程中存在着主观因素,失败的概率就会增加。

(四)用事实说话和用数据说话。

大数据时代既要用事实说话,也要用数据说话,这句话是没错,但关键在于应该说清楚用事实说话是用具体的、抽样的个体性事实说话,而用数据说话是用抽象的、普遍性规律说话。前者是必然的理由,后者具有或然性。因为大数据样本不仅需要更多的时间去分析,它们往往还包含被抽样的所有个体的许多不同信息,从统计学的角度讲,这意味着这些样本是“高维的”。更多的维度增加了发现欺骗性关联的风险。比如,在医学研究中,可能会将某种药物的疗效与病人的身高联系在一起。但是这可能仅仅是因为大数据包含方方面面的信息,从身高、体重到眼睛的颜色等等。需要考虑的维度如此之多,有些维度显得重要似乎只是出于偶然。因此,用数据说话是媒体在大数据时代展现权威性、公信力的重要手段,但不是必不可少的手段。

(五)重传者分析而轻受众理解。

计算机领域的科学家通过开发出卓越的计算能力和信息存储技术,让大数据的积累成为可能。但是收集数据及存储信息与理解这些内容并不是一回事。了解大数据的真正意义并不等同于对小数据进行解读。对于广大非专业的受众而言,对大数据分析结果的理解绝不应是简单回忆,而是具有历史的连续性和非连续性特点,即尽管过去了的东西其本身不可能原样再现和重演,这是讲的非连续性。但历史事件一旦过去,它总会给后人留下对它的某种理解,这理解就是给出历史事件的意义,正是这理解才使得一去不复返的历史事件持存着、继续着,而这也就是历史连续性的具体内涵。而大数据思维因为过多的强调非结构化序列的连续性而割裂信息事件历史意义的非连续性传承,从而使得大数据思维历史意义空洞化,从而加大其随机性定义生成的可能性,使得思维在总体上缺乏历史必然性的观照。

大数据思维客观性来源于对一个个具体的个体所持有的丰富意义域向普遍性方向进行抽象的结果,其特征是一步一步地撇开个体身上道德的、功用的、审美的和哲学的意义等,以至最终达到最为抽象的同一性。传统思维客观性则在于首先以抽象的同一性意义为逻辑起点,超越但不抛弃抽象走向具体,通过把功用的、审美的和道德的意义与普遍意义融贯在一起,构建一个包括所有这些意义在内的有机统一体。大数据思维实践更大的理性——人文法则。

参考中文互联网数据研究资讯中心,在此感谢。


此文摘处:DataThinking

推荐 0
本文由 GeorgeYao 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

5 个评论

很理性的思考,数据是有局限性、时效性的。
这文章谁写的?
http://mp.weixin.qq.com/s?__biz=MzI4NDAzODkzOA==&mid=207629993&idx=1&sn=b16fdcd16a6d5d46e7020bc1d5206d0b#rd
http://mp.weixin.qq.com/s?__biz=MzI4NDAzODkzOA==&mid=207629993&idx=1&sn=b16fdcd16a6d5d46e7020bc1d5206d0b#rd
还是不知道谁写的,“昨天出差长春并返连”,希望找到大连的同道中人啊。

要回复文章请先登录注册