序
- 拥抱“大数据时代”
- 实实在在的大数据
- 大数据也是一样,量变导致质变
- 一场生活,工作与思维的大变革
- 在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样
- 研究数据如此之多,以至于我们不再热衷于追求精确度
- 笔记:相对来说在庞大的数据系出现极少的数据错误也不会影响最后的结果,但是当错误的数据越多,也就越可能影响最终的结果
- 我们不再于热衷寻求因果关系,只要让数据发声
- 笔记:这个得看具体情况,必要时刻也要去了解现象背后的原因,数据也是由人们产生的
一.大数据时代的思维变革
更多——不是随机样本,而是全体数据
- 让数据”发声“
- 利用所有的数据,让每一条数据都发挥其作用
- 小数据时代的随机采样,最少的数据获得最多的信息
- 采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大
- 随机采样取得了巨大的成功,成为现代社会,现代测量领域的主心骨,但这只是一条捷径,是在
不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷 - 全数据模式,样本=总体
- 大数据是指不用随机分析法这样的捷径,而采用所有数据的方法
更杂——不是精确性,而是混杂性
- 允许不精确
- 大数据时代要求我们重新审视精确性的优劣
- 大数据的简单算法比小数据的复杂算法更有效
- 纷繁的数据越多越好
- 大数据不仅让我们不再期待精确性,也让我们无法实现精确
- 混杂性,不是竭力避免,而是标准途径
- 要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免
- 新的数据库设计的诞生
- 只有5%的数字数据是结构化的且能适用于 传统数据库,如果不接受混乱,剩下95%的非结构化数据都无法被利用
- NoSQL
更好——不是因果关系,而是相关关系
- 关联物
- 现在拥有如此多的数据,这么好的机器计算能力,因而不再需要人工选择一个关联物或者一小部分相似数据来逐一分析了
- 大数据的相关关系分析更准确,更快,而且不易受偏见的影响
- 建立在相关关系分析法基础上的预测是大数据的核心
- 通过找出一个关联物并检控它,我们就能预测未来
- 当收集,存储和分析数据的成本比较高的时候,应该适当地丢弃一些数据
- “是什么”,而不是“为什么”
- 通过去探求“是什么”而不是“为什么”,相关关系帮组我们更好地了解了这个世界
- 相关关系很有用,不仅仅是因为它能为我们提供新的视角,而且提供的视角都很清晰。
而我们一旦把因果关系考虑进来,这些视角就有可能被蒙蔽掉 - 改变,从操作方式开始
- 大数据,改变人类探索世界的方法
- 因为不受限于传统的思维模式和特定领域里隐含的固有偏见,大数据才能为我们提供如此多新的深刻洞见
- 大数据时代将要释放出的巨大价值使得我们选择大数据的理念和方法不再是一种权衡,而是通往
未来的必然改变。但是在我们到达目的地之前,我们有必要了解怎样才能到达
二.大数据时代的商业变革
数据化——一切皆可“量化”
- 数据,从最不可能的地方提取出来
- 数据化,不是数字化
- 量化一切,数据化的核心
- 当文字变成数据
- 当方位变成数据
- 当沟通变成数据
- 时间万物的数据化
价值——“取之不尽,用之不竭”的数据创新
- 数据创新1:数据的再利用
- 数据创新2:重组数组
- 数据创新3:可扩展数据
- 数据创新4:数据的折旧值
- 数据创新5:数据废气
- 数据创新6:开放数据
- 给数据估值
角色定位——数据,技术和思维的三足鼎立
- 大数据价值链的3大构成
- 大数据掌控公司
- 大数据技术公司
- 大数据思维公司和个人
- 全新的数据中间商
- 专家的消亡与数据科学家的崛起
- 大数据,决定企业竞争力
三.大数据时代的管理变革
风险——让数据主宰一切的隐优
- 无处不在的“第三那只眼”
- 我们的隐私被二次利用了
- 预测与惩罚,不是因为“所做”,而是因为“将做”
- 数据独裁
- 挣脱大数据的困境
掌控——责任与自由并举的信息管理
- 管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任
- 管理变革2:个人动因VS预测分析
- 管理变革3:击碎黑盒子,大数据算法师
- 管理变革4:反数据垄断大亨
结语
- 正在发生的未来