现代预言家 - WordsTaste
现代预言家
标签:统计法术修炼
  2018-05-18 11:19:27, 修改于2018-05-18 11:27:46

今天我正式踏上了我的数据科学之路。
将会新开许多专栏,将我所学用浅白的语言记录下来。
数据科学家是一个十分酷炫的职业,严谨的模型,形象的图表,精确的数字,生动的叙述......
但归根结底,数据科学家是把成千上亿杂乱无章的数据,消化产出最对人类有价值的成果和产品。
套用《我的英雄学院》的一句我十分喜欢的台词。
“这是一段讲述我成为最棒数据科学家的故事!”



斯坦福大学《Statistical Learning》的公开课是一个很好的开始。适合像我这样非统计专业,有一点统计基础的同学学习。这个系列的文章主要讲述这门课的内容。内容不求精确,但力求简洁易懂,不失统计学伟大之深刻。


数据是个抽象的东西,谈论数据时,为了更加具体,我们最好加个 “xx的数据”
比如 “电视广告投放的数据” “销售的数据” “邮箱的数据” “学生成绩的数据”
一旦数据有了归类属别,分析起来会简单明了。
分析什么呢? 分析数据与数据之间的关系。
为什么我们要先分析不同属别数据之间的关系呢?
因为有些数据很好控制,却未必能带来效益,有些数据不好控制,却对收益至关重要。
投放多少电视广告,我们很好控制。但每分花在电视广告的钱能带来多少销量,却无法控制。
但在决定是否要投放电视广告,投放多少时,我们希望能对结果,也就是其所带来的销量,有一个准确的预期。
这个预期不是凭空生出来的,也很难通过物理推演得出。
最简单的方法是通过以往的数据来探究两者之间的关系。

从以往的数据我们可以分析得出,相比于电台和报纸,电视广告所带的销量效率最高。(如果横坐标是金钱的话)
一旦明了不同数据之间的关系,我们就能像预言家一样,预知未来。
过去的预言家靠直觉,现代的预言家靠数据!
仔细想下去,过去所谓的“直觉”, 也是历史经验,感觉,环境给予人的各种生理脉冲之下综合得出的结果,本质上也是多源数据在人大脑这个分析器中所产出的成果。

预言,靠的是数据,从古至今都是。
数据科学家,就是现代预言家。



<<<返回上一页 阅读(585) | 评论(0) | 收藏(0) | 赞(0)

验证码