独家完整版小说《绝对掌控》是泡泡妹妹最新写的一本科幻小说风格的小说,这本小说的主角是沃尔玛阳光,书中主要讲述了:测试,开始帮助他炒股挣钱之后,他就可以用这些钱来雇人帮忙开发软件了。到时他可以将整个软件分成很多个模块,每个模块发一个包,无论是包给个人也好,还是包给其他软件公司也好,这样分解开发,最终再在他这里组...
精彩章节试读:
论。
这个数据分析模块,它必须同时具备显Xing因果分析能力,和隐Xing因果分析能力。
比如生猪存栏数据下跌,必然导致随后的猪肉价格上涨。生猪存栏数量与猪肉价格存在某种必然的因果关系,而数据分析模块,必须具备识别这种明显由因就可以导致果的因果关系的能力。
比如东南海峡输油管道发生破裂,必然导致帝国东南大区油品价格上涨,这也存在某种必然的因果关系。只不过与生猪存栏数据不同的是,生猪存栏数据属于常态化数据,它每天都有,每天都有浮动,而油管破裂属于偶发事件。
虽然油管破裂属于偶发事件,但是数据分析模块必须具备识别这种偶发事件,进而给出随后由其导致的必然后果的能力。
类似的因果关联事件或者数据很多,数据分析模块必须具备识别这种显Xing因果联系的能力。
与这些显Xing因果相对应的,就是隐Xing因果联系。
那个著名的啤酒和尿布的案例其实就是隐Xing因果联系,这些隐Xing因果之间,不一定具备必然Xing,但是因和果之间,往往存在或然Xing联系。
就单个事例来说,这种因果联系未必成立,但是将其置于一个足够大的基数上时,这种因果联系就凸显出来,这是一种概率学意义上的因果关系。
另外有一个案例,就是基于这种概率学因果关系的。一个搜索公司,它想研究今年冬天流感爆发的可能Xing,但是它研究的角度非常有意思,他不是从医学角度来研究,而是程序和算法角度来研究。
它通过分析5000万条最频繁检索的词汇,将之和疾病中心在5年间季节Xing流感传播时期的数据进行比较,并建立一个特定的数学模型,从中寻找关联Xing,寻找那些隐藏起来或然联系,最终它成功预测了流感的爆发,甚至可以精确到特定的地区和城市。
如果说显Xing因果只需要事先标注和设定,那么隐Xing因果明显就需要挖掘和寻找了,而如何找到这些隐Xing因果,就是数据分析模块的主要功能,同时也是这个模块是否设计成功的一个标志Xing指标。