数据科学中的强大思维
人类擅长在所有的事物中寻找对应的模式。 真模式,假模式,命名的模式。 我们是那种能在薯片上找到猫王的脸的生物。 如果你倾向于将模式与洞察力等同起来,请记住有三种数据模式:
1、存在于你的数据集中和数据之外的模式/事实
2、仅存在于数据集中的模式/事实
3、只存在于你想象中的模式/事实
数据模式可以存在于(1)所有感兴趣的人群中,(2)仅仅在样本中,或者(3)只存在于你的头脑中
哪一种对你来说更有用,取决于你的目标是什么
一、追求灵感
你追求的是纯粹的灵感,那么它们都非常适用。即使是来自术语apophenia中的奇特的定义apopheny(人类有错误地感知不相关事物之间的联系和意义的倾向)也可以激发你(文章里面的称呼统一一下,要么都你,要么都你吧)的创意。 创造力是没有特定的答案的,所以你需要做的就是查看你的数据,并享受它带来的乐趣。 创造力是一种额外的收获,尽量不要在这个过程中浪费太多时间。
二、崇尚事实
政府想要向你征税的时候,它一点也不关心你这一年除了财务数据之外的模式。 基于事实的决定是,通过你的欠债情况,分析去年的数据得出应该采取的方法。它会基于事实对你所欠下的债务做出决定,而做出决定的方法就是分析去年的数据。换句话说,查看数据并使用公式进行评估。你只需要对手头的数据进行描述性统计分析。前面两种模式都可以很好地做到这一点。
三、在不确定的情况下做出决策
有时,理想和现实是有差距的,当你不具备做决定所需要的全部信息时,你就需要在不确定性中寻找方向,选择一个合理的行动方案。
这就是统计学,它是一门会改变你在不确定情况下思维方式的科学。它的目的是能产生一个像icarus一样的飞跃,突破你的知识局限,而不是遇到短板就突然结束。
这就是数据科学的核心挑战:如何应对数据不足的情况。
在你离开一个断崖式的障碍之前,你当然会希望你在现实中可以运用的模式是可以突破它的。换句话说,模式必须一般化才能真正有用。
在三种类型中,如果你是在不确定的情况下做出决策,那么只有第一种(可推广的)模式是安全的。 不幸的是,你还会在数据中发现其他类型的模式,这也是数据科学的核心问题: 如何应对数据不足的情况。
【赐研手机维修网】文章内容来源:https://m.vip-chn.com/jishu/ai/97.html