批判性思维-用数据说话更像实事求是

table of contents

    批判性思维-用数据说话更像实事求是

    01.

    论证的目的是为了证明论点的成立,而支持论点成立的关键则是论据。论据是否真实、是否可信,直接影响着论证的质量。

    论据一般就两类:道理和事实。而数据,则是“事实”类论据的主要形式。

    提供“数据”充当论据来支持论点很必要,但有个前提——数据的使用必须准确;否则,就会出现诸如:以偏概全、偏向样本、滥用数据等错误的论证。

    以偏概全谬误,指的是我们以片面的、单一的样本所反应的数据,来支持论点的成立。

    鲁迅在《活中国的姿态》序中,写了两为旅行者来中国:

    一个旅行者走进了下野的有钱的大官的书斋,看见有许多很贵的砚石,便说中国是“文雅的国度”;

    一个观察者到上海来一下,买几种猥亵的书和图画,再去寻寻奇怪的观览物事,便说中国是“色情的国度”。

    那中国到底是“文雅”还是“色情”?

    一处犄角旮旯的印象怎能代表整个中国?

    这里的两个结论都不成立,它们都是由片面的样本数据得出来的,是以偏概全谬误的表现。

    还有守株待兔的例子:

    说宋国有一农民,见一只兔子撞死在了树蹲上。于是,他便放下锄头在旁边等。

    他想的是,只有蹲在这边等,就能得到更多撞死的兔子。

    偶然地、一次兔子撞到树根死了,就被他过度概括成了:

    兔子会经常撞树,所以只要等,就会得到更多兔子。

    这样等到天荒地老,可能都等不到第二只了吧。

    可见,单一样本反应的数据,是无法有力地支持一个结论成立的。

    02.

    偏向样本谬误,指的是我们用于观察得出结论的样本,是根据个人喜好抽取的,因此它们没有多样性及代表性,得出的数据不足以支撑结论成立。

    张三的爷爷喜欢养狗

    隔壁李大爷喜欢养狗

    楼上张老头喜欢养狗

    吴奶奶也养了两条狗…

    ------------

    所以,全小区的人都喜欢养狗

    这个结论可信不?

    即便还有赵大爷、王老太等等,它们都喜欢养狗,也仅仅代表了(部分或全部)老年人的兴趣爱好。

    这些样本数据,又怎能推出“全小区的人都喜欢养狗”呢?难不成这小区没有年轻人、没有小孩、没有其他的人了?

    这样以自己的偏向而抽取的样本数据做论据,就犯了偏向样本谬误。

    对XX市年入百万的人群进行了幸福度问卷,发现这座城市中有70%以上的人感觉生活是幸福的。

    这个结论就有点不靠谱。

    这个调研,针对的群体是“这座城市年入百万的群体”,它无法反应“这座城市”的情况。

    按照收入标准划分,这个城市还有年入不足10万的人群,甚至不足5万的人群;并且,他们可能是“这座城市”的大多数,更能代表这座城市。

    大多数人没有参与、没有表态,仅凭自己的偏好抽取的单一的、少数的样本,不足以支持观点。这犯了偏向样本谬误。

    03.

    滥用数据谬误,指的是我们忽略了样本总体性质的差异,却对两个统计数据进行生硬比较,试图支撑某一结论成立。

    美国海军曾忽悠年轻人参军,做了广告:

    在美国与西班牙作战期间,纽约市民的死亡率是1.6%,而美国海军的死亡率仅为0.9%。

    欢迎广大青年投入海军,美国海军的死亡率比纽约市民的死亡率还要低。

    你认同他们的这个说法吗?

    他们坑骗年轻人也是毫不顾忌。

    看这两个用于比较的数据,它们的样本性质有非常大的差异。

    美国海军这个群体,绝大多数是年轻小伙,身体素质过硬;而纽约市民这个群体,它包含了老弱病残等民众。

    群体性质存在差异,因此它们各自得出的数据是无法拉在一起比较的。

    再说死亡方式,海军是战争致死,市民是自然死亡,两组数据性质也不同,也是无法比较的。

    只有同一类群体的同一类数据之间才有可比性,否则,为了证明而强行比较,就犯了滥用数据谬误。

    以上我们简单的聊了以偏概全、偏向样本、滥用数据的谬误

     

     

    声明:本站文章内容最新发布文章多为原创,同时转载了不少知乎和公众号多年之前就已经发布过的比较好的文章。保存文章的目的是为了提高自己的水平,同时可以看看各位当年的大佬对未来预测是否靠谱,另外也是为了自己查找回顾方便。转载文章每篇都亲自阅读,并且做了整理和修改,删除了一些招生或者培训信息,每篇文章尽量保留原作者信息和意图。