《统计陷阱》
砖头Ⓥ茅坑
http://www.douban.com/subject/1100657/ 第一章,样本的内在有偏 1,抽取的样本多大程度上能代表整体?抽样后计算所得的结果看似确定,其实是可疑的。 2,随机样本的检验标准:总体中的每个个体是否有相同的几率被选进样本? 3,但是纯粹从整体获得“纯随机抽样”近乎不可能的。 4,所以我们只能采用“分层抽样”。即将整体按照某种标准分成不同的部分、层次。 5,虽然绝对不可能找到完全合乎要求的抽样样本,但就目前来看恐怕最好的就是“分层抽样”了。 6,永远都要对统计数字保持怀疑。 第二章,精心挑选的平均数 1,“平均数”这个笼统的概念里包括着: 均值、中位数、众数 2,举例来说: 一共有一百个人,其每年总收入是一百万元。 【均值】:就是用一百万除以一百人。结论是每人平均每年收入是一万元。(这是结果最大的平均数值) 【中位数】:把每个人的收入从大到小排列,一半人在某数之上,一半人在某数之下。此即为中位数。(会比均值小一些) 【众数】:在一百个收入数字里,出现最多的那个数字。 上述均为“平均数”。一般来说,如果所处理的数值比较一般化,也就是说数据呈正态分布(用书上的话说就是像一口钟),那么均值、中位数、众数都差不多在一个点上。 3,但有的统计数据是不会正态分布的。比如收入。 4,书中举了一个通过平均数的不同计算来进行会计造假的例子。虽然据说很粗燥,但我依旧没怎么看懂。不过可以肯定的是:利用“平均”造假很有前途~ 6,见到平均,一定要怀疑之。
你的回复
回复请先 登录 , 或 注册
161 人聚集在这个小组
加入小组
相关内容推荐
最新讨论 ( 更多 )
- 语言类型学(刘丹青) (砖头Ⓥ茅坑)
- 转换生成理论讲座(沈阳) (砖头Ⓥ茅坑)
- 类型学语料分析(王超贤) (砖头Ⓥ茅坑)
- 原来这儿猫着这么一个小组~ (丑孩子)
- 计算语言学概论(詹卫东) (砖头Ⓥ茅坑)