《统计陷阱》

砖头Ⓥ茅坑组长
2008-07-01 00:39:14

http://www.douban.com/subject/1100657/ 第一章，样本的内在有偏 1，抽取的样本多大程度上能代表整体？抽样后计算所得的结果看似确定，其实是可疑的。 2，随机样本的检验标准：总体中的每个个体是否有相同的几率被选进样本？ 3，但是纯粹从整体获得“纯随机抽样”近乎不可能的。 4，所以我们只能采用“分层抽样”。即将整体按照某种标准分成不同的部分、层次。 5，虽然绝对不可能找到完全合乎要求的抽样样本，但就目前来看恐怕最好的就是“分层抽样”了。 6，永远都要对统计数字保持怀疑。第二章，精心挑选的平均数 1，“平均数”这个笼统的概念里包括着：均值、中位数、众数 2，举例来说：一共有一百个人，其每年总收入是一百万元。【均值】：就是用一百万除以一百人。结论是每人平均每年收入是一万元。（这是结果最大的平均数值）【中位数】：把每个人的收入从大到小排列，一半人在某数之上，一半人在某数之下。此即为中位数。（会比均值小一些）【众数】：在一百个收入数字里，出现最多的那个数字。上述均为“平均数”。一般来说，如果所处理的数值比较一般化，也就是说数据呈正态分布（用书上的话说就是像一口钟），那么均值、中位数、众数都差不多在一个点上。 3，但有的统计数据是不会正态分布的。比如收入。 4，书中举了一个通过平均数的不同计算来进行会计造假的例子。虽然据说很粗燥，但我依旧没怎么看懂。不过可以肯定的是：利用“平均”造假很有前途～ 6，见到平均，一定要怀疑之。

加入小组后即可参加投票

确定

回复转发赞收藏查看所有回复

你的回复

回复请先登录 , 或注册

砖头in茅坑的读书学习记录

161 人聚集在这个小组

加入小组

《统计陷阱》

砖头Ⓥ茅坑组长
2008-07-01 00:39:14

你的回复

相关内容推荐

最新讨论 ( 更多 )

《统计陷阱》

砖头Ⓥ茅坑 组长 2008-07-01 00:39:14

你的回复

相关内容推荐

最新讨论 ( 更多 )

砖头Ⓥ茅坑组长
2008-07-01 00:39:14