目录 - cnblogs.com · 2019-01-31 ·...

61
目录 1.1. Chapter 1 Representation of data ............................................................................... 5 1.2. 知识点展开方式 ................................................................................................................ 5 1.3. 考察方式 ............................................................................................................................ 9 2. Chapter 2 Measures of location ........................................................................................... 10 2.1. 知识点展开方式 .............................................................................................................. 10 2.2. 考察方式 .......................................................................................................................... 15 3. Chapter 3 measure of spread ............................................................................................... 16 3.1. 知识点展开方式 .............................................................................................................. 16 3.2. 考察方式 ......................................................................................................................... 25 4. Chapter 4 Probability ............................................................................................................. 26 4.1. 知识点展开方式: .......................................................................................................... 26 4.2. 考察方式: ..................................................................................................................... 30 5. Chapter 5 permutations and combinations ........................................................................ 34 5.1. 知识点展开方式: .......................................................................................................... 34 5.2. 考察方式: ..................................................................................................................... 38 6. Probability distributions: ....................................................................................................... 42 6.1. 知识点展开方式 .............................................................................................................. 42 6.2. 考察方式 ......................................................................................................................... 45 7. Binomial distribution ............................................................................................................... 46 7.1. 考察方式: ...................................................................................................................... 48 8. Chapter 8 Expectation and variance of a random variable ........................................... 49 8.1. 知识点展开方式 .............................................................................................................. 49 8.2. 考察方式: ..................................................................................................................... 52 9. Chapter 9 The normal distribution: .................................................................................... 54 9.1. 知识点展开方式: .......................................................................................................... 54 9.2. 考察方式: ..................................................................................................................... 60

Transcript of 目录 - cnblogs.com · 2019-01-31 ·...

Page 1: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

目录

1.1. Chapter 1 Representation of data...............................................................................5

1.2. 知识点展开方式................................................................................................................5

1.3. 考察方式............................................................................................................................9

2. Chapter 2 Measures of location........................................................................................... 10

2.1. 知识点展开方式.............................................................................................................. 10

2.2. 考察方式..........................................................................................................................15

3. Chapter 3 measure of spread............................................................................................... 16

3.1. 知识点展开方式.............................................................................................................. 16

3.2. 考察方式.........................................................................................................................25

4. Chapter 4 Probability............................................................................................................. 26

4.1. 知识点展开方式:..........................................................................................................26

4.2. 考察方式:.....................................................................................................................30

5. Chapter 5 permutations and combinations........................................................................34

5.1. 知识点展开方式:..........................................................................................................34

5.2. 考察方式:.....................................................................................................................38

6. Probability distributions:.......................................................................................................42

6.1. 知识点展开方式..............................................................................................................42

6.2. 考察方式.........................................................................................................................45

7. Binomial distribution...............................................................................................................46

7.1. 考察方式:......................................................................................................................48

8. Chapter 8 Expectation and variance of a random variable...........................................49

8.1. 知识点展开方式..............................................................................................................49

8.2. 考察方式:.....................................................................................................................52

9. Chapter 9 The normal distribution:....................................................................................54

9.1. 知识点展开方式:..........................................................................................................54

9.2. 考察方式:.....................................................................................................................60

Page 2: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 3: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 4: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 5: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Review of Statistic 1

1.1. Chapter 1 Representation of data

1.2. 知识点展开方式

Statistics :the collection,organization and analysis of numerical information are all

part of the subject called statistics.Variable <->property of dataMissing observation : - 1Qualitative data : typeQuantitative data: numerical

Continuous variable :can take any value in a particular range

Discrete variable : there are clear steps between its possible values

Stem-and-leaf diagrams :one way of arranging the values .

Brackets :圆括号

Raw data: the values collected in a survey or experiment before they are categorized.

Page 6: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Ordered stem-and-leaf diagram :

Back-to-back stem-and-leaf diagram:

Histograms :for large sets of data,we divide the data into groups,called classes.

Page 7: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

The class boundaries: 需要特别注意一下下面这两个情况。

Page 8: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Frequency densities:

下面这个题需要注意一下:

Cumulative frequency graphs:to represent continuous data ,注意区间的 [ , )关系

Page 9: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Practical activities

1.3. 考察方式

Page 10: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

2. Chapter 2 Measures of location

一个数据的位置其实透露了很多信息,比较著名的例子是时间序列分析、

2.1. 知识点展开方式

Measure of location(measure of central tendency)

Page 11: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

The median :先排序,如果偶数个,中间两个取平均,如果个,直接取中间那个。

一般给各种图让找 median:

①stem-and-leaf diagram :

②frequency table:

Page 12: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

The mean :

Summation notion :便于书写的一个符号,符号对于人类认知的重要意义,牛顿和莱布尼茨

均发明了微积分,但是牛顿的符号很不好用,而莱布尼茨所用的积分号最终成为现在世界通

用的符号。

Page 13: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

与 median 同样的从图中找 mean:

下边这两大堆记不记无所谓,只要知道 mean 的定义就能算出来。

The mode and the modal class:

Page 14: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Comparison of the mean,median and mode:

选择合适的 measure 去解释某个事情:

Outliers,skewed,

Page 15: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

2.2. 考察方式

Page 16: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

3. Chapter 3 measure of spread

3.1. 知识点展开方式

下面这个四分间距是为了避免数据在边缘很离散的那种情况,比如 1-100,最后一个数是

1000,这样造成 range 特别大,不能够反应数据真实状况。

Page 17: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

乘以 1/4 或者 3/4,然后向上取整。比如 97.5 就找第 98 个。

Page 18: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

The five-number summary:

Box-and-whisker plots(box plot):

Zero skew,positive skew,negative skew:

其实就是根据平均值的位置,平均值在左边就是 positive skew,在右边就是 negative skew。

Page 19: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

下面这三张图是根据 median 位置,media 在左边就是 positive,在右边就是 negative。

同样的数据用不同的图去判断 skew 很有可能得到相反的结果,因为你的判断标准不一样。

Outliers(异常值)给了一种判别数据点是异常值的标准,这种标准还有很多很多,这只是

其中一种,统计学就是这样,方法可行好用即可,而且这很容易编程实现,算法相当简单,

便于处理上亿条的大数据。

Page 20: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Variance and standard deviation:

最后一个 variance 公式的证明是这本书上为数不多的证之一,学会去解决没见过的问题也

是我们学数学的重要原因之一。

Page 21: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Calculating variance from a frequency table:

下面这些理解即可:

Page 22: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Choosing how to represent data:

Page 23: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 24: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 25: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

3.2. 考察方式

Page 26: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

4. Chapter 4 Probability

最引人注目的概率终于出现了。

4.1. 知识点展开方式:

Assigning probability:

Page 27: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 28: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 29: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

要想说明下面的事实需要一些微积分:

Page 30: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

4.2. 考察方式:

Page 31: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 32: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 33: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 34: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

5. Chapter 5 permutations and combinations

排列与组合,这一章其实完全可以放在 Pure mathematics 里边的 binomial theorem 讲,

既然这里讲了,我们就结合着来说一下吧。

5.1. 知识点展开方式:

(x+y)^n

Sample space

Page 35: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

熟知 :1! 2! 3! 4! 5! 6!

Page 36: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 37: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

一些补充的小知识点:

Page 38: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

5.2. 考察方式:

我下面分类的介绍会考察的若干种方式:

。。。。

Page 39: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 40: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 41: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 42: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

6. Probability distributions:

6.1. 知识点展开方式

主要讲 discrete random variable

Page 43: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 44: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 45: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

6.2. 考察方式

Page 46: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

7. Binomial distribution

与二项式定理,组合的关系

我们先考虑伯努利分布,然后进阶到二项分布,比课本上直接讲更容易理解。

伯努利分布:

概率空间{X,Y} P(X)=p,P(Y)=q

在现实生活中,我们经常碰到这样简单的概率模型,比如抛硬币通常有两个结果。

二项分布:

重复 n 次伯努利事件即可:

Page 47: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Using the binomial distribution as a model:

Page 48: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

7.1. 考察方式:

Page 49: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

8. Chapter 8 Expectation and variance of a random variable

8.1. 知识点展开方式

Expectation and variance :

Page 50: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

学会证明下边等式的右边:

Page 51: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

The expectation and variance of a binomial distribution:

会证,更重要的是会用:

Page 52: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

8.2. 考察方式:

Page 53: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 54: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

9. Chapter 9 The normal distribution:

9.1. 知识点展开方式:

Modelling continuous variables:

Page 55: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

概率密度图像随着两个参数变化:

Page 56: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

The standard normal distribution:

Page 57: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。
Page 58: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

下面是关于大写 phi(z)的一些计算:

Standardising a normal distribution:

把一个一般的正态分布化成标准的正态分布,可以方便计算和查表。

Page 59: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

Modelling with the normal distribution:

Page 60: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。

9.2. 考察方式:

Page 61: 目录 - cnblogs.com · 2019-01-31 · 下面这三张图是根据median位置,media在左边就是positive,在右边就是negative。 同样的数据用不同的图去判断skew很有可能得到相反的结果,因为你的判断标准不一样。