数学 & 统计知识大全(附视频)

数学 & 统计知识大全(附视频)高等数学1. 导数定义2. 左右导数导数的几何意义和物理意义3. 函数的可导性与连续性之间的关系4. 平面曲线的切线和法线5. 四则运算法则6. 基本导数与微分表7. 复合函数,反函数,隐函数以及参数方程所确定的函数的微分法8. 常用高阶导数公式9. 微分中值定理,泰勒公式10. 洛必达法则11. 泰勒公式12. 函数单调性的判断13. 渐近线的求法14. 函数凹凸性的判断15. 弧微分16.曲率17.曲率半径线性代数行列式矩阵1.矩阵的加法2.矩阵的数乘3.矩阵的乘法4. 三者之间的关系5.有关的结论6.有关的结论7.有关矩阵秩的结论8.分块求逆公式向量1.有关向量组的线性表示2.有关向量组的线性相关性3.有关向量组的线性表示4.向量组的秩与矩阵的秩之间的关系5.维向量空间的基变换公式及过渡矩阵6.坐标变换公式7.向量的内积8.Schmidt正交化9.正交基及规范正交基线性方程组1.克莱姆法则3.非奇次线性方程组有解的充分必要条件,线性方程组解的性质和解的结构4.奇次线性方程组的基础解系和通解,解空间,非奇次线性方程组的通解矩阵的特征值和特征向量1.矩阵的特征值和特征向量的概念及性质2.相似变换、相似矩阵的概念及性质3.矩阵可相似对角化的充分必要条件4.实对称矩阵的特征值、特征向量及相似对角阵二次型1.个变量的二次齐次函数2.惯性定理,二次型的标准形和规范形3.用正交变换和配方法化二次型为标准形,二次型及其矩阵的正定性概率论和数理统计随机事件和概率1.事件的关系与运算2.运算律3.德摩根律4.完全事件组 5.概率的基本公式6.事件的独立性7.独立重复试验 随机变量及其概率分布1.随机变量及概率分布2.分布函数的概念与性质3.离散型随机变量的概率分布4.连续型随机变量的概率密度5.常见分布6.随机变量函数的概率分布7.重要公式与结论多维随机变量及其分布1.二维随机变量及其联合分布2.二维离散型随机变量的分布3. 二维连续性随机变量的密度4.常见二维随机变量的联合分布5.随机变量的独立性和相关性6.两个随机变量简单函数的概率分布7.重要公式与结论随机变量的数字特征1.数学期望2.方差3.标准差4.离散型:5.连续型:6.随机变量函数的数学期望7.协方差 8.相关系数9.重要公式与结论数理统计的基本概念1.基本概念2.分布3.正态总体的常用样本分布4.重要公式与结论

数据科学(data science)需要较强的数学基础,我本科纯数出身,倒是不用学习到特别冗长复杂的理论证明,但是向量矩阵、概率统计是一定要深度掌握的!


高等数学

1. 导数定义

导数和微分的概念

(8)f(x0)=limΔx0f(x0+Δx)f(x0)Δx

或者:

(9)$f(x0)=limxx0f(x)f(x0)xx0

 

2. 左右导数导数的几何意义和物理意义

函数f(x)x0处的左、右导数分别定义为:

左导数:

(10)f(x0)=limΔx0f(x0+Δx)f(x0)Δx=limxx0f(x)f(x0)xx0,(x=x0+Δx)

 

右导数:

(11)f+(x0)=limΔx0+f(x0+Δx)f(x0)Δx=limxx0+f(x)f(x0)xx0

 

3. 函数的可导性与连续性之间的关系

Th1: 函数f(x)x0处可微f(x)x0处可导

Th2: 若函数在点x0处可导,则y=f(x)在点x0处连续,反之则不成立。即函数连续不一定可导。

Th3: f(x0)存在f(x0)=f+(x0)

4. 平面曲线的切线和法线

切线方程 : yy0=f(x0)(xx0) 法线方程:yy0=1f(x0)(xx0),f(x0)0

 

5. 四则运算法则

设函数u=u(x)v=v(x)]在点x可导则

  1. (u±v)=u±v d(u±v)=du±dv
  2. (uv)=uv+vu d(uv)=udv+vdu
  3. (uv)=vuuvv2(v0) d(uv)=vduudvv2

6. 基本导数与微分表

  1. y=c(常数) y=0 dy=0
  2. y=xα(α为实数) y=αxα1 dy=αxα1dx
  3. y=ax y=axlna dy=axlnadx 特例: (ex)=ex d(ex)=exdx
  4. y=logax y=1xlna dy=1xlnadx 特例:y=lnx (lnx)=1x d(lnx)=1xdx
  1. y=sinx y=cosx d(sinx)=cosxdx
  1. y=cosx y=sinx d(cosx)=sinxdx
  1. y=tanx y=1cos2x=sec2x d(tanx)=sec2xdx
  2. y=cotx y=1sin2x=csc2x d(cotx)=csc2xdx
  3. y=secx y=secxtanx d(secx)=secxtanxdx
  4. y=cscx y=cscxcotx d(cscx)=cscxcotxdx
  5. y=arcsinx y=11x2 d(arcsinx)=11x2dx
  1. y=arccosx

y=11x2 d(arccosx)=11x2dx

  1. y=arctanx

y=11+x2 d(arctanx)=11+x2dx

  1. y=arccotx

y=11+x2

d(arccotx)=11+x2dx

  1. y=shx

y=chx d(shx)=chxdx

  1. y=chx

y=shx d(chx)=shxdx

7. 复合函数,反函数,隐函数以及参数方程所确定的函数的微分法

(1) 反函数的运算法则: 设y=f(x)在点x的某邻域内单调连续,在点x处可导且f(x)0,则其反函数在点x所对应的y处可导,并且有dydx=1dxdy (2) 复合函数的运算法则:若μ=φ(x)在点x可导,而y=f(μ)在对应点μ(μ=φ(x))可导,则复合函数y=f(φ(x))在点x可导,且y=f(μ)φ(x) (3) 隐函数导数dydx的求法一般有三种方法: 1)方程两边对x求导,要记住yx的函数,则y的函数是x的复合函数.例如1yy2lnyey等均是x的复合函数. x求导应按复合函数连锁法则做. 2)公式法.由F(x,y)=0dydx=Fx(x,y)Fy(x,y),其中,Fx(x,y) Fy(x,y)分别表示F(x,y)xy的偏导数 3)利用微分形式不变性

8. 常用高阶导数公式

(1)(ax)(n)=axlnna(a>0)(ex)(n)=ex (2)(sinkx)(n)=knsin(kx+nπ2) (3)(coskx)(n)=kncos(kx+nπ2) (4)(xm)(n)=m(m1)(mn+1)xmn (5)(lnx)(n)=(1)(n1)(n1)!xn (6)莱布尼兹公式:若u(x),v(x)n阶可导,则 (uv)(n)=i=0ncniu(i)v(ni),其中u(0)=uv(0)=v

9. 微分中值定理,泰勒公式

Th1:(费马定理)

若函数f(x)满足条件: (1)函数f(x)x0的某邻域内有定义,并且在此邻域内恒有 f(x)f(x0)f(x)f(x0),

(2) f(x)x0处可导,则有 f(x0)=0

Th2:(罗尔定理)

设函数f(x)满足条件: (1)在闭区间[a,b]上连续;

(2)在(a,b)内可导;

(3)f(a)=f(b)

则在(a,b)内一存在个ξ,使 f(ξ)=0 Th3: (拉格朗日中值定理)

设函数f(x)满足条件: (1)在[a,b]上连续;

(2)在(a,b)内可导;

则在(a,b)内一存在个ξ,使 f(b)f(a)ba=f(ξ)

Th4: (柯西中值定理)

设函数f(x)g(x)满足条件: (1) 在[a,b]上连续;

(2) 在(a,b)内可导且f(x)g(x)均存在,且g(x)0

则在(a,b)内存在一个ξ,使 f(b)f(a)g(b)g(a)=f(ξ)g(ξ)

10. 洛必达法则

法则Ⅰ (00型) 设函数f(x),g(x)满足条件: limxx0f(x)=0,limxx0g(x)=0;

f(x),g(x)x0的邻域内可导,(在x0处可除外)且g(x)0;

limxx0f(x)g(x)存在(或)。

则: limxx0f(x)g(x)=limxx0f(x)g(x) 法则I (00型)设函数f(x),g(x)满足条件: limxf(x)=0,limxg(x)=0;

存在一个X>0,当|x|>X时,f(x),g(x)可导,且g(x)0;limxx0f(x)g(x)存在(或)。

则: limxx0f(x)g(x)=limxx0f(x)g(x) 法则Ⅱ(型) 设函数f(x),g(x)满足条件: limxx0f(x)=,limxx0g(x)=; f(x),g(x)x0 的邻域内可导(在x0处可除外)且g(x)0;limxx0f(x)g(x)存在(或)。则 limxx0f(x)g(x)=limxx0f(x)g(x).同理法则II(型)仿法则I可写出。

11. 泰勒公式

设函数f(x)在点x0处的某邻域内具有n+1阶导数,则对该邻域内异于x0的任意点x,在x0x之间至少存在 一个ξ,使得: f(x)=f(x0)+f(x0)(xx0)+12!f(x0)(xx0)2+ +f(n)(x0)n!(xx0)n+Rn(x) 其中 Rn(x)=f(n+1)(ξ)(n+1)!(xx0)n+1称为f(x)在点x0处的n阶泰勒余项。

x0=0,则n阶泰勒公式 f(x)=f(0)+f(0)x+12!f(0)x2++f(n)(0)n!xn+Rn(x)……(1) 其中 Rn(x)=f(n+1)(ξ)(n+1)!xn+1ξ在0与x之间.(1)式称为麦克劳林公式

常用五种函数在x0=0处的泰勒公式

(1) ex=1+x+12!x2++1n!xn+xn+1(n+1)!eξ

=1+x+12!x2++1n!xn+o(xn)

(2) sinx=x13!x3++xnn!sinnπ2+xn+1(n+1)!sin(ξ+n+12π)

=x13!x3++xnn!sinnπ2+o(xn)

(3) cosx=112!x2++xnn!cosnπ2+xn+1(n+1)!cos(ξ+n+12π)

=112!x2++xnn!cosnπ2+o(xn)

(4) ln(1+x)=x12x2+13x3+(1)n1xnn+(1)nxn+1(n+1)(1+ξ)n+1

=x12x2+13x3+(1)n1xnn+o(xn)

(5) (1+x)m=1+mx+m(m1)2!x2++m(m1)(mn+1)n!xn +m(m1)(mn+1)(n+1)!xn+1(1+ξ)mn1

(1+x)m=1+mx+m(m1)2!x2+ +m(m1)(mn+1)n!xn+o(xn)

12. 函数单调性的判断

Th1: 设函数f(x)(a,b)区间内可导,如果对x(a,b),都有f(x)>0(或f(x)<0),则函数f(x)(a,b)内是单调增加的(或单调减少)

Th2: (取极值的必要条件)设函数f(x)x0处可导,且在x0处取极值,则f(x0)=0

Th3: (取极值的第一充分条件)设函数f(x)x0的某一邻域内可微,且f(x0)=0(或f(x)x0处连续,但f(x0)不存在。) (1)若当x经过x0时,f(x)由“+”变“-”,则f(x0)为极大值; (2)若当x经过x0时,f(x)由“-”变“+”,则f(x0)为极小值; (3)若f(x)经过x=x0的两侧不变号,则f(x0)不是极值。

Th4: (取极值的第二充分条件)设f(x)在点x0处有f(x)0,且f(x0)=0,则 当f(x0)<0时,f(x0)为极大值; f(x0)>0时,f(x0)为极小值。 注:如果f(x0)<0,此方法失效。

13. 渐近线的求法

(1)水平渐近线 若limx+f(x)=b,或limxf(x)=b,则

y=b称为函数y=f(x)的水平渐近线。

(2)铅直渐近线 若limxx0f(x)=,或limxx0+f(x)=,则

x=x0称为y=f(x)的铅直渐近线。

(3)斜渐近线 若a=limxf(x)x,b=limx[f(x)ax],则 y=ax+b称为y=f(x)的斜渐近线。

14. 函数凹凸性的判断

Th1: (凹凸性的判别定理)若在I上f(x)<0(或f(x)>0),则f(x)在I上是凸的(或凹的)。

Th2: (拐点的判别定理1)若在x0f(x)=0,(或f(x)不存在),当x变动经过x0时,f(x)变号,则(x0,f(x0))为拐点。

Th3: (拐点的判别定理2)设f(x)x0点的某邻域内有三阶导数,且f(x)=0f(x)0,则(x0,f(x0))为拐点。

15. 弧微分

dS=1+y2dx

16.曲率

曲线y=f(x)在点(x,y)处的曲率k=|y|(1+y2)32 对于参数方程{(3)x=φ(t)(4)y=ψ(t),k=|φ(t)ψ(t)φ(t)ψ(t)|[φ2(t)+ψ2(t)]32

17.曲率半径

曲线在点M处的曲率k(k0)与曲线在点M处的曲率半径ρ有如下关系:ρ=1k

线性代数

行列式

行列式按行(列)展开定理

(1) 设A=(aij)n×n,则:ai1Aj1+ai2Aj2++ainAjn={|A|,i=j0,ij

a1iA1j+a2iA2j++aniAnj={|A|,i=j0,ijAA=AA=|A|E,其中:A=(A11A12A1nA21A22A2nAn1An2Ann)=(Aji)=(Aij)T

Dn=|111x1x2xnx1n1x2n1xnn1|=1j<in(xixj)

(2) 设A,Bn阶方阵,则|AB|=|A||B|=|B||A|=|BA|,但|A±B|=|A|±|B|不一定成立。

(3) |kA|=kn|A|,An阶方阵。

(4) 设An阶方阵,|AT|=|A|;|A1|=|A|1(若A可逆),|A|=|A|n1

n2

(5) |AOOB|=|ACOB|=|AOCB|=|A||B| A,B为方阵,但|OAm×mBn×nO|=(1)mn|A||B|

(6) 范德蒙行列式Dn=|111x1x2xnx1n1x2n1xnn1|=1j<in(xixj)

An阶方阵,λi(i=1,2,n)An个特征值,则 |A|=i=1nλi

矩阵

矩阵:m×n个数aij排成mn列的表格[a11a12a1na21a22a2nam1am2amn] 称为矩阵,简记为A,或者(aij)m×n 。若m=n,则称An阶矩阵或n阶方阵。

矩阵的线性运算

1.矩阵的加法

A=(aij),B=(bij)是两个m×n矩阵,则m×n 矩阵C=cij)=aij+bij称为矩阵AB的和,记为A+B=C

2.矩阵的数乘

A=(aij)m×n矩阵,k是一个常数,则m×n矩阵(kaij)称为数k与矩阵A的数乘,记为kA

3.矩阵的乘法

A=(aij)m×n矩阵,B=(bij)n×s矩阵,那么m×s矩阵C=(cij),其中cij=ai1b1j+ai2b2j++ainbnj=k=1naikbkj称为AB的乘积,记为C=AB

4. ATA1A三者之间的关系

(1) (AT)T=A,(AB)T=BTAT,(kA)T=kAT,(A±B)T=AT±BT

(2) (A1)1=A,(AB)1=B1A1,(kA)1=1kA1,

(A±B)1=A1±B1不一定成立。

(3) (A)=|A|n2 A  (n3)(AB)=BA, (kA)=kn1A  (n2)

(A±B)=A±B不一定成立。

(4) (A1)T=(AT)1, (A1)=(AA)1,(A)T=(AT)

5.有关A的结论

(1) AA=AA=|A|E

(2) |A|=|A|n1 (n2),    (kA)=kn1A,  (A)=|A|n2A(n3)

(3) 若A可逆,则A=|A|A1,(A)=1|A|A

(4) 若An阶方阵,则:

r(A)={n,r(A)=n1,r(A)=n10,r(A)<n1

6.有关A1的结论

A可逆AB=E;|A|0;r(A)=n;

A可以表示为初等矩阵的乘积;A;Ax=0

7.有关矩阵秩的结论

(1) 秩r(A)=行秩=列秩;

(2) r(Am×n)min(m,n);

(3) A0r(A)1

(4) r(A±B)r(A)+r(B);

(5) 初等变换不改变矩阵的秩

(6) r(A)+r(B)nr(AB)min(r(A),r(B)),特别若AB=O 则:r(A)+r(B)n

(7) 若A1存在r(AB)=r(B);B1存在 r(AB)=r(A);

r(Am×n)=nr(AB)=r(B);r(Am×s)=nr(AB)=r(A)

(8) r(Am×s)=nAx=0只有零解

8.分块求逆公式

(AOOB)1=(A1OOB1)(ACOB)1=(A1A1CB1OB1)

(AOCB)1=(A1OB1CA1B1)(OABO)1=(OB1A1O)

这里AB均为可逆方阵。

向量

1.有关向量组的线性表示

(1)α1,α2,,αs线性相关至少有一个向量可以用其余向量线性表示。

(2)α1,α2,,αs线性无关,α1,α2,,αsβ线性相关β可以由α1,α2,,αs唯一线性表示。

(3) β可以由α1,α2,,αs线性表示 r(α1,α2,,αs)=r(α1,α2,,αs,β)

2.有关向量组的线性相关性

(1)部分相关,整体相关;整体无关,部分无关.

(2) ① nn维向量 α1,α2αn线性无关|[α1α2αn]|0nn维向量α1,α2αn线性相关 |[α1,α2,,αn]|=0

n+1n维向量线性相关。

③ 若α1,α2αS线性无关,则添加分量后仍线性无关;或一组向量线性相关,去掉某些分量后仍线性相关。

3.有关向量组的线性表示

(1) α1,α2,,αs线性相关至少有一个向量可以用其余向量线性表示。

(2) α1,α2,,αs线性无关,α1,α2,,αsβ线性相关β 可以由α1,α2,,αs唯一线性表示。

(3) β可以由α1,α2,,αs线性表示 r(α1,α2,,αs)=r(α1,α2,,αs,β)

4.向量组的秩与矩阵的秩之间的关系

r(Am×n)=r,则A的秩r(A)A的行列向量组的线性相关性关系为:

(1) 若r(Am×n)=r=m,则A的行向量组线性无关。

(2) 若r(Am×n)=r<m,则A的行向量组线性相关。

(3) 若r(Am×n)=r=n,则A的列向量组线性无关。

(4) 若r(Am×n)=r<n,则A的列向量组线性相关。

5.n维向量空间的基变换公式及过渡矩阵

α1,α2,,αnβ1,β2,,βn是向量空间V的两组基,则基变换公式为:

(β1,β2,,βn)=(α1,α2,,αn)[c11c12c1nc21c22c2ncn1cn2cnn]=(α1,α2,,αn)C

其中C是可逆矩阵,称为由基α1,α2,,αn到基β1,β2,,βn的过渡矩阵。

6.坐标变换公式

若向量γ在基α1,α2,,αn与基β1,β2,,βn的坐标分别是 X=(x1,x2,,xn)T

Y=(y1,y2,,yn)T 即: γ=x1α1+x2α2++xnαn=y1β1+y2β2++ynβn,则向量坐标变换公式为X=CYY=C1X,其中C是从基α1,α2,,αn到基β1,β2,,βn的过渡矩阵。

7.向量的内积

(α,β)=a1b1+a2b2++anbn=αTβ=βTα

8.Schmidt正交化

α1,α2,,αs线性无关,则可构造β1,β2,,βs使其两两正交,且βi仅是α1,α2,,αi的线性组合(i=1,2,,n),再把βi单位化,记γi=βi|βi|,则γ1,γ2,,γi是规范正交向量组。其中 β1=α1β2=α2(α2,β1)(β1,β1)β1β3=α3(α3,β1)(β1,β1)β1(α3,β2)(β2,β2)β2

............

βs=αs(αs,β1)(β1,β1)β1(αs,β2)(β2,β2)β2(αs,βs1)(βs1,βs1)βs1

9.正交基及规范正交基

向量空间一组基中的向量如果两两正交,就称为正交基;若正交基中每个向量都是单位向量,就称其为规范正交基。

线性方程组

1.克莱姆法则

线性方程组{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2an1x1+an2x2++annxn=bn,如果系数行列式D=|A|0,则方程组有唯一解,x1=D1D,x2=D2D,,xn=DnD,其中Dj是把D中第j列元素换成方程组右端的常数列所得的行列式。

2. n阶矩阵A可逆Ax=0只有零解。b,Ax=b总有唯一解,一般地,r(Am×n)=nAx=0只有零解。

3.非奇次线性方程组有解的充分必要条件,线性方程组解的性质和解的结构

(1) 设Am×n矩阵,若r(Am×n)=m,则对Ax=b而言必有r(A)=r(Ab)=m,从而Ax=b有解。

(2) 设x1,x2,xsAx=b的解,则k1x1+k2x2+ksxsk1+k2++ks=1时仍为Ax=b的解;但当k1+k2++ks=0时,则为Ax=0的解。特别x1+x22Ax=b的解;2x3(x1+x2)Ax=0的解。

(3) 非齐次线性方程组Ax=b无解r(A)+1=r(A)b不能由A的列向量α1,α2,,αn线性表示。

4.奇次线性方程组的基础解系和通解,解空间,非奇次线性方程组的通解

(1) 齐次方程组Ax=0恒有解(必有零解)。当有非零解时,由于解向量的任意线性组合仍是该齐次方程组的解向量,因此Ax=0的全体解向量构成一个向量空间,称为该方程组的解空间,解空间的维数是nr(A),解空间的一组基称为齐次方程组的基础解系。

(2) η1,η2,,ηtAx=0的基础解系,即:

  1. η1,η2,,ηtAx=0的解;
  2. η1,η2,,ηt线性无关;
  3. Ax=0的任一解都可以由η1,η2,,ηt线性表出. k1η1+k2η2++ktηtAx=0的通解,其中k1,k2,,kt是任意常数。

矩阵的特征值和特征向量

1.矩阵的特征值和特征向量的概念及性质

(1) 设λA的一个特征值,则 kA,aA+bE,A2,Am,f(A),AT,A1,A有一个特征值分别为 kλ,aλ+b,λ2,λm,f(λ),λ,λ1,|A|λ,且对应特征向量相同(AT 例外)。

(2)若λ1,λ2,,λnAn个特征值,则i=1nλi=i=1naii,i=1nλi=|A| ,从而|A|0A没有特征值。

(3)设λ1,λ2,,λsAs个特征值,对应特征向量为α1,α2,,αs

若: α=k1α1+k2α2++ksαs ,

则: Anα=k1Anα1+k2Anα2++ksAnαs=k1λ1nα1+k2λ2nα2+ksλsnαs

2.相似变换、相似矩阵的概念及性质

(1) 若AB,则

  1. ATBT,A1B1,,AB
  2. |A|=|B|,i=1nAii=i=1nbii,r(A)=r(B)
  3. |λEA|=|λEB|,对λ成立
3.矩阵可相似对角化的充分必要条件

(1)设An阶方阵,则A可对角化对每个ki重根特征值λi,有nr(λiEA)=ki

(2) 设A可对角化,则由P1AP=Λ,A=PΛP1,从而An=PΛnP1

(3) 重要结论

  1. AB,CD,则[AOOC][BOOD].
  2. AB,则f(A)f(B),|f(A)||f(B)|,其中f(A)为关于n阶方阵A的多项式。
  3. A为可对角化矩阵,则其非零特征值的个数(重根重复计算)=秩(A)
4.实对称矩阵的特征值、特征向量及相似对角阵

(1)相似矩阵:设A,B为两个n阶方阵,如果存在一个可逆矩阵P,使得B=P1AP成立,则称矩阵AB相似,记为AB

(2)相似矩阵的性质:如果AB则有:

  1. ATBT
  2. A1B1 (若AB均可逆)
  3. AkBkk为正整数)
  4. |λEA|=|λEB|,从而A,B 有相同的特征值
  5. |A|=|B|,从而A,B同时可逆或者不可逆
  6. (A)=(B),|λEA|=|λEB|A,B不一定相似

二次型

1.n个变量的二次齐次函数

f(x1,x2,,xn)=i=1nj=1naijxiyj,其中aij=aji(i,j=1,2,,n),称为n元二次型,简称二次型. 若令x= [x1x1xn],A=[a11a12a1na21a22a2nan1an2ann],这二次型f可改写成矩阵向量形式f=xTAx。其中A称为二次型矩阵,因为aij=aji(i,j=1,2,,n),所以二次型矩阵均为对称矩阵,且二次型与对称矩阵一一对应,并把矩阵A的秩称为二次型的秩。

2.惯性定理,二次型的标准形和规范形

(1) 惯性定理

对于任一二次型,不论选取怎样的合同变换使它化为仅含平方项的标准型,其正负惯性指数与所选变换无关,这就是所谓的惯性定理。

(2) 标准形

二次型f=(x1,x2,,xn)=xTAx经过合同变换x=Cy化为f=xTAx=yTCTAC

y=i=1rdiyi2称为 f(rn)的标准形。在一般的数域内,二次型的标准形不是唯一的,与所作的合同变换有关,但系数不为零的平方项的个数由r(A)唯一确定。

(3) 规范形

任一实二次型f都可经过合同变换化为规范形f=z12+z22+zp2zp+12zr2,其中rA的秩,p为正惯性指数,rp为负惯性指数,且规范型唯一。

3.用正交变换和配方法化二次型为标准形,二次型及其矩阵的正定性

A正定kA(k>0),AT,A1,A正定;|A|>0,A可逆;aii>0,且|Aii|>0

AB正定A+B正定,但ABBA不一定正定

A正定f(x)=xTAx>0,x0

A的各阶顺序主子式全大于零

A的所有特征值大于零

A的正惯性指数为n

存在可逆阵P使A=PTP

存在正交矩阵Q,使QTAQ=Q1AQ=(λ1λn),

其中λi>0,i=1,2,,n.正定kA(k>0),AT,A1,A正定; |A|>0,A可逆;aii>0,且|Aii|>0

概率论和数理统计

随机事件和概率

1.事件的关系与运算

(1) 子事件:AB,若A发生,则B发生。

(2) 相等事件:A=B,即AB,且BA

(3) 和事件:AB(或A+B),AB中至少有一个发生。

(4) 差事件:ABA发生但B不发生。

(5) 积事件:AB(或AB),AB同时发生。

(6) 互斥事件(互不相容):AB=

(7) 互逆事件(对立事件): AB=,AB=Ω,A=B¯,B=A¯

2.运算律

(1) 交换律:AB=BA,AB=BA (2) 结合律:(AB)C=A(BC) (3) 分配律:(AB)C=A(BC)

3.德摩根律

AB=A¯B¯ AB=A¯B¯

4.完全事件组

A1A2An两两互斥,且和事件为必然事件,即AiAj=,ij,ni=1=Ω

5.概率的基本公式

(1)条件概率: P(B|A)=P(AB)P(A),表示A发生的条件下,B发生的概率。 (2)全概率公式: P(A)=i=1nP(A|Bi)P(Bi),BiBj=,ij,ni=1Bi=Ω (3) Bayes公式:

P(Bj|A)=P(A|Bj)P(Bj)i=1nP(A|Bi)P(Bi),j=1,2,,n 注:上述公式中事件Bi的个数可为可列个。 (4)乘法公式: P(A1A2)=P(A1)P(A2|A1)=P(A2)P(A1|A2) P(A1A2An)=P(A1)P(A2|A1)P(A3|A1A2)P(An|A1A2An1)

6.事件的独立性

(1)AB相互独立P(AB)=P(A)P(B) (2)ABC两两独立 P(AB)=P(A)P(B);P(BC)=P(B)P(C) ;P(AC)=P(A)P(C); (3)ABC相互独立 P(AB)=P(A)P(B); P(BC)=P(B)P(C) ; P(AC)=P(A)P(C) ; P(ABC)=P(A)P(B)P(C)

7.独立重复试验

将某试验独立重复n次,若每次实验中事件A发生的概率为p,则n次试验中A发生k次的概率为: P(X=k)=Cnkpk(1p)nk 8.重要公式与结论

(1)P(A¯)=1P(A)

(2)P(AB)=P(A)+P(B)P(AB) P(ABC)=P(A)+P(B)+P(C)P(AB)P(BC)P(AC)+P(ABC) (3)P(AB)=P(A)P(AB) (4)P(AB¯)=P(A)P(AB),P(A)=P(AB)+P(AB¯), P(AB)=P(A)+P(A¯B)=P(AB)+P(AB¯)+P(A¯B) (5)条件概率P(|B)满足概率的所有性质, 例如:. P(A¯1|B)=1P(A1|B) P(A1A2|B)=P(A1|B)+P(A2|B)P(A1A2|B) P(A1A2|B)=P(A1|B)P(A2|A1B) (6)若A1,A2,,An相互独立,则P(i=1nAi)=i=1nP(Ai), P(i=1nAi)=i=1n(1P(Ai)) (7)互斥、互逆与独立性之间的关系: AB互逆 AB互斥,但反之不成立,AB互斥(或互逆)且均非零概率事件AB不独立. (8)若A1,A2,,Am,B1,B2,,Bn相互独立,则f(A1,A2,,Am)g(B1,B2,,Bn)也相互独立,其中f(),g()分别表示对相应事件做任意事件运算后所得的事件,另外,概率为1(或0)的事件与任何事件相互独立.

 

随机变量及其概率分布

1.随机变量及概率分布

取值带有随机性的变量,严格地说是定义在样本空间上,取值于实数的函数称为随机变量,概率分布通常指分布函数或分布律

2.分布函数的概念与性质

定义: F(x)=P(Xx),<x<+

性质:(1)0F(x)1

(2) F(x)单调不减

(3) 右连续F(x+0)=F(x)

(4) F()=0,F(+)=1

3.离散型随机变量的概率分布

P(X=xi)=pi,i=1,2,,n,pi0,i=1pi=1

4.连续型随机变量的概率密度

概率密度f(x);非负可积,且:

(1)f(x)0,

(2)+f(x)dx=1

(3)xf(x)的连续点,则:

f(x)=F(x)分布函数F(x)=xf(t)dt

5.常见分布

(1) 0-1分布:P(X=k)=pk(1p)1k,k=0,1

(2) 二项分布:B(n,p)P(X=k)=Cnkpk(1p)nk,k=0,1,,n

(3) Poisson分布:p(λ)P(X=k)=λkk!eλ,λ>0,k=0,1,2

(4) 均匀分布U(a,b)f(x)={1ba,a<x<b0,

(5) 正态分布:N(μ,σ2): φ(x)=12πσe(xμ)22σ2,σ>0,<x<+

(6)指数分布:E(λ):f(x)={λeλx,x>0,λ>00,

(7)几何分布:G(p):P(X=k)=(1p)k1p,0<p<1,k=1,2,.

(8)超几何分布: H(N,M,n):P(X=k)=CMkCNMnkCNn,k=0,1,,min(n,M)

6.随机变量函数的概率分布

(1)离散型:P(X=x1)=pi,Y=g(X)

则: P(Y=yj)=g(xi)=yiP(X=xi)

(2)连续型:X ~fX(x),Y=g(x)

则:Fy(y)=P(Yy)=P(g(X)y)=g(x)yfx(x)dxfY(y)=FY(y)

7.重要公式与结论

(1) XN(0,1)φ(0)=12π,Φ(0)=12, Φ(a)=P(Xa)=1Φ(a)

(2) XN(μ,σ2)XμσN(0,1),P(Xa)=Φ(aμσ)

(3) XE(λ)P(X>s+t|X>s)=P(X>t)

(4) XG(p)P(X=m+k|X>m)=P(X=k)

(5) 离散型随机变量的分布函数为阶梯间断函数;连续型随机变量的分布函数为连续函数,但不一定为处处可导函数。

(6) 存在既非离散也非连续型随机变量。

多维随机变量及其分布

1.二维随机变量及其联合分布

由两个随机变量构成的随机向量(X,Y), 联合分布为F(x,y)=P(Xx,Yy)

2.二维离散型随机变量的分布

(1) 联合概率分布律 P{X=xi,Y=yj}=pij;i,j=1,2,

(2) 边缘分布律 pi=j=1pij,i=1,2, pj=ipij,j=1,2,

(3) 条件分布律 P{X=xi|Y=yj}=pijpj P{Y=yj|X=xi}=pijpi

3. 二维连续性随机变量的密度

(1) 联合概率密度f(x,y):

  1. f(x,y)0
  2. ++f(x,y)dxdy=1

(2) 分布函数:F(x,y)=xyf(u,v)dudv

(3) 边缘概率密度: fX(x)=+f(x,y)dy fY(y)=+f(x,y)dx

(4) 条件概率密度:fX|Y(x|y)=f(x,y)fY(y) fY|X(y|x)=f(x,y)fX(x)

4.常见二维随机变量的联合分布

(1) 二维均匀分布:(x,y)U(D) ,f(x,y)={1S(D),(x,y)D0,

(2) 二维正态分布:(X,Y)N(μ1,μ2,σ12,σ22,ρ),(X,Y)N(μ1,μ2,σ12,σ22,ρ)

f(x,y)=12πσ1σ21ρ2.exp{12(1ρ2)[(xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22]}

5.随机变量的独立性和相关性

XY的相互独立:F(x,y)=FX(x)FY(y):

pij=pipj(离散型) f(x,y)=fX(x)fY(y)(连续型)

XY的相关性:

相关系数ρXY=0时,称XY不相关, 否则称XY相关

6.两个随机变量简单函数的概率分布

离散型: P(X=xi,Y=yi)=pij,Z=g(X,Y) 则:

P(Z=zk)=P{g(X,Y)=zk}=g(xi,yi)=zkP(X=xi,Y=yj)

连续型: (X,Y)f(x,y),Z=g(X,Y) 则:

Fz(z)=P{g(X,Y)z}=g(x,y)zf(x,y)dxdyfz(z)=Fz(z)

7.重要公式与结论

(1) 边缘密度公式: fX(x)=+f(x,y)dy, fY(y)=+f(x,y)dx

(2) P{(X,Y)D}=Df(x,y)dxdy

(3) 若(X,Y)服从二维正态分布N(μ1,μ2,σ12,σ22,ρ) 则有:

  1. XN(μ1,σ12),YN(μ2,σ22).
  2. XY相互独立ρ=0,即XY不相关。
  3. C1X+C2YN(C1μ1+C2μ2,C12σ12+C22σ22+2C1C2σ1σ2ρ)
  4.  X关于Y=y的条件分布为: N(μ1+ρσ1σ2(yμ2),σ12(1ρ2))
  5. Y关于X=x的条件分布为: N(μ2+ρσ2σ1(xμ1),σ22(1ρ2))

(4) 若XY独立,且分别服从N(μ1,σ12),N(μ1,σ22), 则:(X,Y)N(μ1,μ2,σ12,σ22,0),

C1X+C2Y ~N(C1μ1+C2μ2,C12σ12C22σ22).

(5) 若XY相互独立,f(x)g(x)为连续函数, 则f(X)g(Y)也相互独立。

随机变量的数字特征

1.数学期望

离散型:P{X=xi}=pi,E(X)=ixipi

连续型: Xf(x),E(X)=+xf(x)dx

性质:

(1) E(C)=C,E[E(X)]=E(X)

(2) E(C1X+C2Y)=C1E(X)+C2E(Y)

(3) 若XY独立,则E(XY)=E(X)E(Y)

(4)[E(XY)]2E(X2)E(Y2)

2.方差D(X)=E[XE(X)]2=E(X2)[E(X)]2
3.标准差D(X)
4.离散型:D(X)=i[xiE(X)]2pi
5.连续型:D(X)=+[xE(X)]2f(x)dx

性质:

(1) D(C)=0,D[E(X)]=0,D[D(X)]=0

(2) XY相互独立,则D(X±Y)=D(X)+D(Y)

(3) D(C1X+C2)=C12D(X)

(4) 一般有 D(X±Y)=D(X)+D(Y)±2Cov(X,Y)=D(X)+D(Y)±2ρD(X)D(Y)

(5) D(X)<E(XC)2,CE(X)

(6) D(X)=0P{X=C}=1

6.随机变量函数的数学期望

(1) 对于函数Y=g(x)

X为离散型:P{X=xi}=pi,E(Y)=ig(xi)pi

X为连续型:Xf(x),E(Y)=+g(x)f(x)dx

(2) Z=g(X,Y);(X,Y)P{X=xi,Y=yj}=pij; E(Z)=ijg(xi,yj)pij (X,Y)f(x,y);E(Z)=++g(x,y)f(x,y)dxdy

7.协方差

Cov(X,Y)=E[(XE(X)(YE(Y))]

8.相关系数

ρXY=Cov(X,Y)D(X)D(Y),k阶原点矩 E(Xk); k阶中心矩 E{[XE(X)]k}

性质:

(1) Cov(X,Y)=Cov(Y,X)

(2) Cov(aX,bY)=abCov(Y,X)

(3) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

(4) |ρ(X,Y)|1

(5)  ρ(X,Y)=1P(Y=aX+b)=1 ,其中a>0

ρ(X,Y)=1P(Y=aX+b)=1 ,其中a<0

9.重要公式与结论

(1) D(X)=E(X2)E2(X)

(2) Cov(X,Y)=E(XY)E(X)E(Y)

(3) |ρ(X,Y)|1,ρ(X,Y)=1P(Y=aX+b)=1,其中a>0

ρ(X,Y)=1P(Y=aX+b)=1,其中a<0

(4) 下面5个条件互为充要条件:

ρ(X,Y)=0 Cov(X,Y)=0 E(X,Y)=E(X)E(Y) D(X+Y)=D(X)+D(Y) D(XY)=D(X)+D(Y)

注:XY独立为上述5个条件中任何一个成立的充分条件,但非必要条件。

数理统计的基本概念

1.基本概念

总体:研究对象的全体,它是一个随机变量,用X表示。

个体:组成总体的每个基本元素。

简单随机样本:来自总体Xn个相互独立且与总体同分布的随机变量X1,X2,Xn,称为容量为n的简单随机样本,简称样本。

统计量:设X1,X2,Xn,是来自总体X的一个样本,g(X1,X2,Xn))是样本的连续函数,且g()中不含任何未知参数,则称g(X1,X2,Xn)为统计量。

样本均值:X=1ni=1nXi

样本方差:S2=1n1i=1n(XiX)2

样本矩:样本k阶原点矩:Ak=1ni=1nXik,k=1,2,

样本k阶中心矩:Bk=1ni=1n(XiX)k,k=1,2,

2.分布

χ2分布:χ2=X12+X22++Xn2χ2(n),其中X1,X2,Xn,相互独立,且同服从N(0,1)

t分布:T=XY/nt(n) ,其中XN(0,1),Yχ2(n),XY 相互独立。

F分布:F=X/n1Y/n2F(n1,n2),其中Xχ2(n1),Yχ2(n2),XY相互独立。

分位数:若P(Xxα)=α,则称xαXα分位数

3.正态总体的常用样本分布

(1) 设X1,X2,Xn为来自正态总体N(μ,σ2)的样本,

X=1ni=1nXi,S2=1n1i=1n(XiX)2,则:

  1. XN(μ,σ2n)  或者XμσnN(0,1)
  2. (n1)S2σ2=1σ2i=1n(XiX)2χ2(n1)
  3. 1σ2i=1n(Xiμ)2χ2(n)

4)  XμS/nt(n1)

4.重要公式与结论

(1) 对于χ2χ2(n),有E(χ2(n))=n,D(χ2(n))=2n;

(2) 对于Tt(n),有E(T)=0,D(T)=nn2(n>2)

(3) 对于F ~F(m,n),有 1FF(n,m),Fa/2(m,n)=1F1a/2(n,m);

(4) 对于任意总体X,有 E(X)=E(X),E(S2)=D(X),D(X)=D(X)n