Hàm sinh mô men

Concept in probability theory and statisticsBản mẫu:SHORTDESC:Concept in probability theory and statistics

Trong lý thuyết xác suấtthống kê, hàm sinh mô men (moment-generating function hay MGF) của một biến ngẫu nhiên là một mô tả thay thế cho hàm phân phối xác suất của nó. Do đó, nó cung cấp một cách tiếp cận khác đến các kết quả phân tích dữ liệu so với làm việc trực tiếp với hàm mật độ xác suất hay hàm phân phối tích lũy. Một số kết quả đặc biệt đơn giản tồn tại cho hàm sinh mô men của các phân phối được định nghĩa bởi tổng có trọng số của các biến ngẫu nhiên. Tuy nhiên, không phải biến ngẫu nhiên nào cũng có hàm sinh mô men.

Hàm sinh mô men, như tên gọi, có thể được sử dụng để tính toán các mô men của một phân phối xác suất: mô men thứ n tại điểm 0 là đạo hàm cấp n của hàm sinh mô men tại 0.

Ngoài các phân bố giá trị thực một biến, hàm sinh mô men cũng có thể được định nghĩa cho các biến ngẫu nhiên giá trị vectơ hoặc ma trận, và còn có thể được mở rộng cho các trường hợp tổng quát hơn.

Hàm sinh mô men của một phân bố giá trị thực không nhất thiết phải tồn tại, không giống hàm đặc trưng. Có một số quan hệ giữa hành vi của hàm sinh mô men của một phân phối và các tính chất của phân phối đó, chẳng hạn sự tồn tại của các mô men.

Định nghĩa

Cho X {\displaystyle X} là một biến ngẫu nhiên với hàm phân phối (cdf) F X {\displaystyle F_{X}} . Hàm sinh mô men (mgf) của X {\displaystyle X} (hay của F X {\displaystyle F_{X}} ), ký hiệu M X ( t ) {\displaystyle M_{X}(t)} , được định nghĩa là

M X ( t ) = E [ e t X ] {\displaystyle M_{X}(t)=\operatorname {E} \left[e^{tX}\right]}

với điều kiện là kỳ vọng này tồn tại cho mỗi điểm t {\displaystyle t} trong một lân cận của 0. Tức là, tồn tại số h > 0 {\displaystyle h>0} sao cho với mọi t {\displaystyle t} trên khoảng h < t < h {\displaystyle -h<t<h} , E [ e t X ] {\displaystyle \operatorname {E} \left[e^{tX}\right]} tồn tại. Nếu kỳ vọng không tồn tại trong một lân cận của điểm 0, ta nói rằng hàm sinh mô men không tồn tại.[1]

Nói cách khác, hàm sinh mô men của X chính là kỳ vọng của biến ngẫu nhiên e t X {\displaystyle e^{tX}} . Tổng quát hơn, nếu X = ( X 1 , , X n ) T {\displaystyle \mathbf {X} =(X_{1},\ldots ,X_{n})^{\mathrm {T} }} , hay với một vectơ ngẫu nhiên n {\displaystyle n} -chiều, và t {\displaystyle \mathbf {t} } là một vectơ cố định, ta sử dụng tích vô hướng t X = t T X {\displaystyle \mathbf {t} \cdot \mathbf {X} =\mathbf {t} ^{\mathrm {T} }\mathbf {X} } thay vì  t X {\displaystyle tX} :

M X ( t ) := E ( e t T X ) . {\displaystyle M_{\mathbf {X} }(\mathbf {t} ):=\operatorname {E} \left(e^{\mathbf {t} ^{\mathrm {T} }\mathbf {X} }\right).}

M X ( 0 ) {\displaystyle M_{X}(0)} luôn tồn tại và bằng 1. Tuy nhiên một vấn đề quan trọng với hàm sinh mô men đó là các mô men và hàm sinh mô men có thể không tồn tại, vì các tích phân không nhất thiết phải hội tụ tuyệt đối. Trong khi đó, hàm đặc trưng hay biến đổi Fourier của hàm mật độ luôn tồn tại (do nó là tích phân của một hàm bị chặn trên một không gian với độ đo hữu hạn), và có thể thay vào đó được sử dụng cho một số mục đích.

Hàm sinh mô men có tên như vậy bởi vì nó có thể được sử dụng để tìm các mô men của phân phối.[2] Khai triển chuỗi của e t X {\displaystyle e^{tX}}

e t X = 1 + t X + t 2 X 2 2 ! + t 3 X 3 3 ! + + t n X n n ! + . {\displaystyle e^{t\,X}=1+t\,X+{\frac {t^{2}\,X^{2}}{2!}}+{\frac {t^{3}\,X^{3}}{3!}}+\cdots +{\frac {t^{n}\,X^{n}}{n!}}+\cdots .}

Từ đó ta có

M X ( t ) = E ( e t X ) = 1 + t E ( X ) + t 2 E ( X 2 ) 2 ! + t 3 E ( X 3 ) 3 ! + + t n E ( X n ) n ! + = 1 + t m 1 + t 2 m 2 2 ! + t 3 m 3 3 ! + + t n m n n ! + , {\displaystyle {\begin{aligned}M_{X}(t)=\operatorname {E} (e^{t\,X})&=1+t\operatorname {E} (X)+{\frac {t^{2}\operatorname {E} (X^{2})}{2!}}+{\frac {t^{3}\operatorname {E} (X^{3})}{3!}}+\cdots +{\frac {t^{n}\operatorname {E} (X^{n})}{n!}}+\cdots \\&=1+tm_{1}+{\frac {t^{2}m_{2}}{2!}}+{\frac {t^{3}m_{3}}{3!}}+\cdots +{\frac {t^{n}m_{n}}{n!}}+\cdots ,\end{aligned}}}

trong đó m n {\displaystyle m_{n}} là mô men cấp n {\displaystyle n} . Lấy đạo hàm M X ( t ) {\displaystyle M_{X}(t)} i {\displaystyle i} lần theo biến t {\displaystyle t} và đặt t = 0 {\displaystyle t=0} , ta nhận được mô men cấp thứ i {\displaystyle i} quanh điểm gốc, m i {\displaystyle m_{i}} .

Nếu X {\displaystyle X} là một biến ngẫu nhiên liên tục, quan hệ sau đây giữa hàm sinh mô men của nó M X ( t ) {\displaystyle M_{X}(t)} biến đổi Laplace hai phía của hàm mật độ xác suất của nó f X ( x ) {\displaystyle f_{X}(x)} được thỏa mãn:

M X ( t ) = L { f X } ( t ) , {\displaystyle M_{X}(t)={\mathcal {L}}\{f_{X}\}(-t),}

bởi biến đổi Laplace hai phía của hàm mật độ được cho bằng

L { f X } ( s ) = e s x f X ( x ) d x , {\displaystyle {\mathcal {L}}\{f_{X}\}(s)=\int _{-\infty }^{\infty }e^{-sx}f_{X}(x)\,dx,}

và hàm sinh mô men được định nghĩa mở rộng (bởi luật hàm biến ngẫu nhiên) là

M X ( t ) = E [ e t X ] = e t x f X ( x ) d x . {\displaystyle M_{X}(t)=\operatorname {E} \left[e^{tX}\right]=\int _{-\infty }^{\infty }e^{tx}f_{X}(x)\,dx.}

Hàm đặc trưng φ X ( t ) {\displaystyle \varphi _{X}(t)} có liên hệ sau với hàm sinh mô men: φ X ( t ) = M i X ( t ) = M X ( i t ) : {\displaystyle \varphi _{X}(t)=M_{iX}(t)=M_{X}(it):} hàm đặc trưng chính là hàm sinh mô men của iX hay hàm sinh mô men của X khi được tính trên trục ảo.

Ví dụ

Dưới đây là một số ví dụ về hàm sinh mô men và hàm đặc trưng của một số phân phối xác suất để so sánh. Có thể thấy rằng hàm đặc trưng là một phép quay Wick của hàm sinh mô men M X ( t ) {\displaystyle M_{X}(t)} khi nó tồn tại.

Phân phối Hàm sinh mô men M X ( t ) {\displaystyle M_{X}(t)} Hàm đặc trưng φ ( t ) {\displaystyle \varphi (t)}
suy biến δ a {\displaystyle \delta _{a}} e t a {\displaystyle e^{ta}} e i t a {\displaystyle e^{ita}}
Bernoulli P ( X = 1 ) = p {\displaystyle P(X=1)=p} 1 p + p e t {\displaystyle 1-p+pe^{t}} 1 p + p e i t {\displaystyle 1-p+pe^{it}}
hình học ( 1 p ) k 1 p {\displaystyle (1-p)^{k-1}\,p} p e t 1 ( 1 p ) e t {\displaystyle {\frac {pe^{t}}{1-(1-p)e^{t}}}}
t < ln ( 1 p ) {\displaystyle \forall t<-\ln(1-p)}
p e i t 1 ( 1 p ) e i t {\displaystyle {\frac {pe^{it}}{1-(1-p)\,e^{it}}}}
nhị thức B ( n , p ) {\displaystyle B(n,p)} ( 1 p + p e t ) n {\displaystyle \left(1-p+pe^{t}\right)^{n}} ( 1 p + p e i t ) n {\displaystyle \left(1-p+pe^{it}\right)^{n}}
nhị thức âm NB ( r , p ) {\displaystyle \operatorname {NB} (r,p)} ( p 1 e t + p e t ) r , t < log ( 1 p ) {\displaystyle \left({\frac {p}{1-e^{t}+pe^{t}}}\right)^{r},t<-\log(1-p)} ( p 1 e i t + p e i t ) r {\displaystyle \left({\frac {p}{1-e^{it}+pe^{it}}}\right)^{r}}
Poisson Pois ( λ ) {\displaystyle \operatorname {Pois} (\lambda )} e λ ( e t 1 ) {\displaystyle e^{\lambda (e^{t}-1)}} e λ ( e i t 1 ) {\displaystyle e^{\lambda (e^{it}-1)}}
đều liên tục U ( a , b ) {\displaystyle \operatorname {U} (a,b)} e t b e t a t ( b a ) {\displaystyle {\frac {e^{tb}-e^{ta}}{t(b-a)}}} e i t b e i t a i t ( b a ) {\displaystyle {\frac {e^{itb}-e^{ita}}{it(b-a)}}}
đều rời rạc DU ( a , b ) {\displaystyle \operatorname {DU} (a,b)} e a t e ( b + 1 ) t ( b a + 1 ) ( 1 e t ) {\displaystyle {\frac {e^{at}-e^{(b+1)t}}{(b-a+1)(1-e^{t})}}} e a i t e ( b + 1 ) i t ( b a + 1 ) ( 1 e i t ) {\displaystyle {\frac {e^{ait}-e^{(b+1)it}}{(b-a+1)(1-e^{it})}}}
Laplace L ( μ , b ) {\displaystyle L(\mu ,b)} e t μ 1 b 2 t 2 ,   | t | < 1 / b {\displaystyle {\frac {e^{t\mu }}{1-b^{2}t^{2}}},~|t|<1/b} e i t μ 1 + b 2 t 2 {\displaystyle {\frac {e^{it\mu }}{1+b^{2}t^{2}}}}
chuẩn N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})} e t μ + 1 2 σ 2 t 2 {\displaystyle e^{t\mu +{\frac {1}{2}}\sigma ^{2}t^{2}}} e i t μ 1 2 σ 2 t 2 {\displaystyle e^{it\mu -{\frac {1}{2}}\sigma ^{2}t^{2}}}
chi-bình phương χ k 2 {\displaystyle \chi _{k}^{2}} ( 1 2 t ) k 2 {\displaystyle (1-2t)^{-{\frac {k}{2}}}} ( 1 2 i t ) k 2 {\displaystyle (1-2it)^{-{\frac {k}{2}}}}
chi-bình phương phi trung tâm χ k 2 ( λ ) {\displaystyle \chi _{k}^{2}(\lambda )} e λ t / ( 1 2 t ) ( 1 2 t ) k 2 {\displaystyle e^{\lambda t/(1-2t)}(1-2t)^{-{\frac {k}{2}}}} e i λ t / ( 1 2 i t ) ( 1 2 i t ) k 2 {\displaystyle e^{i\lambda t/(1-2it)}(1-2it)^{-{\frac {k}{2}}}}
Gamma Γ ( k , θ ) {\displaystyle \Gamma (k,\theta )} ( 1 t θ ) k ,   t < 1 θ {\displaystyle (1-t\theta )^{-k},~\forall t<{\tfrac {1}{\theta }}} ( 1 i t θ ) k {\displaystyle (1-it\theta )^{-k}}
Exp ( λ ) {\displaystyle \operatorname {Exp} (\lambda )} ( 1 t λ 1 ) 1 ,   t < λ {\displaystyle \left(1-t\lambda ^{-1}\right)^{-1},~t<\lambda } ( 1 i t λ 1 ) 1 {\displaystyle \left(1-it\lambda ^{-1}\right)^{-1}}
chuẩn nhiều chiều N ( μ , Σ ) {\displaystyle N(\mathbf {\mu } ,\mathbf {\Sigma } )} e t T ( μ + 1 2 Σ t ) {\displaystyle e^{\mathbf {t} ^{\mathrm {T} }\left({\boldsymbol {\mu }}+{\frac {1}{2}}\mathbf {\Sigma t} \right)}} e t T ( i μ 1 2 Σ t ) {\displaystyle e^{\mathbf {t} ^{\mathrm {T} }\left(i{\boldsymbol {\mu }}-{\frac {1}{2}}{\boldsymbol {\Sigma }}\mathbf {t} \right)}}
Cauchy Cauchy ( μ , θ ) {\displaystyle \operatorname {Cauchy} (\mu ,\theta )} không tồn tại e i t μ θ | t | {\displaystyle e^{it\mu -\theta |t|}}
Cauchy nhiều chiều

MultiCauchy ( μ , Σ ) {\displaystyle \operatorname {MultiCauchy} (\mu ,\Sigma )} [3]

không tồn tại e i t T μ t T Σ t {\displaystyle \!\,e^{i\mathbf {t} ^{\mathrm {T} }{\boldsymbol {\mu }}-{\sqrt {\mathbf {t} ^{\mathrm {T} }{\boldsymbol {\Sigma }}\mathbf {t} }}}}

Tính toán

Hàm sinh mô men là kỳ vọng của một hàm của biến ngẫu nhiên, nó có thể được viết dưới dạng:

  • Đối với một hàm khối xác suất rời rạc, M X ( t ) = i = 0 e t x i p i {\displaystyle M_{X}(t)=\sum _{i=0}^{\infty }e^{tx_{i}}\,p_{i}}
  • Đối với một hàm mật độ xác suất liên tục, M X ( t ) = e t x f ( x ) d x {\displaystyle M_{X}(t)=\int _{-\infty }^{\infty }e^{tx}f(x)\,dx}
  • Trong trường hợp tổng quát: M X ( t ) = e t x d F ( x ) {\displaystyle M_{X}(t)=\int _{-\infty }^{\infty }e^{tx}\,dF(x)} , sử dụng tích phân Riemann–Stieltjes, và trong đó F {\displaystyle F} hàm phân phối tích lũy. Đây chỉ đơn giản là biến đổi Laplace-Stieltjes của F {\displaystyle F} , nhưng với dấu của đối số ngược lại.

Chú ý rằng đối với trường hợp mà X {\displaystyle X} hàm mật độ xác suất liên tục f ( x ) {\displaystyle f(x)} , thì M X ( t ) {\displaystyle M_{X}(-t)} biến đổi Laplace hai phía của f ( x ) {\displaystyle f(x)} .

M X ( t ) = e t x f ( x ) d x = ( 1 + t x + t 2 x 2 2 ! + + t n x n n ! + ) f ( x ) d x = 1 + t m 1 + t 2 m 2 2 ! + + t n m n n ! + , {\displaystyle {\begin{aligned}M_{X}(t)&=\int _{-\infty }^{\infty }e^{tx}f(x)\,dx\\&=\int _{-\infty }^{\infty }\left(1+tx+{\frac {t^{2}x^{2}}{2!}}+\cdots +{\frac {t^{n}x^{n}}{n!}}+\cdots \right)f(x)\,dx\\&=1+tm_{1}+{\frac {t^{2}m_{2}}{2!}}+\cdots +{\frac {t^{n}m_{n}}{n!}}+\cdots ,\end{aligned}}}

trong đó m n {\displaystyle m_{n}} là mô men cấp thứ n {\displaystyle n} .

Biến đổi tuyến tính của các biến ngẫu nhiên

Nếu biến ngẫu nhiên X {\displaystyle X} có hàm sinh mô men M X ( t ) {\displaystyle M_{X}(t)} , thì α X + β {\displaystyle \alpha X+\beta } có hàm sinh mô men M α X + β ( t ) = e β t M X ( α t ) {\displaystyle M_{\alpha X+\beta }(t)=e^{\beta t}M_{X}(\alpha t)}

M α X + β ( t ) = E [ e ( α X + β ) t ] = e β t E [ e α X t ] = e β t M X ( α t ) {\displaystyle M_{\alpha X+\beta }(t)=E[e^{(\alpha X+\beta )t}]=e^{\beta t}E[e^{\alpha Xt}]=e^{\beta t}M_{X}(\alpha t)}

Tổ hợp tuyến tính của các biến ngẫu nhiên độc lập

Nếu S n = i = 1 n a i X i {\displaystyle S_{n}=\sum _{i=1}^{n}a_{i}X_{i}} , trong đó các Xi là các biến ngẫu nhiên độc lập và các ai là hằng số, thì hàm mật độ xác suất của Sntích chập của các hàm mật độ tương ứng của mỗi Xi, và hàm sinh mô men của Sn được cho bởi:

M S n ( t ) = M X 1 ( a 1 t ) M X 2 ( a 2 t ) M X n ( a n t ) . {\displaystyle M_{S_{n}}(t)=M_{X_{1}}(a_{1}t)M_{X_{2}}(a_{2}t)\cdots M_{X_{n}}(a_{n}t)\,.}

Biến ngẫu nhiên giá trị vectơ

Đối với biến ngẫu nhiên giá trị vectơ X {\displaystyle \mathbf {X} } với các thành phần thực, hàm sinh mô men được cho bởi:

M X ( t ) = E ( e t , X ) {\displaystyle M_{X}(\mathbf {t} )=E\left(e^{\langle \mathbf {t} ,\mathbf {X} \rangle }\right)}

trong đó t {\displaystyle \mathbf {t} } là một vectơ và , {\displaystyle \langle \cdot ,\cdot \rangle } tích vô hướng.

Tính chất quan trọng

Hàm sinh mô men là dương và lồi logarit, với M(0) = 1.

Một tính chất quan trọng của hàm sinh mô men đó là nó xác định duy nhất phân phối xác suất. Nói cách khác, nếu X {\displaystyle X} Y {\displaystyle Y} là hai biến ngẫu nhiên và với mọi giá trị của t, ta có

M X ( t ) = M Y ( t ) , {\displaystyle M_{X}(t)=M_{Y}(t),\,}

thì

F X ( x ) = F Y ( x ) {\displaystyle F_{X}(x)=F_{Y}(x)\,}

đối với mọi giá trị của x (hay một cách tương đương là XY có cùng phân phối xác suất). Tuy nhiên, phát biểu này không tương đuơng với phát biểu "nếu hai phân phối có các mô men giống nhau thì chúng bằng nhau tại mọi điểm." Điều này là do trong một số trường hợp, các mô men tồn tại nhưng hàm sinh mô men thì không, bởi vì giới hạn

lim n i = 0 n t i m i i ! {\displaystyle \lim _{n\rightarrow \infty }\sum _{i=0}^{n}{\frac {t^{i}m_{i}}{i!}}}

có thể không tồn tại. Phân phối log-chuẩn là một ví dụ về khi điều này xảy ra.

Tính toán các mô men

Hàm sinh mô men có tên gọi như vậy bởi vì nếu nó tồn tại trên một khoảng mở quanh t = 0, thì nó là hàm sinh lũy thừa của các mô men của phân phối xác suất:

m n = E ( X n ) = M X ( n ) ( 0 ) = d n M X d t n | t = 0 . {\displaystyle m_{n}=E\left(X^{n}\right)=M_{X}^{(n)}(0)=\left.{\frac {d^{n}M_{X}}{dt^{n}}}\right|_{t=0}.}

Điều này tức là, với n là một số nguyên không âm, mô men gốc cấp thứ n (tại điểm 0) chính là đạo hàm cấp n của hàm sinh mô men, tính ở điểm t = 0.

Tham khảo

Trích dẫn

  1. ^ Casella, George; Berger, Roger L. (1990). Statistical Inference. Wadsworth & Brooks/Cole. tr. 61. ISBN 0-534-11958-1.
  2. ^ Bulmer, M. G. (1979). Principles of Statistics. Dover. tr. 75–79. ISBN 0-486-63760-3.
  3. ^ Kotz et al.[cần chú thích đầy đủ] p. 37 using 1 as the number of degree of freedom to recover the Cauchy distribution

Nguồn

  • Casella, George; Berger, Roger (2002). Statistical Inference (ấn bản 2). tr. 59–68. ISBN 978-0-534-24312-8.