Distribuições de Probabilidade Discretas e Contínuas
UFPE
representam variáveies aleatórias (v.a.);
representam realizações da variáveis aleatórias;
representam vetores aleatórios;
representam realização de vetores aleatórios;
representam matrizes aleatórios;
representam realização de matrizes aleatória;
dimensão das \(features\), variáveis
tamanho da amostra
\(i\)-ésima observação, instância
\(j\)-ésima \(feature\), variável
Uma variável aleatória segue a distribuição Bernoulli, se assume apenas os valores 0 ou 1.
função de probabilidade:
\[\begin{align} p(x) = p^x(1-p)^{1-x}, \, x = 0,1. \end{align}\]
A notação utilizada é \(X \sim Bernoulli(p)\). Na distribuição de Bernoulli, a probabilidade \(p\) pe denominada de parâmetro do modelo.
É prática comum considerar o valor 1 para sucesso e 0 para fracasso.
Seja \(X\) o número total de sucessos obtidos na realização de \(n\) ensaios de Bernoulli independentes. Neste caso, diremos que \(X\) segue a distribuição Binomial com parâmetros \(n\) e \(p\).
função de probabilidade:
\[\begin{align} p(x) = {n \choose k} p^x(1-p)^{n-x}, \, x = 0,1,\ldots,n. \end{align}\]
A notação utilizada é \(X \sim Binomial(n,p)\).
Considere uma sequência de ensaios Bernoulli independentes. Defina \(X\) como o número de fracassos anteriores ao primeiro sucesso ou, em outras palavras, o tempo de espera (em termos de ensaios anteriores) para o primeiro sucesso. A variável \(X\) segue a distribuição Geométrico com parâmetro \(p\), \(0 < p < 1\).
função de probabilidade:
\[\begin{align} p(x) = p(1-p)^{x}, \, x = 0,1,\ldots. \end{align}\]
A notação utilizada neste caso é \(X \sim Geo(p)\).
Considere uma sequência de ensaios Bernoulli independentes e definimos \(X\) como o número de fracassos anteriores ao \(r\)-ésimo sucesso. A variável \(X\) segue a distribuição Binomial Negativo com parâmetros \(r\) e \(p\), \(0 < p < 1\), \(r > 0\).
função de probabilidade:
\[\begin{align} p(x) = {x+r-1 \choose r-1 } p^r(1-p)^{x}, \, x = 0,1,\ldots. \end{align}\]
A notação utilizada neste caso é \(X \sim BN(r,p)\).
Note que se \(r=1\) temos a distribuição Geométrico.
Dizemos que \(X\) segue a distribuição Uniforme Contínuo, no intervalo \([a,b] \subset \mathbb{R}\), se todos os subintervalos de \([a,b]\) com mesmo comprimento tiverem a mesma probabilidade.
função densidade:
\[\begin{align} f(x) = \dfrac{1}{b-a}I_{[a,b]}(x). \end{align}\]
Usaremos neste caso a notação \(X \sim U[a,b]\).
A variável aleatória \(X\) segue a distribuição Exponencial de parâmetro \(\lambda > 0\).
função densidade:
\[\begin{align} f(x) = \lambda e^{-\lambda x}I_{(0, \infty)}(x). \end{align}\]
Usaremos neste caso a notação \(X \sim Exp(\lambda)\).
O parâmetro \(\lambda\) indica a taxa de ocorrência por unidade de medida, que pode ser tempo, distância ou volume, entre outras.
Diremos que \(X\) segue um Distribuição Gama, se sua densidade for dada por:
função densidade:
\[\begin{align} f(x) = \dfrac{\beta^{\alpha}}{\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x}I_{(0, \infty)}(x), \end{align}\]
sendo \(\alpha\) e \(\beta\) dois parâmetros positivos e com \(\Gamma (\alpha)\) sendo a função matemática Gama, definida por
\[\begin{align} \Gamma (\alpha) = \int_{0}^{\infty}x^{\alpha-1}e^{-x}dx,\, \alpha >0. \end{align}\]
Usaremos neste caso a notação \(X \sim Gama(\alpha, \beta)\).
Vale destacar alguns resultados sobre a função Gama:
A distribuição Gama converge para outras distribuições, vejamos alguns deles:
Parâmetros | Distribuição | Notação |
---|---|---|
\(\alpha = 1\), \(\beta >0\) | Exponencial | \(Exp(\beta)\) |
\(\alpha = 1/2\), \(n > 0\) inteiro, \(\beta = 1/2\) | Qui-quadrado com \(n\) graus de liberdade | \(\chi^2_n\) |
\(\alpha = k\), \(k>0\) inteiro, \(\beta >0\) | Erlang de ordem \(k\) | \(Erl_k(\beta)\) |
Uma variável \(X\) segue a distribuição Normal se sua densidade for:
função densidade:
\[\begin{align} f(x) = \dfrac{1}{\sigma \sqrt {2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}I_{(- \infty, \infty)}(x), \end{align}\]
com \(\mu, \sigma \in \mathbb{R}\), \(\sigma > 0\). Usaremos a notação \(X \sim N(\mu,\sigma^2)\).
A distribuição Normal possui uma grande importância na Estatística. Ela serve coma distribuição para quantidades de interesse na Inferência Estastística e, também, é usada em aproximações e Distribuição limite de distribuições.
BIBLIOGRAFIA BÁSICA
JAMES, Barry R. Probabilidade: um curso em nível intermediário. 3.ed. Rio de Janeiro: IMPA, 2006.
MAGALHÃES, M.N., Probabilidade e Variáveis Aleatórias, IME-USP, 2010.
ROSS, S. Probabilidade Um curso moderno com aplicações., Artmed Editora, 2010.
BIBLIOGRAFIA COMPLEMENTAR
HOEL, P.G.; PORT, S.C.; STONE, C.J., Introdução à Teoria da Probabilidade, Interciência, 1978.
MEYER, P.L., Probabilidade: Aplicações à Estatística, Livros Técnicos e Científicos Editora S.A, 1984.
LIPSCHUTZ, Seymour. Probabilidade. 4. ed. rev. São Paulo: Makron Books, 1993.
BIBLIOGRAFIA COMPLEMENTAR cont.
MURTEIRA, B.J.F., Probabilidade e Estatística, Volume I, Editora McGraw-Hill de Portugal Ltda., 1979.
LARSON, H., Introduction to Probability, Addison Wesley, 1995.
MORGADO, A. C; PITOMBEIRA, J. B.; CARVALHO, P. C. P.; FERNANDEZ, Pedro J. Análise combinatória e probabilidade. Rio de Janeiro: Sociedade Brasileira de Matemática, 1991.
OBRIGADO!
Slide produzido com quarto
Aprendizagem de Máquina - Prof. Jodavid Ferreira