Tópicos Especiais em Estatística Comp.

Apresentação

Prof. Jodavid Ferreira

UFPE

Quem é o Dr. Jodavid Ferreira?

  • Graduação em Estatística pela UFPB;
  • Mestrado em Estatística pela UFPE;
  • Doutor em Estatística pela UFPE;

Experiências em Pesquisa

  • Processamento de Imagens PolSAR;
  • Probabilidade fuzzy;
  • Machine Learning;
  • Deep Learning;

Experiências Profissional

  • HartB Group e ThinkAI Group (Startups com foco em Inteligência Artificial);
  • Certificado em IA pela Huawei e em Engenharia de dados pela Google;

Estrutura da disciplina


  • Carga Horária: 75 horas

  • Como será a disciplina:

    • Aulas expositivas;
    • Aulas práticas (em computador);
    • Avaliação:
      • 1 Prova - 21.11.2024;
      • 2 Trabalhos:
        • 1º Trabalho - apresentação de 1 artigo científico (vou sortear 1 para cada);
          • 26.09.2024
        • 2º Trabalho - aplicação de alguns métodos e será completo com escrita e apresentação;
          • Inicio: 02.12.2024

Tópicos da disciplina


  1. Fundamentos de Programação em R e Python:
    • Essenciais para a implementação de métodos estatísticos computacionais.
  2. Ferramentas e Versionamento (Git e GitHub):
    • Importantes para o gerenciamento de projetos (em estatística computacional), colaborativos e reprodutíveis.
  3. Web Scraping:
    • Utilizado para coletar dados, que é uma etapa crucial na análise estatística.
  4. Desenvolvimento de Aplicações Web (Markdown e Shiny):
    • Permite a criação de dashboards e ferramentas interativas para visualização de dados e resultados.

Tópicos da disciplina


  1. APIs e Docker:
    • Facilitam a integração e a distribuição de aplicações em diferentes ambientes.
  2. Big Data:
    • Envolve técnicas de manipulação e análise de grandes volumes de dados, frequentemente usadas em estatística.
  3. Bancos de Dados Estruturados e Não Estruturados:
    • Conhecimentos sobre diferentes tipos de dados e suas manipulações são cruciais em análises estatísticas complexas.
  4. Machine Learning (apenas os conceitos):
    • Engloba métodos estatísticos avançados para previsão e classificação, essenciais na estatística computacional.

Tópicos da disciplina


  1. TensorFlow e Keras:
    • Ferramentas de software utilizadas para implementar modelos de deep learning.
  2. Deep Learning e Redes Neurais:
    • São métodos “estatísticos” avançados utilizados para modelagem e análise de dados complexos.
  3. Modelos de Linguagem Natural (LLMs):
    • Modelos da IA Generativa que conseguem gerar dados a partir de diferentes inputs.







R e Python


R e Python





O que é o R? O que é o Python?

R e Python


R:

  • É uma linguagem de programação voltado para a análise estatística e gráficos;

  • É uma linguagem de programação de alto nível e de código aberto (R é Software Livre);

  • É uma das linguagens mais utilizadas em estatística e análise de dados, e possui uma grande quantidade de pacotes para tais fins.

Python:

  • É uma linguagem de programação de alto nível e de código aberto (o Python é Open Source);

  • É uma das linguagens mais utilizadas em desenvolvimento de software e análise de dados.;

  • É uma linguagem de programação que também possui uma grande quantidade de pacotes para análise de dados.

R e Python


Fonte: https://www.statista.com/statistics/793628/worldwide-developer-survey-most-used-languages/

Fonte: https://www.statista.com/statistics/793628/worldwide-developer-survey-most-used-languages/

- python na 3º posição;

- R na 21º posição;

Programação


  • Por que Programar?


Geralmente, utilizamos a programação quando “se precisa automatizar processos do nosso dia a dia”.


Para programarmos, usamos uma linguagem de programação que possibilita informar ao computador como ele deve se comportar para assim conseguirmos automatizar o processo desejado

Por que Progamar?



- Programação de Alto Nível:

Uma linguagem de programação de alto nível disponibiliza comandos (palavras-chaves) bem próximos de uma linguagem natural. Com isso, o processo de “conversar” com o computador é facilitado, pois essas palavras-chaves fornecem uma maior clareza de como se deve orquestrar o que o computador deve fazer por nós.


- Programação de Baixo Nível:

Uma linguagem de programação de baixo nível é mais próxima da linguagem de máquina, ou seja, mais próxima do que o computador entende. Com isso, o processo de “conversar” com o computador é mais difícil, pois é necessário entender como o computador funciona para poder programar. Um exemplo de linguagem de baixo nível é o Assembly, que é uma linguagem de programação que utiliza códigos de máquina para programar.

Por que Progamar?



  • Exemplo em R
# Exemplo de código em R
cat('Hello, World!\n')
  • Exemplo em python
# Exemplo de código em python
print('Hello, World!')
  • Exemplo em Assembly
section .data
    msg db 'Hello, World!', 0xA  ; Mensagem a ser impressa seguida de nova linha
    len equ $ - msg              ; Calcula o comprimento da string

section .text
    global _start                ; Define o ponto de entrada do programa

_start:
    mov edx, len                ; Define o terceiro argumento: tamanho da mensagem
    mov ecx, msg                ; Define o segundo argumento: ponteiro para a mensagem
    mov ebx, 1                  ; Define o primeiro argumento: descritor de arquivo (stdout)
    mov eax, 4                  ; Define o número da chamada de sistema para sys_write
    int 0x80                    ; Chama o kernel

    mov eax, 1                  ; Define o número da chamada de sistema para sys_exit
    xor ebx, ebx                ; Define o argumento para sys_exit: 0
    int 0x80                    ; Chama o kernel

Por que é interessante aprender R e python?


Plataformas Recomendadas


Plataformas Recomendadas


Tipos de Redes Neurais


Sites Interessantes


Referências para serem utilizadas



  • The Elements of Statistical Learning: Data Mining, Inference and Prediction, Hastie, T., Tibshirani, R. and Friedman, J., 2nd ed., Springer-Verlag, 2009.

  • An Introduction to Statistical Learning: With Applications in R, James, G., Witten, D., Hastie, T. and Tibshirani, R., Springer-Verlag, 2013.

  • Aprendizado de máquina: uma abordagem estatística, Izbicki, R. and Santos, T. M., 2020.


Imagens:

  • Esta apresentação possui imagens obtidas da internet. Caso a fonte não seja informada, contactar o autor para que a mesma seja adicionada.




OBRIGADO!


Slide produzido com quarto