Conceitos, Visão geral sobre mercado de trabalho e apresentação de um case de IA
UFPE

Professor Depto. de Estatística da UFPE
Pense na pessoa mais inteligente que você conhece!!!
A Inteligência, mais especificamente inteligência humana é um termo interessante de discutir, ela envolve (Sternberg, 2000):
o cérebro humano, que é o órgão mais complexo do corpo humano;
a mente, sendo esta relacionada a capacidade de pensar, raciocinar, lembrar, entender e sentir;
o pensamento lógico, que é a capacidade de raciocinar e resolver problemas;
a compreensão, associado a capacidade de entender e interpretar informações;
a aplicabilidade, que vai de encontro a capacidade de aplicar conhecimentos e habilidade em sua maioria sendo em situações práticas;
Em geral, a inteligência pode ser bem definida como a capacidade de um indivíduo realizar tarefas efetivamente usando seu próprio conhecimento, interpretação e perspicácia.

Teste de Turing.O conceito básico deste jogo é descobrir se o participante é humano ou um computador.
O cenário 1 do teste consiste em três jogadores, onde o primeiro jogador é um “homem”, o segundo jogador é uma “mulher” e o terceiro jogador é o “interrogador”, que pode ser tanto um homem quanto uma mulher. Os dois primeiros jogadores estarão em salas diferentes, e o interrogador não sabe quem são os jogadores. Agora, o desafio do interrogador é descobrir o gênero dos dois primeiros jogadores com base nas respostas escritas dadas por eles para as perguntas feitas pelo interrogador. Outro desafio será criado fazendo com que o primeiro jogador dê intencionalmente respostas incorretas às perguntas, o que pode induzir o interrogador a inferir que o primeiro jogador é uma “mulher” em vez de um “homem”. A Figure 1 mostra o cenário do teste de imitação.
Turing tentou projetar este jogo com uma pequena alteração, na qual substituiu um dos dois primeiros jogadores por um computador no cenário de teste 2.
Ele analisou se a máquina tinha a capacidade de agir como um jogador humano aplicando sua própria inteligência.
Ele provou através do teste que o computador tem uma melhor capacidade de confundir o interrogador com sua inteligência, de modo que o interrogador tem a possibilidade de interpretar erroneamente o primeiro jogador como humano em vez de computador.
A inteligência da máquina foi comprovada através do teste de Alan Turing e amplamente aceita pela comunidade de pesquisa na época.
Timeline 1 da IA.(fonte:Weijermars, et.al. )
Timeline 2 da IA.(fonte: Momentum Works report – The future by ChatGPT)
(fonte: AI Experience - Google)
Existem três abordagens da Inteligência Artificial:
é uma escola de pensamento que diz que a inteligência depende da percepção e da ação. Assim, o comportamento da inteligência só pode ser demonstrado no mundo real através da constante interação com o meio.
tenta replicar a inteligência humana, como a capacidade de resolver problemas através de regras e lógica. Por meio de símbolos, como palavras e conceitos, uma estrutura lógica é organizada que permite ao sistema de IA realizar as tarefas.
é baseada na simulação dos componentes do cérebro (modelagem da inteligência humana), como neurônios e sinapses. Aqui as soluções são baseadas em padrões e aprendizado de máquina, tentando imitar o funcionamento do cérebro humano.



A Inteligência Artificial é dividida em duas partes:
é quando uma máquina realmente entende o que está acontecendo. Podem existir emoções e criatividade. Na maior parte, é o que vemo em filmes de ficção científica.
é quando uma máquina realiza a correspondência entre padrões, e está relacionada a tarefas específicas, e as capacidades não são facilmente transferíveis para outros sistemas.
O ambiente de inteligência artificial consiste em cinco componentes principais:
O ambiente de inteligência artificial consiste em cinco componentes principais:
Machine Leaning (ML) ou Aprendizado de máquina (AM) é um subcampo da Inteligência Artificial que estuda, desenvolve e analisa os algoritmos de aprendizado. Através de utilização dos métodos de AM, modelos baseado em dados podem ser criados para solucionar um determinado tipo de problema específico que de IA, dentre eles, aprendizados supervisionados, não supervisionados e aprendizagem por reforço.

Inicialmente, as aplicações que eram consideradas de AM eram apenas as desenvolvidas estritamente pela comunidade da computação, contudo, no final dos anos 90, as aplicações de AM começaram a ter intersecções com as de estatística.
Atualmente, a comunidade de AM é bastante interdisciplinar, sendo a estatística uma das áreas. Enquanto que até os anos 90, métodos criados pela estatística começavam a ser incorporados em AM, atualmente a direção oposta está cada vez mais comum: métodos desenvolvidos por AM começaram a ser usados em estatística.
Dessa forma, hoje os algoritmos existentes em Machine Learning e Inteligência Artificial possuem como base em sua maioria conceitos da Estatística e Computação.
Atualmente no mercado de trabalho, nomenclaturas estão surgindo para diferenciar as áreas que trabalham com dados. As mais frequentes utilizadas atualmente são:
Atualmente no mercado de trabalho, nomenclaturas estão surgindo para diferenciar as áreas que trabalham com dados. As mais frequentes utilizadas atualmente são:
A ciência de dados é uma ciência que tem como princípios fundamentais a extração de conhecimento e informações a partir de dados utilizando o ‘ferramental’ e conceitos da matemática, estatística e computação. Com a ciência de dados é possível criar soluções e gerar resultados para obter insights, prever eventos futuros que auxiliam na tomada de decisões.
Atualmente, a ciência de dados é sinônimo ou está relacionando a termos como:
…mas isso é apenas um novo giro ou nomenclatura em áreas que existem a muito tempo.

Graças ao avanço de tecnologias computacionais a
nível de hardware e software, a capacidade de:
tornou-se mais acessível e eficiente.
Dessa forma as técnicas estatísticas e computacionais que são utilizadas na ciência de dados ganharam uma âncora em negócios nos últimos anos;

Atualmente, existem aproximadamente 22,2 bilhões de dispositivos conectados à internet;
8.2 bilhões de pessoas vivendo em nosso planeta;
Essas conexões entre pessoas e dispositivos geram uma massa de dados estimada:
![]()
Para se ter uma ideia do que isso significa, vamos entender rapidamente a estrutura de armazenamento de dados com exemplos que temos no cotidiano.

Este último, equivale a ’todas as centrais
de dados, discos rígidos, pendrives e servidores de todo o mundo’.
No Brasil, atualmente, 72,5 milhões de domicílios tem acesso à Internet (92,5%), sendo 77% estão nas mídias sociais, como blogs, Facebook, X, Instagram, SlideShare, Youtube, entre outros, realizando algum tipo de interação e assim trocando dados e informações.
Uso digital no Brasil. Fonte: We are social.
Fluxograma do processo de ciência de dados de Doing Data Science, de Schutt & O’Neil (2013)
.png)

Compreender os dados e descobrir o que pode ser digno de nota ou interessante a destacar para outras pessoas.
Mesmo sabendo que existem dados de diferentes formas, quando estamos no contexto de dados estrurados é importante ter essa reflexão em mente!
- Hadley Wickham
Há três regras inter-relacionadas que tornam um conjunto de dados arrumados (tidy):
Cada variável deve ter sua própria coluna.
Cada observação deve ter sua própria linha.
Cada valor deve ter sua própria célula.
Pode-se afirmar que para aplicar ciência de dados é preciso ter conhecimentos de
Isto é importante, porque as ferramentas e algoritmos desenvolvidos são baseadas nestas áreas. Por isso, eles são considerdos a essência da Ciência de Dados
Ao considerar as áreas de
é possível destacar 4 (quatro) pilares fundamentais para se tornar um cientista de dados
Possuir “Pensamento e raciocínio lógico matemático”, é extremamente necessário ter a capacidade de realizar operações lógicas, ou seja, a capacidade de organizar dados ou informações para se obter um contexto, um significado e um resultado ou consequência
Em seguida, a “Matemática e Estatística” é a base de todos os algoritmos aplicados à machine learning e inteligência artificial, no qual os conceitos matemáticos e a estatística é característica intrínseca da ciência de dados.
Outro ponto importante é o “Conhecimento em Programação”, a extração de dados exige criatividade devido ao emaranhado de dados possíveis para um determinado fim e exige também formas viáveis para extração. Tanto a criatividade quanto a viabilidade são postas em prática a partir de programas oriundos do conhecimento de linguagens de programação.
Por fim, o quarto pilar, podemos dizer que é o “Conhecimento em Banco de dados”, todos os dados disponíveis podem ser armazenados, ainda que temporariamente, para produzirem o conhecimento necessário para determinado fim e praticamente em quase todas as fases do ciclo de vida do dado pertencente à análises estarão relacionadas à bancos de dados, sejam estes relacionais ou não relacionais, que são assuntos que o cientista de dados deve dominar no seu dia a dia.


Link para Estudo:
Estamos precisando de uma solução para Karaokê. Gostaríamos de utilizar uma solução de Inteligência Artificial que possua o mínimo de interação humana. A solução será utilizada em programa de TV e queremos algo inovador para nosso meio. Nosso time não possui especialistas em IA, assim, precisamos de uma solução que possamos enviar via *.mp3 ou qualquer outra extensão, e a solução consiga gerar um vídeo com a música escolhida e a letra sendo passada no tempo correto. A maioria das músicas serão em português e inglês.
Solução proposta:
Desenvolver uma plataforma para manipulação dos áudios e conversão do vídeo final;
Por que 4 redes neurais?
Desenho simples de arquitetura:

Rede Neural para transcrição de texto - Whisper - OpenAI (Dezembro 2022) - Link do paper: https://arxiv.org/pdf/2212.04356:
Rede Neural para Isolamento de Vocal - Demucs - FacebookResearch (Abril 2021) - Link do paper: https://hal.science/hal-02379796/document:
Rede Neural de sincronização de texto - MMS - Massively Multilingual Speech - OpenAI e Meta (Maio 2023) - Link do paper: https://arxiv.org/pdf/2305.13516
Aplicação da solução em forma de vídeo:
Solução sendo aplicada:

Os cientistas de dados são profissionais interdisciplinares. Eles podem lidar com todos os aspectos de um problema, desde a coleta inicial de dados e condicionamento de dados até a obtenção de conclusões. Eles podem e devem pensar fora da caixa para encontrar novas maneiras de ver o problema ou trabalhar com problemas definidos de uma maneira muito ampla, e eles sempre devem estar prontos para o seguinte questionamento:
‘Aqui estão os dados, o que você pode fazer com eles?’
Mike Loukides
vice-presidente de estratégia de conteúdo da O’Reilly Media
Newell, Allen. “Intellectual issues in the history of artificial intelligence.” Artificial Intelligence: Critical Concepts (1982): 25-70.
Kaliraj, P., and T. Devi, eds. Artificial intelligence theory, models, and applications. CRC press, 2021.
Livros:
OBRIGADO!
Slide produzido com quarto
Lattes: http://lattes.cnpq.br/4617170601890026
LinkedIn: jodavidferreira
Site Pessoal: https://jodavid.github.io/
e-mail: jodavid.ferreira@ufpe.br

Inteligência Artificial e Estatística - Jodavid Ferreira - https://jodavid.github.io/