Habilitar o(a) aluno(a) a utilizar o software R de computação estatística e gráficos para realizar análise com dados na forma de texto em linguagem natural.
Ao final do curso o participante será capaz de configurar o ambiente para análise dede texto no R, importar e pré-processar corpus de texto, realizar visualizações de dados e aplicar métodos como análise de sentimento, modelagem de tópicos, análise de agrupamento, rotulação de partes do discurso de extração de entidades nomeadas.
Problemas e métodos em mineração de textos. Importação e pré-processamento de texto. Análise de sentimentos. Tokenização e n-gramas. Frequência de palavras. Nuvem de palavras. Matrizes de documentos e termos e ponderações. Análise de agrupamento. Modelagem de tópicos. Alocação latente de Dirichlet. Métodos alternativos. Aplicações de NLP. Rotulação de partes do discurso. Extração de entidades nomeadas. Word embeddings.
- Professor: João Lucas Cordeiro
- Professor: Geisyane Karina Gonzaga
- Professor: Celso Y. Ishida
- Professor: Paulo Justiniano
- Professor: Henrique Margotte
- Professor: Vinícius Mioto
- Professor: Felipe Queluz
- Professor: Tiago Serique
- Professor: Davi Yokogawa
- Professor: Walmes Zeviani
Público-alvo
Curso para quem quer desenvolver modelos de Machine Learning supervisionados e não supervisionados.
Objetivo
Proporcionar ao(à) aluno(a) conhecimento teórico e prático referente aos principais métodos de aprendizado de máquina não supervisionados e supervisionados. Habilitar o(a) aluno(a) a utilizar o software R e/ou Python para implementação de algoritmos de aprendizado de máquina. Ao final do curso o participante deverá demonstrar capacidade para realizar tarefas, tais como: análise de agrupamento e redução de dimensionalidade, regressão e classificação.
Programa
Conceitos iniciais, Histórico e Aplicações. Análise de Agrupamentos: K-médias. Redução de Dimensionalidade: PCA e t-SNE. Classificação: Regressão Logística, KNN, Árvores de Decisão, Redes Neurais. Regressão: Regressão Linear, KNN, CART, Redes Neurais. Métodos ensemble: Florestas Aleatórias.
Metodologia de ensino
O curso é na modalidade totalmente online com encontros síncronos usando a plataforma Zoom. Os participantes poderão participar por chat, voz e vídeo e terão acesso aos materiais de aula usados, como slides, tutoriais, scripts e conjuntos de dados. Os instrutores usarão, além dos slides, tutoriais guiados, quizzes e scripts para fixação do conteúdo.
Professor
Anderson de Souza Ara (UFPR) · Possui graduação (2009) e mestrado (2011) em Estatística, títulos obtidos na Universidade Federal de São Carlos (UFSCar). Doutor em Estatística (2016) pelos Programas de Pós-Graduação em Estatística (PPGEst-UFSCar) e Pós-Graduação em Ciência da Computação (PPG-CC-UFSCar). Desde agosto de 2021, Professor Assistente do Departamento de Estatística da Universidade Federal do Paraná (DEST-UFPR), Curitiba-PR, Brasil. Professor Assistente do Departamento de Estatística da Universidade Federal da Bahia (DEST-UFBA), Salvador-BA, Brasil (2017-2021). Docente da Faculdade de Tecnologia SENAI-SP, São Carlos-SP, Brasil (2009-2015). Pesquisador do Laboratório de Estatística e Geoinformação (LEG-UFPR) e do Centro de Integração de Dados e Conhecimentos em Saúde (Cidacs/Fiocruz). Pesquisador do Programa de Pós-Graduação em Métodos Numéricos em Engenharia (PPGMNE) da UFPR e do Programa de Pós-Graduação em Matemática (PGMAT) da UFBA. Bolsista de pesquisa do Microsoft AI for Earth Program e da Wellcome Trust Foundation.
- Professor: Anderson Ara
- Professor: João Lucas Cordeiro
- Professor: Geisyane Karina Gonzaga
- Professor: Celso Y. Ishida
- Professor: Paulo Justiniano
- Professor: Henrique Margotte
- Professor: Vinícius Mioto
- Professor: Gabriel Felipe Ribeiro
- Professor: Tiago Serique
- Professor: Davi Yokogawa
- Professor: Walmes Zeviani
Público-alvo
Curso para quem quer desenvolver e disponibilizar aplicações/dashboards em Shiny e relatórios dinâmicos em Rmarkdown.
Objetivo
Habilitar o(a) aluno(a) a utilizar o software R de computação estatística e gráficos para planejar, construir e implantar dashboards baseados em {shiny} e produzir relatórios dinâmicos de análise de dados com {rmarkdown}. Ao final do curso o participante será capaz de confeccionar gráficos, tabelas, relatórios, planejar, construir e implantar dashboards que exibam métricas/indicadores e visualizações de dados, permitam download de relatórios/arquivos e upload de dados ou conexão com bancos de dados.
Programa
Componentes de uma aplicação Shiny. Conexões para reatividade. Organização lógica. Planejamento de um dashboard. Funções do backend. Layout do frontend. O grafo de reatividade. Ordem de execução. Expressões reativas. Gráficos interativos para aplicações Shiny. Tabelas e gauges. Uso de temas do Shiny. Relatórios em RMarkdown. Literate programing. Anatomia de documentos RMarkdown. Controle de execução e exibição e blocos de código. Produzindo tabelas e gráficos. Inserção de resultados no texto. Customização da aparência dos documentos. Outros tipos de documentos. Implantação de aplicações Shiny. Relatório dinâmico dentro de uma aplicação. Conexão com bancos de dados.
Metodologia de ensino
O curso é na modalidade totalmente online com encontros síncronos usando a plataforma Zoom. Os participantes poderão participar por chat, voz e vídeo e terão acesso aos materiais de aula usados, como slides, tutoriais, scripts e conjuntos de dados. Os instrutores usarão, além dos slides, tutoriais guiados, quizzes e scripts para fixação do conteúdo.
Professor
Walmes Zeviani · Doutor em Estatística & Experimentação Agropecuária, professor do Departamento de Estatística desde 2010 & programador R com mais de 12 anos de experiência. Tem experiência no ensino de Estatística e Data Science, já ministrou inúmeros cursos de R em instituições de ensino e pesquisa desde 2008. É vice-coordenador do programa de Especialização em Data Science & Big Data da UFPR.
- Professor: Lineu Alberto
- Professor: Wagner Bonat
- Professor: João Lucas Cordeiro
- Professor: Celso Y. Ishida
- Professor: Paulo Justiniano
- Professor: João Vitor Marques Moro
- Professor: Vinícius Mioto
- Professor: Felipe Queluz
- Professor: Davi Yokogawa
- Professor: Walmes Zeviani
Público-alvo
Curso para quem quer produzir dashboards para apoio à decisão e monitoramento de fenômenos usando o Power BI.
Objetivo
Habilitar o(a) aluno(a) a utilizar o software Microsoft Power BI para análise de dados. Instalar, configurar, importar arquivos, relacionar bases de dados, trabalhar com esses dados, criar medidas personalizadas e relatórios interativos. Ao final do curso o participante deverá demonstrar capacidade no uso do Microsoft Power BI para realizar tarefas de análise de dados, tais como: leitura, tratamento e organização de dados para análise, manipulação e análise dos dados usando medidas, colunas calculadas e dashboards.
Programa
Instalação e configuração do Power BI; tour pela versão Desktop; diferença entre as versões Desktop, Mobile, Pro e Premium; importação de arquivos texto, csv e planilhas do Excel; transformação de dados; estabelecendo relações entre bases de dados; Power Query; criação de medidas e colunas utilizando DAX; estrutura de relatórios e inserção de itens; gráficos simples e combinados; formatação condicional de tabelas; hierarquia e segmentação de dados; publicação de relatórios no ambiente web; construção de dashboards para aplicativo móvel.
Metodologia de ensino
O curso é na modalidade totalmente online com encontros síncronos usando a plataforma Zoom. Os participantes poderão participar por chat, voz e vídeo e terão acesso aos materiais de aula usados, como slides, tutoriais, scripts e conjuntos de dados. Os instrutores usarão, além dos slides, tutoriais guiados, quizzes e scripts para fixação do conteúdo.
Professor
Rogério Hultmann Filho · Possui graduação em Estatística pela Universidade Federal do Paraná. É Estatístico com amplo conhecimento em análise de dados, inteligência de negócios. Quase 4 anos de experiência em análise de dados, iniciando a carreira com análise de contratos de manutenção, estimativa de durabilidade de componentes e utilização de dados de conectividade para melhor precificação de contratos. Atualmente trabalhando com análise estatística, inteligência artificial para melhor previsão de demanda de peças de reposição/otimização de parâmetros de estoque e ferramentas de business intelligence (Power BI).
- Professor: Wagner Bonat
- Professor: João Lucas Cordeiro
- Professor: Geisyane Karina Gonzaga
- Professor: Rogerio Hultmann Filho
- Professor: ROGERIO DE JESUS HULTMANN FILHO
- Professor: Celso Y. Ishida
- Professor: Paulo Justiniano
- Professor: Henrique Margotte
- Professor: João Vitor Marques Moro
- Professor: Vinícius Mioto
- Professor: Tiago Serique
- Professor: Davi Yokogawa
- Professor: Walmes Zeviani
Público-alvo
Curso para quem já está ou quer entrar na carreira de Data Science e estar seguro sobre a compreensão e aplicação dos métodos estatísticos para entregar soluções baseadas em dados.
Objetivo
Habilitar o(a) aluno(a) a utilizar métodos estatísticos tais como, medidas descritivas, gráficas e tabulares. Princípios de probabilidade e inferência estatística.
Ao final do curso o participante deverá demonstrar capacidade de uso e interpretação racional de métodos estatísticos relacionados a estatística descritiva e inferencial.
Programa
Estatística: contextualização e motivação; Métodos de amostragem; Estatística descritiva; Medidas de associação; Elementos de probabilidade; Inferência estatística; Testes de hipóteses; Comparando dois grupos; Analisando a associação entre duas variáveis categóricas; comparando mais de dois grupos.
Metodologia de ensino
O curso é na modalidade totalmente online com encontros síncronos usando a plataforma Zoom. Os participantes poderão participar por chat, voz e vídeo e terão acesso aos materiais de aula usados, como slides, tutoriais, scripts e conjuntos de dados. Os instrutores usarão, além dos slides, tutoriais guiados, quizzes e scripts para fixação do conteúdo.
Professor
Wagner Hugo Bonat (UFPR) · Possui graduação em Estatística pela Universidade Federal do Paraná (2008), mestrado em Métodos Numéricos em Engenharia pela Universidade Federal do Paraná (2010) e doutorado em PhD Mathematics and Computer Science - University of Southern Denmark (2016). Tem experiência na área de Probabilidade e Estatística, com ênfase em Probabilidade e Estatística, atuando principalmente nos seguintes temas: modelos multivariados, funções de estimação, máxima verossimilhança, estatística espacial e sofware R.
- Professor: Wagner Bonat
- Professor: João Lucas Cordeiro
- Professor: Geisyane Karina Gonzaga
- Professor: Rogerio Hultmann Filho
- Professor: Paulo Justiniano
- Professor: João Vitor Marques Moro
- Professor: Vinícius Mioto
- Professor: Ricardo Rasmussen Petterle
- Professor: RICARDO RASMUSSEN PETTERLE
- Professor: Tiago Serique
- Professor: Davi Yokogawa
- Professor: Walmes Zeviani
Público-alvo
Curso para quem já está ou quer entrar na carreira de Data Science e aprender a linguagem R para entregar soluções baseadas em dados. O Curso vai ensinar a linguagem R desde o início, apresentando e exercitando os conceitos de programação até a análise exploratória de dados apresentada em relatórios.
Objetivo
Habilitar o(a) aluno(a) a utilizar o software R de computação estatística e gráficos para análise de dados. Isso corresponde a realizar tarefas de importação, tratamento e organização de dados, manipulação e análise de dados com estatística descritiva e construção de gráficos.
Ao final do curso o participante será capaz de instalar e configurar o ambiente para análise de dados com R, instalar e gerir pacotes, importar, manipular dados, confeccionar, interpretar e exportar gráficos, aplicar e interpretar medidas resumo numéricas, exportar resultados de análise.
Programa
Instalação e configuração do ambientação ao R e RStudio IDE para análise de dados; Visão geral e convenções da linguagem R; Aritmética e manipulação básica de vetores; Estruturas de programação e funções; Estruturas de dados; Importação de dados; Visualização de dados com ggplot2; Limpeza e organização para o formato tidy; Processamento e transformação de dados; Agregação e conciliação de dados; Manipulação de datas, strings e fatores; Estimação e testes de hipótese; Análise de regressão linear simples.
Metodologia de ensino
O curso é na modalidade totalmente online com encontros síncronos usando a plataforma Zoom. Os participantes poderão participar por chat, voz e vídeo e terão acesso aos materiais de aula usados, como slides, tutoriais, scripts e conjuntos de dados. Os instrutores usarão, além dos slides, tutoriais guiados, quizzes e scripts para fixação do conteúdo.
Professor
Fernando de Pol Mayer (UFPR) · Departamento de Estatística. Mestre em Ecologia pela Universidade Federal de Santa Catarina (2011) e Doutor em Estatística e Experimentação Agronômica, Universidade de São Paulo (2019). Tem mais de 15 anos de experiência com programação com a linguagem R e possui interesses em modelagem estatística, estatística computacional e pesquisa reproduzível.
- Professor: Geisyane Karina Gonzaga
- Professor: Paulo Justiniano
- Professor: Henrique Margotte
- Professor: João Vitor Marques Moro
- Professor: Fernando Mayer
- Professor: Felipe Melo
- Professor: Vinícius Mioto
- Professor: Tiago Serique
- Professor: Davi Yokogawa
- Professor: Walmes Zeviani
Público-alvo
Curso para quem já está ou quer entrar na carreira de Data Science e aprender a linguagem Python para entregar soluções baseadas em dados. O Curso vai ensinar a linguagem Python desde o início, apresentando e exercitando os conceitos de programação até a análise exploratória de dados apresentada em relatórios.
Objetivo
Habilitar o(a) aluno(a) a utilizar a linguagem de programação Python para análise de dados. Realizar tarefas de leitura (entrada), processamento (tratamento e organização), manipulação e análise de dados com estatística descritiva e construção de gráficos simples.
Ao final do curso, o participante terá adquirido conhecimentos básicos sobre programação, será capaz de instalar e configurar seu próprio ambiente para programação e análise de dados com Python, importar e manipular dados em formatos textuais e estruturados, confeccionar e exportar gráficos, e salvar resultados de análises em arquivos.
Programa
Introdução ao Python; Funções; Entrada e Saída de Dados (linha de comando, argumentos, arquivos); Estruturas de dados (arrays, tuplas, listas e dicionários); Manipulação de strings; Bibliotecas/módulos padrão e suas funções; Numpy; Pandas; Visualização de Dados.
Metodologia de ensino
O curso é na modalidade totalmente online com encontros síncronos usando a plataforma Zoom. Os participantes poderão participar por chat, voz e vídeo e terão acesso aos materiais de aula usados, como slides, tutoriais, scripts e conjuntos de dados. Os instrutores usarão, além dos slides, tutoriais guiados, quizzes e scripts para fixação do conteúdo.
- Professor: André Grégio
- Professor: Paulo Ricardo Lisboa de Almeida
- Professor: Henrique Margotte
- Professor: João Vitor Marques Moro
- Professor: Vinícius Mioto
- Professor: Tiago Serique
- Professor: Claudio Torres Junior
- Professor: Davi Yokogawa
- Professor: Walmes Zeviani
Público-alvo
Curso para quem já está ou quer entrar na carreira de Data Science e aprender a usar o Excel para entregar soluções baseadas em dados. O Curso vai ensinar o Excel desde o início, apresentando e exercitando os conceitos sobre planilhas até a análise exploratória de dados e análise estatística.
Objetivo
Habilitar o(a) aluno(a) a utilizar o software MS Excel para a análise de dados. Realizar tarefas de ingestão, tratamento e organização de dados, manipulação e análise de dados com estatística descritiva e construção de gráficos.
Ao final do curso o participante deverá demonstrar capacidade no uso do MS Excel para realizar tarefas de leitura, tratamento e organização de dados para análise, manipulação e análise dos dados usando métodos de estatística descritiva e gráficos.
Programa
Ambientação ao Excel; Entrada de dados e tipos de valores; Fórmulas; Expressões lógicas; Referências; Reconhecimento de padrões; Importação de dados; Formatação condicional; Funções para texto e datas; Filtro de valores; Classificação de valores; Cruzamento de conciliação de dados; Pivotagem de dados (Tabela dinâmica); Análise descritiva numérica; Análise gráfica univariada; Análise gráfica bivariada; Distribuições de probabilidade; Testes de hipótese; Análise de regressão linear; Análise de variância.
Metodologia de ensino
O curso é na modalidade totalmente online com encontros síncronos usando a plataforma Zoom. Os participantes poderão participar por chat, voz e vídeo e terão acesso aos materiais de aula usados, como slides, tutoriais, scripts e conjuntos de dados. Os instrutores usarão, além dos slides, tutoriais guiados, quizzes e scripts para fixação do conteúdo.
Professor
Celso Yoshikazu Ishida (UFPR) · Possui graduação em Bacharelado em Informática pela Universidade Federal do Paraná (1996), mestrado em Informática pela Universidade Federal do Paraná (2002), doutorado em Métodos Numéricos em Engenharia pela Universidade Federal do Paraná (2008) e doutorado sandwich em Matemática Aplicada - Université Paris-Sud XI (2004). Tem experiência na área de Ciência da Computação, com ênfase em Inteligência Artificial, atuando principalmente nos seguintes temas: computação evolucionária, aprendizado de máquina, mineração de dados, programação genética e classificação.
- Professor: João Lucas Cordeiro
- Professor: Geisyane Karina Gonzaga
- Professor: Celso Y. Ishida
- Professor: Paulo Justiniano
- Professor: Henrique Margotte
- Professor: João Vitor Marques Moro
- Professor: Vinícius Mioto
- Professor: guilherme pateiro
- Professor: Tiago Serique
- Professor: Davi Yokogawa
- Professor: Walmes Zeviani