cursos-2
cursos-1

Cursos

"Treinamentos especializados em gestão de riscos, finanças e ciência de dados, com agenda permanente e fechados, desenvolvidos especificamente para cada organização."

Cursos Anteriores

Mineração de dados e Aprendizado de máquina: aplicações em dados estruturados

1 de janeiro de 2019

Introdução

Mineração de dados e Aprendizado de máquina (ou Data Mining e Machine Learning) consiste na exploração estatística e computacional de grandes bases de dados com o objetivo de identificar, capturar, selecionar e validar padrões e/ou conhecimentos implícitos subjacentes aos dados. Grandes bases de dados ocorrem com frequência em organizações que acumulam dados oriundos do relacionamento com seus clientes e de diversas outras fontes, internas e externas à organização. Isso significa uma grande variedade de dados distintos e, possivelmente, uma grande quantidade de dados em termos de tempo de acúmulo.

Nos últimos anos houve progressos importantes nos métodos estatísticos e computacionais, que se tornaram mais eficientes, robustos, diversificados e adequados, para a análise de dados de negócios e, em particular, destacamos duas áreas que tem tido uma grande relevância: relacionamento com clientes (CRM analítico) e detecção de fraudes / anomalias.

Desenvolvemos um conjunto de 5 cursos partindo dos modelos aplicáveis em dados estruturados e evoluindo para modelos aplicáveis em dados não estruturados, o arcabouço tecnológico para uso em Big Data e aplicações atuais de Big Data.

 


Cursos do programa

  1. Mineração de dados e Aprendizado de máquina: aplicações em dados estruturados
  2. Mineração em Grafos e Sistemas de Recomendação
  3. Mineração de textos e de Redes Sociais
  4. Deep Learning
  5. Infraestrutura de Big Data: tecnológica e analítica

 

Objetivos 

Apresentar e discutir as principais metodologias e técnicas úteis para a análise estatística e computacional de grandes bases de dados (estruturados e não-estruturados) e que encontram uma grande variedade de aplicação em problemas atuais. Os cursos terão um caráter formativo e recomendamos observar os pré-requisitos mínimos para poderem usufruir os benefícios dos cursos. Os exemplos em geral serão dados preferencialmente com o uso da linguagem R ou Python e aplicativos específicos.

Os objetivos específicos dos cursos são os seguintes:

  • Apresentar e explorar as principais metodologias, técnicas e algoritmos de DM
  • Apresentar como a tecnologia de DM extrai informações úteis de grandes bases de dados
  • Capacitar os participantes a atuarem de forma proativa em projetos de DM
  • Apresentar a infraestrutura tecnológica necessária para análise de dados não estruturados
  • Apresentar e explorar as principais funcionalidades, técnicas e algoritmos de mineração de dados para uso em Big Data

 

Público-alvo 

  • Profissionais de análise quantitativa de dados e de modelagem estatística e de mineração de
    dados
  • Profissionais de informática interessados no processo de descoberta de conhecimento em
    bases de dados (KDD) e em Big Data em geral
  • Profissionais atuando na área de mineração de dados, Big Data e áreas afins e as diversas áreas de negócio usando mineração de dados e Big Data.

 

Carga Horária, Local, Data e Inscrição

Cada curso tem carga horária de 16 horas, ministradas em 2 dias consecutivos. Os cursos serão realizados em São Paulo (Bairro de Pinheiros), das 08:30 às 17:30 horas. As inscrições devem ser feitas através do e-mail analitix.educacional@analitix.com.br ou do telefone (11) 3814 4491.

O valor do investimento de cada um dos cursos é de R$ 1.500,00 para pagamentos recebidos antes da data do respectivo curso (após isso, o valor passa para R$ 1.700,00) e o pagamento deve ser feito via Depósito Bancário. No valor do investimento está incluso o material didático em formato impresso, coffee breaks e certificado de participação.

 

Data do curso

 

Metodologia de Ensino

  • Aulas teóricas e expositivas
  • Apresentação de exemplos práticos com uso de aplicativos específicos da área.

 

Conteúdo Programático

 

  1. Introdução
    1. O que é Data Mining e quem são seus profissionais?
    2. Aplicações
  2. Preparação de Dados:
    1. Seleção de atributos
    2. Tratamento de valores ausentes
    3. Problemas com classes desbalanceadas
    4. Amostragem
  3. Apresentação e discussão de Métodos Supervisionados
    1. Árvores de Decisão (C4.5)
    2. Modelos estatísticos
    3. Redes Neurais
    4. Classificador Naive Bayes
    5. Seleção de Modelos
      • Super-ajuste (overfitting)
      • Bias x variância
      • Validação Cruzada, estimativas da capacidade de generalização e construção do modelo preditivo
  4. Apresentação e discussão de Métodos Não Supervisionados
    1. Algoritmos de Associação / Apriori
    2. Métodos Particionais (k-Means e EM para Misturas de Gaussianas)
    3. Detecção de anomalias via densidades Gaussianas
    4. Conjuntos Bayesianos
    5. Detecção de anomalias via agrupamento de dados
  5. Modelos Supervisionados e Não-Supervisionados
    1. Redes Bayesianas
    2. Noções sobre Sistemas Especialistas
    3. Combinando Diferentes Modelos (Classifier Ensembles)
  6. Introdução a Big Data
    1. Visão Geral, Desafios e Especificidades
    2. O contexto de dados não-estruturados
    3. Exemplo de aplicação: Dados de Redes Sociais
      • Mineração em Grafos
      • Crowdsourcing
      • Sentiment Analysis

 

A Analitix se reserva o direito de alterar ou cancelar o curso em função de não atingir o número mínimo de alunos por turma.

 

Coordenadores

Claudio Paiva:

Sócio-Diretor da Analitix e Manager da QRM Brasil, com extensa experiência na prestação de serviços na área financeira, incluindo gestão integrada de riscos, Basiléia II e III, A/LM, engenharia financeira e na aplicação de modelagem quantitativa em diversas áreas. Foi Professor-Doutor do Instituto de Matemática e Estatística da USP, é Bacharel e Mestre em Física pela UFMG, Ph.D. em Matemática Aplicada pela Goethe Universität Frankfurt e realizou pós-doutorado no Courant Institute of Mathematical Sciences da New York University.

 

Estevam R. Hruschka Jr.

Graduado em Ciências da Computação pela Universidade Estadual de Londrina (1994), mestrado em Ciência da Computação pela Universidade de Brasília (1997), doutorado em Sistemas Computacionais de Alto Desempenho pela Universidade Federal do Rio de Janeiro (PEC/COPPE/UFRJ) (2003) e pós-doutorado em Aprendizado de Máquina pela Carnegie Mellon University (EUA).

Professor associado da Universidade Federal de São Carlos e professor colaborador/visitante na Carnegie Mellon University, EUA, onde lidera, em conjunto com os professores Tom Mitchell e William Cohen, o projeto Read The Web (http://rtw.ml.cmu.edu). Possui experiência na área de Ciência da Computação, com ênfase em Aprendizado de Máquina, Mineração de Dados e atuando principalmente nos seguintes temas de pesquisa: aprendizado de máquina, aprendizado sem fim, modelos gráficos probabilísticos, modelos Bayesianos, algoritmos evolutivos e teoria dos grafos.

 

inscrições encerradas


© Analitx | criação BlueBossa