Exploração de Dados › 45587

código no paco
45587
área científica
Informática / Sistemas de Informação
créditos
6
escolaridade
ensino teórico-prático (TP) - 3 horas/semana
idioma(s) de lecionação
a inserir brevemente
objectivos

Esta unidade curricular foca o desenvolvimento de sistemas de apoio à decisão usando técnicas de data warehousing e data mining.

O data warehousing designa um conjunto de técnicas de bases de dados para a criar repositórios centralizados que integram dados provenientes de fontes heterogéneas. Tipicamente, armazenam dados atuais e dados históricos, e são usados para análise de dados, análise de tendências e criação de relatórios em sistemas de apoio à decisão.

O data mining é uma área interdisciplinar orientada para o processo de procura de padrões em grandes volumes de dados. Estes objectivos são alcançados utilizando técnicas de pré-processamento que visam a normalização e muitas vezes a redução de dimensão, algoritmos que extraem a informação relevante e, finalmente a apresentação da informação de maneira a poder ser interpretada.

competências


  • Compreender as técnicas de modelação de dados multidimensionais.
  • Desenhar, implementar e otimizar Data Warehouses.
  • Compreender e aplicar processos de transformação de dados.
  • Compreender as técnicas de classificação e agrupamento de dados.
  • Aplicar as técnicas de data mining a problemas comuns.
conteúdos

1. Data Warehousing (DW)
1.1. Modelos de dados multidimensionais
1.2. Esquemas de implementação de data warehouses
1.3. Técnicas de extração, transformação e carregamento de dados
1.4. Processamento analítico de dados (OLAP): esquemas de implementação, técnicas de processamento de dados e ferramentas
1.5. Estruturas de dados e métodos de acesso multidimensionais: índices bitmap, bases de dados colunares e bases de dados em memória


2. Data Mining (DM)
2.1. Técnicas de análise e pré-processamento de dados
2.2. Técnicas de Classificação: técnicas de Bayes, árvores de decisão, modelos lineares (perceptrão e SVM (support vector machine)), modelos não lineares (redes neuronais e SVM), KNN (vizinhos mais próximos)
2.3. Classificadores e medidas de desempenho
2.4. Técnicas de Agrupamento: medidas de semelhança, K-médias, e algoritmos Hierárquicos
2.5. SOM (self organizing maps) e redes de Kohonen

avaliação

Avaliação discreta.

requisitos

Conceitos básicos de probabilidades,  estatística e bases de dados.

metodologia

Um exame final

Avaliação de trabalhos: relatórios e apresentações orais.

Leitura e apresentação de artigos científicos.

bibliografia base
C. S. Jensen, T. B. Pedersen, C. Thomsen. Multidimensional Databases and Data Warehousing (Synthesis Lectures on Data Management). Morgan & Claypool Publishers, 2010. H. Witten and E. Frank, Data Mining ,Pratical Machine Learning Tools and Techniques, Elsevier 2005.
bibliografia recomendada
  • C. S. Jensen, T. B. Pedersen, C. Thomsen. Multidimensional Databases and Data Warehousing (Synthesis Lectures on Data Management). Morgan & Claypool Publishers, 2010.
  • H. Witten and E. Frank, Data Mining ,Pratical Machine Learning Tools and Techniques, Elsevier 2005
  • Pang Ning Tan, M. Steinback , Vipin Kumar- Introduction to data mining- Addison-Wesley- 2006
  • Inmon, W., Building the data warehouse, , John Wiley & Sons, 2005.
  • Stefano Rizzi. Conceptual modeling solutions for the data warehouse. In Data Warehousing and Mining: Concepts, Methodologies, Tools, and Applications, J. Wang (Ed.), Information Science Reference, pp. 208-227, 2008. 
Este sítio web utiliza cookies sem recolher informação pessoal que permita a identificação dos utilizadores. Ao navegar neste sítio está a consentir a sua utilização.saber mais
Para que esta página funcione corretamente deve ativar a execução de Javascript. Se tal não for possível, algumas funcionalidades poderão estar limitadas.