Recuperação de Informação › 42596

código no paco
42596
área científica
Informática / Sistemas de Informação
créditos
6
escolaridade
ensino teórico-prático (TP) - 3 horas/semana
idioma(s) de lecionação
Português, Inglês
objectivos

O objectivo desta disciplina é estudar as técnicas e algoritmos utilizados na recuperação e extracção de informação baseada em texto (IR e IE). Após o estudo deste curso o aluno deverá ser capaz de: 1) compreender conceitos fundamentais de recuperação e extracção de informação 2) implementar algoritmos e usar estratégias baseadas em dicionários e em aprendizagem automática e 3) avaliar o desempenho de solução de IR e IE.

competências

Após este curso o aluno deverá ser capaz de compreender o funcionamento e de desenvolver soluções de:

1) de armazenamento e indexação de textos;

2) de recuperação de informação; e

3) de extracção de informação.

conteúdos
  1. Conceitos gerais
    1. Termos,  stop-words, normalização
    2. Stemming, lemmatization, part-of-speech
    3. Indexação
  2. Dicionários
    1. Estruturas de dados
    2. Tolerância de termos
  3. Construção e compressão de índices
  4. Modelo de espaço vectorial
    1. Pesagem de termos e documentos
    2. Medidas de desempenho
    3. Expansão de termos
  5. Modelos probabilísticos
  6. Modelos baseados em linguagens
  7. Classificação de documentos      
  8. Web crawling e pesquisa
  9. Extracção de informação 
avaliação

Relatório de síntese (40%) e trabalhos práticos (60%)

requisitos

Conhecimentos sólidos de estruturas de dados, algoritmos e programação (Java preferencialmente) 

metodologia

A componente prática será organizada segundo um conjunto de pequenos trabalhos, a realizar maioritariamente durante as aulas, nos quais se pretende fazer experiências que consolidem os conceitos teóricos apresentados.

bibliografia recomendada

“Introduction to Information Retrieval”, C.D. Manning, P. Raghaven, H. Schütze, 2008, Cambridge University Press. http://nlp.stanford.edu/IR-book/information-retrieval-book.html
“Modern Information Retrieval: The Concepts and Technology behind Search (2nd Edition)”, R. Baeza-Yates, B. Ribeiro-Neto B., 2011, Addison Wesley Professional.
“Mining the Web: Discovering Knowledge from Hypertext Data”, S. Chakrabarti, 2002, M Kaufmann. http://www.cse.iitb.ac.in/~soumen/mining-the-web/
“Search Engines: Information Retrieval in Practice", W. B. Croft, D. Metzler, and T. Strohman, Addison Wesley, 2009. http://www.search-engines-book.com/

Este sítio web utiliza cookies sem recolher informação pessoal que permita a identificação dos utilizadores. Ao navegar neste sítio está a consentir a sua utilização.saber mais
Para que esta página funcione corretamente deve ativar a execução de Javascript. Se tal não for possível, algumas funcionalidades poderão estar limitadas.