Processamento de Fala e Linguagem Natural › 42579

código no paco
42579
área científica
Eletrotecnia / Análise e Processamento de Sinal
créditos
6
escolaridade
ensino teórico-prático (TP) - 3 horas/semana
idioma(s) de lecionação
a inserir brevemente
objectivos

Nesta unidade curricular pretende-se introduzir os alunos no vasto campo do processamento de fala e linguagem natural nos seus múltiplos aspectos, desde o reconhecimento e síntese de fala até aos sistemas de Diálogo, passando pela análise sintáctica e semântica. Pretende-se sobretudo que os alunos dominem os princípios e técnicas básicas e tomem contacto com várias ferramentas disponíveis nestas áreas. 

Com o interesse crescente em procurar conteúdos na web tendo em conta o significado (semântica), desenvolvimentos nas tecnologias de interacção humano-máquina multimodais, pressão para que mais e mais serviços estejam disponíveis via telemóvel (smartphones) mantendo as mãos e olhos livres, este tipo de tecnologias tem uma vasta gama de potenciais aplicações. Profissionais da área das Ciências da Computação, Computadores e Telemática e Informática necessitam de formação de base nestas áreas para estarem preparados para novos desafios como os que são objecto de investigação e desenvolvimento em grandes empresas como a Google, Microsoft, IBM, etc.

Esta área apresenta ainda a especificidade de a “adaptação” de sistemas/produtos ao Português não ser uma simples tarefa de localização, obrigando, na generalidade dos casos, ao desenvolvimento completo dos sistemas ou, pelo menos, de partes muito relevantes destes sistemas. Ciente destas necessidades, a Microsoft criou em 2005 em Portugal um Centro de Desenvolvimento dedicado às questões da Linguagem (Escrita e Falada), a Microsoft Language Development Center (MLDC), centro com que o DETI/IEETA tem vindo a colaborar em termos de investigação e projectos.  Para que o esforço de criação de tecnologias e sistemas para o Português possa continuar é relevante a formação de recursos humanos com pelo menos as competências básicas nestas áreas no âmbito do MIECT.

competências
  • Capacidade de implementar pequenos módulos e sistemas  usando tecnologias do processamento de Fala e Linguagem Natural; 
  • Capacidades de base para trabalhar na integração de componentes e tecnologias de Reconhecimento e Síntese de Fala e de Processamento de Linguagem Natural em aplicações reais;
  • Atitude crítica, suportada no conhecimento das principais tecnologias e respectivo estado da arte, acerca da possibilidade de utilizar processamento de fala e linguagem natural em determinada tarefa.
conteúdos

1.      Introdução

2.      Reconhecimento de fala

3.      Síntese de Voz

4.      Processamento e análise das palavras

5.      Análise da estrutura das frases  (análise sintáctica)

6.      Análise semântica

7.      Conceitos base em Geração de Linguagem natural

8.      Sistemas integrando estas tecnologias

avaliação

Avaliação contínua baseada no Trabalho realizado na parte prática das aulas e respectivos relatórios, trabalho prático da área de Processamento de Fala  e trabalho prático final.

requisitos

Conhecimentos sólidos de programação.

metodologia

A disciplina integrará 3 componentes: parte teórica, resolução de problemas e trabalhos práticos para avaliação.

A componente prática será organizada segundo um conjunto de pequenos trabalhos (guiões), a realizar maioritariamente durante as aulas, nos quais se pretende fazer experiências que consolidem os conceitos teóricos apresentados.

Os trabalhos práticos para avaliação envolvem a resolução de problemas “reais” usando ferramentas e linguagens apropriadas (essencialmente Python, NLTK e HTK).

Exemplos de trabalhos práticos para avaliação:

  • Desenvolvimento de um sistema de reconhecimento de fala de vocabulário reduzido com base no sistema HTK. Este tipo de sistemas pode ser aplicado, por exemplo, ao controlo de um elevador por voz;
  • Adaptação de um sistema de Geração de Linguagem Natural (ex: Rosetta desenvolvido no LTI de CMU) a uma aplicação em Português; 
  • Implementação, por adaptação, de um sistema capaz de adicionar a um texto informação sobre quais as palavras que são nomes, verbos, adjectivos, etc (denominado de Part-of-Speech tagging).

 

 

bibliografia recomendada

Bibliografia principal: 

Steven Bird, Ewan Klein e Edward Loper  (2009). Natural Language Processing with Python - Analyzing Text with the Natural Language Toolkit. O’Reilly. 

X. Huang, A. Acero, Hsiao-Wuen Hon (2001). Spoken Language Processing: A Guide to Theory, Algorithm and Syst. Dev. 

Outras referências:

Daniel Jurafsky e James H. Martin (2000). Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition, Prentice Hall.

Paul Taylor (2009). Text-to-Speech Synthesis.  Cambridge University Press. 

Carlos Abreu  (2008). Interface com reconhecimento de fala para apoio a pessoas com limitações funcionais. Dissertação de Mestrado em Enga Biomédica, Universidade de Aveiro.  Disponível em http://biblioteca.sinbad.ua.pt/teses/2008001389

Pedro Amorim (2009). Síntese de Nomes em Português. Dissertação de Mestrado Integrado em Engenharia Electrónica e Telecomunicações, Universidade de Aveiro.

Ruslan Mitkov, [editors] (2003). The Oxford handbook of computational linguistics, Oxford University Press.

Este sítio web utiliza cookies sem recolher informação pessoal que permita a identificação dos utilizadores. Ao navegar neste sítio está a consentir a sua utilização.saber mais
Para que esta página funcione corretamente deve ativar a execução de Javascript. Se tal não for possível, algumas funcionalidades poderão estar limitadas.