Corretor gramatical para o emacs

Disponível somente no TrabalhosFeitos
  • Páginas : 5 (1045 palavras )
  • Download(s) : 0
  • Publicado : 12 de maio de 2012
Ler documento completo
Amostra do texto
Corretor Gramatical Para o Emacs
Aluno: Thiago Maciel Batista (5749922) Supervisor: Marcelo Finger 4 de junho de 2010

1

Sumário
1 Resumo da Monograa
1.1 PLN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 CoGrOO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Emacs usando o CoGrOO . . . . . . . . . . . . . . . . . . . .

3

3 3 4

2 Objetivosdo Trabalho 3 Atividades já Realizadas 4 Cronograma de atividades 5 Estrutura esperada da monograa

4 5 5 6

2

1 Resumo da Monograa
1.1 PLN

As linguagens normalmente compreendidas e manipuladas por computadores são formais e precisas, diferentemente de linguagens humanas, que possuem características que dicultam ao computador compreendê-las, como por exemplo presença de ambiguidade,dependência do contexto, características culturais etc. Processamento de linguagem natural (PLN) é uma área da computação que pesquisa e desenvolve algoritmos para processar uma linguagem natural, de modo a torná-la compreenssível para um computador. Dessa forma, um computador será capaz de interpretar e gerar textos em linguagens naturais, tornando a comunicação homem-máquina o mais naturalpossível. PLN é uma área em plena evolução e que ainda tem muito a evoluir, mas já existem muitas aplicações que utilizam os conceitos de PLN. Alguns exemplos da utilidade de PLN são, extração de informação, recuperação de informação, tradução automática, geração e interpretação de linguagem natural, resumos de textos e correção de textos.
1.2 CoGrOO

Um exemplo de um programa que utiliza PLN é oCoGrOO. Um corretor gramatical para a língua portuguesa do Brasil totalmente acoplável ao OpenOce.org desenvolvido por alunos da Universidade de São Paulo. O CoGrOO utiliza análise sintática, morfológica e regras gramaticas para detectar erros em textos. O processo feito pelo CoGrOO para a análise gramatical de um texto é dividido em fases, que são executadas uma após a outra. Atualmente, o CoGrOO écomposto por módulos, sendo que, cada módulo realiza uma fase do processo. Abaixo temos os módulos do CoGrOO.
• SentenceDetect - Divide o texto em sentenças • Tokenizer - Identica os tokens. • ProperNameFinder - Identica nomes próprios no texto. • ContractionSparator - Gera uma lista de tokens e suas contrações.

3

• Pretagger - Gera uma lista de CogrooTokens com nomes proprios econtrações

• Postagger - Devolve uma lista de etiquetas morfológicas associadas aos

Cogrootokens.

• Rulesapplier - Aplica as regras gramaticais à lista de CoGrOOTokens

e gera uma lista de erros

O CoGrOO está em evolução e atualmente está sendo desenvolvido o CoGrOO UIMA, uma nova versão do corretor que utiliza a arquitetura padronizada do Apache UIMA, um aplicativo para manipulação dedados não estruturados.
1.3 Emacs usando o CoGrOO

Apesar de ser feito, a princípio, para o OpenOce o CoGrOO pode ser acoplado a outros aplicativos. Aproveitando essa mobilidade do CoGrOO, vamos acoplá-lo ao editor de texto Emacs que, apesar de ser um editor de texto popular, ainda não possui um corretor para a língua portuguesa acoplado a ele.

2 Objetivos do Trabalho
Este trabalho tem comoobjetivo estudar formas de acoplar o corretor gramatical CoGrOO ao editor de textos Emacs. Usaremos duas versões do CoGrOO , a última versão do sem utilizar o UIMA e o CoGrOO UIMA, com a nalidade de testar qual versão se adapta melhor ao projeto. Ao nal do acoplamento, teremos o Emacs usando o CoGrOO para analisar e encontrar erros em textos digitados pelos usuários. O CoGrOO processará umtrecho de um texto enviado pelo Emacs a procura de erros e devolverá ao Emacs os erros encontrados e sugestões para correção. O emacs poderá usar os erros apontados pelo CoGrOO para mostrar ao usuário onde ocorreram erros no texto, de forma que o usuário possa identicá-los e arrumá-los. Para isso, o Emacs destacará trechos do texto onde foram detectados erros. Após nalizarmos a parte de acoplar o...
tracking img