From HLT@INESC-ID
Date
- 15:30, November 30, 2007
- INESC-ID's Room 336 (Alves Redol)
Speaker
Resumo (PT)
O objectivo deste trabalho é, no âmbito do projecto RICOBA, criar um programa que converta equações em MathML para /texto/. O texto traduzido deve corresponder o máximo possível com a leitura da equação usando linguagem natural. O programa desenvolvido recebe como argumento de entrada um ficheiro XML com a norma MathML e devolve dois ficheiros, um em HTML e o outro em TXT.
Adicionalmente, pode o ficheiro de configuração destina-se a adaptar o texto de saída a condições que não se podem extrair directamente do ficheiro MathML.
O programa foi desenvolvido em JAVA para garantir maior portabilidade do código. O trabalho dispõe de documentação numa WIKI, com informação relativa aos desenvolvimentos do projecto e discussões acerca dos formatos dos ficheiros e da arquitectura do programa. Existe também um JAVADoc com toda a documentação do código do programa, e um repositório SVN com todas as versões do programa existentes. Este apresentação encontra-se dividido em sete capítulos: introdução, arquitectura do programa desenvolvido, heurísticas, formatos dos ficheiros, portabilidade do código e por último, as conclusões. Serão apresentados vários exemplos que permitem atestar a eficácia do sistema de conversão de equações para texto.