PuertoTex: a data mining software based on ontologies for automatic summarization on port and coastal engineering domain

Authors

  • Amed LEIVA-MEDEROS
  • Sandor DOMÍNGUEZ-VELASCO
  • Jose Antonio SENSO

Keywords:

Automata, Disambiguation of scientific texts, Data mining, Ontologies, Automatic summarization

Abstract

The aim of this word to develop and evaluate the results of the implementation of an ontology-based software capable of generating automatic summaries in the field of Ports and Coastal Engineering. For the development of the tool has been used several techniques emanating from the analysis of discourse and cognitive techniques for generating rules for the treatment of the texts. It also calls for the construction of an ontology that facilitates the processes of labeling from the potential of Resource Description Framework and Extensible Makup Language. It has built a set of agents acting on the ontology, which declared its main elements. Are presented as a product generated, Puertotex, software for the construction of ontology-based automatic summaries. The evaluation of the summaries generated reflects the quality of the system, which is limited only by your ability to work with the domain under investigation. 

Downloads

Download data is not yet available.

References

AGUIRRE, E. Formalization of concept-relatedness using ontologies: applications in the construction of lexical knowledge bases, word sense disambiguation and automatic spelling correction. 1998. Tesis (Doctoral) - Universidad de País Vasco, San Sebastián, 1998.

D’CUNHA, I. Hacia un modelo lingüístico de resumen automático de artículos médicos en español. 2006. Tesis (Doctoral) - Universidad Pompeu Fabra, Barcelona, 2006.

DIJK, T.; KINTSCH, W. Strategies of discourse comprehension. Orlando: Academic, 1983.

DOMÍNGUEZ, S. Calculus copora. Santa Clara: Universidad Central Marta Abreu de las Villas, 2011.

ENDRES-NIGGEMEYER, B. Simsum: an empirically founded simulation of summarizing. Information Processing and Management, v.36, n.4, p.659-682, 2005.

ENDRES-NIGGEMEYER, B.; MAIRE, E.; SIGEL, A. How to implement a naturalistic model of abstracting: four core working steps of an expert abstractor. Information Processing & Management, v.31, n.5, p.631-674, 1995.

FABER, P.; MÁRQUEZ, C.; VEGA, M. Framing terminology: a process-oriented approach. Meta, v.50, n.4, p.189-213, 2005.

HERNÁNDEZ, A. Indización y resumen. La Habana: Universidad de la Habana, 2006.

HERNÁNDEZ, A. Organización y representación del conocimiento: paradigmas, hipertextos y fundamentación metamodélica. 2007. Tesis (Doctoral Bibliotecología y Ciencia de la Información) - Universidad de la Habana, La Habana, 2007a.

HERNÁNDEZ, A Paradigmas dominantes de la representación de la información y el conocimiento. La Habana: Universidad de la Habana, 2007b.

HERRERA, R. Formatos de comunicación. 2007. Disponible en: <http://fcom.uh.edu.cu>. Acceso en: 16 jul. 2011.

LEIVA, A. et al. An automat for the semantic processing of structured information. In: INTERNATIONAL CONFERENCE OF DESING OF SOFTWARE AND APLICACTIÓN, 9., 2009, Pisa, Italy. Proceedings… Pisa: IEEE, 2009. p.85-89.

LIN, C.; HOVY, E. Automatic evaluation of summaries using n-gram co-ocurrence statistic. In: HUMAN TECHNOLOGYCONFERENCE, 2003, Edmonton, Canada. Proceedings… Edmonton, Canada: HLT-NAACL, 2003. p.71-78.

LUNH, H. The automatic creation of literature abstracts. Journal of Research of Development, v.2, n.2, p.59-165, 1958.

MANCHÓN, E. Evaluación por criterios o heurística. 2002. Disponible en: <http://www.ainda.info/evaluacion_heuristica. html>. Acceso en: 1 enero 2011.

MANN, W.; THOMPSON, S. Rhetorical structure theory: a theory of text organization. Los Angeles: Information Sciences Institute, 1990.

MATHIS, B.; RUSH, J.; YOUNG, C. Improvement of automatic abstracts by the use of structural analysis. Jounal of the American Sciety for Information Science, v.24, n.2, p.101-109, 1973.

METZELTIN, M. De la retórica al análisis del discurso. Revista Electrónica de Estudios Filológicos, n.6, 2003. Disponible en: <http://www.tonosdigital.es/ojs/index.php/tonos/article/view/506>. Acceso en: 1 marzo 2012.

NIELSEN, J. Heuristic evaluation. In: NIELSEN, J.; MACK, R. (Ed.). Usability inspection methods. New York: John Wiley 1994. p.25-52.

NIELSEN, J. How to conduct a heuristic evaluation. 2002a. Available from: <http://www.useit.com/papers/heuristic/heuristic_evaluation.html>. Cited: 26 Jan. 2011.

NIELSEN, J. Ten usability heuristics. 2002b. Available from: <http://www.useit.com/papers/heuristic/heuristic_list.html>. Cited: 21 Jan. 2011.

ONO, K.; SUMITA, K.; MIIKE, S. Abstract generation based on rhetorical structure extraction. In: INTERNATIONAL CONFERENCE ON COMPUTATIONAL LINGUISTICS, 15., 1994, Kyoto, Japan. Proceedings… Kyoto, Japan: DBLP, 1994.

PANECA, F. La prensa remediana del siglo XIX: reflejo de la cultura popular tradicional de la localidad. 2009. Tesis (Doctoral) - Facultad de Humanidades, Universidad Central Marta Abreu de las Villas, Santa Clara, 2009.

PILLEUX, M. Competencia comunicativa y análisis del discurso. Estudios Filológicos, n.36, p.143-152, 2001. Disponible en: <http://www.scielo.cl>. Acceso en: 1 marzo 2012.

PINTO, M. El resumen documental: principios y métodos. Madrid: Fundación Germán Sánchez Ruipérez, 2001.

PINTO, M. Interdisciplinary approaches to the concept and practice of written text documentary content analysis. Journal of Documentation, v.50, n.2, p.405-418, 2004.

RIGAU, G. Resolución automática de la ambigüedad semántica de palabras. Soria, España: Fundación Duques de Soria, 2002.

SALTON, G. On the application of syntactic methodologies in automatic text analysis. Information Processing and Management, v.26, p.73-92, 1996.

SÁNCHEZ-CUADRADO, S. et al. Definición de una metodología para la construcción de sistemas de organización del conocimiento a partir de un corpus documental en lenguaje natural. Procesamiento del Lenguaje Natural, n.39, p.213-220, 2007.

SENSO, J. Representación del conocimiento en la ingeniería de puertos y costas: proyecto investigador. Granada, España: Universidad de Granada, 2009.

SIDOROV, G.; ZAZUETA, O.O. Resolución de anáfora pronominal para el español usando el método de conocimiento limitado. In: ENCUENTRO NACIONAL DE CIENCIAS DE LA COMPUTACIÓN, 7., 2006, San Luís Potosi, Mexico. Anales… San Luís Potosi, Mexico: SMCC, 2006. p.276-281.

Published

2012-05-25

How to Cite

LEIVA-MEDEROS, A. ., DOMÍNGUEZ-VELASCO, S. ., & SENSO, J. A. . (2012). PuertoTex: a data mining software based on ontologies for automatic summarization on port and coastal engineering domain. Transinformação, 24(2). Retrieved from https://puccampinas.emnuvens.com.br/transinfo/article/view/6157

Issue

Section

ARTIGOS