Un estudio de los métodos de reducción del frente de Pareto a una única solución aplicado al problema de resumen extractivo multi-documento
- Jesus M. Sanchez-Gomez
- Miguel A. Vega-Rodríguez
- Carlos J. P´erez
ISSN: 1135-5948
Año de publicación: 2020
Número: 65
Páginas: 21-28
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
Los métodos de resumen automático son actualmente necesarios en muchos contextos diferentes. El problema de resumen extractivo multi-documento intenta cubrir el contenido principal de una colección de documentos y reducir la información redundante. La mejor manera de abordar esta tarea es mediante un enfoque de optimización multi-objetivo. El resultado de este enfoque es un conjunto de soluciones no dominadas o conjunto de Pareto. Sin embargo, dado que solo se necesita un resumen, se debe reducir el frente de Pareto a una única solución. Para ello, se han considerado varios métodos, como el mayor hipervolumen, la solución consenso, la distancia más corta al punto ideal y la distancia más corta a todos los puntos. Los métodos han sido probados utilizando conjuntos de datos de DUC, y han sido evaluados con las métricas ROUGE. Los resultados revelan que la solución consenso obtiene los mejores valores promedio.
Referencias bibliográficas
- Aguirre, O. y H. Taboada. 2011. A Clustering Method Based on Dynamic Self Organizing Trees for Post-Pareto Optimality Analysis. Procedia Computer Science, 6:195–200.
- Alguliev, R. M., R. M. Aliguliyev, y C. A. Mehdiyev. 2011. Sentence selection for generic document summarization using an adaptive differential evolution algorithm. Swarm Evol. Comput., 1(4):213–222.
- Antipova, E., C. Pozo, G. Guill´en-Gosálbez, D. Boer, L. F. Cabeza, y L. Jiménez. 2015. On the use of filters to facilitate the postoptimal analysis of the Pareto solutions in multi-objective optimization. Comput. Chem. Eng., 74:48–58.
- Beume, N., C. M. Fonseca, M. López-Ibáñez, L. Paquete, y J. Vahrenhold. 2009. On the Complexity of Computing the Hypervolume Indicator. IEEE Trans. Evol. Comput., 13(5):1075–1082.
- Ferreira, J. C., C. M. Fonseca, y A. GasparCunha. 2007. Methodology to Select Solutions from the Pareto-Optimal Set: A Comparative Study. En Proceedings of the 9th Annual Conference on Genetic and Evolutionary Computation, p´aginas 789–796. ACM.
- Hashimi, H., A. Hafez, y H. Mathkour. 2015. Selection criteria for text mining approaches. Comput. Hum. Behav., 51:729–733.
- Lin, C.-Y. 2004. ROUGE: A package for automatic evaluation of summaries. En Proceedings of the ACL-04 Workshop, volumen 8, p´aginas 74–81. ACL.
- NIST. 2014. Document Understanding Conferences. http://duc.nist.gov. Ultimo acceso: 11 de agosto de 2020.
- Padhye, N. y K. Deb. 2011. Multi-objective optimisation and multi-criteria decision making in SLS using evolutionary approaches. Rapid Prototyping Journal, 17(6):458–478.
- Pérez, C. J., M. A. Vega-Rodríguez, K. Reder, y M. Fl¨orke. 2017. A Multi-Objective Artificial Bee Colony-based optimization approach to design water quality monitoring networks in river basins. Journal of Cleaner Production, 166:579–589.
- Ristad, E. S. y P. N. Yianilos. 1998. Learning string-edit distance. IEEE Trans. Pattern Anal. Mach. Intell., 20(5):522–532.
- Saleh, H. H., N. J. Kadhim, y B. A. Attea. 2015. A genetic based optimization model for extractive multi-document text summarization. Iraqi Journal of Science, 56(2):1489–1498.
- Sanchez-Gomez, J. M., M. A. VegaRodr´ıguez, y C. J. P´erez. 2018. Extractive multi-document text summarization using a multi-objective artificial bee colony optimization approach. Knowledge-Based Syst., 159:1–8.
- Siwale, I. 2013. Practical Multi-Objective Programming. Informe t´ecnico, Technical Report RD-14-2013. APEX Research.
- Soylu, B. y S. K. Ulusoy. 2011. A preference ordered classification for a multi-objective max–min redundancy allocation problem. Comput. Oper. Res., 38(12):1855–1866.
- Sudeng, S. y N. Wattanapongsakorn. 2015. Post Pareto-optimal pruning algorithm for multiple objective optimization using specific extended angle dominance. Eng. Appl. Artif. Intell., 38:221–236.
- Taboada, H. A. y D. W. Coit. 2007. Data Clustering of Solutions for Multiple Objective System Reliability Optimization Problems. Qual. Technol. Quant. Manag., 4(2):191–210.
- Veerappa, V. y E. Letier. 2011. Understanding Clusters of Optimal Solutions in Multi-Objective Decision Problems. En 19th Requirements Engineering Conference, páginas 89–98. IEEE.
- Wan, X. 2008. An exploration of document impact on graph-based multi-document summarization. En Proceedings of the Conference on Empirical Methods in NLP, páginas 755–762. ACL.
- Wu, L., X. Xu, X. Ye, y X. Zhu. 2015. Repeat and near-repeat burglaries and offender involvement in a large Chinese city. Cartogr. Geogr. Inf. Sci., 42(2):178–189.
- Zajic, D. M., B. J. Dorr, y J. Lin. 2008. Single-document and multidocument summarization techniques for email threads using sentence compression. Inf. Process. Manage., 4(4):1600–1610.
- Zhao, L., Z. Lu, W. Yun, y W. Wang. 2017. Validation metric based on Mahalanobis distance for models with multiple correlated responses. Reliab. Eng. Syst. Saf., 159:80–89.