El mundo está sobrecargado de información. Los científicos de la Universidad Ben-Gurion ayudarán a la gente a superar esta situación con un método automatizado e independiente del idioma para resumir los textos.
Según el Prof. Mark Last, quien ayudó a inventar la nueva tecnología, “La gente está tratando de tragar tanta información y esto ahorra tiempo a los lectores. No tienen que pasar mucho tiempo leyendo un artículo largo, pueden ir al grano”.
Trabajó por última vez con la Dra. Marina Litvak y el Dr. Menachem Friedman.
Específicamente, BGN Technologies, la empresa de transferencia de tecnología de BGU, introdujo una herramienta novedosa, automatizada e independiente del idioma para resumir textos que es aplicable para la extracción de artículos, revistas y bases de datos dentro de los propios medios y por parte de los usuarios de dichos medios. Los usuarios pueden ser organizaciones profesionales, como bibliotecas o motores de búsqueda académicos, o individuos.
Los resúmenes de texto se basan en un algoritmo genético que, según un comunicado, clasifica las frases de los documentos mediante características estadísticas de las frases.
En la fase I, dijo Last al Jerusalén Post, “calculamos un conjunto de métricas estadísticas para cada frase del documento”. Luego, el algoritmo asigna un peso a cada métrica. Basándose en ese peso, el algoritmo calcula la importancia de cada frase del documento. Las frases se reordenan y el usuario recibe un resumen a partir del cual puede decidir su interés en la pieza.
Todo el proceso está automatizado.
“Algunos sitios web de noticias, como el New York Times, presentan un breve resumen o aspectos destacados de cada uno de sus artículos de noticias”, dijo Last. “A mi leal saber y entender, hoy en día, esos resúmenes se hacen manualmente. Nuestro método puede hacerlo automáticamente”.
Aún más singular es que el sistema funciona en al menos nueve idiomas: inglés, hebreo, árabe, persa, ruso, chino, alemán, francés y español. Su calidad de resumen ya ha sido evaluada en cuatro de esos idiomas: El inglés, el hebreo, el árabe y el persa muestran un alto nivel de similitud con los resúmenes generados por los seres humanos.
El primer informe sobre el método fue publicado por el equipo en 2010. Desde entonces, ha seguido perfeccionando el sistema. Hoy, dijo Last, “la gente está muy contenta con los resultados”.
Zafrir Levy, vicepresidente de desarrollo de negocios de BGN Technologies, dijo que después de presentar una patente para proteger la invención, BGN Technologies ahora está buscando un socio industrial para el desarrollo posterior de la tecnología.
“Actualmente estamos buscando socios potenciales para el desarrollo y la comercialización de esta prometedora invención”, dijo Levy.