Desde hace cientos de años se imprimen miles de textos y libros judíos, pero muchos judíos -incluso los que hablan hebreo- tienen dificultades para leerlos. Una innovadora tecnología de IA que se lanzará esta semana espera permitir que cualquier persona que hable hebreo pueda leer y aprender estos valiosos e importantes textos.
Esta nueva tecnología se llama Dicta Maivin (experto en dictado). Se trata de una nueva aplicación de la organización Dicta que hace accesible la literatura rabínica vocalizándola y puntuándola automáticamente, abriendo abreviaturas e identificando los textos fuente.
Esta nueva tecnología innovadora estará pronto a disposición de cualquier persona interesada en los textos judíos. “Puedes elegir un libro de la biblioteca de Dicta y verlo procesado o subir cualquier texto rabínico y Maivin lo procesará automáticamente en tiempo real”, dijo su fundador, el profesor Moshe Koppel, un fascinante informático israelí-estadounidense y estudioso del Talmud, además de activista que promueve las opiniones conservadoras en Israel.
Dicta aplica herramientas punteras de aprendizaje automático y procesamiento del lenguaje natural al análisis de textos hebreos. “Nuestro objetivo es eliminar la pesadez del estudio de los textos hebreos clásicos y modernos para que los investigadores puedan centrarse en las cuestiones más profundas”, afirma su página web.
Dicta puede parecer una empresa tecnológica emergente, pero en realidad es una organización sin ánimo de lucro que ofrece sus productos de forma gratuita en beneficio del público.
Cómo se utiliza
“La idea es utilizar la IA (inteligencia artificial) con tecnología punta para procesar textos judíos o hebreos”, dijo Koppel a The Jerusalem Post durante una entrevista en su casa de Efrat.
Compartió, por primera vez con un medio de comunicación, que el producto estrella en el que ha estado trabajando durante los últimos cinco años está “a punto de estar listo”, y que será “presentado en el 18º Congreso Mundial de Estudios Judíos, que tendrá lugar en la Universidad Hebrea de Jerusalén la próxima semana”.
Koppel puso el ejemplo de un libro que puede ser escaneado por Dicta Maivin y permitir el acceso del texto a un público más amplio gracias a sus múltiples características.
“Digamos que un libro está escrito en esta antigua escritura Rashi” -un tipo de letra hebrea basado en la caligrafía sefardí del siglo XV, muy popular entre los libros judíos publicados en los últimos cientos de años– “no tiene nekudot (signos diacríticos utilizados para representar las vocales o distinguir entre pronunciaciones alternativas de las letras en hebreo), no tiene puntuación y probablemente tenga incluso errores, porque los impresores de entonces eran un poco chapuceros”, explicó.
En cuanto a las referencias, “tiene un millón de ellas, pero no te dice dónde están”. Koppel dijo que muchas veces, en los textos judíos, uno de los rabinos escribirá “como dijo el Rambán”, pero no dirá exactamente dónde lo dijo o escribió. “Los rabinos pueden estar citando el Talmud en sus libros sin decir siquiera dónde está; no hay atribución”.
Koppel cogió su teléfono móvil y mostró exactamente cómo funciona la tecnología. “Lo que hemos hecho es que puedes coger tu teléfono y hacer una foto de la página, y te devolverán la página con el texto ya digitalizado”, dijo entusiasmado. “Ya no es una foto; ha pasado por el reconocimiento óptico de caracteres [OCR]; el texto ha sido corregido de errores y se ha hecho más accesible de muchas maneras. Se puede puntuar este texto; se pueden poner las nekudot. Se puede explicar cualquiera de las Rashei Tevot [abreviaturas hebreas]. Sólo tienes que poner el cursor encima y te mostrará lo que significa”.
Tanto los textos judíos antiguos como los modernos tienen muchas abreviaturas en hebreo, lo que puede dificultar mucho su aprendizaje para alguien que no tenga una formación o comprensión lo suficientemente amplia. Koppel ha dicho que muchas personas deciden dejar de aprender esos textos porque, aunque hablan hebreo, no saben qué significan todas esas abreviaturas.
El desarrollador de la aplicación mostró entonces cómo la tecnología conectaba este texto recién escaneado con otros. Una frase que dijera “Como dijeron los sabios”, sin ninguna atribución, te mostrará cuál de los sabios dijo o escribió este dicho o cita con sólo pulsar el texto en línea. “Maivin crea notas a pie de página para todos los textos que escanea”, comenta Koppel, explicando que “la aplicación básicamente recrea una edición científica de este antiguo libro judío”.
Un añadido encantador de la aplicación Maivin de Dicta es que la escritura Rashi se transforma en un nuevo tipo de letra hebrea que se asemeja a la antigua escritura, pero que cualquiera que sepa leer hebreo podrá leer. “Mi nuera es una inventora de fuentes”, dijo Koppel, sonriendo. “Le encargamos un tipo de letra: para la gente a la que le gusta la letra Rashi, pero tiene dificultades para entenderla. Es una fuente Rashi adaptada que cualquiera puede leer”.
“Ahora mismo tenemos millones de libros en la biblioteca”, dijo. “No estoy esperando a que saquen una foto de estos libros: lo estamos haciendo por nuestra cuenta. En menos de una hora podemos escanear un libro entero y hacer todo el procesamiento”.
Cómo funciona
Al preguntarle qué parte de Maivin es automática y qué parte necesita la intervención humana, Koppel respondió que es casi completamente automática. “Hay una parte muy pequeña del trabajo que de momento necesita intervención”, reveló. Básicamente, si la tecnología escanea una palabra que no existe en hebreo o que se usa poco en todos los demás textos judíos que ya ha escaneado, hará una segunda ronda.
Entonces utilizan una nueva tecnología de IA llamada BERT, dijo Koppel al Post. “El funcionamiento de BERT consiste en darle un contexto, bloquear una palabra y luego decirle: Adivina cuál debería ser esta palabra. Entonces te da el orden de las probabilidades de las palabras que deberían ir ahí”.
“Cuando no estamos seguros de una palabra, utilizamos BERT, y también lo entrenamos, ya que es una tecnología de aprendizaje automático, así que le das material y aprende durante este entrenamiento”, dijo. “Le dimos a BERT toda la literatura rabínica que ya habíamos escaneado, y dijimos ‘vale, adivina cuál debería ser esta palabra en un texto rabínico’”.
La intervención humana se produce, según Koppel, sólo en el 1% de las situaciones, cuando BERT da una lista de palabras probables. “Le damos el texto básicamente a cualquier persona que sepa leer un libro, preferiblemente alguien con formación en la yeshiva. No tienen que ser expertos en el mundo”.
“Todo lo que hacemos es 100% gratuito”, compartió Koppel, revelando que Dicta está totalmente financiado por donantes.
¿Quién es Moshe Koppel?
Kopple creció en Nueva York, y después de la escuela secundaria estudió en Yeshivat Har Etzion en Alon Shvut. Volvió para completar su doctorado en matemáticas en la Universidad de Nueva York. Antes de volver a Israel, hizo su posdoctorado en Princeton.
Durante decenas de años, Koppel fue miembro del Departamento de Informática de la Universidad de Bar-Ilan. Pero la mayoría de los israelíes probablemente le conozcan por su trabajo como fundador del Kohelet Policy Forum, un grupo de reflexión conservador-libertario con sede en Jerusalén, financiado por un donante estadounidense cuyo nombre se mantiene en secreto.
Los medios de comunicación israelíes, tanto liberales como conservadores, lo han mencionado muchas veces como una de las personas más poderosas e influyentes del país.
Según el sitio web de Kohelet, el foro “se esfuerza por asegurar el futuro de Israel como Estado-nación del pueblo judío, por fortalecer la democracia representativa y por ampliar la libertad individual y los principios del libre mercado en Israel”.
Maivin está listo para su lanzamiento, dijo Koppel. “Está en nuestro laboratorio y estamos perfeccionando algunas de las herramientas que son mejores que otras. La mayoría de las funciones están funcionando de la mejor manera posible. El aspecto de la puntuación de la aplicación en este momento es un hack; no es el producto final que querríamos. La función de abreviatura, diría, tiene una precisión del 90%, lo que no es suficiente. Pero sabemos cómo mejorarla y sólo lleva tiempo”.
La mayoría de las funciones ya están en línea, así como una nueva aplicación, y Koppel destacó que en los próximos días se subirán al sitio algunas de las nuevas funciones. Así que para las personas que han estado buscando una mejor experiencia de lectura de textos judíos, Dicta Maivin está aquí.