El Instituto de Ingeniería del Conocimiento lanza el primer modelo de lenguaje en español para el sector legal

Redacción Derecho Práctico

10 agosto, 202110 agosto, 2021
0 Comments

(Extracto de esta notica publicada en Huffingtonpost.es)

El Instituto de Ingeniería del Conocimiento (IIC) trabaja en un proyecto de investigación para explotar y crear modelos de lenguaje en español: RigoBERTa. Y uno de los primeros logros ha sido el desarrollo del primer modelo de lenguaje en español adaptado al sector legal, mejorando la clasificación de documentos y la detección de entidades.

Para la creación de ese primer modelo de lenguaje en español para el sector legal, han partido de BETO, el modelo general del español desarrollado por la Universidad de Chile. Este se ha reentrenado con un gran corpus legal-administrativo de más de 500 millones de palabras, que ha sido recopilado de fuentes abiertas y curado por su equipo de lingüistas computacionales, garantizando la calidad de los textos.

Contar con un modelo de lenguaje adaptado al ámbito legal tiene ventajas si se pone en práctica con dos de los principales problemas del sector: la clasificación de documentos y la detección de entidades nombradas en el texto (personas y organizaciones). Una vez reajustado el modelo del español general, los primeros resultados muestran cómo se gana en acierto cuando se usa la versión especializada en el sector legal.

¿Quieres saber más?

Está pasando - Últimas noticias Legaltech

Etiquetas: Clasificación de documentos, Inteligencia artificial, Procesamiento del lenguaje natural

Derecho práctico

El Instituto de Ingeniería del Conocimiento lanza el primer modelo de lenguaje en español para el sector legal

Redacción Derecho Práctico

Deja una respuesta Cancelar la respuesta

Redacción Derecho Práctico

Deja una respuesta Cancelar la respuesta

Esta web usa cookies