Actualidad, AI, Inteligencia Artificial

RigoBERTa, el sistema basado en la IA que ayuda a clasificar documentos legales

El Instituto de Ingeniería del Conocimiento (IIC) trabaja en un proyecto de investigación para crear modelos de lenguaje español basados en la IA.

Muchos se han preguntado por los avances de la Inteligencia Artificial (IA) en el sector legal. Y lo cierto es que por fin se puede decir que este ámbito cuenta con un sistema basado en la IA y que sirve para clasificar documentos legales, principalmente.

Proyecto de investigación

La iniciativa ha partido del Instituto de Ingeniería del Conocimiento (IIC). El organismo trabaja en un proyecto de investigación para explotar y crear modelos de lenguaje en español. Se trata de RigoBERTa. De hecho, uno de los primeros logros que ya ha conseguido tiene que ver con el desarrollo del primer modelo de lenguaje en español adaptado al sector legal.

En concreto, este modelo se está utilizando para clasificar documentos y detectar entidades nombradas en el texto (personas y organizaciones). Una vez reajustado el modelo del español general, los primeros resultados muestran cómo se gana en acierto cuando se usa la versión especializada en el sector legal.

Tras el lanzamiento del modelo del IIC, se liberó de manera abierta el modelo RoBERTalex, desarrollado bajo el paraguas del Plan de Impulso de las Tecnologías del Lenguaje y también enfocado al dominio legal. Probados ambos, el primero sigue alcanzando cotas de rendimiento más elevadas.

Metodología chilena

Se ha desarrollado una metodología para reajustar los modelos de lenguaje existentes y adaptarlos a los diferentes dominios con nuevos textos del sector en cuestión. Por ejemplo, para la creación de ese primer modelo de lenguaje en español para el sector legal, han partido de BETO, el modelo general del español desarrollado por la Universidad de Chile.

Por otro lado, dentro del proyecto de investigación RigoBERTa, se va a seguir trabajando en el desarrollo de modelos de lenguaje del español general, así como en modelos adaptados a diferentes dominios.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

El dato como motor real de la IA y la automatización

Aldana Balmaceda
12/03/2026

¿Puede la inteligencia artificial transformar el sector asegurador si los datos no están bien estructurados, gobernados y gestionados? El Informe Tendencias Digitales 2026 en el

La IA facilita hackear robots, pero una nueva IA de ciberseguridad cambia las reglas

Aldana Balmaceda
11/03/2026

Durante años, la industria de la robótica asumió algo sencillo: hackear robots era extremadamente difícil. Acceder a un dispositivo robótico requería conocimientos muy especializados,

Ciberamenazas en la era de la IA: Los agentes autónomos amplificarán los riesgos internos

Aldana Balmaceda
11/03/2026

Pese a que el panorama de amenazas está más fragmentado, las amenazas internas siguen siendo una de las principales preocupaciones de los responsables de

La dependencia de la IA no gestionada multiplica los riesgos regulatorios en las empresas

Aldana Balmaceda
10/03/2026

La adopción acelerada de modelos de lenguaje grandes (LLM) en entornos corporativos está generando un riesgo silencioso para las organizaciones. Según una investigación de TrendAI,

Medir y optimizar la visibilidad de tiendas y marcas en asistentes IA

Aldana Balmaceda
10/03/2026

Cada día, millones de usuarios utilizan los asistentes de Inteligencia Artificial para solicitar datos sobre dónde comprar, comer, dónde alojarse o qué hacer en

Proyecto ARES: el nuevo Banco de Datos del Ministerio de Hacienda culmina su implementación con éxito

Aldana Balmaceda
09/03/2026

Getronics, multinacional de servicios tecnológicos con más de 135 años de trayectoria internacional, ha culminado con éxito el desarrollo e implantación del nuevo Banco

EVENTOS

La IA inunda la construcción: desde la inversión hasta la planificación pasando por la digitalización de licencias

AI, Eventos

La IA amplifica los sesgos de género para las jóvenes: más frágiles, dependientes y con vocación a la salud

IA en femenino, Inteligencia Artificial

Convertir datos en impacto real

Eventos

Samsung impulsa la IA doméstica con ecosistemas abiertos en CES 2026

Actualidad, Eventos

Samsung presenta su Filosofía AI en el CES 2026

AI, Eventos

El CAIO Day reúne en Madrid a 330 líderes de IA y confirma el auge del nuevo rol estratégico en las empresas

Eventos, Inteligencia Artificial

RECIBE NUESTRA NEWSLETTER

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things