Un sistema neurosimbólico, por lo tanto, utiliza tanto la lógica como el procesamiento del lenguaje para responder a la pregunta, que es similar a cómo respondería un ser humano.
La construcción de máquinas pensantes ha sido una obsesión humana desde tiempos inmemoriales y, a lo largo de la historia, hemos visto a muchos investigadores trabajar en el concepto de generar máquinas inteligentes. Si bien las redes neuronales son la forma más popular de IA que ha sido capaz de lograrlo, la «IA simbólica» desempeñó en su día un papel crucial para lograrlo. Se utilizó en IBM Watson para vencer a los jugadores humanos en Jeopardy en 2011 hasta que fue tomada por las redes neuronales entrenadas por el aprendizaje profundo.
Aunque las redes neuronales nos han proporcionado muchos avances interesantes, los investigadores creen que para que la IA avance, debe comprender no solo el «qué» sino también el «por qué» e incluso procesar las relaciones causa-efecto.
Los modelos actuales de aprendizaje profundo tienen defectos en su falta de interpretabilidad del modelo y la necesidad de grandes cantidades de datos para el aprendizaje. Esto ha llevado a los investigadores a explorar nuevas vías en la IA, que es la unión de las redes neuronales y las técnicas de IA simbólica.
¿Qué es la IA neurosimbólica?
Se trata de una versión más sofisticada de la IA que hemos conocido hasta ahora, que utiliza arquitecturas de redes neuronales de aprendizaje profundo y las combina con técnicas de razonamiento simbólico. Por ejemplo, hemos estado utilizando redes neuronales para identificar qué tipo de forma o color tiene un determinado objeto. Si se aplica el razonamiento simbólico, se puede dar un paso más allá para indicar propiedades más interesantes sobre el objeto, como el área del objeto, el volumen, etc.
Superar las carencias de las redes neuronales y la IA simbólica
Si nos fijamos en los pensamientos y procesos de razonamiento humanos, los seres humanos utilizan símbolos como parte esencial de la comunicación, lo que los hace inteligentes. Para que las máquinas funcionen como los humanos, los investigadores intentaron simular símbolos en ellas. Esta IA simbólica se basaba en reglas e implicaba la incorporación explícita de conocimientos humanos y reglas de comportamiento en los programas informáticos, lo que hacía que el proceso fuera engorroso. También hacía que los sistemas fueran caros y menos precisos a medida que se incorporaban más reglas.
Para hacer frente a estos retos, los investigadores exploraron un enfoque más orientado a los datos, lo que llevó a la popularidad de las redes neuronales. Mientras que la IA simbólica necesitaba ser alimentada con cada bit de información, las redes neuronales podían aprender por sí mismas si se les proporcionaban grandes conjuntos de datos. Aunque esto funcionaba muy bien, como ya se ha mencionado, la falta de interpretabilidad del modelo y la gran cantidad de datos que necesita para seguir aprendiendo exigen un sistema mejor.
Para entenderlo mejor, aunque el aprendizaje profundo es adecuado para el reconocimiento de patrones a gran escala, tiene dificultades para capturar la estructura compositiva y causal de los datos. Mientras que los modelos simbólicos son buenos para capturar la estructura compositiva y causal, pero se esfuerzan por conseguir correlaciones complejas.
El déficit de estas dos técnicas ha llevado a la fusión de estas dos tecnologías en la IA neuro-simbólica, que es más eficiente que estas dos por separado. La idea es fusionar el aprendizaje y la lógica para que los sistemas sean más inteligentes. Los investigadores creen que los algoritmos de IA simbólica ayudarán a incorporar el razonamiento de sentido común y el conocimiento del dominio al aprendizaje profundo. Por ejemplo, al detectar una forma, un sistema neurosimbólico utilizaría las capacidades de reconocimiento de patrones de una red neuronal para identificar objetos y la lógica de la IA simbólica para comprenderlos mejor.
Un sistema neurosimbólico, por tanto, utiliza tanto la lógica como el procesamiento del lenguaje para responder a la pregunta, que es similar a cómo respondería un humano. No sólo es más eficaz, sino que requiere muy pocos datos de entrenamiento, a diferencia de las redes neuronales.