Tecnologías propuestas y objetivos
La tecnología propuesta en este proyecto consiste en un sistema modular capaz de analizar distintas características de una publicación realizada en algún medio digital, incluyendo la confiabilidad de dicha publicación, así como la toxicidad de su contenido textual. La salida del sistema será un informe relacionado con la desinformación derivada de una noticia y con el nivel de toxicidad. En concreto, el sistema propuesto dispondrá, en esta Prueba De Concepto (PDC), de dos módulos sinérgicos: detección de la confiablidad de la noticia (SocialTrust) y detección de la toxicidad de la misma (SocialTox). Estos dos aspectos son fundamentales para medir el grado de impacto que un bulo alcanza en internet.
Como origen de la PDC, se partirá de un sistema experimental generado en el proyecto de origen que utiliza un conjunto muy limitado de datos de entrenamiento, pero que obtuvo resultados satisfactorios y competitivos. Así, el objetivo principal de la PDC es disponer de una herramienta que aplica diferentes modelos del lenguaje para la detección del grado de confiabilidad y toxicidad de la información. Esta herramienta permitirá, en proyectos futuros, su aplicabilidad a la cadena de valor de diferentes sectores. Con esta prueba de concepto se pretende validar su incorporación de manera real en sectores productivos como el periodístico, político, sector público, entre otros. Para conseguir este objetivo general será necesario abordar los siguientes objetivos específicos.
Estos objetivos son compartidos de manera simbiótica por los dos equipos de investigación, estando el equipo UJA en los aspectos de toxicidad centrándose en la implementación y desarrollo del módulo SocialTox, mientras que el equipo UA se centrará en los aspectos de confiabilidad orientado a la implementación y desarrollo del módulo SocialTrust:
- Objetivo 1: Construir un dataset lo suficientemente amplio que permita generar los modelos de lenguaje más potentes y adaptados al dominio e idioma posible tanto para el desarrollo del módulo SocialTrust (UA) como para el módulo SocialTox (UJA).
- Objetivo 2: Entrenar la herramienta con el dataset. Como resultado de este entrenamiento se obtendrán nuevos modelos del lenguaje que se irán ajustando para obtener un marco optimizado tanto para el módulo SocialTrust (UA) como para el módulo SocialTox (UJA).
- Objetivo 3: Integrar en un único servicio en la nube los algoritmos y modelos que componen un sistema de medición de la honestidad (confiabilidad y toxicidad) de un mensaje publicado en medios digitales (UJA, UA).
- Objetivo 4: Definir el marco de evaluación del servicio propuesto mediante la identificación de los grupos de interés, los datos necesarios y las métricas de evaluación, que posibiliten la validación de la solución atendiendo a las necesidad de dichos grupos (UJA, UA).
- Objetivo 5: Realizar un análisis de las pruebas llevadas a cabo y obtener una evaluación final. Este es un objetivo primordial, pues representa la meta esperada en toda prueba de concepto (UJA, UA).
- Objetivo 6: Determinar los aspectos destacables para posteriores procesos de maduración tecnológica. Se pretende así la identificación de perfeccionamientos que faciliten la evolución del producto a niveles TLR superiores (UJA, UA).