1. Introducción y estado de la cuestión
1.1. La inteligencia periodística y artificial
Fue Ada Lovelace en el siglo XIX quien predijo la posibilidad de que existiera una “máquina de pensar”, lo que más tarde sería el primer “programa informático de la historia”. Posteriormente, Grace Hooper enseñó a “pensar” a Mark I, el primer computador de IBM, que se utilizó durante la Segunda Guerra Mundial en 1944, dando los primeros pasos de lo que serían los algoritmos computacionales (Elías, 2015). A partir de Alan Turing y su test de comportamiento inteligente a máquinas, por el que se le considera uno de los pioneros de la inteligencia artificial, se comenzó a plantear si ese pensamiento de las máquinas podía hacerse pasar por el de un humano, y en base a esta reflexión nació el término “inteligencia artificial” (Anyoha, 2020).
Desde los años 90, la agencia Thomson Reuters comenzó a investigar de forma interna las aplicaciones de la computación en el periodismo (Thomson Reuters Corporation, s.f.), y en 2014 Associated Press comenzó a elaborar noticias de forma automatizada con IA con el programa desarrollado por la empresa Automated Insights (Miller, 2015). Desde entonces, se han desarrollado aplicaciones de la inteligencia artificial (IA) y de la computación en el periodismo, pero aún en 2022, los avances de la tecnología han acelerado considerablemente más que aquellos en la industria periodística, y queda mucho por recorrer.
Es por su impacto tanto académico como en el sector, que se propone continuar con la investigación de las aplicaciones de la inteligencia artificial en el ámbito periodístico. A través de una exploración sistemática de las diferentes maneras en las que puede contribuir a las dinámicas periodísticas, se avanza en el conocimiento de sus implicaciones como tecnología. Es indispensable comprender las oportunidades y retos de las tecnologías para adoptarlas y adaptarlas según las necesidades del sector (Lewis et al., 2019).
1.2. Objetivos de la investigación
Se requiere llevar a cabo un estudio exhaustivo sobre la integración de la inteligencia artificial (IA) en las diversas etapas del proceso de producción informativa, dado que existe una insuficiencia de enfoques exploratorios en esta área (Tejedor y Vila, 2021). Debido a la naturaleza cambiante de la IA (Túñez-López et al., 2020), es fundamental mantener una constante actualización de los conocimientos con un enfoque aplicado a las soluciones de la industria. La investigación parte de la siguiente hipótesis: la implementación de la inteligencia artificial en las redacciones periodísticas es un proceso en desarrollo y que existen obstáculos que dificultan su adopción plena. Construyendo sobre ello, los objetivos de esta investigación para poder comprobarla son los siguientes:
-
Ilustrar la penetración de la inteligencia artificial en las dinámicas periodísticas a lo largo del proceso de elaboración de noticias.
-
Identificar los cambios en las dinámicas de redacción provocados por la introducción de la inteligencia artificial.
-
Localizar proyectos de inteligencia artificial en curso en el ámbito mediático español.
-
Categorizar las aplicaciones de inteligencia artificial propuestas en la literatura académica y compararlas con aquellas identificadas en las redacciones.
-
Comprender las implicaciones y retos del uso de la inteligencia artificial en el ámbito periodístico.
1.3. Relación entre tecnología y periodismo
La historia de las relaciones entre la tecnología y los medios es exhaustiva, pero la selección propuesta por Parrat-Fernández et al. (2021) esboza un panorama general de forma pertinente. En 1952 se utilizó por primera vez un ordenador para predecir el resultado de unas elecciones presidenciales de EE. UU. (Cox, 2000), y a partir de los 60, el periodista Philip Meyer comenzó las técnicas de lo que se llamaría “periodismo de precisión” (Coddington, 2014) y posteriormente, CAR, de sus siglas en inglés, “computer-assisted reporting” o periodismo asistido por ordenador (Cox, 2000).
Durante los años 80 comienza el fenómeno de automatización de noticias, que a partir de los 2000 se denominó periodismo computacional (Thurman, 2020), y es definido como la aplicación de métodos computacionales “a la búsqueda, filtrado, composición, presentación y distribución de noticias” (Parrat-Fernández et al., 2021).
En definitiva, la evolución tecnológica se dedica de forma progresiva a automatizar el proceso y labor de la comunicación (Reeves, 2016), y la inteligencia artificial es parte de esa evolución tecnológica que impacta en la industria tanto a nivel técnico como académico.
En este sentido, hay autores que ligan la implementación de la IA a la preocupación por la sustitución laboral de las máquinas (Carlson, 2015; Kim y Kim, 2018; Kirley, 2016) o el hecho de que el uso de la tecnología prioriza las decisiones comerciales sobre los asuntos periodísticos (Whittaker, 2019).
Sin embargo, otros se muestran optimistas, y aquellos como Ufarte Ruiz et al. (2021) destacan las oportunidades que brinda la IA, y otros como Hansen et al. (2017) o Diakopoulos (2019), apuntan a que esta tecnología no sustituirá sino complementará el trabajo periodístico y que el periodista sigue siendo una figura esencial en la industria (Manyika et al., 2017). Más allá de la destrucción de puestos de trabajo, la IA abre la puerta a la creación de nuevos roles (Broussard et al., 2019).
1.4. ¿Y qué es la “inteligencia artificial”? Definiciones y conceptos clave
Los orígenes de la inteligencia artificial residen en los experimentos llevados a cabo en los años 50, entre los que destacan el método para definir como inteligente a una máquina de Alan Turing (Turing, 1950), así como la posibilidad de programar una máquina como jugador de ajedrez de Shannon (1950).
Fue en 1956 cuando se denominó por primera vez el término de “inteligencia artificial” por el investigador John McCarthy, considerado uno de los padres de esta tecnología junto con Marvin L. Minsky, Nathaniel Rochester y Chaude E. Shannon, que participaron en el primer proyecto expresamente sobre IA (McCarthy et al., 2006). En este caso, se define como aquellos “programas escritos para resolver problemas que suponen dificultad intelectual para los humanos”. En 2007, McCarthy definió la IA como la ciencia e ingeniería que crea máquinas inteligentes, especialmente programas informáticos inteligentes”, definiendo la inteligencia como “la parte computacional de la habilidad de conseguir objetivos (McCarthy et al., 2006).
En su definición, McCarthy (McCarthy et al., 2006) apunta a la relación con el reto computacional de “comprender la inteligencia humana” (Broussard et al. (2019) destacan la creciente importancia del concepto de machine learning (ML), una rama de la IA, que definen como “el entrenamiento de las máquinas para aprender de los datos, reconocer patrones y juzgar consecuentemente”, y que de forma gradual mejora su precisión a la hora de imitar el aprendizaje humano (IBM Cloud Education, 2020). En ML se basan la mayoría de las soluciones relacionadas con el análisis y producción lingüística, las que afectan al periodismo. Si el proceso de aprendizaje del algoritmo en cuestión cuenta con poca o nula intervención humana y se puede aplicar de forma escalable se considera deep learning, y si interviene un humano, non-deep o aprendizaje supervisado. Este segundo tipo constituye la mayoría de los algoritmos utilizados en las aplicaciones periodísticas, porque son los humanos o las decisiones editoriales las que determinan las diferencias y similitudes en las que se ha de fijar el algoritmo, y necesita más datos estructurados para comprenderlo (IBM Cloud Education, 2020), como en la verificación de bulos, por ejemplo. Las conexiones realizadas en el aprendizaje profundo conforman una red que simula el comportamiento de asociación de las neuronas, y se denomina redes neuronales (IBM Cloud Education, 2020), donde la profundidad indica el número de capas de la red de conexiones.
Los procesos que se aplican en periodismo dentro de estos campos son los de procesamiento de lenguaje natural, que justamente trata de comprender las lenguas tanto escritas como habladas, y no solo datos o números, para poder reconocer y responder a texto o audio, así como traducirlo o crearlo. Está presente en los asistentes digitales, en chatbots o en el periodismo robot (Brown, 2021).
Hay que tener en cuenta que, aunque los conceptos de inteligencia artificial sean nombrados en función de procesos neurobiológicos, actúan más como una metáfora que como una analogía directa, comparando su funcionamiento y su aprendizaje. Sus funciones en machine learning se reducen a la gestión de la información que explica el MIT (Brown, 2021):
-
Función descriptiva: el sistema utiliza datos para explicar qué ha ocurrido, como con la identificación de patrones o la producción informativa.
-
Función predictiva: el sistema utiliza los datos para predecir lo que ocurrirá según unas condiciones, como los modelos de propensión a suscripción de los medios
-
Función prescriptiva: el sistema utiliza los datos para sugerir qué acciones tomar en ciertas circunstancias, como los sistemas de alertas.
Aun así, su relevancia supera al sector periodístico, y supone una transformación social completa (Túñez-López et al., 2020) con un abanico de posibilidades amplio. Así es que en 2019 se presenta en España la estrategia de I+D+i en Inteligencia artificial (Ministerio de Ciencia, Innovación y Universidades, 2019), y un año más tarde se aprueba la Estrategia Nacional en Inteligencia Artificial (Ministerio de Asuntos Económicos y Transformación Digital, 2020) en España, cuando también se publica el Libro blanco sobre IA de la UE (Comisión Europea, 2020), como declaración de cooperación en la materia a nivel europeo. El foco y atención de las instituciones muestran el objetivo de promover el desarrollo e invertir en mejorar la IA y sus aplicaciones.
1.5. Tipos de aplicaciones de inteligencia artificial
Según diversos académicos, las formas existentes en las que la IA puede impactar en el periodismo son aquellas que proporcionan los máximos beneficios que puede proporcionar la automatización, para poder alcanzar el denominado “periodismo aumentado” (Tejedor y Vila, 2021).
Se recogen de forma sistematizada los diversos usos que tratan diversos académicos e instituciones para crear una tabla integradora de cómo se aplica la inteligencia artificial en la industria periodística, siguiendo la clasificación de fases de London School of Economics (Beckett, 2019).
Tabla 1. Usos de la IA en la industria periodística según la revisión bibliográfica
Fase del proceso periodístico |
Aplicaciones generales |
Definición de usos concretos |
Investigación y pre-producción |
Monitorización |
Seguimiento de noticias, perfiles de redes sociales, eventos y otras publicaciones |
Identificación |
Exploración interactiva y localización de patrones y conexiones entre datos, análisis de sentimiento y toxicidad |
|
Predicción |
Realizar suposiciones de futura información según datos previos, detección de tendencias |
|
Verificación |
Verificación de datos, fuentes y hechos, comprobación de bulos y campañas de desinformación |
|
Curación |
Selección y filtrado de contenido en función de condiciones establecidas |
|
Lingüística |
Transcripción de audio a texto, traducción de idiomas y correcciones lingüísticas |
|
Comportamiento de la audiencia |
Investigación sobre comportamiento de uso y preferencias de contenido de los lectores y el mercado, segmentación de audiencias |
|
Manejo de archivo |
Digitalización, etiquetado y clasificación del archivo documental |
|
Asistente automático |
Automatización de tareas diarias de la redacción |
|
Producción |
Generación automatizada |
Automatización de tareas diarias de la redacción |
Bots |
Producción de textos automatizada por procesamiento de lenguaje natural |
|
Edición |
Producción de contenido informacional y conversacional automático (chatbots) |
|
Distribución |
Comentarios |
Moderación y etiquetado de comentarios |
Recomendación |
Recomendación de artículos y otros productos editoriales |
|
Producto |
Desarrollo de producto editorial y tecnológico y experiencias de usuario |
|
Optimización |
Optimización de imágenes, vídeos, titulares y otros tipos de contenido |
|
Negocio |
Definición del modelo de suscripción y modelos de propensión, decisiones de negocio |
|
Clasificación |
Etiquetado de artículos |
Fuente: Elaboración propia como síntesis de usos recopilados por las fuentes Beckett, 2019; Broussard et al.,2019; Diakopoulos, 2019; Lewis et al., 2019; Keefe et al., 2021; Marconi, 2020; Tejedor y Vila, 2021; Túñez-López et al., 2020; Veglis y Maniou, 2019
1.6. ¿Nuevos periodismos o nuevas formas de hacer periodismo?
La amplia oferta de oportunidades que se abren al frente de la industria llama a una estrecha colaboración entre programadores y periodistas. La transposición de habilidades entre uno y otros roles (Túñez-López et al., 2020) apunta a que los periodistas se convertirán en analistas y curadores de datos. Con la IA nace un nuevo tipo de periodismo, el “exo-periodismo”, conceptualizado por Tejedor y Vila (2021) en el que se conectan todas las posibilidades de la IA con las rutinas productivas del periodismo para elevar las habilidades periodísticas y los productos mediáticos a un nivel superior, una suerte de “periodismo aumentado” (Tejedor y Vila, 2021).
Si este periodismo aumentado, además, se centra en producir piezas de forma automatizada, se trata de un subcampo del periodismo computacional que, según qué investigador, ha sido denominado periodismo automatizado (Loosen, 2018) o robot-periodismo (Carlson, 2015) e incluso IA comunicativa (Guzman y Lewis, 2019). El concepto de periodismo se ve intrínsecamente relacionado con la nueva perspectiva que dota la aplicación de la inteligencia artificial al oficio, y que en su extremo, trata de completar la tarea de narración del periodista de forma autónoma, desde la búsqueda y selección de información, a la verificación, composición, presentación y distribución de esta (Thurman, 2020).
En cuanto a la selección y búsqueda de información, se ha realizado un estudio exhaustivo sobre su aplicación en el periodismo de investigación. Autores como Diakopoulos (2019) han investigado su utilización en el manejo de grandes volúmenes de datos. Por otro lado, Yanfang (2019) se ha centrado en la producción automatizada y en las diferencias entre las noticias generadas por periodistas y las generadas por algoritmos. Además, se ha observado que las empresas proveedoras de algoritmos, como se ha evidenciado en el estudio del uso de IA en el sector, tienen una "responsabilidad distribuida" en el diseño del algoritmo y en las acciones informativas llevadas a cabo. Wu et al. (2019), Saurwein (2019) y Dierickx (2019) han abordado esta temática en sus investigaciones.
A partir de estas nuevas prácticas de periodismo automatizado, autores como Galily (2018) se cuestionan si son una mera fase de evolución o si suponen “una insurrección” que “disolverá a los periodistas humanos de la profesión”, a lo que Manyika et al. (2017) destacan que solo el 15% de las tareas de un reportero y el 9% de las de un editor podrían ser automatizadas con la tecnología actual. Porque, aunque las redes neuronales sean capaces de identificar con gran precisión patrones, no son capaces de contextualizarlos sin el conocimiento de un periodista que o bien edite la pieza o bien enseñe al algoritmo a reconocer las conexiones entre los patrones (Diakopoulos, 2019). En ello se centra la rama de investigación de human-machine communication o HCM (Guzman, 2018), en comprender la tecnología como objeto comunicativo y periodístico, tendiendo un puente entre las máquinas y los periodistas como comunicadores, como muestra también esta investigación en proyectos actuales en redacciones españolas.
2. Metodología
La metodología utilizada en esta investigación se basa en un enfoque cualitativo que emplea el método de triangulación para recopilar información. Esto implica la realización de entrevistas en profundidad semi-estructuradas y una revisión integradora de la literatura disponible (Codina, 2017). Las entrevistas se diseñaron específicamente para abordar los objetivos previamente identificados en la investigación:
-
Usos de la inteligencia artificial (IA) en las dinámicas de la redacción y producción de noticias en los medios periodísticos.
-
Desarrollo de la implementación de la IA en casos reales en el ámbito mediático.
-
Perfiles profesionales necesarios para la implementación exitosa de la IA en el periodismo.
-
Cambios necesarios en las mentalidades y procesos de trabajo de las redacciones para adaptarse a la evolución tecnológica y la introducción de la IA.
Se seleccionaron profesionales de diferentes perfiles, redacciones y empresas para obtener una visión amplia del estado actual de la inteligencia artificial en el ámbito mediático. Cada uno de los proyectos entrevistados proporciona información que permite comprender las aplicaciones tangibles de la IA, complementando así los hallazgos de la literatura académica. Además de los casos de estudio en España, específicamente Newtral, RTVE y El País, se llevaron a cabo entrevistas con expertos de empresas como Prodigioso Volcán y Narrativa, que trabajan en proyectos de inteligencia artificial para medios de comunicación.
Tabla 2. Lista de entrevistados en profundidad
Nombre entrevistado |
Cargo |
Código de entrevista para citas |
Carmen Torrijos |
Responsable de inteligencia artificial en Prodigioso Volcán |
PV_CT |
Sofía Sánchez |
PR y Marketing de Narrativa |
NIA_SS |
David Corral |
Responsable de innovación en RTVE |
RTVE_DC |
Rubén Míguez |
Responsable de tecnología e innovación de Newtral |
NW_RM |
Noemí Ramírez |
Chief Data Officer de Prisa Media |
PM_NR |
Fuente: elaboración propia.
Newtral, RTVE y El País se seleccionaron como casos de estudio debido a su destacado avance en la aplicación tecnológica de la inteligencia artificial en su rutina diaria. Estos casos ilustran ejemplos concretos de cómo la IA ha modificado de manera significativa las rutinas de producción periodística, incluyendo la producción automatizada de noticias en RTVE, las estrategias de verificación de datos en Newtral y la personalización de productos en El País.
La revisión de la literatura se llevó a cabo utilizando la plataforma Scopus y se realizaron búsquedas utilizando las palabras clave "Journalism" AND "Artificial Intelligence". Además, se complementó la búsqueda revisando documentos con las mismas palabras clave en Google Scholar para obtener resultados adicionales. Dado que los resúmenes de los artículos están publicados en inglés junto con el idioma de publicación, se aseguró una revisión exhaustiva utilizando palabras clave en inglés sin limitaciones lingüísticas.
3. Análisis y resultados
Las conversaciones con agentes del sector dedicados al desarrollo de proyectos de inteligencia artificial para medios, como Narrativa.AI o Prodigioso Volcán, han permitido la identificación de los diversos tipos de proyectos que se realizan en la actualidad en España en el ámbito periodístico con esta tecnología.
Los tres casos de estudio seleccionados para esta investigación presentan aplicaciones de la inteligencia artificial en múltiples fases de la rutina productiva: la redacción automatizado, la recomendación y personalización de piezas, y la verificación de información. Los resultados relevantes del resto de entrevistas se incluyen en la discusión de resultados para complementar la información.
3.1. Caso de estudio: Radio Televisión Española (RTVE)
La implementación de inteligencia artificial en RTVE, el principal medio de comunicación público de España, se basa en colaboraciones y recursos externos de centros de investigación de universidades (RTVE_DC). En su caso, el equipo centrado en IA está compuesto principalmente por ingenieros de telecomunicaciones y periodistas, y tienen multitud de proyectos en marcha.
Tabla 3. Proyectos de inteligencia artificial de RTVE junto con entidades colaboradoras
Entidad |
Proyecto |
RTVE y Universidad Autónoma de Barcelona |
Observatorio para la Innovación de los Informativos en la Sociedad Digital: investigación sobre aplicación de IA en el periodismo |
RTVE y Universidad Autónoma de Barcelona |
Proyecto OFT: herramienta académica para detectar la desinformación |
RTVE y Universidad de Zaragoza |
Identificación de objetos y personas |
RTVE y Universidad de Zaragoza |
Identificación de voces |
RTVE y Universidad de Zaragoza |
Metadatado de web semántica |
RTVE y Universidad Carlos III de Madrid |
Speech to text: subtitulado de noticias en directo para dar accesibilidad. Ideado para implementar en los idiomas cooficiales del estado |
RTVE |
Emulador de voces humanas para altavoces inteligentes |
RTVE |
Gestión de redes: comprobación de emisión televisiva y radiofónica en aire |
RTVE y Narrativa |
Producción automatizada de noticias deportivas y electorales |
RTVE y Narrativa |
Análisis de sentimiento |
Fuente: elaboración propia.
3.1.1. Implementación de la inteligencia artificial en la producción del contenido
La mayoría de los proyectos de IA de RTVE están en fase de investigación, excepto el proyecto de producción automatizada de contenido que está en producción. En 2023 se prevé que se lance el sistema de “periodismo robot” desarrollado junto con Narrativa para cubrir las elecciones generales. Ya realizaron un prototipo piloto interno en 2021 (Corral, 2021) para cubrir las de la Comunidad de Madrid y con el que se generaron 2.583 noticias con 77 tandas de ficheros de datos (Corral, 2021).
Narrativa, la empresa con la que colaboran nace en 2015 para proporcionar contenido frecuente a las compañías que no tienen tiempo para generarlo, y “que un periodista no tenga que estar perdiendo el tiempo” escribiendo piezas mecánicas (NIA_SS). Trabajan con EFE, Infobae o Wall Street Journal, entre otros medios internacionales. Su equipo está formado tanto por perfiles técnicos como por periodistas y comunicadores audiovisuales, para conseguir entender la visión de los clientes (los medios) y los intereses de los lectores y estructurar de esta manera las piezas informativas. Narrativa.AI considera indispensable involucrar a la figura del periodista, en tanto que comprende el contexto de la pieza, para así editar el texto automatizado, tanto antes como después (NIA_SS). Además, incluyen una nueva figura, mezcla entre técnico y redactor, que revisa los textos antes de producirse con IA, el editor de automatización (NIA_SS). La edición posterior la realiza RTVE (RTVE_DC).
El proyecto con Narrativa cuenta con la tecnología propia de la empresa, por lo que es un desarrollo externo a RTVE, personalizado según su guía de estilo periodística (RTVE_DC). El algoritmo ha sido entrenado para producir piezas informativas sobre datos electorales, tras descartar su aplicación en la información deportiva. La herramienta también tiene potencial con información menos estructurada, para posibles aplicaciones futuras (RTVE_DC).
A la hora de personalizar el sistema que generará automáticamente las piezas, se sigue una metodología concreta que entrena al algoritmo para que progresivamente sea más preciso en función de la guía de estilo de RTVE, el lenguaje y la función periodística, y el tipo de datos a manejar según el tipo de información (RTVE_DC). Las fases son las siguientes:
-
Identificación de temáticas: Cada vez que se trata un tema diferente, el algoritmo ha de entrenarse de nuevo con sus datos, estructura y vocabulario específicos.
-
Introducción de un corpus de texto para el entrenamiento del algoritmo: se procesan multitud de piezas informativas, de RTVE y otros medios, en el software de Narrativa.AI para enseñar al algoritmo cómo confeccionarlas.
-
Primera prueba: se procesa el conjunto de datos de los resultados de la votación, en caso de información electoral, para producir la pieza piloto.
-
Testeo y modificaciones: la redacción de RTVE devuelve un análisis de la primera pieza con los elementos a cambiar, para educar al sistema y conseguir una mayor precisión. Siguen el método de “ensayo-error” y el estilo de RTVE.
-
Prueba definitiva: se realiza cuando la producción automatizada ha alcanzado los estándares necesarios de calidad y precisión informativa delimitados por RTVE.
Más allá de la IA, el equipo es interdepartamental dentro de la compañía y trata de identificar las tecnologías interesantes para RTVE, entender su funcionamiento, analizarlas y adaptarlas a las necesidades de la corporación (RTVE_DC). Actualmente trabajan con más tecnologías como 5G y Cloud.
3.2. Caso de estudio: Newtral
En el caso de Newtral, empresa formada en 2018 por la periodista Ana Pastor (Newtral, 2022), cuentan con un equipo de 6 programadores full stack, científicos de datos, arquitectos de datos e ingenieros de machine learning que recogen, transforman y desarrollan del modelo algorítmico a utilizar. Este equipo trabaja en colaboración con más de 30 periodistas que validan y evalúan el modelo y su impacto en el mundo práctico (NW_RM), así como con diseñadores gráficos que presentan y visualizan la información que se produce. Trabajan con herramientas de computación externas que suponen la mayor parte del coste y les ofrecen el poder de procesamiento de datos suficiente, pero la tecnología que utilizan es un desarrollo interno, así como la determinación de requisitos, la identificación de contextos y las producciones creativas.
3.2.1. Implementación de la inteligencia artificial en la identificación de bulos y desinformación
Tienen dos proyectos en los que incluyen desarrollo de IA dentro de su misión de combatir la desinformación. Su objetivo es “pasar de 8h a 1h de dedicación en verificación” (NW_RM) e incrementar la productividad y la efectividad, “para ser más rápidos y procesar un gran volumen de datos” (NW_RM). La razón no es de optimizar el margen de coste, sino para “lograr que el factcheck llegue a tiempo” a los afectados por la desinformación (NW_RM).
Tabla 4. Resumen de proyectos con aplicaciones de IA en Newtral
Proyecto |
Definición |
Estado |
Objetivo |
Monitorización de datos verificables |
Identificación de datos verificables en vídeo |
En producción |
Aumentar efectividad y productividad |
Fact-checking automatizado |
Automatización de respuestas en hechos ya verificados |
En investigación |
Reducir repetición de verificaciones |
Detección de fase swaping |
Identificación de Deep fakes con alteración de caras |
En investigación |
Colaboración con CERF y profundizar en materia de deepfakes |
Rubén Míguez |
Responsable de tecnología e innovación de Newtral |
En investigación |
Aplicación al ámbito político |
“Las calles de ellas” |
Localizar las calles con nombres de mujer |
Finalizado |
Experimentación periodística |
Fuente: elaboración propia.
3.2.2. Proyecto 1: monitorización de bulos
El primer proyecto consiste en un software interno para verificar hechos de declaraciones grabadas en vídeo. Es liderado por un equipo humano aunque hay desarrollo de IA que lo sustenta. Para ello, trabajan con vídeos que suben a un servidor en la nube. El audio se procesa para pasarlo a texto, conversión denominada como speech to text. El sistema está entrenado con un modelo de lenguaje o corpus de texto en español, el XLM RoBERTa, pero funciona “con una precisión bastante buena” (NW_RM) con el resto de los idiomas de la UE por el proceso de transfer learning. Este modelo de lenguaje se entrena con información de la web, conocido como common crawl, extraída de páginas como Wikipedia.
Una vez transcrito el audio, el sistema, que cuenta con tecnología propia desarrollada por el equipo de Newtral, identifica las frases que tienen potencial de ser verificadas. Las condiciones que cumplen las frases “verificables” es que son relevantes y son hechos factuales. Las primeras frases “verificables” son identificadas por los periodistas para entrenar al algoritmo. El proceso en el que “aprende” la estructura de dichas frases se conoce como fine tuning. Una vez aprendido, se procede a clasificar las frases verificables en el programa por parte de los periodistas.
La interfaz muestra la siguiente información:
-
Transcripción completa del texto
-
Etiquetas que diferencian a los interlocutores del vídeo procesado
-
Identificadores de tiempo según el momento en el que comienza cada intervención
-
Frases subrayadas identificadas como frases “verificables”
-
Lista del conjunto de frases seleccionadas por el algoritmo
-
Porcentaje de fiabilidad en la predicción de cada una de las frases
En el caso de que los periodistas identifiquen frases que no deberían estar marcadas, se eliminan manualmente, al igual que se pueden añadir y subrayar frases, mejorando la herramienta progresivamente.
3.2.3. Proyecto 2: automatización de la verificación de bulos
El segundo proyecto que han desarrollado es una herramienta de etiquetado de mensajes que llegan al perfil de WhatsApp del medio, aunque no está automatizada sino en fase de experimentación (NW_RM).
Se ha habilitado para que los lectores envíen posibles bulos y se identifique si ya han sido verificados en la base de datos. En caso afirmativo, se contesta automáticamente. En caso negativo, un periodista lo verifica. Así, la carga de trabajo de los factcheckers se reduce únicamente a contenido nuevo.
Hasta ahora, no utilizan ni están desarrollando tecnología para detectar la manipulación de imágenes o vídeos, o de bots. Tienen un proyecto para medir la toxicidad del lenguaje político en un nivel fuerte o leve, con un sistema similar al que utilizan para identificar frases “verificables”, y que también aplican a la monitorización de perfiles políticos en redes sociales, pero que está en fase de experimentación (NW_RM).
3.3. Caso de estudio: El País
En el caso de El País, el medio de prensa generalista más leído de España, se utiliza la inteligencia artificial en diferentes fases de la actividad del medio. Los desarrollos de machine learning se orientan tanto a mejorar procesos como a la personalización de productos, y al modelo de suscripción digital. “Toda IA tiene que responder a necesidades específicas”, de negocio o editoriales (PM_NR).
El equipo de data para prensa y radio está unido en un equipo transversal. Cuentan con una combinación de perfiles técnicos, analistas, científicos e ingenieros de datos, desarrolladores y perfiles de producto y editorial. La parte del equipo técnico identifica las variables a tener en cuenta a la hora de desarrollar el algoritmo de inteligencia artificial del proyecto y la parte del equipo de producto identifica la visión de la propuesta del modelo a desarrollar (PM_NR).
3.2.1. Proyecto 1: newsletters individualizadas
Para El País, la personalización es uno de los temas más candentes desde la evolución de los medios digitales. Cuentan con una newsletter de carácter personalizado que lanzaron en 2021, Radar.
Se lanzó como prototipo exclusivo para los suscriptores de pago y ya está disponible para los 4 millones de usuarios registrados (PM_NR). La newsletter se genera de manera automática en base a metadatos del contenido y a las lecturas previas del usuario, para identificar los contenidos no leídos y susceptibles de interesar a los suscriptores de Radar. Según Ramírez, se publican entre 200 y 300 artículos al día, una cantidad insostenible para ser leída por un usuario. También utilizan reglas editoriales junto a la tecnología, porque como medio de comunicación “el valor de la jerarquía y prescripción editorial es relevante” y porque, más allá del atractivo de una portada, “es imposible leer todo” (PM_NR).
El objetivo de este producto es incentivar la lectura y fidelizar al usuario (PM_NR). Su tasa de apertura es la más alta de todo el portfolio de newsletters del medio y un 62% de aquellos que la reciben son suscriptores de pago. En este sentido, en El País se considera indispensable medir todo lo que hacen (PM_NR).
También utilizan un sistema similar para la recomendación de contenido de audio en su aplicación de Podium Podcast, llamado Tailor Cast.
3.2.2. Proyecto 2: moderación de comentarios
Fue una de las primeras incursiones que hicieron en el entorno de la inteligencia artificial y que continúa en funcionamiento. Parte de una problemática a la que, según Noemí Ramírez, se enfrentan los medios, sobre todo en prensa: cómo abordar el flujo de comentarios que se reciben dentro de las noticias.
En 2018, origen del proyecto, El País no contaba con un modelo de suscripción digital y todos sus artículos estaban abiertos a comentario. Recibían en su conjunto una media de 10.000 comentarios diarios, unos 300.000 al mes. No existía ningún tipo de barrera que restringiera el acceso a comentar de los usuarios. Más allá de ser una vía de expresión de los lectores, existía un gran volumen de comentarios “fuera de lugar” desde la perspectiva de la contribución al discurso público (PM_NR).
El proyecto se lanza ese mismo año en colaboración con Google y su proyecto Jigsaw, que es la base del programa de moderación Coral, con el que cuentan medios como NY Times. El País fue el socio en español para entrenar el modelo y generar el corpus de texto para poder moderar y gestionar los niveles de toxicidad de los comentarios, como solución al problema que afecta a toda la industria. Ahora está disponible para que cualquier medio lo incluya en su sistema de comentarios.
El proceso de entrenamiento se estructura en:
-
Procesamiento de lenguaje natural: la base es el flujo de comentarios de El País de manera anonimizada y respetando las normativas en materia de privacidad.
-
Etiquetado del modelo de machine learning: aprende a partir de comentarios etiquetados como tóxicos o no tóxicos por personas humanas, y se automatiza de forma progresiva el etiquetado.
-
Establecer umbral de toxicidad: existía una preocupación de “la limitación a la libertad de expresión” y ciertas cuestiones éticas alrededor de la moderación de comentarios (PM_NR), y el nivel de toxicidad aceptado es alto.
-
Introducción en el bloque de comentarios: una vez los resultados devueltos por el sistema automatizado, se introduce dentro del flujo de publicación de comentarios. Si una persona va a publicar un comentario potencialmente tóxico, recibe una alerta para que modifique su mensaje antes de publicarlo. Así, “en lugar de impedir que ese comentario pueda pasar, le da la guía para reformular y que sea aceptable” (PM_NR).
Tres meses después del lanzamiento del proyecto, la toxicidad de los comentarios había descendido un 7% y los comentarios habían aumentado un 19% en volumen. Desde el lanzamiento del modelo de suscripción, la publicación de comentarios está restringida a los suscriptores de pago, por lo que el volumen de comentarios es menor, pero internamente se considera que mejora la calidad del discurso periodístico y la conversación generada.
Una vez desarrollado, para darle continuidad a este y otros proyectos, “el orden de prioridades” es cambiante en cuanto a “dotación de esfuerzos, tiempo y presupuesto” (PM_NR). Por ejemplo, han explorado pero no implantado la producción automatizada “por falta de conocimiento y de resistencias” de que “una propuesta de narrativa te venga dada por un algoritmo” (PM_NR).
Tabla 5. Resumen de proyectos con aplicaciones de IA en Newtral
Proyecto |
Definición |
Estado |
Objetivo |
Moderación de comentarios |
Notificar al usuario de la redacción de un comentario abusivo |
Desarrollo finalizado y en fase de mantenimiento |
Mejorar la calidad del discurso público entre lectores |
Radar |
Newsletter personalizada para cada usuario |
En producción |
Incentivar la lectura y fidelización del lector |
Tailor Cast |
Lista de reproducción con contenido de audio recomendado |
En producción |
Fidelizar al oyente evitando las cámaras de eco |
Modelo de suscripción (varios) |
Algoritmos alrededor de:
|
En producción |
Optimizar le modelo de suscripción del medio |
Fuente: elaboración propia.
3.4. Próximos pasos en la industria
3.4.1. Usos potenciales
La implementación de la inteligencia artificial en los diferentes casos de estudio coincide entre algunos de los medios. Hay prácticas bien asentadas dentro de la fase temprana de esta tecnología en la industria, a la vez que también hay multitud de proyectos en fase experimental para entender el potencial de la IA. En general, lo importante para todos cuatro medios es que las iniciativas se basen en necesidades reales y hacia objetivos concretos.
Tabla 6. Resumen de áreas de aplicación de IA en los medios nacionales estudiados
|
El País |
RTVE |
Newtral |
Moderación de comentarios |
|
X |
X |
Verificación de datos |
|
X |
X |
Recomendación de contenido |
X |
|
|
Modelo de suscripción |
X |
|
|
Identificación de comentarios tóxicos |
X |
|
X |
Fuente: elaboración propia
Donde más avanzado está el sector es en la producción de contenidos automatizados (PV_CT). Se destacan principalmente la potencia de comprensión del lenguaje que ofrecen nuevas herramientas como GPT-3, que consiguen emular con gran verosimilitud el lenguaje humano (PV_CT), y que con el tiempo dan cada vez respuestas más elaboradas y personalizadas (NIA_SS), en las que se apoyan tecnologías como la de Narrativa.AI. Ya existe un corpus de texto en español de la Biblioteca Nacional Española, MarIA, que constituye el primer modelo de lenguaje entrenado masivamente con datos en español (BNE, 2021), por lo que las aplicaciones son factibles más allá del inglés. En materia de desinformación, la innovación técnica tiene oportunidad de desarrollo en la verificación, como se ha visto con Newtral, además de la creación de sistemas de alerta temprana, que permitirán construir sistemas de verificación mejor orientados y con mayor capacidad de contrarrestar el mensaje (NW_RM).
En términos de innovación, el gran reto es la detección de los deep fakes (vídeos falsos generados por IA), que son cada vez más difíciles de identificar, y suponen un ciclo sin fin en el que los bulos creados por IA son incapaces de ser detectados por herramientas de verificación automática (NW_RM).
3.4.2. Desarrollo propio o externalizado: recursos necesarios
En términos de desarrollo, no existe una tendencia clara sobre entrenar a los algoritmos propios o utilizar recursos externos, y tanto El País como Newtral han creado proyectos de ambas maneras.
En cuanto a recursos externos, se puede recurrir a las colaboraciones con universidades, como RTVE. Empresas como Prodigioso Volcán o Narrativa.AI, que son proveedoras tecnológicas para los medios en materia de IA, consideran que existe la oportunidad de crear un sector más pequeño de consultoras o socios tecnológicos que estén al alcance económico de los medios y alineadas con sus intereses (NIA_SS, PV_CT) para que así apuesten por esta tecnología.
En cualquier caso, es necesario atender al presupuesto necesario para invertir en esta tecnología. Proyectos como Journalism.AI de la London School of Economics o Local News AI de Associated Press tienen como objetivo acortar esa brecha y encontrar los usos idóneos de IA para cada medio, así como aportar la formación necesaria para tratar con precisión y comprender todos los conceptos que rodean a esta tecnología.
3.4.3. La necesidad de la implicación humana
El beneficio más significativo de la unión de IA y periodismo es que existe gran cantidad de verticales informativas en las que los datos están estructurados, como son la actualidad de deportes, financiera y de mercados bursátiles, y noticias creadas para el posicionamiento SEO, como los rankings sociales. (NIA_SS).
“Una IA no puede destapar un caso de corrupción” (NIA_SS) y “no comprende el texto que está generando” (PV_CT), el por qué cae la bolsa, por ejemplo (NIA_SS). Se identifica la necesidad de contar con un periodista para dar contexto de las noticias (NIA_SS).
La implicación humana está en la definición de experiencias de usuario, las recomendaciones editoriales (PM_NR), la contextualización de la información y la definición de indicadores o métricas de precisión (PV_CT) o la revisión de la precisión del sistema (NW_RM). En definitiva, cada aplicación de IA cuenta con fases del proyecto que requieren decisiones humanas.
La mayor fortaleza de la unión de tecnología y periodismo es que resulta un apoyo, no un sustituto (RTVE_DC), y sirve para crear contenido complementario, afinar las verificaciones o recomendar contenido, mejorando la experiencia del lector y la rutina del periodista. No existe un solapamiento total entre las capacidades de la inteligencia artificial y las del periodista. Aun así, existe un miedo generalizado a la pérdida de empleo por la sustitución. Más allá de los recursos económicos, el limitante en la implementación de la IA es el conocimiento del concepto (PM_NR).
4. Discusión y conclusiones
4.1. La tarea pendiente: reducir la brecha tecnológica
A través de entrevistas a los principales actores involucrados en proyectos de IA en los medios de comunicación, se examina el amplio potencial de la inteligencia artificial (IA) para mejorar el periodismo y se destaca la brecha existente entre los avances tecnológicos y su implementación en la industria. Se identifican dos desafíos principales: la resistencia de los trabajadores y la falta de habilidades técnicas necesarias. A pesar de ello, se ha demostrado que la IA puede optimizar los procesos periodísticos y permitir que los periodistas resalten sus habilidades únicas y creativas. La adopción de la IA en el periodismo requiere superar estos desafíos para obtener una ventaja competitiva en el campo mediático.
Existe una brecha significativa entre los avances y la innovación técnica en la industria periodística, abarcando desde la redacción de artículos hasta la moderación de comentarios y la distribución de noticias. El principal obstáculo en la implementación de IA en las redacciones es la resistencia de los propios trabajadores, a pesar de que no esté respaldada por evidencia sólida. Los medios consideran que la pluma distintiva de los autores es lo que atrae a los lectores, a pesar de los ejemplos existentes de IA en campos como la pintura y la música. Para demostrar su valor único, los periodistas deben enfocarse en lo que los distingue de lo que las máquinas producen.
La falta de habilidades técnicas necesarias para aplicar y mantener proyectos de IA también representa un obstáculo. En un entorno donde la IA y los periodistas trabajan juntos, el periodista del futuro requerirá habilidades adicionales para procesar y comprender datos, así como prácticas relacionadas con la IA y otras tecnologías.
El periodismo actual requiere nuevos perfiles profesionales con una actitud renovada, mayor formación tecnológica y enfoque en tareas cognitivas para enriquecer los contenidos y resaltar las características distintivas de los periodistas que respaldan la reputación de los medios. Programas como el Master of Science in Journalism and Computer Science de la Universidad de Columbia, reconocida por los premios Pulitzer y su liderazgo académico, ofrecen una formación conjunta en tecnología y periodismo, abordando asignaturas como "Fronteras del Periodismo Computacional", "Análisis de algoritmos" y "Datos y bases de datos".
El juicio y la intuición de los periodistas siguen siendo indispensables, tanto en las tareas empresariales como en las editoriales. El objetivo futuro es utilizar la inteligencia artificial para mejorar la calidad y eficiencia del trabajo periodístico, alejándose de las tareas repetitivas y centrándose en las más creativas.
El último desafío es cerrar la brecha entre la investigación teórica sobre los usos potenciales de la IA y su aplicación práctica en la industria periodística. Aunque todavía queda espacio para avanzar y desarrollar, es solo cuestión de tiempo antes de que las redacciones consideren su implementación según sus necesidades.
La adopción de la IA en los medios de comunicación está en una etapa inicial, y aquellos que desarrollen proyectos de IA ahora se beneficiarán al destacar como medios con un valor diferencial. Esta investigación respalda la hipótesis inicial al demostrar que existe una brecha tecnológica en la implementación de la IA en las redacciones periodísticas, debido a la resistencia de los trabajadores y la falta de habilidades técnicas necesarias.
Sin embargo, también se ha comprobado que la IA puede ser una herramienta complementaria que mejora los procesos periodísticos y permite a los periodistas destacar sus habilidades únicas y creativas. Por lo tanto, queda claro que la adopción de la inteligencia artificial en el periodismo es un desafío pendiente que requiere superar los obstáculos mencionados para aprovechar todo su potencial.
En base a los hallazgos y conclusiones obtenidos en esta investigación, se identifican varias posibles futuras líneas de investigación en el ámbito de la inteligencia artificial en el periodismo. Estas incluyen la exploración de nuevas aplicaciones de la IA. Además, es crucial investigar los aspectos de transparencia algorítmica y la equidad en la distribución de noticias personalizadas. Asimismo, se recomienda realizar estudios comparativos entre diferentes modelos de IA y evaluar su impacto en la calidad y diversidad de la información periodística. Estas líneas de investigación contribuirán a impulsar el avance y la adopción responsable de la IA en el campo del periodismo.