El SIP Bot es una herramienta de inteligencia artificial de la Sociedad Interamericana de Prensa que monitorea en tiempo real violaciones a la libertad de prensa. Rastrea información publicada en medios, Google News, Twitter y de una selección de notas y denuncias de la SIP. Contiene un mapa de calor que permite observar el clima de la libertad de prensa en cada país, un botón para hacer denuncias y un menú en el que destacan las declaraciones de líderes de gobiernos, conversaciones de ciudadanos y eventos relevantes.
Cómo se calcula la información
Todos los días a las 02:00 AM (EST) y 14:00 (EST) se ejecuta una captura de datos que considera los titulares de noticias y/o los tuits que contienen los términos o etiquetas configurados por el administrador de esta herramienta. Luego se calculan nuevas variables a partir de los textos originales contenidos en los tuits y las noticias. Así, para cada tuit o noticia, la herramienta identifica las siguientes variables:
• Polaridad: calificación numérica del tono de una publicación, que va entre -1 (muy negativo) a +1 (muy positivo). Esta métrica permite calcular el mapa del clima de prensa.
• Efectividad (Twitter):, es la suma de los RTs y favoritos.
• Ubicación: se identifica si el texto contiene el nombre de un país o una ciudad. En el caso de Twitter, a veces incluye la ubicación desde donde se originó la conversación (menos del 4% de los casos). En caso de que no se identifique un territorio, pero el texto mencione a algún periodista, medio o gobierno (configurado por el administrador de esta herramienta), se asigna la ubicación asociada al emisor de la información.
• Etiquetas lista de etiquetas o tags configurados por el administrador de esta herramienta que están contenidos en el texto.
Tabulaciones
Se ejecuta un proceso extra de filtro que reduce la cantidad de textos a analizar. Esto se debe a que existen textos que contienen términos que por sí solos no son suficientes para identificar una noticia o conversación relacionada con la libertad de prensa.
Los textos filtrados se almacenan en una base de datos. Luego, se procesan mediante operaciones que simplifican los cálculos, para que el usuario pueda obtener información de inmediato. Estos pre cálculos se almacenan en las siguientes tablas:
• Tabla del clima de libertad de prensa: almacena el conteo de publicaciones, agrupados por fecha, territorio (país) y fuente (Twitter, Google News y otras fuentes). Alimenta el menú “Clima”.
• Tabla de clima de gobierno: almacena el conteo de publicaciones y su polaridad promedio, agrupadas por fecha, territorio (país) y fuente (Twitter o Google News) sólo para aquellas publicaciones en las que se mencione a un Presidente o a su Gobierno. Alimenta el menú “Gobiernos”.
• Tabla de palabras (Twitter): para cada palabra en los textos, almacena la frecuencia de su uso, junto con su tipo (palabra como tal, hashtag y mención) y efectividad promedio, agrupadas por fecha, territorio (país) y grupo (periodistas, medios, gobiernos o ninguno). Alimenta el menú “Conversación”.
• Tabla de usuarios (Twitter): para cada usuario de Twitter, almacena la efectividad promedio, la suma de favoritos, suma de RTs y el conteo de conversaciones, agrupadas por fecha, nombre de usuario, territorio (país) y grupo. Alimenta el menú “Protagonistas”.
• Tabla de tendencias: para cada uno de los términos (configurados por el administrador de esta herramienta), se almacena el conteo de publicaciones donde estos son mencionados, agrupado por fecha, la etiqueta del término y territorio (país). Alimenta el menú “Tendencias”.
Finalmente, cada vez que un usuario navega en alguna parte de la herramienta (por ejemplo, para visualizar un país en el mapa de libertad de prensa entre dos fechas), la herramienta procesa las tablas pre calculadas (en ese ejemplo, la tabla de clima). Algunas peticiones, como las conversaciones más populares, se realizan sobre las bases de datos en las que se almacenan las noticias y los tuits. En ambos casos, las respuestas son inmediatas.
Fuente: SIP
No hay comentarios.:
Publicar un comentario