[Publicidad]
esteban.roman@eluniversal.com.mx
¿Cómo medir el silencio que —sabemos— golpea a los periodistas en distintas partes del país? La respuesta original se mantuvo a lo largo de la investigación: comparando homicidios (el más confiable de los registros delictivos de alto impacto) contra notas periodísticas sobre esos mismos delitos.
Es así que nos dimos cuenta de que lo más cercano a esa base era Google. Recaban datos desde 2004 y su tecnología de búsqueda permitiría filtrar el tipo de noticias que buscábamos de forma específica.
Pero Google News, nos dimos cuenta, no puede discriminar —sólo con un par de palabras llave— criterios que sólo un humano puede discernir, como la diferencia entre un homicidio doloso y uno culposo; o como una nota de seguimiento contra un breaking news.
Es entonces que se generó una combinación de keywords que fueron creadas a partir de ciclos de ensayo y error, hasta que la muestra resultante arrojó un resultado de 70% de notas útiles. Sin embargo, no podíamos fiarnos sólo de la supervisión humana. Siguió, por ello, un filtro de machine learning.
[Publicidad]
Más información

Confabulario
El fotógrafo de los espíritus libres en la ciudad de México: entrevista con Pieter Henket

Confabulario
Cesare Beccaria: el derecho como límite al Estado

Cultura
Un bebedor con su itinerario

Confabulario
“La mujeres cubanas hemos tenido una regresión en muchos campos”: entrevista a Zaida Capote Cruz





