Enmarcados en el cruce entre la sociología de la traducción y las humanidades digitales, presentaremos los pasos metodológicos que hemos seguido en la construcción de una base de datos unificada sobre traducciones, traductores y traductoras en revistas iberoamericanas (1898-1959). Esta base de datos homogeneiza metadatos de 395 revistas, extraídos de 5 repositorios digitales. En este artículo, nos detendremos en explicar cómo hemos construido la categoría “traducción”, de difícil detección por 2 motivos: 1-histórico, ya que la traducción no era una práctica cultural declarada; 2-bibliotecológico, dado que las fichas hemerográficas no suelen proporcionar información sobre traducción o lenguas de origen de los contenidos de las revistas. En ese sentido, explicaremos el experimento que hemos desarrollado con técnicas de Procesamiento de Lenguaje Natural para poder enriquecer los datos relativos a este campo y así establecer el porcentaje de “traducciones probables”. El objetivo final es poder realizar un análisis masivo para detectar patrones relativos a la traducción literaria como práctica central en la modernización del espacio literario transnacional.