¿Quien no se ha encontrado en alguna ocasión descargando ficheros de alguna herramienta para hacer keyword research? Podemos mencionar Keyword Planner de Adwords, KeywordTool.io, SISTRIX, Ahrefs, y otras muchas….
Formato del excel que nos descargamos
Me centro en la herramienta keywordtool.io, que da información de suggest de Google y también ofrece el dato del volumen de búsqueda extraído de la api de Adwords. Lo que descargas es esto:

¿Pero si me he descargado 20, 30, o. más ficheros como este, qué, lo hago manual? Qué habría que hacer:
- Fusionar todos los ficheros que nos hayamos descargado, uno a uno.
- Desduplicar las keywords que estén repetidas
- Eliminar las filas de aquellas keywords que no tengan datos, en la imagen de ejemplo serían las que van de la fila 21 a la 28
- Poner un 0 en los campos vacíos de las distintas columnas (volumen de búsqueda de los últimos meses)
Ya os podéis imaginar lo que lleva en tiempo hacer esto a mano fichero a fichero…. para tirarse de los pelos como mínimo.
Script de R para automatizar la gestión de datos
Espero que los expertos reales en R no se me tiren al cuello, yo aún soy una aprendiz y utilizo las tareas SEO cotidianas para aplicar en R a modo de retos que me ayuden a seguir aprendiendo y sacando nuevas utilidades a R, algo que me aporta mucho personalmente. Si hay formas de hacer esto más ágiles, más creativas o más cortas incluso, soy toda oídos 🙂
Lo que hace este script corto y sencillo es lo siguiente:
- Instalar las librerías necesarias
- Indicarle a R en qué carpeta están los ficheros
- Crear una lista con los archivos y un dataframe que será dónde se fusionen
- El bucle que recorre la lista y deja en el dataframe toda la info
- Operaciones de manipulación del dataframe para dejarlo limpio (sin diplucados, campos vacíos)
- Descarga en formato excel para trabajar
¿Cómo evolucionarlo?
Yo lo he hecho para un caso concreto: los export de KeywordTool.io. Pero como es normal, hay muchas herramientas y cada csv/excel que se exporta tiene unas idiosincrasias, la cosa es ver qué hace falta hacer y utilizar las librerías que R nos ofrece, por lo que hay muchas aplicaciones adicionales o incluso la opción de construir un script que limpie cualquier tipo de fichero exportado de una herramienta SEO.
También hay otra evolución chula que sería volcar el fichero resultante a un Google Drive automáticamente, darle formato, y miles de cosas posibles, pero por ahora, yo os dejo el que está basado en keywordtool.io que es a lo que habéis venido aquí 🙂

Hasta otra y…..Enjoy!!
Soy MJ Cachón
Consultora SEO desde 2008, directora de la agencia SEO Laika. Volcada en unir el análisis de datos y el SEO estratégico, con business intelligence usando R, Screaming Frog, SISTRIX, Sitebulb y otras fuentes de datos. Mi filosofía: aprender y compartir.