Cómo fusionar ficheros excel con r

16 de septiembre de 2021
09/06/202315:51

¿Quien no se ha encontrado en alguna ocasión descargando ficheros de alguna herramienta para hacer keyword research? Podemos mencionar Keyword Planner de Adwords, KeywordTool.io, SISTRIX, Ahrefs, y otras muchas….

Formato del excel que nos descargamos

Me centro en la herramienta keywordtool.io, que da información de suggest de Google y también ofrece el dato del volumen de búsqueda extraído de la api de Adwords. Lo que descargas es esto:

Formato descarga keyword tool

¿Pero si me he descargado 20, 30, o. más ficheros como este, qué, lo hago manual? Qué habría que hacer:

  • Fusionar todos los ficheros que nos hayamos descargado, uno a uno.
  • Desduplicar las keywords que estén repetidas
  • Eliminar las filas de aquellas keywords que no tengan datos, en la imagen de ejemplo serían las que van de la fila 21 a la 28
  • Poner un 0 en los campos vacíos de las distintas columnas (volumen de búsqueda de los últimos meses)

Ya os podéis imaginar lo que lleva en tiempo hacer esto a mano fichero a fichero…. para tirarse de los pelos como mínimo.

Script de R para automatizar la gestión de datos

Espero que los expertos reales en R no se me tiren al cuello, yo aún soy una aprendiz y utilizo las tareas SEO cotidianas para aplicar en R a modo de retos que me ayuden a seguir aprendiendo y sacando nuevas utilidades a R, algo que me aporta mucho personalmente.  Si hay formas de hacer esto más ágiles, más creativas o más cortas incluso, soy toda oídos 🙂

Lo que hace este script corto y sencillo es lo siguiente:

  • Instalar las librerías necesarias
  • Indicarle a R en qué carpeta están los ficheros
  • Crear una lista con los archivos y un dataframe que será dónde se fusionen
  • El bucle que recorre la lista y deja en el dataframe toda la info
  • Operaciones de manipulación del dataframe para dejarlo limpio (sin diplucados, campos vacíos)
  • Descarga en formato excel para trabajar

¿Cómo evolucionarlo?

Yo lo he hecho para un caso concreto: los export de KeywordTool.io. Pero como es normal, hay muchas herramientas y cada csv/excel que se exporta tiene unas idiosincrasias, la cosa es ver qué hace falta hacer y utilizar las librerías que R nos ofrece, por lo que hay muchas aplicaciones adicionales o incluso la opción de construir un script que limpie cualquier tipo de fichero exportado de una herramienta SEO.

También hay otra evolución chula que sería volcar el fichero resultante a un Google Drive automáticamente, darle formato, y miles de cosas posibles, pero por ahora, yo os dejo el que está basado en keywordtool.io que es a lo que habéis venido aquí 🙂

Hasta otra y…..Enjoy!!

Soy MJ Cachón

Consultora SEO desde 2008, directora de la agencia SEO Laika. Volcada en unir el análisis de datos y el SEO estratégico, con business intelligence usando R, Screaming Frog, SISTRIX, Sitebulb y otras fuentes de datos. Mi filosofía: aprender y compartir.

Explorar por temas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *