Utilidades de Xpath en Google Docs

Xpath es un lenguaje que, mediante la construcción de expresiones, puede recorrer documentos tipo XML. Con esto, se pueden llevar a cabo análisis muy interesantes de documentos de este tipo. Sobre XML, podemos decir, que es un lenguaje de etiquetado similar a HTML, capaz de mostrar cómo se estructura una página, o cómo debería. La … Utilidades de Xpath en Google Docs

22 de agosto de 2011

12/06/202321:09

Mj Cachon

Xpath es un lenguaje que, mediante la construcción de expresiones, puede recorrer documentos tipo XML. Con esto, se pueden llevar a cabo análisis muy interesantes de documentos de este tipo.
Sobre XML, podemos decir, que es un lenguaje de etiquetado similar a HTML, capaz de mostrar cómo se estructura una página, o cómo debería. La principal diferencia con HTML es que tiene un objetivo más de distribución y almacenamiento de información, hasta el punto de no mostrar dichos datos.
Dicho esto, ahora vamos a pararnos a ver qué utilidades podemos aprovechar de ambas, si nos las llevamos a un documento de Google Docs. Antes de continuar, indicar un par de recursos imprescindibles para ahondar en este tema.

Y a continuación de leer y poner en práctica lo que cuentan en Distilled y Seo Gadget, aquí dejo un ejemplo interesante para seguir usuarios o hashtags de twitter relevantes

Monitorizar un hashtag de Twitter

Lo primero es irnos al buscador avanzado de twitter y buscar el hashtag que queramos analizar. Yo voy a usar para el ejemplo #aloloco

Acabo de darme cuenta, que con el nuevo diseño de este buscador, Twitter ha eliminado la opción de guardar como rss la búsqueda realizada, así que, usaremos un pequeño «parche» que creo funcionará!

Abrimos Google Docs –> Crear Nuevo –> Hoja de Calculo

Vamos a hacer un pequeño dashboard que nos muestre quién ha usado ese hashtag, con qué tweet, en qué fecha y hora se realizó la publicación, y como extra, vamos a incluir unas columnas que muestren followers y following de dichos usuarios, así como su Klout (aunque no sea la métrica de popularidad más objetiva).

Las cabeceras de columnas serían:

Hashtag – User – Url Tweet – Fecha y Hora – Tweet – User Twitter – Following – Follower – Klout

Ahora justo debajo de «Hashtag» en la celda A2, escribimos:

=importFeed("http://search.twitter.com/search.atom?q=+%23aloloco")

En cuanto demos al enter, se rellenan automáticamente filas y columnas con la información hasta «User Twitter».

Aquí viene un matiz, ya que «User» se muestra con formato «user twitter (nombre)», con lo cual, necesitamos obtener únicamente el user de twitter, sin el nombre entre paréntesis, para usar ese dato en la obtención de las columnas extras.
Para ello, debemos adentrarnos en el código fuente de twitter y ver cómo extraer la información que queremos. En este caso, los datos de seguidos y seguidores, llevan un id, que es el que vamos a rastrear. Con Klout, pasa lo mismo, es necesario hacer un pequeño análisis de la estructura de su código, para ver qué se puede extraer.
[Nota: las extensiones Firebug o Web Developer, pueden ser muy útiles para explorar código fuente]
De esta forma, una vez tengamos estos detalles resueltos, justo debajo de la columna de «Following», vamos a escribir una fórmula un poco más complicada, que nos permita extraer la cifra de Following de estos usuarios:

=importxml(«https://twitter.com/»&F2&»»; «//span[@id=’following_count’]»)

F2 corresponde a la columna "User Twitter", a la que hemos eliminado el paréntesis con el nombre, ya que si no hacemos esto previamente, no vamos a poder extraer información para la url http://twitter.com/usuario/(nombre-usuario).
Y hecho esto, ahora podemos hacer lo mismo con la columna "Follower", en la que mantenemos la fórmula, con un pequeño cambio, del id:

=importxml("https://twitter.com/"&F2&""; "//span[@id='follower_count']")

Con ambos datos seleccionados, podemos arrastrar las fórmulas hasta el final de ambas columnas para tener toda la información al completo.
El último paso es incluir la cifra de Klout, que se puede extraer con:

=importXML(«http://beta.klout.com/»&F2;»//div[@class=»]»)

Ahora ya tenemos un panel básico con el que monitorizar un hashtag, con los usuarios supuestamente más «relevantes», y otra información que podría incluirse. Lo mejor de todo es que cada vez que entremos a este Google Docs, la información se actualiza automáticamente (respetando los límites de 50 funciones por documento).
Trabajar con Google Docs, realizando extracciones de datos externos, tiene un límite de 50 funciones, con lo cual, esto es útil para ciertos casos, pero lógicamente no sería la solución idónea para monitorizar grandes cantidades de información.

Google Docs ofrece ayuda y artículos explicativos para trabajar con las distintas formas de exportar datos, con lo cual, por falta de recursos no será :D

Y un regalo para los que lean hasta el final: Lista de Querys Xpath para SEO

Soy MJ Cachón

Consultora SEO desde 2008, directora de la agencia SEO Laika. Volcada en unir el análisis de datos y el SEO estratégico, con business intelligence usando R, Screaming Frog, SISTRIX, Sitebulb y otras fuentes de datos. Mi filosofía: aprender y compartir.

Explorar por temas

data seo ecommerce estrategia herramientas migraciones seo onpage seo técnico

tal vez sea
de tu interés

Legibilidad de textos en español: ¿métricas alternativas a «Flesch Reading Ease»?

Cuando nos enfrentamos al reto de estudiar la legibilidad de contenidos en proyectos web encontramos literatura y métricas notorias como Flesch Reading Ease. La importancia de estas métricas está en algo sencillo y que no deberíamos dejar de tener presente: si nuestros textos o contenidos no se entienden fácilmente vamos a perder a nuestros usuarios. … Legibilidad de textos en español: ¿métricas alternativas a «Flesch Reading Ease»?

Leer artículo
Cómo crear un bot bueno en Twitter (I)

Cómo crear un bot de Twitter, pero no de esos que hablan en inglés, tienen fotos de perfil extrañas y nos spamean… No, no, yo quiero explicaros cómo crear un bot bueno, que comparta contenidos interesantes y que pueda llegar a ser relevante, recibiendo retweets, mentions y todo. Para empezar, ¿qué es un bot? En Twitter … Cómo crear un bot bueno en Twitter (I)

Leer artículo
Herramientas para evitar procrastinar

Selección de alguna herramienta útil para llevar a cabo esta organización, tanto de proyecto como de listas de tareas

Leer artículo

Utilidades de Xpath en Google Docs

Monitorizar un hashtag de Twitter

Soy MJ Cachón

Explorar por temas

tal vez sea de tu interés

Legibilidad de textos en español: ¿métricas alternativas a «Flesch Reading Ease»?

Cómo crear un bot bueno en Twitter (I)

Herramientas para evitar procrastinar

Deja una respuesta Cancelar la respuesta

tal vez sea
de tu interés