A menudo cuando echamos un vistazo a los datos sociodemográficos de la audiencia en Google Analytics, nos encontramos con que aparecen diferentes códigos de idiomas que pueden confundirnos un poco.
Por ejemplo, podemos ver “es”, “es-es”, “es-mx” o incluso “es-419”. En este post queremos analizar los diferentes escenarios que generan dichos códigos y cómo podemos agruparlos para obtener datos unificados.
Antes de seguir avanzando, lo primero que tenemos que preguntarnos es:
¿Cómo funciona la segmentación por idioma dentro de Google Analytics?
El idioma se otorga en función de la configuración del navegador del usuario, para ello se utilizan dos códigos, el ISO 639.2 que determina el idioma y el ISO 3166 que identifica la región.
Resuelto esto, vemos un ejemplo con los últimos datos del mes de uno de nuestros blogs.
Si tomamos de referencia los idiomas vemos que los 3 primeros se corresponden al mismo, pero con pequeñas variaciones.
La siguiente pregunta que tenemos que hacernos es:
¿Por qué Google Analytics utiliza tres códigos diferentes para mostrar un mismo idioma?
La respuesta la encontramos en el propio funcionamiento, al obtener el idioma de la configuración del navegador encontramos estas discrepancias ya que no todos los navegadores utilizan el mismo sistema.
Para ver mejor cómo actúa podemos filtrar por navegador nuestros resultados y lo veremos con mayor claridad.
Chrome por ejemplo, únicamente utiliza la variación de idioma:
Además si vamos a la configuración de idioma del propio navegador lo podemos ver.
Firefox sin embargo funciona de forma diferente, nos muestra la opción regional en determinadas ocasiones;
Y la respuesta a ello la encontramos también en la propia configuración.
Seguro que algunos os estaréis preguntando, ¿y qué genera ese “es-419” que aparece en mis informes?
Cuando seleccionamos “español (Latinoamérica)” en Google Chrome se otorga esa serie numérica extraída del estándar UN M.49, siendo el 419 el código que engloba la zona de Latinoamérica y el Caribe.
La última pregunta que planteamos a lo largo de este post es:
¿Cómo puedo unificar los resultados de un mismo idioma?
Con los segmentos personalizados podemos agrupar todas las variaciones que contienen es con una sencilla expresión regular:
Sara Urazán
Gracias, clara y precisa la información
Iñaki
Gracias por el artículo, sólo buscaba que era el es-419 pero he descubierto también como meter expresiones regulares en los informes. Un descubrimiento.
Luis
Muy interesante las aclaraciones. Gracias.