¿Cómo determinar una campaña de encuestas con Análisis de Datos?

Jun 5, 2014   //   by wpuser   //   Minería de Datos  //  Comentarios desactivados en ¿Cómo determinar una campaña de encuestas con Análisis de Datos?

Usualmente, antes de realizar un estudio de mercado, o de aplicar campañas de ventas, introducción de nuevos productos en el mercado, o simplemente, la idea de realizar una encuesta a nuestros clientes para valorar ciertos indicadores, siempre tenemos  una primera incógnita: ¿A quiénes de mis clientes debo realizar la encuesta, para que esta sea fiable?

Si tenemos pocos clientes (no deseable), y los conocemos en profundidad, es relativamente sencillo seleccionar una muestra de los mismos para realizar la encuesta o el sondeo de opinión, pero cuando tenemos cientos o miles de clientes, de todo tipo de tamaño y “pelaje”, ¿Cómo puedo asegurarme de que recojo en una muestra sencilla la mayoría de los perfiles posibles que me den una representación veraz de la información? Es en este caso, cuando herramientas analíticas de Minería de Datos, de una forma automatizada y sencilla, nos puede dar la respuesta.

Y la respuesta está en la propia pregunta:  hay que perfilar los clientes. Dado que existen algoritmos muy maduros de segmentación y clasificación, con este tipo de herramientas, modelándolas un poco, seremos capaces de seleccionar de forma óptima y elegante la muestra perfecta para nuestro estudio.

  • Pero, ¿Cómo se hace?  Lo primero y evidente, (a veces no tanto),  es introducir los datos que podamos de nuestros clientes y, por ejemplo, sus ventas,  en el sistema, (cuantos más, mejor).  Después, lanzamos un análisis de correlación para identificar qué variables o indicadores son los que tienen mayor relevancia en el modelo de datos de origen, de esta forma, anulamos las variables que se repiten muchas veces, que son poco representativas (tienen muchos valores únicos), aquellas que tienen datos nulos, y dejamos el “set” de datos listo para el proceso de clasificación.

indicadores_relevantes

  •  Una vez filtrados los indicadores “interesantes”, dados por el sistema, generamos una segmentación automática, que nos indica, sin que el sistema sepa “nada a prirori”, cómo los datos se distribuyen en “perfiles” homogéneos en base a sus datos.

Dependiendo de qué tipo de datos estamos utilizando (más numéricos que alfanuméricos, o mixto), podremos utilizar un tipo de algoritmos u otros.

cluster_automatico

  • El secreto está en determinar cuál es el número óptimo de perfiles a dividir el conjunto completo de los datos. Para ello, se pueden aplicar clasificadores que “evalúen” lo bueno o malo que es el distinto conjunto de datos a la hora de predecir a qué segmento pertenecen.

x-validacion_cluster

Además, podemos generar un “mapa de perfiles” que nos permita analizar de un “vistazo”cuál es el “prototipo” o “centroide” de cada segmento, y así, identificar cada segmento con sus datos principales, e incluso, poder ponerles nombre, si lo deseamos, a cada distribución de datos (esto, aún, las máquinas no saben hacerlo bien):

Perfiles_tipo_Segmentación

Finalmente, cuando ya tenemos los segmentos debidamente clasificados, sólo tenemos que ver qué proporción sobre el universo general le corresponde a cada segmento, y en base a esta proporción, seleccionar un número de individuos representativo. Es decir, si queremos tomar 100 individuos, y el cluster1 supone un 30% del universo, cogeremos 30 individuos de este cluster.

  • ¿Cómo podemos seleccionar los individuos de cada cluster? Existen dos opciones.. La primera y más sencilla, al azar… Le decimos al sistema que tome al azar un porcentaje de cada perfil en base a su distribución general,  y listo.

perfiles_en_mapa

Otra forma más “inteligente” es decidir, dentro de cada perfil, que estrato seleccionamos. Por cada grupo, habrá clientes que estén más cerca del “prototipo” principal de dicho grupo, y otros que estén más lejos, es decir, que pertenecen a ese grupo, pero están cerca de pasarse a otro (imagínense que un grupo es el de los clientes fieles, y otro el de los desertores: habrá individuos que estén “lejos” del centro de los “fieles“, que aunque son “fieles“, están cerca de “desertar“). De esta forma, este análisis no sólo sirve para realizar la encuesta, sino también para detectar anomalías entre los clientes de cada grupo.

perfiles_en_mapa_centroides_vs_desertores

Así, de los 30 individuos que tenemos que tomar del perfil1, por ejemplo, podemos tomar 10 clientes cerca del “centro” del cluster, 5 en el extremo superior, y 5 en el extremo inferior, permitiendo al sistema seleccionar, de entre los clientes del tipo de perfil 1, una distribución importante de los “centrales“, pero también poder recabar la información de los extremos, que posiblemente puedan ser los descontentos.

Con esta selección automática, nos aseguramos de tener la información de la opinión de los distintos tipos de clientes, sin olvidarnos de ninguno.

individuos_seleccionados_para_encuesta

Finalmente, la interpretación de las encuestas, en base a los perfiles, se puede agilizar con un clasificador en base a los contenidos de las mismas, de forma que podamos “triangular” automáticamente los perfiles de las respuestas, en un proceso similar al explicado, pero con los datos de las respuestas agregados a los datos iniciales tomados en la investigación.

Ya saben, cualquier consulta adicional al respecto, dudas, o ayuda en este tipo de procesos, no duden en contactar con nosotros.

Comments are closed.