Francisco Vidal Gonzales Sánchez · enfoque cuantitativo, cuyo diseño es el no experimental, de...
Transcript of Francisco Vidal Gonzales Sánchez · enfoque cuantitativo, cuyo diseño es el no experimental, de...
TÉCNICAS ESTADÍSTICAS MULTIVARIADAS Y SUS APLICACIONES EN
MARKETING
Francisco Vidal Gonzales Sánchez
Docente del Instituto de Educación Superior Tecnológico Manuel Núñez Butrón, Juliaca, Puno, Perú.
Resumen
El objetivo principal de la presente investigación es proporcionar un sistema que permita analizar
las posibles decisiones a tomar en función de los resultados encontrados aplicando métodos de
interdependencia es decir el análisis factorial de correspondencia simple. Los cálculos de las
estadísticas asociadas a ésta técnica multivariada son laboriosos y complejos, desde que la
cantidad de datos que se analizan es generalmente grande con numerosas operaciones
matriciales. Para facilitar estos cálculos se usó el paquete estadísticos SPSS®.PSS®.
Palabras clave: Mercadotecnia, Análisis factorial de correspondencia simple.
MULTIVARIATE STATISTICAL TECHNIQUES AND ITS MARKETING APPLICATIONS
Abstract
The main objective of the present investigation is to provide a system that allows to analyze the
possible decisions to be made in function of the results found applying methods of
interdependence, that is to say, the simple factorial analysis of correspondence. The calculations
of the statistics associated with this multivariate technique are laborious and complex, since the
amount of data being analyzed is generally large with numerous matrix operations. The statistical
package SPSS® was used to facilitate these calculations.
Keywords: Marketing, Simple correspondence factor analysis.
153153 - 164
ARTÍCULO ORIGINAL
Julio Diciembre
Revista de investigación “K uskiykuy” 2016; Vol 1 N° 1: 153 164
Introducción
La estadística permite optimizar las estrategias de Marketing a seguir, reduciendo el
riesgo y aportando una medición real del entorno de inversión. Esto es importante, puesto que
además de saber cuánto ha de invertir una empresa en sus acciones de marketing, también es
necesario medir qué rentabilidad se ha obtenido con dichas acciones. Podemos mencionar sin
temor a equivocarnos, que, no se puede gestionar lo que no se mide. Las mediciones son la clave.
Si usted no puede medirlo, no puede controlarlo. Si no puede controlarlo, no puede gestionarlo. Si
no puede gestionarlo, no puede mejorarlo.
La falta sistemática o ausencia estructural de estadísticas y métodos estadísticos en los
estudios de mercado de las organizaciones, impide una administración científica de las mismas.
Las empresas que no hagan uso de estas nuevas potencialidades y afronten debidamente
éstas nuevas exigencias, no sólo perderán capacidad competitiva, sino que quedarán
desacoplados ante los continuos cambios del entorno, poniendo en serio riesgo su propia
continuidad. Para negociar, para tomar decisiones, para corregir problemas de calidad, para
aumentar la productividad, para fijar precios, para mejorar el mantenimiento y disponibilidad de
las máquinas e instalaciones, para mejorar la concesión y cobranza de los créditos se requiere sí o
sí contar con datos estadísticos, y no solo de datos sino también de métodos estadísticos
coherentes para cada tipo de problema.
En tal sentido las aplicaciones de la estadística multivariada están presentes en
investigaciones de mercados, resulta en información valiosa para la identificación,
caracterización y descripción del mercado, lo que permite a la gerencia de mercadotecnia ajustar
la estrategia comercial en forma más precisa y con menor grado de incertidumbre.
En estadística, la información no sólo aporta medias y varianzas, como normalmente se
suele aducir, en cierta manera de forma despectiva. Los datos pueden seguir patrones subyacentes
que son definitivos para la explicación de fenómenos, y en el caso que nos ocupa, de patrones de
comportamiento en el análisis de los componentes del Marketing Mix
En muchas ocasiones, la aplicación de un análisis estadístico multivariante desentraña
una serie de comportamientos que a través del ojo del especialista en marketing de la empresa a
simple vista no se aprecian. En ese momento un buen analista estadístico podría ser de mucha
ayuda en el proceso de los datos.
Francisco Vidal Gonzales Sánchez
154 153 - 164
La vieja frase de “la información es poder” es cada vez más cierta, pero información de
calidad, no aquella que se obtiene empleando metodologías que no contribuyen a desentrañar una
serie de factores presentes.
Sin estadísticas coherentes una empresa carece de capacidad para reconocer qué
actividades o productos le generan utilidades, y cuales sólo pérdidas. No contar con datos e
interpretarlos correctamente es para los gestores como caminar en la oscuridad. Contar con los
datos les ilumina, les permite ver lo que está aconteciendo y en consecuencia tomar las decisiones
más apropiadas.
Materiales y Métodos
En cuanto a la metodología utilizada en el presente trabajo de investigación se utilizó el
enfoque cuantitativo, cuyo diseño es el no experimental, de tipo transversal. El alcance de
investigación es de carácter descriptivo y explicativo.
La metodología estadística utilizada se conoce como el análisis multivariante,
específicamente el análisis factorial de correspondencias simples. El análisis de
correspondencias es un método multivariante factorial de reducción de la dimensión de una tabla
de casos-variables con datos cualitativos con el fin de obtener un número reducido de factores,
cuya posterior interpretación permitirá un estudio más simple del problema investigado. El
trabajar con variables cualitativas o variables cualitativas categorizadas confiere a esta prueba
factorial una característica diferencial.
A todo esto podemos mencionar que algunos de los métodos estadísticos multivariables
que pueden ser empleados en estudios de mercado son:
Análisis de correspondencias y mapas perceptuales. Para la segmentación de
mercados, determinar asociaciones de conceptos y atributos con productos y servicios que los
contienen. Este análisis requiere Niveles Nominales para su cómputo, sin embargo sirve también
para convertir datos nominales como (si, no) en escalas métricas.
Análisis de conglomerados (Clusters). Para la segmentación de mercados,
perfilamiento de clientes y reducción de variables explicativas. Este análisis funciona mejor con
niveles de Intervalo, pero pueden funcionar positivamente con niveles ordinales.
Análisis factorial por componentes principales. Para la reducción de variables
explicativas. Requiere de niveles ordinales de los datos.
Modelos de elección discreta o CBC (Choice based Conjoint). Para la predicción de
Técnicas estadísticas multivariadas y sus aplicaciones en marketing
155153 - 164
elecciones de valor. Para que esta prueba trabaje, requerirá niveles de intervalo.
Modelos de regresión simple y múltiple, para la predicción de variables
dependientes. Utiliza cualquier tipo de variables - siempre y cuando sean numéricas -, aunque
funciona más efectivamente con variables independientes de razón.
Análisis discriminante. Para la segmentación de mercados, perfilamiento de clientes.
Redes neuronales. Para la segmentación de mercados, perfilamiento de clientes.
La utilización de la metodología de Análisis de Correspondencias en combinación con el
Análisis de Conglomerados resulta en una manera relativamente sencilla y útil para la obtención
de información relevante y de fácil interpretación relacionada con el comportamiento de los
mercados. Esta combinación de métodos se presenta como una ayuda efectiva al proceso
normalmente menos elaborado en el diseño de una estrategia comercial. Además, su utilidad
puede incrementarse en forma considerable en aquellos casos en que existan gran cantidad de
variables de segmentación asociadas.
La mayoría de las técnicas de análisis multivariado pueden ser utilizadas. No existe un
método ideal que pueda ser utilizado para cada estudio de mercado. Cada método tiene ventajas y
desventajas. Los estudios de mercado generalmente requieren de más de un método para dar
buenos resultados. Prácticamente en cada caso se deben de probar muchas técnicas antes de
determinar la mejor solución.
No obstante, es necesario destacar que este tipo de análisis debe ser validado
empíricamente mediante la combinación de investigaciones exploratorias con investigaciones
concluyentes que permitan evaluar la validez de los resultados desde el punto de vista de la
comprobación o rechazo de hipótesis de trabajo.
El Análisis de Correspondencias es un método adaptado para el tratamiento de tablas de
contingencia –tablas de frecuencias bidimensionales– que permite estudiar las eventuales
relaciones existentes entre las filas y columnas de dicha tabla a través de la representación gráfica
simultánea de las mismas.
El análisis Factorial de Correspondencia de una tabla de contingencia tiene como
objetivos fundamentales lo siguiente:
● Analizar toda la información contenida en una tabla de contingencia.
● Representar gráficamente la estructura de una tabla de contingencia.
● Producir estadísticas de control complementarios.
156 153 - 164
Francisco Vidal Gonzales Sánchez
● Analizar la estructura de una tabla de contingencia respetando el hecho que la
misma resume una relación simétrica entre los caracteres observados.
Tabla 1
Clasificación cruzada de k observaciones en una tabla de contingencia n x p
R =1 Ʃk 1j
j = 1
p
c =j Ʃn
i = 1
ki1
k = Ʃ Ʃn p
k ij
j = 1i = 1
Partimos, por tanto, de una tabla de contingencia K que se obtiene clasificando una
población o muestra según dos variables: la variable I, con n modalidades: I = {1, 2 ... i ... n}, y la
variable J, con p modalidades: J = {1, 2 ... j ... p}, de modo que cada elemento de la tabla k indica ij
la frecuencia conjunta de la fila i y de la columna j.
Las frecuencias marginales son designadas por para las filas y por para
las columnas, siendo la frecuencia total de la tabla. Todas estas frecuencias, que son
absolutas, pueden ser transformadas en frecuencias relativas fij a través de la relación fij = kij/k.
Tablas de perfiles-fila y de perfiles-columna
Dado que las distancias entre filas (o entre columnas) están condicionadas por sus masas,
es necesario hacerlas comparables mediante su transformación en perfiles-fila y en perfiles-
columna.
La tabla de perfiles-fila recoge las probabilidades condicionadas de presentar una
determinada modalidad j de la variable J sabiendo que se presenta la modalidad i de la variable I
(fij/fi.). El conjunto de perfiles-fila forma una nube de n puntos en el espacio de las p columnas.
Cada punto i tiene por coordenadas en p: {fij/fi. ; j = 1, 2 ... p}, y su masa fi. es igual a su frecuencia
relativa. El centro de gravedad GI de esta nube es la media de los perfiles-fila ponderados por sus
masas, y se corresponde con el perfil-fila medio, es decir, con las frecuencias marginales de las
columnas (f.j).
Variable JTotalVariable I
p...21
1
2
n
Total
...
k11 k12 k1p
k22
...
...
...
...
k2p
R =1 Ʃk 1j
j = 1
p
k21
kn1 kn2 knP
......
......
R =2 Ʃk 2j
j = 1
p
R =n Ʃk nj
j = 1
p
k = ƩƩn p
k ij
j = 1i = 1
c =p Ʃn
i = 1
kipc =2 Ʃn
i = 1
ki2c =1 Ʃn
i = 1
ki1
157153 - 164
Técnicas estadísticas multivariadas y sus aplicaciones en marketing
Análogamente, la tabla de perfiles-columna recoge las probabilidades condicionadas de
presentar una determinada modalidad i de la variable I sabiendo que se presenta la modalidad j de
la variable J (fij/f.j). El conjunto de perfiles-columna constituye una nube de p puntos en el
espacio de las n filas. Las coordenadas en n del punto j son:
{fij/f.j ; i = 1, 2 ... n}, y cada punto está afectado de una masa f.j . El centro de gravedad GJ
de la nube de perfiles-columna coincide con el perfil columna medio, y sus componentes son las
frecuencias marginales de las filas (fi.).
2Distancia X (ji-cuadrado)
Se define la distancia entre dos puntos-fila y entre dos puntos-columna como:
Ésta es una distancia euclídea ponderada respectivamente por el inverso de la masa de la
columna o de la fila para no favorecer a aquellas columnas o filas que tienen más masa. Así, la
dista 2ncia x va a otorgar la misma importancia a las columnas en el cálculo de la distancia entre
dos perfiles-fila, y a las filas, en el cálculo de la distancia entre perfiles-columna,
independientemente de cuáles sean sus frecuencias relativas.
Inercia de la nube de puntos
La inercia de la nube de puntos-fila respecto a su centro de gravedad es una medida de la
dispersión de la nube, y se calcula como suma ponderada de las distancias entre los puntos-fila y
su centro de gravedad usando como ponderación la masa de cada punto-fila, y como métrica la de 2la distancia x
Análogamente se obtiene la inercia de la nube de puntos-columna respecto a su centro de
gravedad:
Como vemos, la inercia de la nube de puntos-fila coincide con la de la nube de puntos 2 columna, y resulta ser igual al estadístico x de Pearson dividido entre la frecuencia total de la
tabla k.
d2
2x (i,i’) Ʃ
p
j = 11f.j ( )f ij .
fi. f i´jf i’j
2
y d2
2x (j,j ) Ʃ
n
i = 11f i . ( )f ij
f j. f ´jf i j
2´´
158 153 - 164
Francisco Vidal Gonzales Sánchez
H(I,G ) =I Ʃn
i = 1
.f i dx2
2(i,G ) =I Ʃn
i = 1
fi.Ʃj = 1
p
f j.( )f ji
fi ..f j
2
Ʃi = 1
n
Ʃj = 1
p
(f ji jif f. .
..if f j
(2
H(J,G ) =J
Ʃp
j = 1
.f j dx2
2(j,G ) =j Ʃnp
j = 1
f j. Ʃi = 1
n
f i .( )f ji
f i..f i
2
Ʃi = 1
n
Ʃj = 1
p
(f ji jif f. .
..if f j
(2
1
Por lo tanto, la inercia de la nube será tanto mayor cuanto mayor sea la distancia entre los
puntos y su centro de gravedad o, planteado de otro modo, cuanto más se alejen las frecuencias de
la condición de independencia.
Obtención de las dimensiones y coordenadas factoriales
El objetivo del Análisis de Correspondencias será determinar sendos subespacios que
maximicen las inercias de las proyecciones de las respectivas nubes de puntos-fila y puntos-
columna.
Para el ajuste de la nube de puntos-fila, si denotamos por la proyección del punto-
fila i sobre el eje factorial o dimensión □ α, la dimensión 1 será aquella que maximice la inercia o
varianza ponderada de las proyecciones de los puntos-fila sobre dicha dimensión
La dimensión 2 también será aquella que maximice la inercia de las proyecciones de los
puntos-fila sobre dicha dimensión pero con la restricción de que las coordenadas
de las proyecciones de los puntos-fila sobre la dimensión 2 deben ser ortogonales a las obtenidas
para la dimensión . Las dimensiones sucesivas serán también aquellas que
maximicen la inercia de las proyecciones con la restricción de ser ortogonales a las dimensiones
anteriores.
El ajuste de la nube de puntos-columna se realizará de forma análoga. Si se denota por
la proyección del punto-columna j sobre el eje factorial o dimensión la dimensión 1 será aquella α
que maximice la inercia ponderada de las proyecciones de los puntos-columna sobre dicha
dimensión y las dimensiones siguientes serán esas que maximicen la inercia de
las proyecciones pero con la restricción de ser ortogonales a todas las dimensiones obtenidas
anteriormente.
Relaciones de transición o cuasi-baricéntricas
Aunque, como se acaba de señalar, el Análisis de Correspondencias da lugar a sendas
soluciones para las nubes de los puntos-fila y de los puntos-columna, una característica
importante de esta técnica es que ambas soluciones están estrechamente ligadas a través de las
denominadas relaciones de transición o cuasi-baricéntricas, que vienen dadas por las expresiones
siguientes:
(λ1 = Ʃi f .ψ
ψαi
i 2 1i)
(λ 2 = Ʃi f .ψi 2 2i)
1( = Ʃi f .ψi 2i )1i ψ
ᵠ αj
(λ1 = Ʃj f. ψj 2 1j)
159153 - 164
Técnicas estadísticas multivariadas y sus aplicaciones en marketing
λ ᵠ ψ Ʃαi
1 f
α
i j
f .ij =1
p
αj √
λ ᵠ ψ Ʃαj
1 f
α
i j
f.ji =1
n
αi √
y
Estas relaciones permiten obtener, para cada dimensión, las coordenadas de los puntos-
fila a partir de las coordenadas de los puntos-columna, y viceversa. Las relaciones de transición
prueban también la igualdad de las dimensiones del ajuste de la nube de puntos-fila y de la nube
de puntos-columna, siendo el número total de dimensiones extraídas igual al mínimo de n–1 y
p–1.
Resultados y discusión
Utilizando el programa estadístico SPSS versión 23, mostramos los resultados del
análisis de correspondencia en el estudio de mercado sobre la preferencia de los consumidores
hacia los chocolates, en la cual se obtiene mediante la tabulación de una de las preguntas la
siguiente matriz de correspondencias.
Tabla 2
Tabla de correspondencias
En ella podemos ver que por ejemplo existen 14 mujeres jóvenes consumidoras
compulsivas, 12 consumidoras por costumbre y 16 consumidoras ocasionales.
160 153 - 164
Francisco Vidal Gonzales Sánchez
Tabla 3
Perfiles de fila
Tabla 4
Perfiles de columna
Si analizamos los perfiles fila, observamos que los cuatro segmentos demográficos,
parece que hubiera una leve semejanza entre mujeres jóvenes y adultas, asimismo en hombres
jóvenes y adultos. Si observamos los perfiles columna, en estos parece que existe semejanza entre
Consumidores por costumbre y ocasionales.
Tabla 5
Tabla Resumen
a. 6 grados de libertad.
161153 - 164
Técnicas estadísticas multivariadas y sus aplicaciones en marketing
En esta tabla destacaremos varios aspectos:
Valor propio.
Inercia: raíz cuadrada del valor propio. Mide la importancia de un eje; 0.134 el primero y
0.003 el segundo.
Inercia total: explicación total de los ejes. Los ejes explican un total de 0.137.
Proporción de inercia: aunque el valor de la inercia podía parecer pequeño, 0.134 y 0.003,
entre ambos ejes explican el 100 de la varianza y más concretamente el primero el 98% y el
segundo el 2 %.
Chi-cuadrado: con este valor obtenemos el contraste de independencia entre ambas
variables, es decir el contraste de la chi-cuadrado en las Tablas de Contingencia contrasta la
independencia como hipótesis nula frente a la dependencia. En este caso al ser el p-valor 0.002
aceptaríamos la hipótesis de dependencia entre variables.
Tabla 6
Examen de los puntos de fila (con normalización simétrica)
.227 -.789 -.278 .053 .385 .336 .983 .017 1.000HomnbreAdunto
Examen de puntos fila
Las puntuaciones en la dimensión son los valores que toma cada punto en la
representación que hayamos calculado. Con inercia vemos lo que aporta cada categoría al total de
inercia, por ejemplo, del total de inercia (0.137) los hombres jóvenes aportan 0.024.
Con contribución de los puntos a la inercia de la dimensión se mide la importancia de un
punto a la hora de explicar un eje, por ejemplo hombre adulto es el valor más importante para la
orientación del primer eje y hombre joven para el segundo.
Con contribución de la dimensión a la inercia del punto vemos el porcentaje de cada
modalidad explicado por cada eje, el primer eje explica el 98.30% del segmento demográfico
hombre adulto frente a solo el 1,7% del segundo eje.
162 153 - 164
Francisco Vidal Gonzales Sánchez
Tabla 7
Examen de los puntos columna (con normalización simétrica)
.541 8.000
Examen de los puntos columna
Igual que el caso anterior, además de los valores para representar en los ejes, podemos ver
que el primer eje viene muy determinado por el consumidor compulsivo frente al segundo que lo
hace por el consumidor por costumbre. También podemos ver que el primer eje explica el 99.4%
de la varianza de los consumidores compulsivos y ocasionales y el 45.2% de consumidores por
costumbre.
Note en el mapa conceptual (figura Nº 1) los puntos de tipos de consumidor compulsivo y
de costumbre, se encuentran próximos a los puntos de los segmentos demográficos mujer joven,
mujer adulta respectivamente, esto indica que, estamos en presencia de una fuerte relación entre
ambas variables.
Dim
ensi
ón 2 0.4
0.2
0.0
-0.2
-0.4-1.0 -0.5 0.0 0.5 1.0
Hombre Joven
Ocasional
Hombre Adulto
Mujer Joven
Mujer Adulta
Costumbre
Compulsivo
ConsumidorSegmentodemográfico
Figura Nº 1. Mapa Conceptual de la Relación entre Tipos de Consumidores y Segmentos
Demográficos.
Note también que el punto del segmento demográfico hombre joven está muy cerca del
punto tipo de consumidor ocasional, esto indica que existe una muy fuerte relación entre estas
variables.
163153 - 164
Técnicas estadísticas multivariadas y sus aplicaciones en marketing
Mientras más cerca esté los puntos de tipos de consumidores, de los puntos de segmentos
demográficos, más fuerte es la asociación. Lo mismo cuando los puntos de tipos de consumidores
se alejan de los puntos de segmentos demográficos, el grado de interacción entre las variables
disminuye.
Luego mientras más alejado este el punto, tipo de consumidor del o los puntos de
segmento demográfico entonces dicho segmento(s) demográfico(s) no se relaciona(n) con el tipo
o tipos(s) de consumidor(es). Es el caso del segmento demográfico hombres adultos con el tipo de
consumidor compulsivo. Mientras más lejos se encuentren los puntos, mayor será la ausencia de
relación entre las variables.
Conclusiones
El análisis factorial de correspondencia simple, permitió determinar los segmentos de
mercado de una manera eficiente, así se encontró que; las mujeres jóvenes y adultas son
consumidoras compulsivas y de costumbre, mientras que los hombres jóvenes son consumidores
ocasionales más que los hombres adultos.
Referencias
Cuadras, Charles. Nuevos métodos de análisis multivariante. Barcelona: CMC Editions
Manacor, 2014.
Gary Armtronf, Philip Kotler. Fundamentos de Mercadotecnia. México: Prentice Hall , 1998.
Greenacre, Michael. La práctica del análisis de correspondencias. Fundación BBVA, 2008.
Jiménez, Ezequiel Uriel, y Joaquín Aldas Manzano. Análisis multivariante aplicado. Editorial
S.A. Ediciones Paraninfo, 2005.
Lind, Douglas, William Marchal, y Samuel Wathen. Estadística Aplicada a los Negocios y a la
Economía. México: McGraw-Hill, 2005.
Peña, Daniel. Análisis multivariante. McGraw-Hill, 2002.
White, Sarah. Mercadotecnia ¡Fácil! México: Prentice Hall, 2006.
Información de contacto:Francisco Vidal Gonzales Sánchez
Fecha de recepción: 04 de mayo 2016Fecha de aceptación: 18 de julio 2016
164 153 - 164
Francisco Vidal Gonzales Sánchez