Análisis de datos

Cómo analizar datos como un científico especializado en encuestas

Crea una encuesta hoy mismo

Ahora que recopilaste los resultados de tu encuesta y tienes un plan de análisis de datos, es hora de explorar y analizar los datos. Así es cómo los científicos de investigación de encuestas analizan los datos cuantitativos (versus analizar los datos cualitativos), al observar las respuestas y enfocarse en sus preguntas de investigación más populares y en los objetivos de la encuesta, para procesar los números y sacar conclusiones.

Estos son CUATRO pasos orientados a demostrar cómo analizar datos de manera más eficaz:

  1. Observa tus preguntas de investigación más populares.
  2. Tabula de forma cruzada y filtra tus resultados.
  3. Analiza los números.
  4. Saca conclusiones.

Analiza tus preguntas principales de investigación

Primero, hablemos acerca de cómo analizar los resultados de tus preguntas principales de investigación. Recuerda que esbozaste las preguntas principales de investigación cuando estableciste un objetivo para tu encuesta.

Por ejemplo, si organizaste una conferencia de educación y entregaste a los asistentes una encuesta de comentarios después del evento, una de las principales preguntas de investigación podría ser esta: ¿Cómo califican los asistentes la conferencia en general? Ahora, observa las respuestas que recopilaste para una pregunta de la encuesta específica que se refiere a esa pregunta principal de investigación:

Screen Shot 2014-03-05 at 10.46.26 AM

Ten en cuenta que en las respuestas tienes algunos porcentajes (71 %, 18 %) y algunos números en bruto (852, 216).

Los porcentajes son solo eso, el porcentaje de personas que ofreció una respuesta particular. En otras palabras, los porcentajes representan la cantidad de personas que dieron cada respuesta como una proporción del número de personas que respondieron la pregunta. Entonces, 71 % de los encuestados (852 de los 1200 encuestados) planean volver el siguiente año.

Esta tabla también muestra que el 18 % dice que no tiene planeado regresar y el 11 % dice que no está seguro.

Los números brutos son la cantidad de encuestados individuales que dieron cada respuesta. Entonces, 852 personas dijeron, "Sí, ¡regresaré el siguiente año!" Si asumes que la mayoría de las personas dijo sí, y quizás algunas de las personas que dijeron que no estaban seguras, volverán el siguiente año, puedes crear un modelo de pronóstico para estimar la cantidad de personas* que asistirán a la conferencia del siguiente año. *Puedes determinar este número con mayor confianza si tuviste un índice de participación muy alto, esto significa que la mayoría de las personas que asistió a la conferencia y recibió tu encuesta la completó.

Tabulación cruzada y filtrado de resultados

Recuerda que cuando estableciste un objetivo para tu encuesta y desarrollaste el plan de análisis, pensaste qué subgrupos ibas a analizar y comparar. Ahora es el momento en que esa planificación entra en juego. Por ejemplo, digamos que querías ver cómo los maestros, estudiantes y administradores se comparan entre ellos al responder la pregunta acerca de la conferencia del siguiente año. Para averiguarlo, te conviene crear una tabulación cruzada, que muestra los resultados de la pregunta de la conferencia por subgrupo:

Screen Shot 2014-03-05 at 10.54.10 AM

En esta tabla ves que la gran mayoría de los estudiantes (86 %) y maestros (80 %) planea regresar el siguiente año. Sin embargo, los administradores que asistieron a tu conferencia se ven diferentes, ¡con menos de la mitad (46 %) de ellos que tienen la intención de regresar! Con suerte, algunas de nuestras otras preguntas te ayudarán a descubrir por qué y qué puedes hacer para mejorar la conferencia para los administradores, a fin de que más de ellos regresen año tras año.

Utilizar filtros es otra herramienta útil para analizar datos. Filtrar significa reducir tu enfoque a un subgrupo particular y dejar fuera a los demás. Por lo tanto, en lugar de comparar subgrupos entre sí, aquí solo observamos cómo un subgrupo respondió la pregunta. Por ejemplo, podrías limitar tu enfoque a solo mujeres, o solo hombres, luego, volver a realizar la tabulación cruzada por tipo de asistente para comparar las administradoras, maestras y estudiantes mujeres. Una cosa a tener en cuenta a medida que segmentas tus resultados: cada vez que aplicas un filtro o tabulación cruzada, el tamaño de la muestra se reduce. Para asegurarte de que los resultados sean estadísticamente significativos, podría ser útil usar una calculadora de tamaño de la muestra.

Puntos de referencias, tendencias y datos comparativos

Digamos que en tu encuesta de comentarios de la conferencia, una pregunta clave es, "¿En general, cuán satisfecho estuvo con la conferencia?" Tus resultados muestran que el 75 % de los asistentes estuvo satisfecho con la conferencia. Eso parece muy bueno. No obstante, ¿no te gustaría obtener un poco de contexto? ¿Algo con qué compararlo? ¿Es mejor o peor que la del año anterior? ¿Cómo se compara con otras conferencias?

Bien, digamos que formulaste esta pregunta en la encuesta de comentarios de la conferencia después de la conferencia del año anterior. Podrás hacer una comparación de tendencia. Los encuestadores profesionales son malos comediantes, pero una frase favorita es "la tendencia es tu amiga".

Si el índice de satisfacción del año anterior fue del 60 %, incrementaste la satisfacción en 15 puntos porcentuales! ¿Qué provocó este incremento de la satisfacción? Con suerte, las respuestas a otras preguntas en la encuesta ofrecerán algunas respuestas.

Si no posees datos de la conferencia de años anteriores, haz que este año sea el comienzo de la recopilación de comentarios después de cada conferencia. Esto se denomina comparar con un punto de referencia. Estableces un punto de referencia o número inicial y, al avanzar, puedes ver si y cómo esto cambia. Puedes comparar con un punto de referencia no solo la satisfacción de los asistentes, sino también otras preguntas. Podrás hacer un seguimiento, año tras año, acerca de qué piensan los asistentes de la conferencia. Esto se denomina análisis longitudinal de los datos. Obtén más información acerca de cómo

SurveyMonkey Benchmarks puede ayudarte a obtener contexto de los resultados de la encuesta.

¿Qué es el análisis longitudinal?

El análisis longitudinal de los datos (con frecuencia denominado "análisis de tendencia") básicamente es el seguimiento de cómo los resultados de preguntas específicas cambian con el tiempo. Una vez que se establece un punto de referencia, puedes determinar si y cómo los números cambian. Imagina que el índice de satisfacción para tu conferencia fue del 50 % hace tres años, 55 % hace dos años, 65 % el año pasado y 75 % este año. ¡Felicitaciones! El análisis longitudinal de los datos muestra una tendencia sólida ascendente en la satisfacción.

Incluso puedes hacer un seguimiento de los datos para subgrupos diferentes. Por ejemplo, digamos que los índices de satisfacción se incrementan año con año para los estudiantes y maestros, pero no para los administradores. Te conviene observar las respuestas de los administradores a las diversas preguntas para ver si puedes obtener percepciones de por qué están menos satisfechos que otros asistentes.

Analizar los números

Ya sabes cuántas personas dijeron que regresarían, pero ¿cómo puedes saber si tu encuesta entregó respuestas en las que puedes confiar y respuestas que puedes utilizar con confianza para tomar futuras decisiones? Es importante prestar atención a la calidad de tus datos y comprender los componentes de la importancia estadística.

En las conversaciones cotidianas, la palabra "importante" significa valioso o destacado. En el análisis y estadísticas de encuestas, importante significa "una evaluación de la exactitud". Aquí es donde de manera inevitable comienza a funcionar el "más o menos". En particular, significa que los resultados de la encuesta son exactos dentro de un cierto nivel de confianza y no debido al azar. Sacar conclusiones basadas en resultados que no son exactos (es decir, que no son estadísticamente significativos) es riesgoso. El primer factor para considerar en cualquier evaluación de importancia estadística es la representación de tu muestra, es decir, hasta qué punto el grupo de personas que incluiste en la encuesta "representa" a la población total de personas acerca de quién deseas sacar conclusiones.

Tienes un problema si el 90 % de los asistentes a la conferencia que completaron la encuesta eran hombres, pero solo el 15 % de todos los asistentes eran hombres. Cuanto más sepas acerca de la población que te interesa estudiar, más confianza puedes tener cuando tu encuesta se alinea con esos números. Al menos cuando se trata de sexo, te sientes bien si los hombres conforman el 15 % de los encuestados en este ejemplo.

Si la muestra de tu encuesta es una selección aleatoria de una población conocida, la importancia estadística puede calcularse de manera directa. Un factor principal aquí es el tamaño de la muestra. Imagina que 50 de las 1000 personas que asistieron a la conferencia respondieron a la encuesta. Cincuenta (50) es un tamaño de muestra pequeño y genera un amplio margen de error. En resumen, tus resultados no tienen demasiado peso.

Digamos que les preguntaste a los encuestados a cuántas de las 10 sesiones disponibles asistieron durante el transcurso de la conferencia. Y tus resultados se ven así:

Screen Shot 2014-03-05 at 11.02.19 AM

te conviene analizar el promedio. Como puedes recordar, existen tres tipos diferentes de promedio: media, mediana y moda.

En la tabla que se muestra arriba, el número promedio de asistencia a las sesiones es 6.3. El promedio informado aquí es la media, el tipo de promedio que probablemente conozcas mejor. Para determinar la media, sumas los datos y divides eso por la cantidad de números que sumaste. En este ejemplo, tienes 10 personas que dicen haber asistido a una sesión, 50 personas a cuatro sesiones, 100 personas a cinco sesiones, etc. Entonces, multiplicas estos pares juntos, los sumas y divides por el número total de personas.

La mediana es otro tipo de promedio. La mediana es el valor medio, la marca del 50 %. En la tabla mostrada arriba, ubicaríamos el número de sesiones donde 500 personas están a la izquierda del número y 500 a la derecha. La mediana es, en este caso, 7 sesiones. Esto puede ayudarte a eliminar la influencia de valores atípicos, que pueden afectar negativamente tus datos.

El último tipo de promedio es la moda. La moda es la respuesta más frecuente. En este caso la respuesta es seis. 260 participantes de la encuesta asistieron a 6 sesiones, más de las que asistieron a cualquier otra cantidad de sesiones.

Las medias, y otros tipos de promedio, también pueden utilizarse si los resultados se basaron en escalas Likert.

Sacar conclusiones

Cuando se trata de informar los resultados de la encuesta, piensa acerca de la historia que te cuentan los datos.

Digamos que la conferencia en general obtuvo valoraciones mediocres. Profundizas para descubrir qué sucede. Los datos muestran que los asistentes dieron valoraciones muy altas a casi todos los aspectos de tu conferencia, las sesiones y clases, los eventos sociales y el hotel, pero realmente no les gustó la ciudad elegida para la conferencia. (¡Quizás la conferencia se realizó en Chicago, en enero y hacía mucho frío para salir!) Esta es parte de la historia, gran conferencia en general, pésima elección de la ubicación. Miami o San Diego podrían ser una mejor elección para una conferencia en invierno.

Un aspecto del análisis e informe de los datos que debes considerar es la causalidad versus la correlación.

¿Cuál es la diferencia entre la correlación y la causalidad?

La causalidad es cuando un factor provoca otro, mientras que la correlación es cuando dos variables se mueven juntas, pero una no influye o provoca la otra.

Por ejemplo, beber chocolate caliente y usar guantes son dos variables que están relacionadas, tienden a subir y bajar juntas. Sin embargo, una no provoca la otra. De hecho, ambas son provocadas por un tercer factor, el clima frío. El clima frío influye tanto en el consumo de chocolate caliente como en la probabilidad de usar guantes. El clima frío es la variable independiente y el consumo de chocolate caliente y la probabilidad de usar guantes son las variables dependientes. En el caso de nuestra encuesta de comentarios sobre la conferencia, el clima frío probablemente influyó en la insatisfacción de los asistentes acerca de la ciudad de la conferencia y la conferencia en general. Por último, para un examen adicional, la relación entre las variables en tu encuesta podría necesitar el desarrollo de un análisis de regresión.

¿Qué es el análisis de regresión?

El análisis de regresión es un método avanzado de análisis de datos que te permite observar la relación entre dos o más variables. Existen muchos tipos de análisis de regresión y el que elija un científico de encuestas dependerá de las variables que esté examinando. Lo que todos los tipos de análisis de regresión tienen en común es que observan la influencia de una o más variables independientes en una variable dependiente. Al analizar los datos de nuestra encuesta, podríamos estar interesados en saber qué factores afectaron en mayor medida la satisfacción de los asistentes con la conferencia. ¿Es una cuestión de la cantidad de sesiones? ¿El orador principal? ¿Los eventos sociales? ¿El sitio? Al utilizar el análisis de regresión, un científico de encuestas puede determinar si y hasta qué punto la satisfacción con estos diferentes atributos de la conferencia contribuye a la satisfacción general. A su vez, esto ofrece percepciones sobre qué aspectos de la conferencia podrías modificar la próxima vez. Digamos, por ejemplo, que pagaste un alto honorario para tener a un orador principal prestigioso para tu sesión de apertura. Los participantes le dieron al orador y a la conferencia en general un alto puntaje. En base a estos dos factores, podrías pensar que tener un fabuloso (y costoso) orador principal es la clave para el éxito de la conferencia. El análisis de regresión puede ayudarte a determinar si este es realmente el caso. Podrías descubrir que la popularidad del orador principal fue el mayor impulsor de la satisfacción con la conferencia. Si es así, el siguiente año te conviene tener otra vez un excelente orador principal. Sin embargo, digamos que la regresión demuestra que, aunque a todos les gustó el orador, esto no contribuyó mucho a la satisfacción de los asistentes con la conferencia. Si este es el caso, esa gran cantidad de dinero gastada en el orador podría gastarse de mejor manera en otra cosa. Si dedicas tiempo a analizar atentamente la solidez de los datos de tu encuesta, estarás encaminado para utilizar las respuestas a fin de ayudarte a tomar decisiones informadas.

Volver a Encuestas 101

3 consejos rápidos para mejorar el índice de respuesta de las encuestas

Aquí tienes algunas ideas para que los encuestados respondan tus encuestas.

1. Sé rápido

Si la encuesta es breve y concisa, hay mayores probabilidades de que más encuestados la respondan.

2. Ofrece incentivos

Ciertos incentivos, como un pequeño descuento o la participación en un sorteo, contribuyen a que los encuestados completen la encuesta.

3. Consigue un público adecuado

Con SurveyMonkey Audience, puedes adquirir acceso a un público que cumpla con criterios demográficos específicos para tu encuesta. Es una excelente manera de obtener respuestas adecuadas de un grupo específico.

Mira por qué millones de personas confían en SurveyMonkey.

Encuestas ilimitadas

Envía todas las encuestas y los tests que quieras, ¡incluso con los planes gratuitos!

Respuestas rápidas

Fácilmente crea y envía encuestas profesionales. Obtén resultados confiables rápidamente.

Aprobadas por los expertos

Obtén acceso a las preguntas y plantillas aprobadas por nuestros científicos en encuestas.

Resultados en tiempo real

Revisa los resultados sobre la marcha desde cualquier dispositivo. Identifica las tendencias a medida que lleguen los datos.

Ideas innovadoras

Obtén sugerencias y nuevas percepciones con las respuestas a tus encuestas.

Datos prácticos

Extrae percepciones de tus datos y compártelas con tu equipo.