数据分析与知识发现
    主页 > 综合新闻 >

细说如何分析问卷调研数据

相信大家对于调研一定不陌生。给客服打个电话,末了总是要加一句“请您对我的服务给予评价。非常满意请按1…”;随手点个外卖,小哥不忘叮嘱“麻烦您给个五星好评”;出门住个五星级酒店,伴随电子账单而来的还有一份“入住满意度调研”,满意与否都可以在最后一道填空题里一吐为快。如果您在某些领域有专长,或是对某些产品有意向、有了解,还会被邀请参与技术趋势调研,产品内测调研,用户体验调研等等。即使是朝九晚五的打工人,一年忙碌下来也会被公司邀请参与“员工满意度”调研。

作为被调研的你我他或许已经感受到,迄今为止基于问卷形式的调研还是在各个企业和学术研究中有广泛应用,因为这种方法还是能够较为全面、系统地了解不同群体的认知、态度、看法和行为。从求学到求职,小编一路走来学习了不少分析问卷调研的方法。今天小编总结两种日常工作中所见最多的题型的分析方法。一份成功的问卷调研也离不开前期的精细设计与分发。如果大家对这个话题感兴趣,欢迎留言“问卷调研数据分析前传”。

● 第一种题型:打分题

这种题型的优势在于将抽象的行为和意见用直观的方式进行量化。例如“在1-10分的范围内,请您针对本次入住体验进行评价。(1分最低分,10分最高分)”。

遇到这类可以量化的数值打分题,首先可以计算平均分,总体评价入住体验的好坏。比如我这有一组数据显示,某家酒店的整体入住体验得分6.3分,属于中等水平。我们还可以根据不同的群体,更进一步进行交叉分析,看看差异。比如把入住体验按照客人的居住地进行了一次划分:

这样的交叉分析之后,我们发现来自不同城市的客人对入住体验的评分的确有所不同。杭州的客人打分偏高,北京的客人打分偏低。进行到这里,我们所做的是描述性分析,也就勾画出我们收集到样本数据的样子。小编以为对连续的数值型数据进行计算,或多或少总是有些差异的。究竟这样的差异是否有意义?我们能否据此得出杭州客人入住体验比北京客人好呢?

我们可以通过统计分析再进一步验证不同城市客人的入住体验是否有显著差异。具体思路是先提出原假设:来自不同城市客人的入住体验没有显著差异,然后运用单因子方差分析(one-way ANOVA test) 对样本数据集进行检验,计算p值。如果p值>0.05 ,原假设成立,即来自不同城市客人的入住体验没有显著差异;否则,拒绝原假设,即来自不同城市客人的入住体验存在显著差异。

根据我们的样本数据计算出的p值=0.2272 >0.05, 因此原假设成立,即来自不同城市客人的入住体验无显著差异。这样一步统计检验帮助我们验证了样本数据从统计意义上来看并无显著差异。小编圈出两个关键词:一个是“显著”,一个是“统计意义”。描述性分析帮助我们找出差异,统计分析帮助我们检验这些差异是否可以忽略不记。但这样的检验仅仅从统计学的角度给出一个解释。如果业务部门从其他数据或访谈中了解到这样的差异是石锤,那么同样也需要引起我们的关注。

● 第二种题型:量表题

还是上面的问题,小编换个方式问:“您对本次的入住体验____”然后请您选择“A.非常满意 B. 满意 C. 无所谓 D. 不满意 E. 非常不满意”。这种形式的问题就是我们接下来要讲的量表题(Likert Scale)。简单的五个选项是由美国社会心理学家Rensis Likert早在1932年就发明了的方法,用于分析受访者的态度、意见或者情感。与打分题不同的是,这里的五个选项代表了五个类别,我们没有办法直接进行数值计算,但我们可以通过描述性分析来刻画分布。比如对上述的样本数据进行转换后得到对入住体验态度分布:

同样,我们也针对入住客人的居住地进行一次交叉分析得到如下结果:

上述量表分布图展示了各个城市的客人对入住体验不同的态度。小编以为那些“不满意”和“非常不满意”的占比较大的城市是值得关注的。(比如,深圳)那如果我们也想用统计分析来检验这种态度差异是否显著,应该如何操作?

因为量表题的数据类型是不连续的类别变量,我们需要行列卡方检验来进行检测。同样提出原假设:来自不同城市客人的入住体验态度没有显著差异,然后运用行列卡方检验(RxC Chi-square test) 对样本数据集进行检验,计算p值。如果p值>0.05 ,原假设成立,即来自不同城市客人的入住体验态度没有显著差异;否则,拒绝原假设,即来自不同城市客人的入住体验态度存在显著差异。