数据分析与知识发现
    主页 > 综合新闻 >

数据分析中的万能宝典——帕累托最优解,你还

说起帕累托最优,估计没接触过数据分析的人都听过,但是怎么用帕累托模型解决实际业务问题呢?今天老李带你盘清帕累托最优的来龙去脉。

最近,做酒店管理的小李很头疼,酒店最近一个月的损失成本明显升高,但是一直却没办法改善,为什么会这样呢?

原来虽然这家酒店的人气火爆,每天都有客人预定房间,但最终总有一小部分人会取消预定,这些被取消的房间最终就会空下来,给酒店造成了很大的损失。

如果是你,你应该怎么解决这个问题呢?

什么是帕累托?

上面那个例子其实就是帕累托法则的最好体现,因为资源总是有限的,不同的渠道和用户会产生不同的效益,所以我们不能将所有的资源投入到全部渠道里,这就是帕累托法则所遵循的原则。

我们先看一下帕累托最优的定义:

帕累托分析依据的原理是20/80定律,80%的效益常常来自于20%的投入,而其他80%的投入却只产生了20%的效益,这说明,同样的投入在不同的地方会产生不同的效益。

什么意思呢?

首先我们举一个常见的例子:

一家人有A、B两兄弟,如果每个人分别去捕兔子,每个人每天都可以得到20斤食物;如果两兄弟合力去捕杀一只鹿,则可以得到100斤的食物;那么,那么如果你是这两个兄弟的父亲,你会怎么分配任务呢?

其实无非是三种分配方式:

两个人合力捕鹿:得到100斤食物;

两个人分别捕兔:得到40斤食物;

A捕鹿、B捕兔:A不得到食物,B得到20斤食物

A捕兔、B捕鹿:A得到20斤食物,B不得到食物

想都不用想我们都会让两兄弟合力捕捉鹿,这就是帕累托模型的本质,也就是资源集中,我们要把资源投放到效益最高的渠道中,也就是“头部”渠道,而不应该将资源投放到剩下的“尾部”渠道中。

帕累托怎么操作?

我们换到一个实际的例子看一下:

某集团公司下属有十余种业务或产品,但是最近发现公司的营销成本很大,想要缩减一些业务,或者调整一下业务的投入成本。这就是典型的业务升级(资源分配)问题。

帕累托图的绘制过程非常简单,就是按照贡献度从高到低依次排列,并绘制累积贡献度曲线,当样本数量足够大时,贡献度通常会呈现20/80分布。

这里面最大的难点就是如何表示某类产品的累积贡献度呢?

直接用每个产品的销售额比上总销售额?这显然是不可以的!所以我们要用到一个新的指标:累积销售额占比。

直接给大家演示一遍:

首先我们在finebi中从数据源开始上手,这是张销售明细表,其中包含每一笔销售订单的地区信息、商品的类别信息。

首先基于该表,我们使用FineBI中的计算指标功能,进行数据的处理加工分析,先可以简单地写一个计算指标,求销售金额合计,将销售额按照商品进行汇总。

然后我们想要计算累计销售额占比,首先就要计算出累计销售额,其公式为:累计销售额占比=累计销售额/总销售额。

我们先计算累计销售额,这里我们只需要在FineBI当中新建一列,选择“累计值/组内”,也就是按照从低到高计算累计值。

然后我们再算出总销售额,我们再选择新建一列,点击“所有值/组内”,直接计算出所有销售额的总和。

最后,我们根据公式计算出累计销售额占比,这里我们新建一列,将已经计算出的累计销售额和总销售额拖入进去,将字段类型设置为数值,即可得到占比。

这时候我们就可以绘制帕累托图了,选择新建可视化组件,然后将【子品类】字段拖动到横轴,【总销售额】拖动纵轴,再按照由大到小降序排列。

然后我们同样地将【累计销售额占比】字段拖入到纵轴,然后将其设置为折线类型,这时候基本的帕累托图就完成了。