【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《“啤酒与尿布”案例浅析与拓展》,欢迎阅读!
经过大半个学期的数据挖掘学习,我们小组决定在这次展示中对数据挖掘中的“啤酒与尿布”经典案例进行一次浅层次的剖析。
通过我们的课程学习,我们可以得知“啤酒与尿布”的关联方法是购物篮分析,在网上查阅资料后我们得知购物篮分析法曾是沃尔玛的不传之秘,其大致作用应该是帮助我们在销售的过程中找到商品之间的关联性从而获得销售收益的增长。
商品相关性分析是购物篮分析中最重要的部分,其英文是market basket analysis(简称MBA,当然这可不是那个可以用来吓人的学位名称)。从网络中我们得知在数据分析行业购物篮的商品相关性分析被称为“数据挖掘算法之王”,从此也可见其实用性,而这也正是我们小组对此展开研究的主要原因。
就我们所了解的,数据的相关性分析种类主要按三种分类方式分成六种: 按变量多少可分为一元相关和多元相关 按表现形式可分为直线相关和曲线相关 按变化方向可分为正相关与负相关 关于线性相关我们大概做了如下了解:
两变量线性相关指数
2Sr=xy/SxSy ; 丨r丨≤1
一般的来说丨r丨≤0.3 为不存在线性相关;
0.3≤丨r丨≤0.5为低线性相关; 0.5≤丨r丨≤0.8为显著线性相关; 0.8≤丨r丨为高度线性相关;
而购物篮的具体操作流程涉及到一些软件应用,我们暂时还没有掌握,所以在此先行跳过。
接下来我们来谈谈“啤酒与尿布”的进一步探讨,我们在讨论与学习过程中总结出“啤酒与尿布”其实是一种商品交叉销售的代表。而且“啤酒与尿布”的例子并非在所有地方都合适,它应该更适合于它的起源地——沃尔玛之类的大卖场。因为在一些小卖场里各种商品摆放的位置差距并不算太远,故而“啤酒与尿布”案例的方法也就无法得到具体的实施。
我们从网络得知日本也有他们自己的“购物篮方法”,日本的小型商场模式注定了它们无法直接搬用“啤酒与尿布”的方法,于是他们将关注点转移到如下几点:
● 气温由28℃上升到30℃,对碳酸类饮料、凉面的销售量会有什么影响? ● 下雨的时候,关东煮的销售量会有什么变化?
● 盒饭加酸奶、盒饭加罐装啤酒都是针对什么样的客户群体?他们什么时间到门店买这些商品?
日本人的重点是分析所有影响商品销售的关联因素,比如天气、温度、时间、事件、客户群体等,这些因素我们称为商品相关性因素。 然后我们关心的是类似于“啤酒与尿布”的购物篮分析在现实生活中能否获得预期中的效果,然后我们了解到一部分地区性购物商场销售状态(信息来自网络)根据AC·尼尔森2006年对国内零售企业的调查发现, 从周一到周五正常工作日,同样一个万米经营面积的大卖场,国内卖场的平均客单价是29元,家乐福、沃尔玛、欧尚等国际零售巨头卖场的客单价为75元,好又多、大润发、乐购等台资卖场客单价为50元。到了周末(周六、周日)的差距更大,国内卖场客单价为35元,台资卖场客单价为80元,外资卖场可以达到 149元,这就是我们国内企业在购物篮方面的差距。从销售额=客单价*客流量我们可以看出我们国内企业的营业额已经远远低于国外企业了,我们私人认为这是因为国内消费水平偏低,但是不可忽略的是多数国内商场并未将购物篮分析的方法灵活应用,而是生搬其他人的结论。然而不同时间、地区的商品相关性是变化的,故此他们的购物篮分析并不能很好的帮助他们在客
流量不变的情况下提高客单价。提到商品相关性,大家往往认为就是数据分析的事儿,其实我们觉得对于商品相关性来说,更重要的是客户心理层面的因素,毕竟是人在提着购物篮,而不是猴子。客户在购物时的心理行为是产生商品之间关联关系最基本的原因,因此在找到购物篮时,必须要从客户消费心理层面解释这些关联关系,否则“啤酒与尿布”会永远停留在啤酒与尿布两个商品身上,而没有任何的推广意义。要想详细了解商品相关性形成的客户心理因素,要进行大量的客户消费行为观察,构建客户购物篮场景,才可使“啤酒与尿布” 的故事发扬光大。
下述来自网络:
以支持度、置信度、提高度三项指标表现的商品相关性
很多专业人士认为,一个正规的购物篮分析报表应该采取三个指标数字,才可以准确地衡量商品是否真的存在关联关系:采取“支持度(support)-置信度(confidence)”作为主要商品相关性分析指标,为了强化说明关联关系,往往会运用提高度(lift)指标。 1. 支持度(support)指标 在购物篮分析中,支持度指的是多个商品同时出现在同一个购物篮的概率。比如啤酒与尿布同时出现在购物篮中的概率是20%,我们称啤酒与尿布的支 持度是20%,按照国际命名规则表示为:啤酒Implies 尿布=20%。
“啤酒与尿布”不等于“尿布与啤酒”——相关性的单向性:这不是一句绕口令,这是代表商品之间的相关性具有单向性。我们前面讲过,“啤酒与尿布”代表了一种因果关系。在“啤酒与尿布”的故事中,年轻的父亲去超市的目的是购买尿布,在买到尿布的前提下,才会考虑购买啤酒,因此在购买尿布的父亲中有35%购买了啤酒,不代表购买了啤酒的父亲有35%购买了尿布,因为这是两类不同的消费行为,商品之间的因果关系也会不同,因此这个故事不能反过来讲。
要看商品之间是否具有相关性,在计算商品之间的支持度时,需要反过来计算进行验证,看看两个商品之间的相关性具有多少的可信度,从而寻找商品之 间的因果关系。由于商品之间关联关系具有单向性,在零售业也会采取这种表示商品关联关系的方式:尿布→啤酒,即尿布与啤酒之间具有关联关系,方向是从尿布到啤酒(反过来不一定对)。 2. 置信度(confidence)指标
置信度是对支持度进行衡量的指标,用于衡量支持度的可信度及数据强度。由于这项指标是将商品同时出现在购物篮中的概率进行反复运算,因此这是衡量商品相关性的主要指标。
3. 商品之间的亲密关系——提高度(Lift,也称兴趣度)指标 提高度是对支持度、置信度全面衡量的指标,很多时候在衡量商品关联关系时只采用这一个指标,可见这个指标的重要性。当提高度指标大于1时,表明商品之间可能具有真正的关联关系。提高度数据越大,则商品之间的关联意义越大。如果提高度小于1.0时,表明商品之间不可能具有真正的关联关系。
在某些情况下,提高度会出现负值,此时商品之间很有可能具有相互排斥的关系,体现在购物篮中,就是这些商品从来不会出现在同一个购物篮中。
网络引文至此。
接下来谈谈我们对购物篮分析法讨论的所得:
1.购物篮的重要程度大于单一商品,通过了解,我们得知商场在派发销售任务是往往是每组人员承担某类或某种商品的销售量,然而不注重它们之间的关联性可以提高双方或多方销量。或者说,购物篮是消费者心理的体现,所以把握住对购物篮的了解可以使商家与客户始终保持一致。
本文来源:https://www.wddqxz.cn/49ddc28b7cd184254a35354a.html