凯时K66

联系方式 Contact

凯时K66: 天气在线(北京)气象科技有限公司

凯时K66: 地址:北(bei)京(jing)市(shi)海(hai)淀(dian)区海(hai)淀(dian)西大街(jie)36号9层(ceng)

凯(kai)时K66: 电话(hua):010-58995339

凯时K66: 手(shou)机:13701329187

凯时K66: 传真(zhen):010-58995339

凯时K66: 网(wang)址:

搜索 Search

天气驱动行业销售大数据

 2015-09-03 10:41:53  点击:

摘要(yao):自建国以(yi)(yi)来我(wo)国的(de)(de)气(qi)(qi)(qi)象(xiang)系(xi)统已经十(shi)分(fen)完备(bei),2015年中国气(qi)(qi)(qi)象(xiang)局(ju)发布27号令后使(shi)得(de)气(qi)(qi)(qi)象(xiang)数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)迈向开放数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)(Open Data)新(xin)阶段,行(xing)业(ye)与公(gong)众可(ke)以(yi)(yi)使(shi)用(yong)海(hai)量气(qi)(qi)(qi)象(xiang)数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)助力(li)企业(ye),目前行(xing)业(ye)数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)和(he)海(hai)量气(qi)(qi)(qi)象(xiang)数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)还没有得(de)到(dao)完全应(ying)用(yong)。本文主(zhu)要(yao)研究气(qi)(qi)(qi)象(xiang)数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)对(dui)销(xiao)售的(de)(de)影响,进(jin)而(er)利用(yong)气(qi)(qi)(qi)象(xiang)数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)特性完成天(tian)气(qi)(qi)(qi)驱动(dong)行(xing)业(ye)销(xiao)售的(de)(de)预测。我(wo)们以(yi)(yi)两个零售行(xing)业(ye)的(de)(de)销(xiao)售数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)为(wei)例,结(jie)合(he)气(qi)(qi)(qi)象(xiang)局(ju)提(ti)供(gong)的(de)(de)天(tian)气(qi)(qi)(qi)数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)进(jin)行(xing)分(fen)析(xi)。同时,我(wo)们在分(fen)析(xi)中加入了(le)经济因素,如上证指数(shu)(shu)(shu)(shu)(shu)和(he)CPI数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)来提(ti)供(gong)外部(bu)环境支持。与传统的(de)(de)预测不同,在气(qi)(qi)(qi)象(xiang)数(shu)(shu)(shu)(shu)(shu)据(ju)(ju)中,我(wo)们不仅知道(dao)目前时间点的(de)(de)数(shu)(shu)(shu)(shu)(shu)据(ju)(ju),也有目前公(gong)众唾手可(ke)得(de)的(de)(de)未(wei)来七天(tian)精(jing)(jing)确天(tian)气(qi)(qi)(qi)预报。我(wo)们采用(yong)目前流行(xing)的(de)(de)算法随机森林来建模,得(de)到(dao)了(le)很好的(de)(de)泛化(hua)结(jie)果。我(wo)们的(de)(de)预测模型(xing)可(ke)以(yi)(yi)解决销(xiao)售行(xing)业(ye)传统通过从(cong)业(ye)人员的(de)(de)主(zhu)观判断进(jin)行(xing)销(xiao)售预测的(de)(de)局(ju)限,利用(yong)实现更加精(jing)(jing)确可(ke)靠(kao)的(de)(de)指导(dao)。

一、业务介绍

天气一直是指导人们生活的重要因素,德国知名的经济议题观察家弗里德黑姆˙施瓦茨(Friedhelm Schwarz)发表的著作《气候经济学》[1]提到地球上有80%的经济活动都是由于天气因素影响甚至决定的,如:农作物受寒害影响收成及市场价格、凉夏造成冰品销售下降、暖冬缩短羽绒服销售时间、出行航班受天气影响延误以及所有的户外活动等。目前我国(除西部部分人口稀少的区域)的气象系统已经十分完善,气象观测网络从在轨卫星、雷达、高空气球、地面观测站点(降水、风速、风向、相对湿度、大气压力、气温)到地下的农业观测站(土壤墒情:土表下的温度、湿度等),民众可以通过过互联网或智能手机直接了解天气预报。目前积累起来的气象数据量也十分庞大(每年以PB等级的速度增长),但是目前这些数据还没有得到充分的应用。下面我们将阐述利用行业数据和气象数据进行销售预测、使用天气规划营销活动的全过程。

在销(xiao)(xiao)(xiao)售(shou)领域,气象一直是一个(ge)十(shi)分重(zhong)要(yao)的(de)影响因(yin)(yin)素(su)。人们根据(ju)(ju)天(tian)气来情况来决(jue)(jue)定购(gou)买(mai)的(de)衣服,所吃的(de)食物,甚至是饮(yin)(yin)用的(de)饮(yin)(yin)品(pin)(pin),特别是对于酒精性饮(yin)(yin)料和羽(yu)绒服非常直观(guan)受(shou)天(tian)气影响的(de)零售(shou)商品(pin)(pin),天(tian)气对其(qi)销(xiao)(xiao)(xiao)量(liang)起了重(zhong)要(yao)作用。因(yin)(yin)此相关(guan)从(cong)业(ye)(ye)人员会十(shi)分关(guan)注天(tian)气预(yu)报,并根据(ju)(ju)天(tian)气来进(jin)行(xing)(xing)(xing)产品(pin)(pin)设计、营销(xiao)(xiao)(xiao)方案、采购(gou)与销(xiao)(xiao)(xiao)售(shou)等行(xing)(xing)(xing)为(wei)的(de)决(jue)(jue)策(ce)。但(dan)是这种做法只是根据(ju)(ju)从(cong)业(ye)(ye)人员的(de)经验进(jin)行(xing)(xing)(xing)判断,结果十(shi)分主观(guan),容易(yi)导致(zhi)偏(pian)差而做出错误的(de)产销(xiao)(xiao)(xiao)计划(SOP: Sales & Operation Planning),因(yin)(yin)此如(ru)何利用行(xing)(xing)(xing)业(ye)(ye)数(shu)(shu)据(ju)(ju)、气象数(shu)(shu)据(ju)(ju)与其(qi)他公众数(shu)(shu)据(ju)(ju)进(jin)行(xing)(xing)(xing)精确的(de)数(shu)(shu)字化(hua)销(xiao)(xiao)(xiao)售(shou)预(yu)测是行(xing)(xing)(xing)业(ye)(ye)研究的(de)热(re)点(dian),而业(ye)(ye)务受(shou)天(tian)气等外部环境因(yin)(yin)素(su)驱动的(de)关(guan)联性与因(yin)(yin)果性研究落成(cheng)精准(zhun)营销(xiao)(xiao)(xiao)也是本(ben)文强调的(de)重(zhong)点(dian)。

气(qi)(qi)象的(de)(de)观测(ce)体(ti)(ti)系(xi)(xi)是由庞大(da)(da)的(de)(de)物联网(wang)(IOT: Internet of Things)构架(jia)而(er)成(cheng),每分(fen)钟都在监测(ce)相关天(tian)(tian)气(qi)(qi)要(yao)素(风速、风向、温(wen)度、相对湿(shi)度、大(da)(da)气(qi)(qi)压力、降水(shui)等),协同(tong)全世界(jie)各国的(de)(de)观测(ce)网(wang)络,同(tong)时(shi)(shi)结(jie)合地(di)球(qiu)科学、大(da)(da)气(qi)(qi)物理、流体(ti)(ti)力学等专业(ye)知识(shi),通过大(da)(da)型计算机技术(shu)完成(cheng)数(shu)值天(tian)(tian)气(qi)(qi)预(yu)报(bao)(bao)(Numerical Weather Prediction)。目前的(de)(de)预(yu)报(bao)(bao)模式提供给公(gong)众(zhong)的(de)(de)时(shi)(shi)间长度为15天(tian)(tian),48小(xiao)时(shi)(shi)内(nei)为逐小(xiao)时(shi)(shi)预(yu)报(bao)(bao),后续为逐日预(yu)报(bao)(bao)。由于(yu)观测(ce)体(ti)(ti)系(xi)(xi)的(de)(de)完备(bei)以及计算技术(shu)能力的(de)(de)大(da)(da)幅提升(sheng),预(yu)报(bao)(bao)的(de)(de)精细度也已经达到平(ping)方公(gong)里涵盖以及分(fen)钟级(ji)别,天(tian)(tian)气(qi)(qi)预(yu)报(bao)(bao)在一定(ding)的(de)(de)时(shi)(shi)间周(zhou)期内(nei)已经相当成(cheng)熟且具有高准确度。我(wo)们透过行(xing)业(ye)数(shu)据(ju)与气(qi)(qi)象历史数(shu)据(ju)进行(xing)相关性(xing)(xing)分(fen)析确立结(jie)果后,根据(ju)业(ye)务(wu)影响关系(xi)(xi)、数(shu)据(ju)同(tong)比影响等特性(xing)(xing),低风险地(di)进行(xing)因果性(xing)(xing)验证。天(tian)(tian)气(qi)(qi)数(shu)据(ju)有可靠(kao)的(de)(de)预(yu)报(bao)(bao)准确度,是气(qi)(qi)象数(shu)据(ju)可以作为天(tian)(tian)气(qi)(qi)驱动行(xing)业(ye)大(da)(da)的(de)(de)最(zui)大(da)(da)特点。

本文主要研究两项容易受天气因素驱动(影响)的销售预测问题,业务形态特别选取B2B(Business to Business)与B2C(Business to Customer)两种目前多数的业务类型:酒精性饮料的渠道销售预测以及电商平台的羽绒服销量预测。酒精性饮料的销量由很多因素影响,Lee et al.[2]和Rojas et al.[3]研究了广告对酒精性饮料销量的影响,Voleti et al.[4]和Empen et al.[5]研究了品牌资产对于酒精性饮料销量的影响。而在酒精性饮料行业中,还有一个公认对酒精性饮料销量影响极大的指标:天气。2015年我国酒精性饮料行业整体销量下滑,很多人都归因于2015年整体气温偏低的。一般酒精性饮料销量呈现季节性变化,天气寒冷的时候消费者对于酒精性饮料的需求会下降,销量会比较低;而在天气炎热的时候,酒精性饮料的销量会明显增高;本项目不考虑终端零售数据,仅研究酒精性饮料的渠道销售情况是否受天气所驱动,也就是各阶层的渠道商实际销售情况是否受天气影响。

对于羽绒服来说,天气的影响更加明显。从生活经验来看,人们主要是在冬天购买羽绒服,而夏天基本上不会有商家出售羽绒服。中国气象局公共气象服务中心和凡客诚品等公司合作利用气象数据进行羽绒服销量的研究,仅利用平均温度的三次多项式方程就得到了比较准确的结果(刘一伶等[6]),这表明天气的确对羽绒服的销量有十分重要的影响。

在(zai)不同的(de)地区(qu),天(tian)气(qi)对(dui)销量的(de)影(ying)响(xiang)也(ye)有明(ming)显(xian)(xian)区(qu)别(bie)。在(zai)中(zhong)国北方(fang)地区(qu),四(si)季很明(ming)显(xian)(xian),换季时(shi)时(shi)间间隔比较(jiao)分明(ming),因此人们(men)能快(kuai)速地根据(ju)(ju)气(qi)温(wen)变化(hua)进行反(fan)应。中(zhong)国南方(fang)地区(qu)的(de)换季却(que)十(shi)分反(fan)复,经常会出现(xian)冬天(tian)穿(chuan)夏装(zhuang)的(de)情(qing)况(kuang),整体湿度也(ye)偏(pian)高,因此人们(men)根据(ju)(ju)季节变化(hua)和(he)气(qi)温(wen)变化(hua)进行的(de)反(fan)应会和(he)北方(fang)有很大差别(bie)。本(ben)文(wen)在(zai)研究天(tian)气(qi)对(dui)销量的(de)影(ying)响(xiang)时(shi),会分城市(shi)进行分析,发现(xian)不同城市(shi)中(zhong)天(tian)气(qi)对(dui)销量的(de)影(ying)响(xiang)规律。

 

二、数据描述

(一)酒精性饮料销售数据描述

我们的(de)(de)(de)酒精(jing)性饮料(liao)销(xiao)(xiao)售(shou)数据(ju)(ju)来源于(yu)某知(zhi)名酒精(jing)性饮料(liao)公司(si)渠(qu)(qu)道(dao)销(xiao)(xiao)售(shou)数据(ju)(ju),采集来源为ERP(Enterprise Resource Planning)系(xi)统(tong)的(de)(de)(de)一级渠(qu)(qu)道(dao)销(xiao)(xiao)售(shou)数据(ju)(ju):销(xiao)(xiao)售(shou)订单(Sales Order)与对应的(de)(de)(de)提(ti)货单(Delivery Note)以(yi)及经(jing)(jing)销(xiao)(xiao)商Go-To-Market系(xi)统(tong)的(de)(de)(de)销(xiao)(xiao)售(shou)二级渠(qu)(qu)道(dao)数据(ju)(ju)。数据(ju)(ju)为2013年至2015年五(wu)个经(jing)(jing)销(xiao)(xiao)商位在城市G、城市S、城市H、城市Z、城市W的(de)(de)(de)销(xiao)(xiao)售(shou)数据(ju)(ju);第一部分的(de)(de)(de)一级渠(qu)(qu)道(dao)销(xiao)(xiao)售(shou)数据(ju)(ju)是(shi)(shi)从工(gong)厂(chang)到经(jing)(jing)销(xiao)(xiao)商的(de)(de)(de)数据(ju)(ju),第二部分的(de)(de)(de)二级渠(qu)(qu)道(dao)销(xiao)(xiao)售(shou)数据(ju)(ju)是(shi)(shi)从经(jing)(jing)销(xiao)(xiao)商到售(shou)点的(de)(de)(de)数据(ju)(ju)。工(gong)厂(chang)指(zhi)的(de)(de)(de)是(shi)(shi)酒精(jing)性饮料(liao)的(de)(de)(de)生产工(gong)厂(chang),该酒精(jing)性饮料(liao)公司(si)在不(bu)同(tong)的(de)(de)(de)城市均有经(jing)(jing)销(xiao)(xiao)商(渠(qu)(qu)道(dao)商),分为高(gao)档、中高(gao)档、中档、低挡四个等(deng)(deng)级,不(bu)同(tong)的(de)(de)(de)经(jing)(jing)销(xiao)(xiao)商会(hui)根据(ju)(ju)售(shou)点的(de)(de)(de)需(xu)求(qiu)要求(qiu)工(gong)厂(chang)供货。二级渠(qu)(qu)道(dao)售(shou)点一般(ban)是(shi)(shi)酒吧(ba)、KTV、餐饮、零(ling)售(shou)等(deng)(deng)。

从(cong)(cong)(cong)工(gong)厂(chang)(chang)到(dao)(dao)经销(xiao)(xiao)商(shang)(shang)的(de)(de)(de)(de)数(shu)(shu)据也就是一(yi)级渠道(dao)销(xiao)(xiao)售数(shu)(shu)据,数(shu)(shu)据中的(de)(de)(de)(de)字(zi)段(duan)(duan)见表1。客(ke)(ke)(ke)户(hu)(hu)所(suo)使用的(de)(de)(de)(de)ERP系统(tong)提供多(duo)项业(ye)务(wu)(wu)(wu)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)进行(xing)记录(lu)区(qu)分(fen)(fen)出不同(tong)业(ye)务(wu)(wu)(wu)意义(yi):订(ding)(ding)单(dan)(dan)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)(Order Date)、需求(qiu)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)(Requirement Date)、订(ding)(ding)单(dan)(dan)释放日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)(Order Released Date)、发货日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)(Shipping Date)、交(jiao)(jiao)货日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)(Post Good Issue Date),交(jiao)(jiao)易数(shu)(shu)据皆以(yi)(yi)日(ri)(ri)(ri)(ri)(ri)为单(dan)(dan)位,明(ming)确(que)各个交(jiao)(jiao)易日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)数(shu)(shu)据在(zai)各地区(qu)实(shi)际(ji)(ji)进行(xing)业(ye)务(wu)(wu)(wu)录(lu)入的(de)(de)(de)(de)商(shang)(shang)业(ye)意义(yi)是对业(ye)务(wu)(wu)(wu)数(shu)(shu)据描述理解的(de)(de)(de)(de)第一(yi)步;(1)订(ding)(ding)单(dan)(dan)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi),业(ye)务(wu)(wu)(wu)建(jian)立(li)订(ding)(ding)单(dan)(dan)时(shi)客(ke)(ke)(ke)户(hu)(hu)ERP系统(tong)的(de)(de)(de)(de)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi);(2)需求(qiu)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi),一(yi)级渠道(dao)商(shang)(shang)根(gen)据库存(cun)与销(xiao)(xiao)售预(yu)测的(de)(de)(de)(de)需要(yao)到(dao)(dao)货日(ri)(ri)(ri)(ri)(ri)期(qi)(qi),但目(mu)前此字(zi)段(duan)(duan)没(mei)有(you)严格要(yao)求(qiu)键(jian)入实(shi)际(ji)(ji)需求(qiu)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi);(3)订(ding)(ding)单(dan)(dan)释放日(ri)(ri)(ri)(ri)(ri)期(qi)(qi):在(zai)客(ke)(ke)(ke)户(hu)(hu)流(liu)程中更多(duo)的(de)(de)(de)(de)是指(zhi)客(ke)(ke)(ke)户(hu)(hu)账务(wu)(wu)(wu)信(xin)用额(e)度(du)满足;(4)出货日(ri)(ri)(ri)(ri)(ri)期(qi)(qi):指(zhi)从(cong)(cong)(cong)工(gong)厂(chang)(chang)到(dao)(dao)达一(yi)级渠道(dao)经销(xiao)(xiao)商(shang)(shang)的(de)(de)(de)(de)时(shi)间(jian),在(zai)大多(duo)数(shu)(shu)的(de)(de)(de)(de)运输时(shi)间(jian)都在(zai)一(yi)天以(yi)(yi)内(nei);(5)交(jiao)(jiao)货日(ri)(ri)(ri)(ri)(ri)期(qi)(qi):在(zai)业(ye)务(wu)(wu)(wu)流(liu)程中是用以(yi)(yi)界定(ding)『货权』状态的(de)(de)(de)(de)时(shi)间(jian)点,在(zai)本项目(mu)数(shu)(shu)据多(duo)与出货日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)字(zi)段(duan)(duan)相(xiang)同(tong)。根(gen)据业(ye)务(wu)(wu)(wu)定(ding)义(yi)应该是客(ke)(ke)(ke)户(hu)(hu)需求(qiu)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)(Requirement Date)将会(hui)是天气(qi)驱(qu)动业(ye)务(wu)(wu)(wu)关(guan)系中最强的(de)(de)(de)(de)字(zi)段(duan)(duan),但所(suo)取得(de)的(de)(de)(de)(de)数(shu)(shu)据理解发货日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)(Shipping Date)更接近客(ke)(ke)(ke)户(hu)(hu)的(de)(de)(de)(de)实(shi)际(ji)(ji)需要(yao)的(de)(de)(de)(de)实(shi)际(ji)(ji)时(shi)间(jian);由于(yu)客(ke)(ke)(ke)户(hu)(hu)的(de)(de)(de)(de)业(ye)务(wu)(wu)(wu)流(liu)程录(lu)入时(shi)没(mei)有(you)强制所(suo)有(you)订(ding)(ding)单(dan)(dan)严格要(yao)求(qiu)在(zai)ERP系统(tong)建(jian)立(li)订(ding)(ding)单(dan)(dan)的(de)(de)(de)(de)相(xiang)关(guan)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)字(zi)段(duan)(duan),在(zai)清洗数(shu)(shu)据时(shi)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)的(de)(de)(de)(de)选择上(shang)与业(ye)务(wu)(wu)(wu)单(dan)(dan)位从(cong)(cong)(cong)实(shi)际(ji)(ji)业(ye)务(wu)(wu)(wu)流(liu)程与数(shu)(shu)据结(jie)果来选取最能(neng)真实(shi)呈现天气(qi)驱(qu)动业(ye)务(wu)(wu)(wu)的(de)(de)(de)(de)日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)字(zi)段(duan)(duan)。经过分(fen)(fen)析,在(zai)实(shi)际(ji)(ji)发货日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)下销(xiao)(xiao)量(liang)(liang)(liang)和天气(qi)的(de)(de)(de)(de)相(xiang)关(guan)度(du)也比(bi)较高,所(suo)以(yi)(yi)下面(mian)均采用实(shi)际(ji)(ji)发货日(ri)(ri)(ri)(ri)(ri)期(qi)(qi)作(zuo)为时(shi)间(jian)基准(zhun)。对于(yu)每个产品,其容(rong)量(liang)(liang)(liang)会(hui)有(you)很大不同(tong),有(you)些是罐(guan)装(zhuang)的(de)(de)(de)(de),有(you)些是桶装(zhuang)的(de)(de)(de)(de),在(zai)饮(yin)品行(xing)业(ye)中采用物(wu)品体(ti)积来衡量(liang)(liang)(liang)销(xiao)(xiao)量(liang)(liang)(liang)的(de)(de)(de)(de)多(duo)少(shao),销(xiao)(xiao)售数(shu)(shu)量(liang)(liang)(liang)(瓶、罐(guan))则为辅助(zhu)说(shuo)明(ming)销(xiao)(xiao)售趋势(shi)。

表(biao)1 一级渠道销售数(shu)据的(de)字段描(miao)述

数据 一级渠道销售数据(仅列出最终使用字段)
Id 字(zi)段名Field name 字段说明 备注(zhu)说明
1 城市 销售城市;一级渠道所在城市 城市G、城市S、城市H、城市Z、城市W
2 产品 酒精性饮料产品描述 包括了品牌、子品牌、容量、包装等内容
3 订单日期(Order Date)需求日期(Requirement Date)

释放日(ri)期(qi)(Released Date)

发货(huo)日期(Shipping Date)

交货(huo)日(ri)期(qi)(PGI Date)

下单日期客户需要日期

订单(dan)释放日期

发(fa)货(huo)离厂日期

交货日期

2013年至2015年共计三年
4 交货单数量发货数量 实际发货数量 单位:件
5 体积 酒精性饮料的容量 饮品行业计量单位单位:百升

从一级(ji)渠(qu)(qu)(qu)道(经销(xiao)(xiao)商)到二级(ji)渠(qu)(qu)(qu)道数(shu)(shu)据(ju)的(de)字(zi)段见表2。和一级(ji)渠(qu)(qu)(qu)道数(shu)(shu)据(ju)相同的(de)是,该数(shu)(shu)据(ju)虽然不记(ji)录(lu)在ERP系(xi)统,而(er)记(ji)录(lu)在渠(qu)(qu)(qu)道商的(de)GO-TO-MARKET系(xi)统中(zhong),也定义有不同业务意义的(de)日(ri)(ri)(ri)期(qi)(qi)(qi)系(xi)统审核日(ri)(ri)(ri)期(qi)(qi)(qi)(Audit Date)与发(fa)货日(ri)(ri)(ri)期(qi)(qi)(qi)(Shipping Date),两个日(ri)(ri)(ri)期(qi)(qi)(qi)在数(shu)(shu)据(ju)上几乎一致(zhi),而(er)订(ding)单日(ri)(ri)(ri)期(qi)(qi)(qi)(Order Date)一般(ban)是在月(yue)底记(ji)录(lu)(渠(qu)(qu)(qu)道销(xiao)(xiao)售(shou)返(fan)利(li)模(mo)式特性(xing)),所以该日(ri)(ri)(ri)期(qi)(qi)(qi)并不能准(zhun)确反(fan)映天气驱动的(de)实际日(ri)(ri)(ri)期(qi)(qi)(qi),我(wo)们同样采用发(fa)货日(ri)(ri)(ri)期(qi)(qi)(qi)作为时(shi)间基准(zhun)。对销(xiao)(xiao)量(liang)自然箱、销(xiao)(xiao)量(liang)百(bai)升、销(xiao)(xiao)量(liang)标准(zhun)箱等行业特殊性(xing)记(ji)录(lu),在与合作业务方交流后,与一级(ji)渠(qu)(qu)(qu)道数(shu)(shu)据(ju)相同,选用销(xiao)(xiao)量(liang)百(bai)升。

表2 酒精(jing)性(xing)饮料二级渠道(dao)数据的字段描述

数据 二级渠道销售数据(仅列出最终使用字段)
Id 字段(duan)名Field name 字段(duan)说明 备注说明
1 auditdateorderdate

shipdate

系统审核日期订单日期

发货日期

2013年1月1日到2015年11月30日
2 城市 二级渠道所在城市 城市G、城市S、城市H、城市Z、城市W
3 渠道类型 二级渠道类型 夜店、KTV、酒吧等;高端餐饮;普通餐饮;零售商;
4 品牌家族 标注品牌所属的家族名称 一个系列的大品牌
5 子品牌 品牌细分 品牌的细分
6 出货体积 酒精性饮料的容量(单位:百升) 饮品行业计量单位

酒精(jing)性(xing)饮料属于快速消费品(pin)(FMCG:Fast Moving Consumer Goods),价(jia)格的(de)(de)变更、促(cu)(cu)销(xiao)方(fang)案、返利活(huo)动(dong)、新品(pin)上市等都会影响销(xiao)售的(de)(de)变化,导(dao)致无法(fa)真(zhen)(zhen)实分析挖掘出天气驱动(dong)行业(ye)的(de)(de)真(zhen)(zhen)实情况。业(ye)务方(fang)提供了其他方(fang)面的(de)(de)数据,包(bao)括含税价(jia)格和促(cu)(cu)销(xiao)信息。具体见表3。

表3 酒精(jing)性(xing)饮料(liao)其(qi)他数(shu)据的(de)字段描述(shu)

数据 其他影响销售数据
Id 字段名Field name 字段说明 备注说明
1. 日期 某个价格的期限 每一个产品的价格
2. 价格 每百升物料的月销售含税价
3. MonthStart Date

End Date

价格或促销活动月份与时间段
4. 促销分类 促销类别 22类

我们(men)(men)分别对(dui)一(yi)级渠(qu)道销(xiao)(xiao)(xiao)售(shou)数(shu)据(ju)(ju)以(yi)及二级渠(qu)道销(xiao)(xiao)(xiao)售(shou)数(shu)据(ju)(ju)进(jin)行(xing)整合(he),在(zai)(zai)某一(yi)个(ge)日期下,有不同城市不同品(pin)牌(pai)的(de)销(xiao)(xiao)(xiao)售(shou)数(shu)据(ju)(ju),如果某个(ge)城市的(de)某个(ge)品(pin)牌(pai)在(zai)(zai)某天无销(xiao)(xiao)(xiao)售(shou)数(shu)据(ju)(ju),我们(men)(men)认为(wei)其(qi)销(xiao)(xiao)(xiao)售(shou)额为(wei)0。同时由于按周的(de)销(xiao)(xiao)(xiao)量(liang)比较(jiao)稳(wen)定,规律(lv)比较(jiao)明显,我们(men)(men)以(yi)周为(wei)单位进(jin)行(xing)分析,销(xiao)(xiao)(xiao)量(liang)为(wei)一(yi)周的(de)销(xiao)(xiao)(xiao)量(liang)加(jia)总(zong),价格(ge)为(wei)一(yi)周的(de)平均。

(二)羽绒服销售数据描述

羽(yu)绒服销售(shou)数(shu)据(ju)来(lai)自(zi)电商平台交易(yi)记录(销售(shou)数(shu)据(ju)不区分公(gong)司与相(xiang)关品牌),时(shi)间长度(du)从2011年(nian)到2013年(nian),包括了全国275个(ge)城(cheng)(cheng)市(shi)(shi)(shi)。我们提取出和酒(jiu)精性饮料(liao)数(shu)据(ju)中匹配的(de)五个(ge)城(cheng)(cheng)市(shi)(shi)(shi)来(lai)分析,同时(shi)加入一个(ge)北方(fang)城(cheng)(cheng)市(shi)(shi)(shi):城(cheng)(cheng)市(shi)(shi)(shi)Q。数(shu)据(ju)中除了日(ri)期和城(cheng)(cheng)市(shi)(shi)(shi)两个(ge)字段之外,还有销售(shou)总金额和销售(shou)总件数(shu)。表4总结(jie)了六个(ge)城(cheng)(cheng)市(shi)(shi)(shi)的(de)数(shu)据(ju)量(Observation)。

表(biao)4 羽绒服销量数据(ju)五个城市(shi)的数据(ju)量

城市(shi) Observation
城市G 1096
城市S 1100
城市H 1096
城市Z 1099
城市W 1100
城市Q 1079

从(cong)2011年(nian)1月(yue)1日到2013年(nian)12月(yue)31日共1096天,城(cheng)市S、城(cheng)市Z、城(cheng)市W数(shu)据(ju)(ju)中多(duo)出来的(de)(de)数(shu)据(ju)(ju)量(liang)是由于某(mou)一天的(de)(de)销(xiao)售(shou)量(liang)有两条记录导致(zhi)的(de)(de),我(wo)们把这些(xie)数(shu)据(ju)(ju)按天合(he)并。而城(cheng)市Q的(de)(de)某(mou)些(xie)天没有数(shu)据(ju)(ju),我(wo)们认为(wei)(wei)其销(xiao)量(liang)为(wei)(wei)0,气象数(shu)据(ju)(ju)则取相应时间段与观测城(cheng)市的(de)(de)数(shu)据(ju)(ju)。与酒精性饮料(liao)数(shu)据(ju)(ju)一样按照日粒度(du)进行(xing)整理,同时将一周销(xiao)量(liang)加总作为(wei)(wei)周销(xiao)量(liang)数(shu)据(ju)(ju),按两种时间维度(du)进行(xing)分析。

(三)天气数据描述

快速(su)消费(fei)(fei)品(pin)的(de)(de)(de)(de)酒精(jing)性饮料以及(ji)功能服饰类的(de)(de)(de)(de)羽绒服,业务数(shu)据的(de)(de)(de)(de)最小(xiao)时(shi)(shi)(shi)间颗(ke)粒度(du)为(wei)(wei)天,而天气观测数(shu)据最小(xiao)时(shi)(shi)(shi)间颗(ke)粒度(du)为(wei)(wei)分(fen)钟级。从公众气象(xiang)信息的(de)(de)(de)(de)获取(qu)、消费(fei)(fei)购物(wu)的(de)(de)(de)(de)习惯以及(ji)气象(xiang)数(shu)据日为(wei)(wei)单位(wei)的(de)(de)(de)(de)观测数(shu)据特性出发,主要(yao)以日作为(wei)(wei)天气驱(qu)动消费(fei)(fei)的(de)(de)(de)(de)最小(xiao)时(shi)(shi)(shi)间基础单位(wei),使用的(de)(de)(de)(de)相关气象(xiang)数(shu)据如表5。需要(yao)注意(yi)的(de)(de)(de)(de)是(shi),气象(xiang)数(shu)据可能会(hui)因为(wei)(wei)设备故障或是(shi)其他(ta)因素影(ying)响造(zao)成缺测情(qing)况(kuang),我们所选的(de)(de)(de)(de)都(dou)为(wei)(wei)国(guo)家级观测站,避免缺测导(dao)致(zhi)的(de)(de)(de)(de)数(shu)据质(zhi)量(liang)问(wen)题,而在采取(qu)以周为(wei)(wei)时(shi)(shi)(shi)间基础单位(wei)进行分(fen)析(xi)时(shi)(shi)(shi),以周天气数(shu)据记录的(de)(de)(de)(de)分(fen)位(wei)数(shu)为(wei)(wei)基础。

表5 日(ri)观测气(qi)象数据要素

数据 气象数据要素(日)
Id 字段名Field name 字段说明 备注说明
1 SiteId 台站编号 根据观测台站所在位置可以明确所在地(对应到行政区,如北京市东城区)
2 Day 观测日期
3 PressureAverage 日均大气压力 (单位:MPA)
4 PressureMax 日最大大气压力 (单位:MPA)
5 PressureMin 日最小大气压力 (单位:MPA)
6 TemperatureAverage 日平均气温 (单位:℃)
7 TemperatureMax 日最高气温 (单位:℃)
8 TemperatureMin 日最低气温 (单位:℃)
9 RelativeHumidityAverage 日平均相对湿度 (单位:℃)
10 RelativeHumidityMin 日最小相对湿度 (单位:%)
11 Precipitation20_8 前一日20时至当日8时的各时段降水量的累加值 (单位:mm)
12 Precipitation8_20 由当日08时至当日20时的各时段降水量的累加值 (单位:mm)
13 Precipitation20_20 由前一日20时至当日20时的各时段降水量的累加值 (单位:mm)
14 EvaporationSmall 日最小蒸发量 (单位:mm)
15 EvaporationLarge 日最大蒸发量 (单位:mm)
16 WindSpeedAverage 平均风速 (单位: m/s)
17 WindSpeedMax 最大风速 (单位: m/s)
18 WindSpeedMaxDirection 最大风速的风向 (度)
19 WindSpeedExtreme 极大风速 (单位: m/s)
20 WindSpeedExtremeDirection 极大风速的风向 (度:角度)
21 SunshineHour 日照时长 (单位:小时)
22 SurfaceTemperatureAverage 日地表均温 (单位:℃)
23 SurfaceTemperatureMax 日地表最高温 (单位:℃)
24 SurfaceTemperatureMin 日地表最低温 (单位:℃)

气象(xiang)的(de)数据分(fen)析(xi),除(chu)了以日(ri)(ri)值作(zuo)为分(fen)析(xi)要(yao)(yao)点外,还有其(qi)他几(ji)个特性(xing)也是在进行(xing)天气驱动(dong)行(xing)业(ye)(ye)分(fen)析(xi)时需要(yao)(yao)考量的(de),如(ru):连续(xu)几(ji)日(ri)(ri)高(gao)于35℃高(gao)温、连续(xu)几(ji)日(ri)(ri)降(jiang)雨、连续(xu)几(ji)日(ri)(ri)低于10℃、日(ri)(ri)夜温差超过(guo)20℃,等天气要(yao)(yao)素(su)模式(shi)(pattern)类型的(de)组合(he)都(dou)是天气驱动(dong)行(xing)业(ye)(ye)的(de)要(yao)(yao)素(su),所以除(chu)了表(biao)5的(de)天气要(yao)(yao)素(su)外还要(yao)(yao)设计(ji)多种天气要(yao)(yao)素(su)模式(shi)(pattern)。

天(tian)气上的重大事(shi)件,如台风(feng)(feng)也会对酒精(jing)性饮料(liao)销(xiao)量产生影响(xiang),所以(yi)我(wo)们(men)也将受(shou)影响(xiang)的时间、台风(feng)(feng)等(deng)级(ji)加(jia)入在(zai)气象数据(ju)中(台风(feng)(feng)主要反映在(zai)天(tian)气要素(su)的风(feng)(feng)速、降雨等(deng))。

公(gong)众目(mu)前获取最长的(de)天气(qi)预(yu)报(bao)为(wei)15天,羽绒服以及(ji)酒(jiu)精性饮料的(de)数(shu)据(ju)都自2011年与2013年开始,当时(shi)公(gong)众所(suo)获取的(de)天气(qi)预(yu)报(bao)数(shu)据(ju)多为(wei)7天,所(suo)以在数(shu)据(ju)清洗拟合(he)也会进行多种时(shi)间窗的(de)平移,以确定业(ye)务数(shu)据(ju)是受(shou)当日(ri)实(shi)际感受(shou)的(de)驱动,还是天气(qi)预(yu)报(bao)的(de)提前反应。

(四)补充数据描述

除了合作方提供的(de)销(xiao)(xiao)(xiao)售数(shu)(shu)(shu)(shu)据(ju)(ju)(ju)和(he)气(qi)象局的(de)数(shu)(shu)(shu)(shu)据(ju)(ju)(ju),还要考(kao)虑其他能够(gou)量(liang)化并(bing)获(huo)取的(de)可能影响(xiang)(xiang)销(xiao)(xiao)(xiao)量(liang)的(de)数(shu)(shu)(shu)(shu)据(ju)(ju)(ju)。消费(fei)者的(de)需求(qiu)也(ye)可能受经济因(yin)素的(de)影响(xiang)(xiang),因(yin)此我(wo)(wo)们(men)(men)(men)抓取了数(shu)(shu)(shu)(shu)据(ju)(ju)(ju)时间(jian)(jian)段(duan)内的(de)上证(zheng)指(zhi)(zhi)数(shu)(shu)(shu)(shu)和(he)居民消费(fei)价(jia)格(ge)指(zhi)(zhi)数(shu)(shu)(shu)(shu)(Consumer Price Index,CPI)。由于周(zhou)末(mo)(mo)(mo)收盘,在(zai)周(zhou)末(mo)(mo)(mo)没(mei)有(you)上证(zheng)指(zhi)(zhi)数(shu)(shu)(shu)(shu)数(shu)(shu)(shu)(shu)据(ju)(ju)(ju),周(zhou)末(mo)(mo)(mo)的(de)上证(zheng)指(zhi)(zhi)数(shu)(shu)(shu)(shu)我(wo)(wo)们(men)(men)(men)用周(zhou)五的(de)来(lai)填(tian)补。而我(wo)(wo)们(men)(men)(men)能获(huo)得的(de)CPI数(shu)(shu)(shu)(shu)据(ju)(ju)(ju)是一(yi)个(ge)(ge)月统计一(yi)次,因(yin)此在(zai)某一(yi)个(ge)(ge)月内,我(wo)(wo)们(men)(men)(men)统一(yi)用一(yi)个(ge)(ge)CPI数(shu)(shu)(shu)(shu)值。除此之外,对(dui)于酒(jiu)精性饮料(liao)销(xiao)(xiao)(xiao)售来(lai)说(shuo),在(zai)有(you)重(zhong)(zhong)大赛事(shi)时,如(ru)世界杯等,酒(jiu)精性饮料(liao)销(xiao)(xiao)(xiao)量(liang)会(hui)显著上升,因(yin)此我(wo)(wo)们(men)(men)(men)查找了数(shu)(shu)(shu)(shu)据(ju)(ju)(ju)时间(jian)(jian)段(duan)内可能会(hui)影响(xiang)(xiang)到酒(jiu)精性饮料(liao)销(xiao)(xiao)(xiao)量(liang)的(de)重(zhong)(zhong)大事(shi)件加(jia)入数(shu)(shu)(shu)(shu)据(ju)(ju)(ju)中。加(jia)入event变量(liang),如(ru)果(guo)当(dang)天(tian)有(you)重(zhong)(zhong)大事(shi)件,event为(wei)(wei)1,否(fou)则为(wei)(wei)0。在(zai)法(fa)定假日时,售点和(he)经销(xiao)(xiao)(xiao)商一(yi)般会(hui)提前存货,因(yin)此公司的(de)销(xiao)(xiao)(xiao)量(liang)会(hui)增加(jia),我(wo)(wo)们(men)(men)(men)把这(zhei)个(ge)(ge)因(yin)素也(ye)考(kao)虑进去,在(zai)数(shu)(shu)(shu)(shu)据(ju)(ju)(ju)中增加(jia)holiday变量(liang),假如(ru)当(dang)天(tian)是法(fa)定假日标记为(wei)(wei)1,否(fou)则标记为(wei)(wei)0。同样(yang),月末(mo)(mo)(mo)也(ye)会(hui)出现囤货的(de)现象,与(yu)法(fa)定假期(qi)一(yi)样(yang),我(wo)(wo)们(men)(men)(men)将月末(mo)(mo)(mo)标记为(wei)(wei)1,否(fou)则标记为(wei)(wei)0。

 

三、数据建模

为了找到所有(you)气(qi)(qi)象(xiang)要素(su)中(zhong)真正(zheng)影响销(xiao)量的要素(su),我(wo)们利(li)用皮尔森(Pearson)相关性(xing)进行检(jian)验,发(fa)现平均温度(du)是与酒精性(xing)饮料销(xiao)量以及羽绒服(fu)销(xiao)量关系(xi)最大的要素(su)。因(yin)此在描述性(xing)分(fen)析部分(fen),我(wo)们用平均气(qi)(qi)温来探索销(xiao)量与天气(qi)(qi)之间的关系(xi)。

(一)酒精性饮料数据的建模

(1)描(miao)述性分(fen)析

图(tu)1展示了一级渠(qu)(qu)道(dao)的(de)(de)(de)(de)销(xiao)(xiao)(xiao)(xiao)量(liang)(liang)(liang)按月份的(de)(de)(de)(de)分布(bu)情(qing)况(纵轴实(shi)际(ji)销(xiao)(xiao)(xiao)(xiao)售体(ti)(ti)积涉(she)及(ji)商(shang)业秘(mi)密不(bu)予展示,仅(jin)用(yong)(yong)于说明趋势(shi)),不(bu)同颜(yan)色代表(biao)(biao)不(bu)同年(nian)份,横坐标代表(biao)(biao)月份、纵坐标代表(biao)(biao)百升的(de)(de)(de)(de)销(xiao)(xiao)(xiao)(xiao)量(liang)(liang)(liang)。城(cheng)(cheng)市(shi)G和城(cheng)(cheng)市(shi)S是(shi)(shi)两(liang)个(ge)销(xiao)(xiao)(xiao)(xiao)量(liang)(liang)(liang)大城(cheng)(cheng)市(shi);夏天(tian)的(de)(de)(de)(de)销(xiao)(xiao)(xiao)(xiao)量(liang)(liang)(liang)有明显的(de)(de)(de)(de)增高,而当天(tian)气(qi)转冷的(de)(de)(de)(de)时(shi)候销(xiao)(xiao)(xiao)(xiao)量(liang)(liang)(liang)会(hui)下降(jiang);在城(cheng)(cheng)市(shi)G,销(xiao)(xiao)(xiao)(xiao)量(liang)(liang)(liang)在逐(zhu)年(nian)上升,但是(shi)(shi)在城(cheng)(cheng)市(shi)S、城(cheng)(cheng)市(shi)Z、城(cheng)(cheng)市(shi)H、城(cheng)(cheng)市(shi)W这四(si)个(ge)城(cheng)(cheng)市(shi)却(que)没(mei)有这样(yang)的(de)(de)(de)(de)趋势(shi);城(cheng)(cheng)市(shi)S、城(cheng)(cheng)市(shi)Z、城(cheng)(cheng)市(shi)H、城(cheng)(cheng)市(shi)W这四(si)个(ge)城(cheng)(cheng)市(shi)七八月之后的(de)(de)(de)(de)销(xiao)(xiao)(xiao)(xiao)量(liang)(liang)(liang)均出现了急速下降(jiang)。图(tu)2展示了二级渠(qu)(qu)道(dao)的(de)(de)(de)(de)销(xiao)(xiao)(xiao)(xiao)量(liang)(liang)(liang)按月份的(de)(de)(de)(de)分布(bu)情(qing)况(纵轴实(shi)际(ji)销(xiao)(xiao)(xiao)(xiao)售体(ti)(ti)积涉(she)及(ji)商(shang)业秘(mi)密不(bu)予展示,仅(jin)用(yong)(yong)于说明趋势(shi)),其趋势(shi)与(yu)一级渠(qu)(qu)道(dao)一样(yang),也呈现出季(ji)节的(de)(de)(de)(de)周期性变化。

从销(xiao)(xiao)(xiao)(xiao)量(liang)按(an)(an)月份(fen)的(de)(de)(de)(de)趋势来看,销(xiao)(xiao)(xiao)(xiao)量(liang)确实与天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)有(you)一定的(de)(de)(de)(de)关系。我们在(zai)分(fen)(fen)析的(de)(de)(de)(de)时候分(fen)(fen)别(bie)以(yi)天(tian)(tian)(tian)(tian)(销(xiao)(xiao)(xiao)(xiao)售日与当日天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)数据(ju)(ju),以(yi)及销(xiao)(xiao)(xiao)(xiao)售日数据(ju)(ju)分(fen)(fen)别(bie)平(ping)滑1天(tian)(tian)(tian)(tian)到7天(tian)(tian)(tian)(tian);区(qu)分(fen)(fen)是(shi)受当时天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)感受的(de)(de)(de)(de)影响,还是(shi)接(jie)收天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)预(yu)报(bao)后(hou)所做的(de)(de)(de)(de)反应)还有(you)周(zhou)(采用周(zhou)天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)要(yao)素的(de)(de)(de)(de)分(fen)(fen)位数),最(zui)终是(shi)以(yi)周(zhou)为(wei)单位进(jin)行预(yu)测的(de)(de)(de)(de),因此下(xia)面我们按(an)(an)周(zhou)对(dui)销(xiao)(xiao)(xiao)(xiao)量(liang)和天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)进(jin)行描述。图3和图 4分(fen)(fen)别(bie)为(wei)二级(ji)渠(qu)道和一级(ji)渠(qu)道的(de)(de)(de)(de)销(xiao)(xiao)(xiao)(xiao)量(liang)和天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)按(an)(an)周(zhou)的(de)(de)(de)(de)趋势,横轴(zhou)为(wei)周(zhou),左边(bian)纵(zong)轴(zhou)为(wei)销(xiao)(xiao)(xiao)(xiao)量(liang),右边(bian)纵(zong)轴(zhou)为(wei)平(ping)均气(qi)(qi)(qi)温。出现的(de)(de)(de)(de)负(fu)值销(xiao)(xiao)(xiao)(xiao)量(liang)表示(shi)这一周(zhou)有(you)退货(huo)(huo)的(de)(de)(de)(de)情(qing)况(kuang),而且退货(huo)(huo)数量(liang)要(yao)比(bi)(bi)订(ding)货(huo)(huo)数量(liang)高,在(zai)销(xiao)(xiao)(xiao)(xiao)量(liang)比(bi)(bi)较(jiao)低的(de)(de)(de)(de)城(cheng)(cheng)(cheng)(cheng)(cheng)市会(hui)出现这样的(de)(de)(de)(de)现象。在(zai)城(cheng)(cheng)(cheng)(cheng)(cheng)市G,销(xiao)(xiao)(xiao)(xiao)量(liang)和天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)的(de)(de)(de)(de)趋势比(bi)(bi)较(jiao)明显,而城(cheng)(cheng)(cheng)(cheng)(cheng)市S会(hui)出现一些异(yi)常(chang)情(qing)况(kuang),城(cheng)(cheng)(cheng)(cheng)(cheng)市H、城(cheng)(cheng)(cheng)(cheng)(cheng)市W、城(cheng)(cheng)(cheng)(cheng)(cheng)市Z的(de)(de)(de)(de)趋势比(bi)(bi)较(jiao)弱,特别(bie)是(shi)城(cheng)(cheng)(cheng)(cheng)(cheng)市W,其销(xiao)(xiao)(xiao)(xiao)量(liang)整体偏(pian)低,就算(suan)气(qi)(qi)(qi)温有(you)明显的(de)(de)(de)(de)上升,其销(xiao)(xiao)(xiao)(xiao)量(liang)也没有(you)增长。

城市G
 city1
城市S 城市Z
city2 city3
城市H 城市W
city4 city5

图(tu)1 一级渠道销量按月趋势

城市G
city6
城市S 城市Z
city7 city8
城市H 城市W
city9 city10

图2 二级渠道销(xiao)量按月(yue)趋势

城市G
city11
城市S 城市Z
city12 city13
城市H 城市W
city14 city15

图(tu)3 一级(ji)渠(qu)道销量(liang)与平均气温(wen)按周趋势(shi)(橘(ju)色曲(qu)线为天气平均温(wen)度要素,蓝色曲(qu)线为销量(liang))

 

城市G
city16
城市S 城市Z
city17 city18
城市H 城市W
city19 city20

图4 二级渠道销量与平(ping)均(jun)气温按(an)周趋势(橘(ju)色曲线为天气平(ping)均(jun)温度(du)要素,蓝(lan)色曲线为销量)

 

(2)模型(xing)设定(ding)

时(shi)间序(xu)列数据(ju)(ju)一般由(you)长期(qi)趋(qu)(qu)(qu)势(shi)、季(ji)节(jie)(jie)(jie)变(bian)(bian)(bian)(bian)动(dong)、循(xun)(xun)环变(bian)(bian)(bian)(bian)动(dong)、不规则(ze)变(bian)(bian)(bian)(bian)动(dong)四个部分(fen)(fen)组成。其(qi)中长期(qi)趋(qu)(qu)(qu)势(shi)指(zhi)(zhi)的(de)(de)是(shi)随(sui)着时(shi)间的(de)(de)变(bian)(bian)(bian)(bian)化(hua);季(ji)节(jie)(jie)(jie)变(bian)(bian)(bian)(bian)动(dong)指(zhi)(zhi)随(sui)着季(ji)节(jie)(jie)(jie)变(bian)(bian)(bian)(bian)化(hua)的(de)(de)周期(qi)性(xing)变(bian)(bian)(bian)(bian)动(dong);循(xun)(xun)环变(bian)(bian)(bian)(bian)动(dong)指(zhi)(zhi)以若(ruo)干(gan)年为(wei)单(dan)位的(de)(de)变(bian)(bian)(bian)(bian)化(hua);不规则(ze)变(bian)(bian)(bian)(bian)动(dong)是(shi)随(sui)机(ji)变(bian)(bian)(bian)(bian)化(hua)导(dao)致(zhi)的(de)(de)波(bo)动(dong)。本文的(de)(de)数据(ju)(ju)时(shi)间间隔(ge)均(jun)为(wei)3年左右,所(suo)以不存在(zai)循(xun)(xun)环变(bian)(bian)(bian)(bian)动(dong)项。我(wo)们把数据(ju)(ju)分(fen)(fen)解为(wei)趋(qu)(qu)(qu)势(shi)项、季(ji)节(jie)(jie)(jie)项和(he)随(sui)机(ji)波(bo)动(dong)项,以二级渠道销售(shou)数据(ju)(ju)为(wei)例(li),分(fen)(fen)解情况如图5(纵轴实(shi)际销售(shou)体积(ji)涉及(ji)商业秘密不予展示,仅用(yong)于说(shuo)明趋(qu)(qu)(qu)势(shi))。分(fen)(fen)解之后,虽然由(you)于目前数据(ju)(ju)中还有很(hen)多没有测量出(chu)(chu)来(lai)的(de)(de)因素,白(bai)噪声部分(fen)(fen)不是(shi)完(wan)全由(you)随(sui)机(ji)波(bo)动(dong)影响的(de)(de),但是(shi)季(ji)节(jie)(jie)(jie)项按季(ji)节(jie)(jie)(jie)的(de)(de)周期(qi)趋(qu)(qu)(qu)势(shi)更加(jia)明显了,而趋(qu)(qu)(qu)势(shi)项随(sui)着时(shi)间的(de)(de)变(bian)(bian)(bian)(bian)化(hua)呈(cheng)现一定(ding)的(de)(de)波(bo)动(dong)。我(wo)们对(dui)分(fen)(fen)解出(chu)(chu)的(de)(de)季(ji)节(jie)(jie)(jie)项和(he)趋(qu)(qu)(qu)势(shi)项分(fen)(fen)别进(jin)行预测。

对于季节项部分,我们采用随机森林进行预测。随机森林由2001年被Breiman 提出[7],是一种基于树的集成学习算法。Fernandez-Delgado et al. [8] 在121份数据集上进行了测试,证明随机森林是在支持向量机、神经网络等机器学习算法中表现得最好的一个算法。对于我们的数据来说,很难看出天气变化对销量的影响呈现特定的函数关系,因此我们选用随机森林这种不需要模型假设的非参数方法进行预测。

对(dui)于趋(qu)势(shi)项部分,我们采(cai)用三(san)次样条进行预测(ce)。由(you)于不同城市随着时间变(bian)化(hua)的(de)趋(qu)势(shi)差(cha)别(bie)很(hen)大(da),利用三(san)次样条,我们可(ke)以拟合不同形状的(de)趋(qu)势(shi)变(bian)化(hua)。

基于(yu)公众可以(yi)便(bian)利(li)的(de)(de)获取气(qi)象局提供的(de)(de)7天(tian)(最多15天(tian))天(tian)气(qi)预报前提,与以(yi)往的(de)(de)销(xiao)(xiao)售(shou)预测不同(tong),我(wo)们(men)(men)可以(yi)利(li)用(yong)未(wei)来(lai)的(de)(de)天(tian)气(qi)进(jin)行预测。同(tong)时(shi),呈季节变化的(de)(de)销(xiao)(xiao)量(liang)(liang)不仅受到了天(tian)气(qi)和(he)经济因素的(de)(de)影响(xiang),上一(yi)(yi)(yi)年(nian)同(tong)一(yi)(yi)(yi)个时(shi)间(jian)点的(de)(de)销(xiao)(xiao)量(liang)(liang)和(he)上一(yi)(yi)(yi)周(zhou)的(de)(de)销(xiao)(xiao)量(liang)(liang)也(ye)与当前时(shi)间(jian)点的(de)(de)销(xiao)(xiao)量(liang)(liang)有关系,因此(ci)我(wo)们(men)(men)把同(tong)比销(xiao)(xiao)量(liang)(liang)和(he)环比销(xiao)(xiao)量(liang)(liang)也(ye)放(fang)入模型中。除此(ci)之外(wai),为了考虑经济环境的(de)(de)影响(xiang),我(wo)们(men)(men)加入了上证指数和(he)CPI。

(3)模型结(jie)果(guo)

我们从数据中剔除(chu)出最(zui)后三个(ge)月的(de)(de)数据来做测(ce)试集(ji)(ji),剩(sheng)下(xia)的(de)(de)部分(fen)均为学习集(ji)(ji)。通过(guo)真实值(zhi)(zhi)与预(yu)测(ce)值(zhi)(zhi)之间的(de)(de)误(wu)差的(de)(de)绝对(dui)值(zhi)(zhi)占真实值(zhi)(zhi)的(de)(de)百分(fen)比来衡(heng)量预(yu)测(ce)误(wu)差,预(yu)测(ce)误(wu)差总结见表(biao)6:

表6 酒精性饮料销量(liang)的(de)预测误差

城市 预测误差
一级渠道 二级渠道
城市G 0.1133 0.1203
城市S 0.2808 0.2228
城市H 0.2821 0.3046
城市Z 0.4103 0.1454
城市W 0.4457 0.1988

城(cheng)市G的(de)预(yu)测效果(guo)是最(zui)好的(de),城(cheng)市S次之。在所有天气要素(su)中(zhong)(风、温度(du)、相对(dui)湿(shi)度(du)、大气压力、降雨),温度(du)要素(su)与销售量相关性最(zui)高,但是在图(tu)3和图(tu)4中(zhong),仅(jin)城(cheng)市G可以看到销量和天气的(de)气温要素(su)走势(shi)比较一致,而其他城(cheng)市会出(chu)现气温上升(sheng),销量反而下滑的(de)情况(kuang),而且城(cheng)市G的(de)销量波动趋势(shi)也比较平稳(wen)。

城市G
city21
城市S
city22
城市Z
city23
城市H
city24
城市W
city25

图5 二级渠道销量分(fen)解(jie)情况(kuang)

 

(二)羽绒服数据建模

(1)描述性(xing)分析

图6和图7分别(bie)为羽绒服销(xiao)(xiao)量(liang)与天气(qi)之间的趋(qu)势变化图。虽然(ran)不同城(cheng)市(shi)(shi)之间趋(qu)势有差(cha)别(bie),但(dan)是(shi)(shi)基本上(shang)都呈(cheng)现(xian)当(dang)气(qi)温开始下降(jiang)的时候,销(xiao)(xiao)量(liang)开始上(shang)升的趋(qu)势。同时,不管是(shi)(shi)按销(xiao)(xiao)量(liang)金(jin)额(e)还是(shi)(shi)销(xiao)(xiao)量(liang)件(jian)数都呈(cheng)现(xian)逐年上(shang)升的情况。但(dan)是(shi)(shi)对于城(cheng)市(shi)(shi)S来说(shuo),虽然(ran)每年的销(xiao)(xiao)量(liang)金(jin)额(e)都在上(shang)升,但(dan)是(shi)(shi)销(xiao)(xiao)量(liang)件(jian)数却仅在11年冬(dong)季出现(xian)了一个(ge)高峰后就急剧降(jiang)低,需要进一步(bu)结合其他数据(ju)进行探(tan)讨或(huo)是(shi)(shi)测试(shi)。

表7展示了(le)销(xiao)(xiao)量(liang)(liang)(liang)与平均(jun)气温(wen)(wen)之(zhi)(zhi)间的皮尔森(Pearson)相关(guan)度。除了(le)城市S的销(xiao)(xiao)量(liang)(liang)(liang)件数出现(xian)了(le)异(yi)常之(zhi)(zhi)外,平均(jun)气温(wen)(wen)与销(xiao)(xiao)量(liang)(liang)(liang)之(zhi)(zhi)间呈现(xian)负相关(guan),这表明随着气温(wen)(wen)下降,羽绒服的销(xiao)(xiao)量(liang)(liang)(liang)会(hui)上升,同(tong)时(shi),相关(guan)度均(jun)在(zai)0.3左右,说(shuo)明气温(wen)(wen)与销(xiao)(xiao)量(liang)(liang)(liang)之(zhi)(zhi)间有比较(jiao)强(qiang)的关(guan)系。

表7 销量与平均(jun)气温之间(jian)的皮(pi)尔森(PEARSON)相关系数

城市(shi) 销量(liang)(成交价格:元) 销量(liang)(件(jian))
城市G -0.3980 -0.3332
城市S -0.3188 -0.0008
城市H -0.3267 -0.2888
城市Z -0.3043 -0.2828
城市W -0.3319 -0.2999
城市Q -0.2283 -0.2185

 

城市G
city26
城市S
city27
城市H
city28
城市Z
city29
城市W
city30
城市Q
city31

图(tu)6 销量(元)与平均气温的变化趋(qu)势(红色曲(qu)线为天气,蓝(lan)色曲(qu)线为销量)

城市G
city32
城市S
city33
城市H
city34
城市Z
city35
城市W
city36
城市Q
city37

图7 销(xiao)量(liang)(件)与平(ping)均气温(wen)的变化趋势(红色曲线(xian)为(wei)(wei)天气,绿色曲线(xian)为(wei)(wei)销(xiao)量(liang))

(2)模型设定(ding)

和(he)(he)酒精性饮料数据一(yi)样,我们同(tong)样将数据分解为趋势(shi)项、季节项和(he)(he)随机波动项。对于趋势(shi)项我们依旧(jiu)采(cai)用三次(ci)样条去拟合,而对于季节项,由于我们仅用皮尔森(PEARSON)相关系数就已经可(ke)以(yi)测量(liang)到平均气(qi)温(wen)与销量(liang)之间很(hen)强的(de)(de)相关度,因此我们用线(xian)性回(hui)归来进行预测。同(tong)样,我们在模(mo)型中(zhong)加(jia)入(ru)了环比(bi)销量(liang)和(he)(he)同(tong)比(bi)销量(liang)。而从图6和(he)(he)7 中(zhong),可(ke)以(yi)看出(chu),一(yi)般在气(qi)温(wen)达(da)到峰值后的(de)(de)两(liang)个星(xing)期,销量(liang)达(da)到峰值,因此我们在模(mo)型中(zhong)加(jia)入(ru)比(bi)当前时间点提前两(liang)个星(xing)期的(de)(de)天气(qi)因素(su)。

(3)模型结果

和酒精性饮料数(shu)据一样,我们剔除出最后三个月的(de)数(shu)据来做测试(shi)集(ji),剩下(xia)的(de)部分(fen)(fen)均为学习(xi)集(ji)。通(tong)过真实值与预测值之(zhi)间(jian)的(de)误差的(de)绝(jue)对值占(zhan)真实值的(de)百分(fen)(fen)比来衡(heng)量预测误差。表8展示了(le)羽绒(rong)服数(shu)据的(de)预测误差,很(hen)明显,除了(le)城市S的(de)销量件数(shu)之(zhi)外,其(qi)他部分(fen)(fen)的(de)预测效果都很(hen)好,说明天气(qi)对羽绒(rong)服销量的(de)影响的(de)确十分(fen)(fen)大。

表8 羽绒服数据销量(liang)预测结果

城市 预测误差
销量(元) 销量(件)
城市G 0.0578 0.1000
城市S 0.0452 0.1537
城市H 0.0541 0.0885
城市Z 0.0527 0.0855
城市W 0.0433 0.0673
城市Q 0.0378 0.0664

 

四、业务实施

(Data  Driven)的落(luo)地实施(shi)过(guo)程中,我们(men)与企业(ye)的首(shou)要目标(biao)是明确我们(men)要解(jie)决的商业(ye)问题(Business Question)并进一步了解(jie)透过(guo)数据(ju)进行(xing)分析挖掘解(jie)决问题的可(ke)能。

我们与企(qi)业(ye)合作在设定(ding)商业(ye)问题过程(cheng)中,发现企(qi)业(ye)对于开始数据分析业(ye)务(wu)的商业(ye)问题更多集中在可快速(su)简单(dan)量化成(cheng)绩(ji)的销(xiao)售业(ye)务(wu)(商品或服(fu)务(wu)的销(xiao)售成(cheng)果)与营销(xiao)业(ye)务(wu)(促销(xiao)活(huo)动(dong)、广告投(tou)放等),实施全程(cheng)采取了天(tian)气驱动(dong)业(ye)务(wu)分析框架(Weather Driven Analysis Framework)如(ru)图8。

city38

图(tu)8 天气驱动业务(wu)分(fen)析框架

本(ben)文探讨(tao)的(de)酒精性饮(yin)料以(yi)及(ji)羽(yu)绒服的(de)商(shang)业问(wen)题:销(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测以(yi)及(ji)支持精准营销(xiao)。天(tian)气(qi)驱(qu)动项目交(jiao)付的(de)是(1)可(ke)(ke)以(yi)实时运行可(ke)(ke)视化销(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测模(mo)型与(2)持续(xu)的(de)精细化天(tian)气(qi)预(yu)(yu)(yu)测数据(ju)(ju)支持,示意(yi)画面如图9(因商(shang)业秘密,仅提供系统示意(yi)画面);我们也称此为天(tian)气(qi)驱(qu)动销(xiao)售(shou)(shou)(shou)仪(yi)表板(Dashboard)。客户接(jie)入(ru)天(tian)气(qi)预(yu)(yu)(yu)测数据(ju)(ju)后、同时将假日、价格、促销(xiao)等因子由ERP同步(bu)接(jie)入(ru),天(tian)气(qi)驱(qu)动销(xiao)售(shou)(shou)(shou)仪(yi)表板实时显(xian)示最新的(de)销(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测数字,输出(chu)内容(rong)包括:城市、总销(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测量、各品(pin)牌销(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测量、各渠道(dao)销(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测量以(yi)及(ji)相关的(de)天(tian)气(qi)数据(ju)(ju)与预(yu)(yu)(yu)警(jing)信息(xi)。

city39

图9 天气驱动业务销售预测示意画(hua)面

由经验(yan)判(pan)断开始使用(yong)更多(duo)的数(shu)(shu)据与(yu)采用(yong)大数(shu)(shu)据相(xiang)关技术开始数(shu)(shu)据驱动(Data Driven)经营企(qi)业,天气驱动销售让企(qi)业做(zuo)出下列举措变(bian)化与(yu)趋势:

  1. 企业的产销计划(SOP: Sales & Operation Planning)得到定量的科学化预测支持。
  2. 公司经营与渠道商开始了解天气预报与影响,根据数据进行采购与销售。
  3. 开始天气相关的营销活动(Campaign)。
  4. 根据天气因果性,开始思索如何精确的投放广告(根据目前天气预报的时长准确程度,还无法应对目前传统广告采购规则,但移动广告则非常有机会)。
  5. 电商平台根据各地天气变化预报,调整推送受天气驱动商品。

 

五、总结讨论

本(ben)文通过公共数(shu)据(ju)(ju)(气(qi)象数(shu)据(ju)(ju))结合(he)行业(ye)数(shu)据(ju)(ju)实(shi)际探讨两种不同交易(yi)(yi)形态的(de)业(ye)务(wu):B2B与(yu)B2C,完(wan)成(cheng)通过实(shi)际交易(yi)(yi)数(shu)据(ju)(ju)与(yu)天(tian)气(qi)数(shu)据(ju)(ju)分析挖掘相关性与(yu)因果性实(shi)现天(tian)气(qi)驱(qu)动(dong)(Weather Driven)的(de)实(shi)践(jian),促(cu)使数(shu)据(ju)(ju)驱(qu)动(dong)(Data Driven)能够(gou)真实(shi)落(luo)地协助行业(ye)在同质化非常严重(zhong)的(de)产业(ye)环(huan)境(jing)中快速回应(ying)挑战(zhan)(zhan);但(dan)在大环(huan)境(jing)下,企(qi)业(ye)对于开始数(shu)据(ju)(ju)驱(qu)动(dong)业(ye)务(wu)管理,总(zong)是希望以最(zui)低(di)的(de)投入让现有的(de)资料、数(shu)据(ju)(ju)、IT等资源(yuan)以最(zui)低(di)成(cheng)本(ben)、低(di)风险又(you)有效的(de)方式(shi)完(wan)成(cheng)数(shu)据(ju)(ju)驱(qu)动(dong)的(de)企(qi)业(ye)经(jing)营,造(zao)成(cheng)执(zhi)行者必(bi)须(xu)面对以有限资源(yuan)追(zhui)求极大化成(cheng)效的(de)挑战(zhan)(zhan),也造(zao)就企(qi)业(ye)开始数(shu)据(ju)(ju)驱(qu)动(dong)业(ye)务(wu)管理变革上(shang)的(de)风险。

天(tian)(tian)气(qi)(qi)(qi)(qi)虽然影(ying)响(xiang)众多行(xing)业,但是(shi)天(tian)(tian)气(qi)(qi)(qi)(qi)终(zhong)究仅(jin)是(shi)一(yi)项影(ying)响(xiang)因(yin)子;我们进(jin)行(xing)天(tian)(tian)气(qi)(qi)(qi)(qi)驱动业务(wu)分(fen)析业务(wu)实践中,天(tian)(tian)气(qi)(qi)(qi)(qi)驱动销(xiao)售(shou)(shou)以快速消费品(pin)(FMCG)行(xing)业销(xiao)售(shou)(shou)数据+天(tian)(tian)气(qi)(qi)(qi)(qi)数据的效果反馈最佳,主要(yao)是(shi)因(yin)消费者(zhe)可以用低成本抵抗(kang)天(tian)(tian)气(qi)(qi)(qi)(qi)带来的影(ying)响(xiang),本文(wen)所提及的酒精性饮料快速消费品(pin)的实际(ji)案例。其他(ta)像是(shi)大气(qi)(qi)(qi)(qi)污染预报(bao)、医疗保健(jian)(Healthcare)、农林渔牧也有相当正面的反馈;但是(shi)对于需要(yao)产品(pin)生命周期较(jiao)长、售(shou)(shou)价(jia)较(jiao)高、品(pin)牌占比(bi)较(jiao)重的行(xing)业或领域则需要(yao)更进(jin)一(yi)步的探(tan)讨。

在快(kuai)速消(xiao)费品(pin)的(de)(de)(de)天气驱(qu)动销售虽然可(ke)以(yi)得(de)到(dao)很(hen)好(hao)(hao)的(de)(de)(de)效果(guo),又可(ke)以(yi)细分为不(bu)同的(de)(de)(de)区域(市场(chang)),以(yi)酒精(jing)性(xing)(xing)饮料为例,在城市G与(yu)城市S两个城市该品(pin)牌(pai)已(yi)经(jing)非常成熟,最(zui)终得(de)到(dao)的(de)(de)(de)预(yu)测(ce)准确性(xing)(xing)也非常高,可(ke)是在城市W对该品(pin)牌(pai)还属于新(xin)兴(xing)市场(chang)(Emerging Market)与(yu)天气的(de)(de)(de)相(xiang)关性(xing)(xing)远低于该酒精(jing)性(xing)(xing)饮料口碑、品(pin)牌(pai)认知与(yu)当地口味喜好(hao)(hao)等因(yin)素的(de)(de)(de)影响。羽绒服(fu)的(de)(de)(de)数(shu)据结果(guo)同样说明(ming)了(le)类似的(de)(de)(de)结论,特(te)(te)别呈现在羽绒服(fu)的(de)(de)(de)功(gong)能性(xing)(xing)与(yu)服(fu)饰特(te)(te)性(xing)(xing)上(shang),例如在城市Q这样冬天非常寒冷的(de)(de)(de)区域就会更重视功(gong)能性(xing)(xing),而像是城市G地区消(xiao)费者更注(zhu)重的(de)(de)(de)是服(fu)『饰』的(de)(de)(de)功(gong)能。

从(cong)天(tian)气驱动(dong)(dong)销(xiao)(xiao)(xiao)售(shou)(shou)角(jiao)度来看数(shu)据采(cai)集:酒精性饮料项目(mu)的(de)数(shu)据来源于(yu)ERP以及渠(qu)(qu)道商的(de)GO-TO-MARKET销(xiao)(xiao)(xiao)售(shou)(shou)数(shu)据,有两(liang)项特(te)点:(1)国(guo)内(nei)企(qi)(qi)业的(de)ERP系统主要(yao)(yao)追求的(de)目(mu)标是(shi)(shi)财务记账(zhang)导向(以符合会(hui)计(ji)准则的(de)记录为(wei)依据),可信的(de)是(shi)(shi)交(jiao)易(yi)数(shu)量(liang)与(yu)金额的(de)正(zheng)(zheng)(zheng)确,但无法记录真实(shi)的(de)交(jiao)易(yi)时间;(2)渠(qu)(qu)道商的(de)GO-TO-MARKET销(xiao)(xiao)(xiao)售(shou)(shou)数(shu)据受(shou)到返利(li)(Rebate)政策影响,所(suo)有的(de)交(jiao)易(yi)数(shu)据都(dou)会(hui)因不同区域结算返利(li)或渠(qu)(qu)道申报销(xiao)(xiao)(xiao)售(shou)(shou)考核的(de)时间点而无法记录真实(shi)的(de)交(jiao)易(yi)时间。这(zhei)两(liang)项特(te)点发生在(zai)非常多企(qi)(qi)业CRM(Customer Relationship Management)、ERP系统上(shang),所(suo)以若需要(yao)(yao)进行天(tian)气驱动(dong)(dong)销(xiao)(xiao)(xiao)售(shou)(shou),需要(yao)(yao)投入更多的(de)精力(li)了解每一笔数(shu)据与(yu)每一个(ge)字段的(de)业务含义,才有机会(hui)真正(zheng)(zheng)(zheng)帮(bang)助到企(qi)(qi)业开始(shi)好的(de)数(shu)据驱动(dong)(dong)管理(li)(理(li)解业务才能真正(zheng)(zheng)(zheng)解决商业问(wen)题(ti))。

成(cheng)(cheng)功的(de)(de)数(shu)据(ju)(ju)驱(qu)动业务管理取决于设定正(zheng)确的(de)(de)商(shang)业问题(ti)(Business Question),通过对行(xing)业的(de)(de)理解不(bu)断(duan)地(di)提出可能的(de)(de)假(jia)设(Hypothesis)并(bing)使用大数(shu)据(ju)(ju)的(de)(de)方法论进行(xing)验(yan)证每一项假(jia)设,直到(dao)可验(yan)证数(shu)据(ju)(ju)因果(guo)性(xing)的(de)(de)阶段(duan),并(bing)测试成(cheng)(cheng)功,才是(shi)完整的(de)(de)数(shu)据(ju)(ju)驱(qu)动业务实践(Practice)。错误的(de)(de)问题(ti)会增加企业在推动数(shu)据(ju)(ju)驱(qu)动管理业务成(cheng)(cheng)本与(yu)风险,例如我们(men)将商(shang)业问题(ti)设定为(wei)酒精(jing)性(xing)饮料销(xiao)售与(yu)天(tian)(tian)气要素的(de)(de)相关性(xing),我们(men)很容易得到(dao)天(tian)(tian)气炎(yan)热酒精(jing)性(xing)饮料销(xiao)售量就会上升的(de)(de)结(jie)论(甚至不(bu)用数(shu)据(ju)(ju)就可以得到(dao)此结(jie)论),但是(shi)对于企业需要的(de)(de)是(shi)帮助(zhu)企业用数(shu)据(ju)(ju)去掌握、洞(dong)悉(Insight)、预测商(shang)业行(xing)为(wei),而(er)不(bu)是(shi)为(wei)了大数(shu)据(ju)(ju)而(er)大数(shu)据(ju)(ju)。

本文主要研(yan)(yan)究(jiu)天(tian)气(qi)驱(qu)动的(de)(de)(de)销售预测,在(zai)酒(jiu)精性(xing)饮料(liao)销量和羽绒服(fu)销量两(liang)个领域(yu),利(li)用(yong)天(tian)气(qi)进(jin)行(xing)预测均取(qu)得了(le)十(shi)分(fen)优(you)秀的(de)(de)(de)效(xiao)果。本文仍有(you)(you)很(hen)多可以进(jin)一(yi)(yi)步研(yan)(yan)究(jiu)的(de)(de)(de)空间(jian);目前(qian),我(wo)们(men)(men)研(yan)(yan)究(jiu)的(de)(de)(de)时间(jian)周期都只有(you)(you)三年,而很(hen)多特殊的(de)(de)(de)气(qi)象现(xian)象,如厄尔尼诺(El Nino)、激烈天(tian)气(qi)等,只有(you)(you)在(zai)比较长(zhang)的(de)(de)(de)时间(jian)下(xia)才能表现(xian)出(chu)来,我(wo)们(men)(men)会进(jin)一(yi)(yi)步收(shou)集更(geng)多的(de)(de)(de)数(shu)(shu)据(ju)(ju)(ju)改(gai)善我(wo)们(men)(men)已有(you)(you)的(de)(de)(de)实践积(ji)累。在(zai)我(wo)们(men)(men)的(de)(de)(de)数(shu)(shu)据(ju)(ju)(ju)中,特别(bie)是(shi)酒(jiu)精性(xing)饮料(liao)数(shu)(shu)据(ju)(ju)(ju),有(you)(you)很(hen)多异(yi)常(chang)的(de)(de)(de)情况无法用(yong)现(xian)有(you)(you)的(de)(de)(de)数(shu)(shu)据(ju)(ju)(ju)解释,需要和行(xing)业(ye)进(jin)行(xing)深入(ru)交流(liu)才能够进(jin)一(yi)(yi)步呈(cheng)现(xian)出(chu)更(geng)好的(de)(de)(de)数(shu)(shu)据(ju)(ju)(ju)驱(qu)动业(ye)务效(xiao)果,好的(de)(de)(de)数(shu)(shu)据(ju)(ju)(ju)驱(qu)动业(ye)务一(yi)(yi)定是(shi)来自于深入(ru)行(xing)业(ye)了(le)解行(xing)业(ye)的(de)(de)(de)努力与积(ji)累。

参考(kao)文献

[1] 施瓦茨(ci). 气候经济(ji)学[M]. 气象出版社, 2012.

[2] Byunglak Lee, Victor J. Tremblay. Advertising and the U.S. Market Demand for Beer.[J]. Applied Economics, 1992, 24(1):69-76.

[3] Rojas C, Peterson E B. Demand for differentiated products: Price and advertising evidence from the U.S. beer market [J]. International Journal of Industrial Organization, 2008, 26(1):288-307.

[4] Voleti S, Ghosh P. A non-parametric model of residual brand equity in hierarchical branding structures with application to US beer data[J]. Journal of the Royal Statistical Society, 2014, 177(1):135–152.

[5] Empen J, Hamilton S F. How Do SUPERMARKETS RESPOND TO BRAND-LEVEL DEMAND SHOCKS? EVIDENCE FROM THE GERMAN BEER MARKET[J]. American Journal of Agricultural Economics, 2013, 95(5):1223-1229.

[6] 刘一(yi)伶, 杜(du)春(chun)生, 张辉. 羽(yu)绒服销量预测模型及(ji)其商业应(ying)用研究[J]. 现代经济信息, 2012(19):175-176.

[7] Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1):5–32.

[8] Fernández-Delgado M, Cernadas E, Barro S, et al. Do we need hundreds of classifiers to solve real world classification problems?[J]. Journal of Machine Learning Research, 2014, 15(1):3133-3181.

来源:统计之都

作者:罗应琏(北京维艾思气象信息科技有限公司),朱珊(中山大学华南统计科学研究中心) ,何顺(中山大学华南统计科学研究中心),周翔(中山大学华南统计科学研究中心),李昶(北京维艾思气象信息科技有限公司) ,王学钦(中山大学华南统计科学研究中心)

链接:http://cos.name/2016/05/weather-driven-industry-sales-big-data/

玻璃隔断_办公室玻璃隔断墙—希格玛隔墙_好隔墙 淋浴房厂家,中山淋浴房,中山淋浴房厂家,不锈钢淋浴房-玛莎洁具 热收缩包装机_热收缩机具备厂家直销价格优势的专业提供商-青岛麦格自动化设备有限公司 滦州市捷澳建材有限公司 深圳市纺织(集团)股份有限公司 -深圳市纺织(集团)股份有限公司 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人