数据预测实战:2019天猫双11销售额预测:2583.387亿
- 2019 年 11 月 12 日
- 筆記
来源:本文来自《趣味数据周刊》
作者:herain

数据预测,不是实际值,不要迷信
一年一度的双11,我们喜欢买买买,更乐意看到全民双11会创作怎样的销售奇迹。2019年是第11个双11,希望我们的梦想一一实现,再创销售奇迹。
等不及,我们一起预测2019天猫双11销售额。
注释:times代表第几次,gmv代表销售额
1、历年销售预览:

2、简单的折线图:

3、绘制散点图:
看一看次数与销售额的的关系,可以看一个有坡度弯曲的曲线,如果强行采用一元线性回归,预测第11次双11的销售额(GMV)会低估。
> scatterplot(gmv~times, data=tianmao,spread=F,

4、预测开始:
4.1、用一元线性回归预测(我知道上图看明显是曲线,因为数量小,可以试试预测值)
tianmao <- data.frame(times=c(1,2,3,4,5,6,7,8,9,10), gmv=c(0.5,9.36,52,191,350,571,912,1207,1682,2135)); > md<-lm(gmv~times, data=tianmao)
得到线性预测函数:

x0<-data.frame(times=11) predict(md, newdata=x0)
预测2019年,第11次的销售额gmv=2013.585。
predict(md, x0, interval="confidence", level=0.95)
在置信度为95%的条件下预测gmv区间:[1627.233, 2399.937]
4.2、非线性的广义相加模型预测,对非线性的拟合会好一点
> library(mgcv) > library(nlme) > model <-gam(gmv~s(times),data = tianmao) > summary(model) >x0<-data.frame(times=11) > predict(model, newdata=x0) 1 2583.387
预测2019年,第11次的销售额gmv= 2583.387。
5、结合一元线性回归模型的预测 和 相加模型的预测
提前恭喜天猫2019年第11次双11大卖
天猫销售额保底:2013.585亿
有望创作新高:2583.387亿
最可能的销售额:2298.486亿