1 绪论
1.1 研究背景与意义
餐饮业在国民经济中占有重要地位,是我国第三产业的一部分。自餐饮业发展以来,其收入一直稳步增长,在国民经济中所占比重呈上升趋势。据中国烹饪协会统计报告:全年餐饮收入在 2015 年达 32310 亿元,同比增长 11.7%,首次突破 3 万亿元。在 2016 年,全年餐饮收入高达 35799 亿元,同比增长 10.8%。2017 年全年餐饮收入也稳步增长,达到了 39644 亿元,同比增长 10.7%,占国内生产总值的 4.8%。到 2018 年,全年餐饮收入更是突破 4 万亿元大关,达到了 42716 亿元,同比增长 9.5%,标志着餐饮业迈入新阶段。图 1-1 展示了近 10 年餐饮业全年收入。
1.1 研究背景与意义
餐饮业在国民经济中占有重要地位,是我国第三产业的一部分。自餐饮业发展以来,其收入一直稳步增长,在国民经济中所占比重呈上升趋势。据中国烹饪协会统计报告:全年餐饮收入在 2015 年达 32310 亿元,同比增长 11.7%,首次突破 3 万亿元。在 2016 年,全年餐饮收入高达 35799 亿元,同比增长 10.8%。2017 年全年餐饮收入也稳步增长,达到了 39644 亿元,同比增长 10.7%,占国内生产总值的 4.8%。到 2018 年,全年餐饮收入更是突破 4 万亿元大关,达到了 42716 亿元,同比增长 9.5%,标志着餐饮业迈入新阶段。图 1-1 展示了近 10 年餐饮业全年收入。

随着科学技术的进步以及我国经济的不断繁荣,餐饮业在近几十年来飞速发展。各种连锁店、餐厅层出不穷。餐饮业规模愈发庞大、经营领域更加多样、服务更为丰富。据统计,目前共有超过 3 千万人从事餐饮行业,门店数量高达 800 多万家。其次,人民生活水平的提高促使人们的消费观念发生变化,消费需求不断升级。消费者不再仅仅只追求吃饱,更加追求安全的食品、优质的体验和舒心的服务。餐饮企业闭店率高达 70%,并且倒闭门店数量为新开店铺的 91.6%。上述原因使得餐饮业竞争愈发激烈和残酷。
信息技术的发展使得企业运营数据大幅增加。大数据时代的来临为企业运营数据提供了更为广阔的应用空间。此外,人工智能等技术为餐饮业注入了更多的科技元素。餐饮企业已引入智能点餐、菜品推荐、线上支付等智能化服务。送餐、烹饪等各类餐饮机器人已成为行业新动态。餐饮业的“智能化”转型已是大势所趋。以上所述使餐饮行业的竞争已不再局限于价格竞争与产品质量竞争,“智能化”也成为餐饮企业竞争的又一重要因素。“智能化”餐饮能够为顾客提供更为便捷的服务,降低运营成本和劳动力成本,也能够为企业管理者提供决策支持和业务管理[1],助企业管理者制定有针对性的营销策略或企业管理决策,从而提高企业竞争力。企业海量数据与大数据和人工智能技术的发展为餐饮业数据分析提供了数据支持和技术保障。目前,在不断升级的餐饮业中,大数据分析已广泛用于销量预测、改善个性化营销、定制服务、商业防损、分析顾客的饮食习惯和用餐模式等[2],[3]。其中销量预测是指结合历史销量数据与外部影响因素等,使用销量预测模型对未来某段时间内菜品销量的估计。销量预测是企业预算和采购的重要依据,同时也是企业能够健康、良好发展的基础。
...........................
信息技术的发展使得企业运营数据大幅增加。大数据时代的来临为企业运营数据提供了更为广阔的应用空间。此外,人工智能等技术为餐饮业注入了更多的科技元素。餐饮企业已引入智能点餐、菜品推荐、线上支付等智能化服务。送餐、烹饪等各类餐饮机器人已成为行业新动态。餐饮业的“智能化”转型已是大势所趋。以上所述使餐饮行业的竞争已不再局限于价格竞争与产品质量竞争,“智能化”也成为餐饮企业竞争的又一重要因素。“智能化”餐饮能够为顾客提供更为便捷的服务,降低运营成本和劳动力成本,也能够为企业管理者提供决策支持和业务管理[1],助企业管理者制定有针对性的营销策略或企业管理决策,从而提高企业竞争力。企业海量数据与大数据和人工智能技术的发展为餐饮业数据分析提供了数据支持和技术保障。目前,在不断升级的餐饮业中,大数据分析已广泛用于销量预测、改善个性化营销、定制服务、商业防损、分析顾客的饮食习惯和用餐模式等[2],[3]。其中销量预测是指结合历史销量数据与外部影响因素等,使用销量预测模型对未来某段时间内菜品销量的估计。销量预测是企业预算和采购的重要依据,同时也是企业能够健康、良好发展的基础。
...........................
1.2 国内外研究现状
近年来,随着信息技术的飞速发展,各个领域的运营数据急剧增加,在商业领域表现尤为明显。商业智能的提出,使得企业运营数据具有较高的商业价值。企业可以从海量数据中挖掘潜在有用信息,作为完善企业制度、提高客户满意度的重要依据,从而为客户提供更加优质和舒心的服务,增加企业直接和间接利润。
准确预测未来短期内商品销量对于企业而言是非常有益的,能够弥补人工采购的弊端。但是对于餐饮业菜品销量预测的研究并不多见。餐饮菜品销量数据具有明显的时序特征,而对于商品销量等时序数据的准确预测一直是研究人员关注的对象。研究人员于此已取得一定研究成果。Ramos 等人[4]采用 ARIMA 模型与状态空间模型分别预测零售业未来时段内商品销量。经过调研发现,销量预测不仅受到历史销量的影响,某些外部因素也会影响销量预测精度。Arunraj 等人[5]提出了加入外部变量的季节性差分自回归滑动平均(SARIMAX)模型,改进了季节性差分自回归滑动平均(SARIMA)模型[6]。除此以外,机器学习也被应用于时序数据预测的研究中。Candelieri 等人[7]采用并行优化模型优化SVM 回归的超参数,以便在短时间提供用水需求量的预测。Yagli 等人[8]对 68 种机器学习算法在太阳辐照度预测中的精度进行了评估,并建议根据环境不同优先选择不同的模型。McCulloch 等人[9]提出了人工神经网络的概念与数学模型,自此,研究人员也将神经网络应用于时序数据的预测。Noorollahi 等人[10]采用了 BPNN,RBFNN 和 ANFIS 对时空风速和空间风速进行预测。Sokolov-Mladenovi? 等人[11]应用极限学习机(ELM)有效地预测GDP。Chiroma 等人[12]采用以花朵授粉算法为优化算法的人工神经网络预测石油消耗。Abedinia[13]等人提出了一种基于神经网络与元启发式算法相结合的混合预测方法进行太阳能预测。人工神经网络的发展和计算机计算能力的不断改进,促使了深度学习的崛起[14]。深度学习在多个领域取得的突破性成果,促使研究人员将深度学习应用于时间序列的预测中,其中包括 SRNs[15]、LSTM[16]等。Boné[17]等人将 RNN 应用于时间序列的研究中。Kaneko等人[18]基于深度学习构建了一个预测零售店商品销量的模型。Holmberg 等人[19]采用Xgboost 和 LSTM 预测了餐饮业菜品销量。LSTM 网络也已用于可再生能源预测[20]、电力负荷预测[21]、地铁网络动态起始-目的地[22]等研究领域[23-26]。
.................................
2 相关理论与算法介绍
2.1 销量预测理论与方法
销量预测问题由来已久,是研究人员研究的热点问题之一。陆宇建等人[42]对于销量预测定义如下:销量预测是根据企业产品过去的经营状况和其他相关资料,对其在一定地区和时期内的销售数量的预计和推测。精确的销量预测,可以为企业提前进行产品生产或储备提供合理的指导,避免产品浪费或积压,从而提升企业利润。销量预测方法可分为定性分析与定量分析两种,其中定量分析法又分为时间序列预测法和因果分析预测法。下图2-1 展示了常见预测方法。

定性分析法主要是行业专家运用现有资料,首先根据历史积累经验,初步分析判断未来产品销量变化趋势,再通过调查座谈等方法对初步结论进行补充完善,为最终产品的销量预测提供依据。虽然定性分析法简便易行,但是其很大程度依赖行业专家的历史经验和直觉,并且行业专家的判断分析能力也对产品销量预测的准确性有较大影响。因此,该方法应用效果较差。
定量分析法通常是研究人员采用数学语言对问题进行描述,能够通过对大量数据的比较和分析对问题做出合理解释。与定性分析法相比,定量分析法的预测结果更加科学、直观、准确,并且应用效果较好。但是,该方法需要高深的数学知识。此外,数据资料的质量和方法的选择也对定量分析法预测结果有一定影响。
...........................
2.2 销量预测算法
2.2.1 自回归滑动平均模型

.............................
近年来,随着信息技术的飞速发展,各个领域的运营数据急剧增加,在商业领域表现尤为明显。商业智能的提出,使得企业运营数据具有较高的商业价值。企业可以从海量数据中挖掘潜在有用信息,作为完善企业制度、提高客户满意度的重要依据,从而为客户提供更加优质和舒心的服务,增加企业直接和间接利润。
准确预测未来短期内商品销量对于企业而言是非常有益的,能够弥补人工采购的弊端。但是对于餐饮业菜品销量预测的研究并不多见。餐饮菜品销量数据具有明显的时序特征,而对于商品销量等时序数据的准确预测一直是研究人员关注的对象。研究人员于此已取得一定研究成果。Ramos 等人[4]采用 ARIMA 模型与状态空间模型分别预测零售业未来时段内商品销量。经过调研发现,销量预测不仅受到历史销量的影响,某些外部因素也会影响销量预测精度。Arunraj 等人[5]提出了加入外部变量的季节性差分自回归滑动平均(SARIMAX)模型,改进了季节性差分自回归滑动平均(SARIMA)模型[6]。除此以外,机器学习也被应用于时序数据预测的研究中。Candelieri 等人[7]采用并行优化模型优化SVM 回归的超参数,以便在短时间提供用水需求量的预测。Yagli 等人[8]对 68 种机器学习算法在太阳辐照度预测中的精度进行了评估,并建议根据环境不同优先选择不同的模型。McCulloch 等人[9]提出了人工神经网络的概念与数学模型,自此,研究人员也将神经网络应用于时序数据的预测。Noorollahi 等人[10]采用了 BPNN,RBFNN 和 ANFIS 对时空风速和空间风速进行预测。Sokolov-Mladenovi? 等人[11]应用极限学习机(ELM)有效地预测GDP。Chiroma 等人[12]采用以花朵授粉算法为优化算法的人工神经网络预测石油消耗。Abedinia[13]等人提出了一种基于神经网络与元启发式算法相结合的混合预测方法进行太阳能预测。人工神经网络的发展和计算机计算能力的不断改进,促使了深度学习的崛起[14]。深度学习在多个领域取得的突破性成果,促使研究人员将深度学习应用于时间序列的预测中,其中包括 SRNs[15]、LSTM[16]等。Boné[17]等人将 RNN 应用于时间序列的研究中。Kaneko等人[18]基于深度学习构建了一个预测零售店商品销量的模型。Holmberg 等人[19]采用Xgboost 和 LSTM 预测了餐饮业菜品销量。LSTM 网络也已用于可再生能源预测[20]、电力负荷预测[21]、地铁网络动态起始-目的地[22]等研究领域[23-26]。
.................................
2 相关理论与算法介绍
2.1 销量预测理论与方法
销量预测问题由来已久,是研究人员研究的热点问题之一。陆宇建等人[42]对于销量预测定义如下:销量预测是根据企业产品过去的经营状况和其他相关资料,对其在一定地区和时期内的销售数量的预计和推测。精确的销量预测,可以为企业提前进行产品生产或储备提供合理的指导,避免产品浪费或积压,从而提升企业利润。销量预测方法可分为定性分析与定量分析两种,其中定量分析法又分为时间序列预测法和因果分析预测法。下图2-1 展示了常见预测方法。

定性分析法主要是行业专家运用现有资料,首先根据历史积累经验,初步分析判断未来产品销量变化趋势,再通过调查座谈等方法对初步结论进行补充完善,为最终产品的销量预测提供依据。虽然定性分析法简便易行,但是其很大程度依赖行业专家的历史经验和直觉,并且行业专家的判断分析能力也对产品销量预测的准确性有较大影响。因此,该方法应用效果较差。
定量分析法通常是研究人员采用数学语言对问题进行描述,能够通过对大量数据的比较和分析对问题做出合理解释。与定性分析法相比,定量分析法的预测结果更加科学、直观、准确,并且应用效果较好。但是,该方法需要高深的数学知识。此外,数据资料的质量和方法的选择也对定量分析法预测结果有一定影响。
...........................
2.2 销量预测算法
2.2.1 自回归滑动平均模型

.............................
3.1 数据介绍与初步分析 .................................... 19
3.2 基于深度学习销量预测模型研究 ............................ 20
4 实验结果与误差分析 ....................................... 31
4.1 普通工作日菜品销量预测结果 ............................ 31
4.2 节假日菜品销量预测结果 ................................... 31
5 菜品销量预测系统设计与实现 ............................................ 41
5.1 菜品销量预测系统 .................................... 41
5.2 系统设计 ........................... 42
5 菜品销量预测系统设计与实现
5.1 菜品销量预测系统
菜品销量预测系统主要基于企业运营账单数据,针对菜品销量预测问题,首先对原始账单数据实现进行日销量统计、离群点检测等数据预处理操作。之后根据本文第三章节搭建网络结构,实现模型训练和未来短期菜品销量进行预测,并将菜品日销量统计结果和菜品销量预测结果存储于数据库中,以便各门店管理者查询。与此同时,对菜品销量情况进行统计,为管理者制定决策提供数据支持。餐饮业菜品销量预测系统如图 5-1 所示。

..........................
6 工作总结与展望
6.1 工作总结
随着大数据时代的来临,海量商业数据越来越有价值。而传统机器学习算法和深度学习技术的发展为海量商业数据辅助企业决策提供了技术支持。本文采用餐饮企业真实账单数据,通过对菜品销量数据进行分析,提出了基于深度学习的餐饮业菜品销量预测模型,并以此为基础设计并实现了餐饮业菜品销量预测系统。该系统能够准确预测未来短期内菜品销量,可为企业采购人员提供可靠参考,也可为企业管理层决策提供依据,防止企业因菜品储备不当而造成的利润损失和顾客就餐不满等现象的出现,促进企业健康良好发展。本文主要包括以下工作:
6.1 工作总结
随着大数据时代的来临,海量商业数据越来越有价值。而传统机器学习算法和深度学习技术的发展为海量商业数据辅助企业决策提供了技术支持。本文采用餐饮企业真实账单数据,通过对菜品销量数据进行分析,提出了基于深度学习的餐饮业菜品销量预测模型,并以此为基础设计并实现了餐饮业菜品销量预测系统。该系统能够准确预测未来短期内菜品销量,可为企业采购人员提供可靠参考,也可为企业管理层决策提供依据,防止企业因菜品储备不当而造成的利润损失和顾客就餐不满等现象的出现,促进企业健康良好发展。本文主要包括以下工作:
(1)文献调研及销量预测问题研究
首先,本文详细介绍了销量预测的背景与意义,调研了国内外相关研究现状。之后详细介绍了销量预测算法,并对本文所用算法相关理论基础进行了阐述,其中包括销量预测模型 ARMA、Xgboost、LSTM,之后对离群点检测算法以及预测模型的评价指标进行了描述。最后简要介绍了本文实验采用的深度学习框架。
(2)销量数据初步分析与数据预处理
在建立销量预测模型之前,首先对销量数据进行了初步统计与分析,去除了其中不具备可预测性等部分菜品。其次研究了菜品销量数据的特征,发现了菜品销量大致服从以星期为周期的正弦分布,并且销量在节假日期间有明显的上升趋势。因此本文提出了基于日期特性的销量数据划分,将数据划分为普通工作日销量数据和节假日销量数据,解决了缺失数据处理及菜品销量分日期有所差异的问题。之后,采用了基于正态分布的一元离群点检测算法检测离群点并对离群点做丢弃处理,为模型的建立和验证准备了高质量的数据。
首先,本文详细介绍了销量预测的背景与意义,调研了国内外相关研究现状。之后详细介绍了销量预测算法,并对本文所用算法相关理论基础进行了阐述,其中包括销量预测模型 ARMA、Xgboost、LSTM,之后对离群点检测算法以及预测模型的评价指标进行了描述。最后简要介绍了本文实验采用的深度学习框架。
(2)销量数据初步分析与数据预处理
在建立销量预测模型之前,首先对销量数据进行了初步统计与分析,去除了其中不具备可预测性等部分菜品。其次研究了菜品销量数据的特征,发现了菜品销量大致服从以星期为周期的正弦分布,并且销量在节假日期间有明显的上升趋势。因此本文提出了基于日期特性的销量数据划分,将数据划分为普通工作日销量数据和节假日销量数据,解决了缺失数据处理及菜品销量分日期有所差异的问题。之后,采用了基于正态分布的一元离群点检测算法检测离群点并对离群点做丢弃处理,为模型的建立和验证准备了高质量的数据。
(3)销量预测模型建立与模型实现
在上述工作的基础上,针对普通工作日与节假日菜品销量数据的不同特征,分别建立了 O-Model 与 H-Model,两者结合构成了基于深度学习的菜品销量预测模型。之后,采用了深度学习框架 Keras 对其进行实现,利用真实销量数据对模型进行训练、测试和验证,并采用 ARMA、Xgboost 方法做对比实验,对实验结果进行了误差分析,明确了某些菜品预测准确率较低原因,并对不同模型预测准确率进行统计。实验结果证明了本文提出的预测模型的有效性。
参考文献(略)
在上述工作的基础上,针对普通工作日与节假日菜品销量数据的不同特征,分别建立了 O-Model 与 H-Model,两者结合构成了基于深度学习的菜品销量预测模型。之后,采用了深度学习框架 Keras 对其进行实现,利用真实销量数据对模型进行训练、测试和验证,并采用 ARMA、Xgboost 方法做对比实验,对实验结果进行了误差分析,明确了某些菜品预测准确率较低原因,并对不同模型预测准确率进行统计。实验结果证明了本文提出的预测模型的有效性。
参考文献(略)