自从改革开放政策实施以来,我国社会经济呈现出高速增长的态势,国民收入水平显著上升,旅游日益成为人们现代化进行休闲、娱乐活动的主要途径之一。目前,我国的国内旅游业是发展潜力最大的旅游市场,在经济的发展中具有重要的地位。所以,对旅游人数进行较为准确的预测分析,为当地旅游业相关部门制定发展战略决策和其他相关政策措施提供一定的理论基础和技术支撑,从而有效地推动旅游 行业的健康发展。
主要的预测方法有两大类:定性分析与定量分析。其中,定性分析主要是根据人的主观判断和已有经验进行大致趋势和范围的分析;定量分析通过建立统计数学模型得到具体的一个数值。在汉斯出版社《计算机科学与应用》期刊中,有学者首先将灰色理论和神经网络模型进行结合,建立灰色神经网络模型,采用遗传算法对模型进行优化。由于模型预测误差较大,为提高模型预测精度,对影响因素进行变量筛选,删除掉影响程度小的因素。
遗传算法(Genetic Algorithm)是通过模拟自然界中自然选择和遗传机制中的选择、交叉、变异的现象,得到具有适应能力的个体,使得种群不断进化,最终得到适应能力最优的个体。其中,基本的操作步骤如下:选择:根据个体适应度值的大小,按照一定的概率在当前种群中选择基因优良的个体到下一代中。交叉:从种群中任意选择两个染色体,以一定概率选择一处或多处的位置交换两者的染色体,从而得到新的优良个体。变异:从群体中任意选择一个染色体,以一定的概率随机改变该染色体上某一处的值,从而产生新个体。
通过阅读文献和查阅相关资料,从《中国统计年鉴》和《中国旅游统计年鉴》中得到原始数据,首先对原始数据进行简单处理,初步得到13个影响因素:X1:总里程;X2:居民消费价格指数;X3:国内旅游收入;X4:城镇居民可支配收入;X5:旅行社个数;X6:城镇居民旅游人均花费;X7:城镇居民消费水平;X8:人均国内生产总值;X9:星级饭店个数;X10:城镇居民人口数;X11:客运量;X12:国内生产总值;X13:第三产业生产总值;被解释变量Y:国内旅游人数。
数据预处理:首先将数据分为训练集和测试集,具体如:选取1994~2019年的相关数据进行模拟,其中,将1994~2016年数据作为训练数据,2017~2019年数据作为测试数据。其次,为了消除单位量纲化的影响,将训练数据和测试数据分别进行归一化处理,消除奇异数据,采用mapminmax函数对数据进行归一化处理,并运用matlab进行计算。mapminmax具体计算公式:xk=(xk−xmin)/(xmax−xmin);其中,xmin为数列的最小值,xmax为数列的最大值。
由于旅游人数受到多种因素的影响,样本数据具有高维度、样本量小的特点,神经网络模型具有自学习性和自适应性的优点,故建立灰色神经网络模型,并不断对模型进行改进,最终确定基于平均值影响法变量筛选的GA-GM神经网络模型为旅游人数的预测模型。创新点在于一方面为旅游人数预测提供了新的算法,丰富了旅游人数预测方向的理论基础,拓宽了基于平均值影响法变量筛选后的GA-GM神经网络算法的应用范围;另一方面该文选取了两种变量筛选的方法,增加了模型的对比性,从而选取最优的模型进行预测。
本文搜集了1994~2019年共26年数据,所选取的样本数量太少,属于小样本,在一定程度上会影响预测值的准确性和可信性。若要进行更加准确性的研究分析,要使得样本容量尽可能地大。在模型之外的影响因素被忽略了,显然会对模型的精度造成一定程度的影响,因此所得的模型仍然需要进行优化修正,从而得到的预测效果更加接近于实际。