西藏旅游地图社区

旅游大数据解析:为什么驻马店的旅游接待人数比杭州多?

2021-01-10 08:24:26

据旧消息,2019年2月,中国旅游学院发布了一篇题为“文化旅游一体化品位更强、主题和客人生活更美好的专题报道”。这份报告在2019年春节前公布了60个城市。

仔细看一下这个排行榜,发现有很多有趣的地方,如衡阳、邵阳比成都、广州多;周口、盐城比深圳多;保定、南阳比桂林多;菏泽、驻马店、商丘比杭州多;邯郸比南京多;沧州比昆明多。也就是说,衡阳、邵阳、周口、盐城、保定、南阳、菏泽、驻马店、商丘、邯郸等城市在2019年春节期间接待的人数比南京还多,这些城市在2019年春节期间接待的人数也比昆明多。

这个城市的接收数据排名是怎么来的?报告说:“中国旅游学会和中国电信联合实验室根据信号大数据计算,”这就像雷冠源的“大数据”。

应用百度的定义:大数据(大数据),是指传统的软件工具在一定的时间范围内无法捕获、管理和处理的数据集。具有较强的决策能力、洞察发现能力和过程优化能力,是一种规模庞大、增长速度快、信息资源多样化的信息资产,需要新的处理模式。

现在几乎每个人都有手机,每部手机的信号就像夜晚的灯光。想象一下,如果我们能忽略地球上那些在太空中携带手机的人,我们就能看到这样一个场景:

我们可以看到每一盏灯-用户拿着手机,像蚂蚁一样穿梭于这个区域,停了下来,搁浅了。根据该算法模型,通过计算它们的流向、居住地点和停留时间,可以计算出一个区域内一个城市的游客接待次数。这是典型的大数据分析方法,使用了大量的多样化(流动方向、停留时间等)。手机信号数据计算的另一种数据-旅游接待号码。这看起来很简单,但实际上过程非常复杂。

然而,很多人会问:为何这个量度与业界人士,包括很多业界人士的理解,有很大的不同?根据理论,中国旅游研究所是全国最权威的旅游统计机构。报告发表后,菏泽的文化旅游机构和驻马店市的人民为什么不宣布春节假期的人数超过了南京、杭州的人数?你没看到这些数据吗?我不明白这些数据是怎么出来的?或者你对这些数据有何感想?

对于这种“异常”数据的结果,报告含糊其辞地说明了原因:“进一步分析各城市接待量表明,春节期间大批农民工返乡,促进了三四线城市旅游繁荣的快速改善,这涉及到我国目前实施的旅游统计系统中对旅游者的定义。”

中国旅游研究所发布的“旅游统计的统计知识/概念和指标分析”说:“从统计意义上说,过去接受国内游客抽样调查的调查对象是指国内游客不为寻求职业和报酬而离开通常的生活环境,前往全国其他地方进行探亲、疗养、调查等旅游活动。参加会议和从事商业、科技、文化、教育、宗教活动的中国内地居民,旅行距离超过10公里,旅行时间超过6小时,但不超过12个月。具体而言,它包括以下要素:

1.国内游客不得在其所访问的地方形成雇用关系。根据2008年国际旅游统计建议中的解释,旅行的主要目的是确定游客是否被算作旅游者。如果旅行者在旅行期间通过旅行赚取收入,但不以经济收入为主要目的,则不形成雇佣关系,停留时间、旅行距离等要求也满足了要求。因此,被调查者抽样的调查对象不一定已经形成了被访问地的雇佣关系,这一点需要明确。

2.国内游客必须是“离开通常环境,旅行超过10公里,旅行时间超过6小时,但不超过12个月的内地居民”。在旅游统计中,通常的环境是与个人有关的一个特征,一个家庭中两个人的通常环境可能是不同的。例如,一个年轻人在A市B区工作很长时间,但他和他的父母长期住在A市C区。然后,他的通常环境是在A市的B区和C区,而他的父母的通常环境是A市的C区,而B区则不是他父母的通常环境。旅行距离和旅行时间也有相应的严格要求,世界各国的标准是不同的。根据我国的实际情况,我国选择了一个相对较低的标准。

3.国内游客是“到国内其他地区旅游、度假和其他旅游活动(包括探亲、疗养、视察、参加会议和旅游活动中的商业、科技、文化、教育、宗教活动)”。旅游活动的范围较广,包括游客到旅游或旅游期间所做的每一件事,不仅包括被认为是典型的旅游活动,如观光和景点,还包括商业、教育和培训活动,所有这些都需要在调查过程中列入统计数字。在旅游统计中,旅游活动分为观光/观光、休闲/度假、家庭/朋友访问、商务、会议、宗教/礼拜、文化/体育/科技交流、购物、保健等。“

看了这个定义后,你可能会认为,在目的地市区返乡的外来务工人员的人数包括在旅游统计中,也就是春节回家的人数也包括在旅游统计中。因为这个庞大的人群符合旅游统计的三个要求:

(一)国内游客不得在被访地形成雇佣关系(当然,回家过年时不存在雇佣关系);

2.国内旅客必须是离开通常环境、旅行超过10公里、旅行时间超过6小时、但不超过12个月的中国内地居民。一位山东菏泽人外出打工,他的“平常环境”是在杭州,而不是菏泽;

3.国内游客“到中国其他地方旅游、度假和其他旅游活动(包括外出探亲、疗养、探亲、参加会议和商务、科技、文化、教育、宗教活动等旅游活动),春节是`探亲访友‘。

这种在春节期间几乎与流动人口重叠的庞大家庭游客,应该是三线、四线甚至五线城市游客人数超过许多一线城市的重要原因之一。

进一步探索,在旅游统计调查系统的官方解释中,地市国内旅游接待数据的计算在“统计知识”的官方解释中是这样的。

国内游客的数量包括过夜游客人数和一天游客人数。这两类游客的计算方法是不同的。

(I)过夜游客人数=在旅游住宿单位过夜的国内游客人数

(2)在亲朋好友家中过夜的国内游客数=接待旅游景点的游客总数×在亲朋好友家中过夜的国内游客比例/在亲朋好友家中过夜的平均游客数。

(3)一天游客人数=从旅游景点到当地城市的国内一天游客人数,由旅游景点到当地城市的国内一日游客人数。

(4)从外国城市到当地城市的国内一天游客人数=当地城市的旅游景点游客总数×外国城市来当地的国内一天游客的比例/外国城市进入当地城市的国内游客的平均人数。

(5)接待当地城市的国内一天游客人数=当地城市接待游客的总人数x国内一天接待当地城市游客的比例/当地城市国内游客的平均人数。

旅游吸引力:指所有吸引游客到旅游目的地的因素之和。从狭义上说,旅游景点是指“景点”。这一制度是指广义的旅游吸引力,即自然因素、社会因素和其他对旅游者具有基本吸引力的因素。旅游景点体系由一个核心圈和两个支撑层次组成。旅游产品和资源构成旅游吸引系统核心圈的主体,是吸引旅游者最基本的因素。各种旅游支助系统(如住宿设施和基础设施等),以及旅游目的地传达的各种信息,以及停留在旅游目的地的游客本身,作为某种程度的支持对游客具有吸引力。

这段话很无聊,根据定义是:一个农民工在春节期间回到菏泽家乡,如果他每天都躺在家里,不出去当家庭主妇,那就不包括在统计范围之内。但是,如果你去风景名胜区,去博物馆,去餐馆,或者去城市公园散步,所有这些都可以被称为“旅游支持系统”,这可以包括在统计范围之内。

进一步考虑,游客统计“离开通常的环境,旅行距离超过10公里,旅行时间超过6小时,但不超过12个月的中国大陆居民”这一范围太大了!在计算方法上,过夜游客容易做到,而“一天旅游者的数量=外国城市的国内一天游客从当地城市接受国内一天游客的数量”。考虑到这一点,用传统的统计方法,如何定义“旅游景点”和如何定义10公里6小时,都很难获得这样的数据。机动性稍差一点。好好想想。春节期间,菏泽地区的当地居民在县城10公里外拜访亲友,然后到酒店擦一顿饭。它是否也包括在计算范围内?这是个大数据吗?

事实上,在我国许多地方的实际运作过程中,旅游景点被界定为狭义的“旅游景区”范畴。

回到大数据的角度,想象一下这个手机用户就像一点光,他们流动,停留,你像上帝一样俯视他们,你在叹气大数据的魔力。

等一下!你觉得有什么不对劲吗?

如果我们把手机灯作为手机用户来看待,就需要根据大数据定义的“新处理模式”对旅游接待数据进行分析和计算。很容易理解的是,通过信号数据,我们可以知道手机用户离开他们通常居住的环境(他们经常居住的地方),旅行距离超过10公里(移动距离可以计算),旅行时间超过6小时(可以计算停留时间)。最大的问题是:在大数据的分析和计算过程中,如何定义“旅游景点引物”。特别是如何标出大量的“旅游景点”的目的地。因为只有标出“旅游景点”的地理范围,才能知道手机用户是“访问”还是“进入旅游景点”,我认为在大数据的计算过程中,这个环节可能会出现问题。

大数据可以欺骗人,也不能欺骗人。如果我们不标出“旅游景点”或“旅游景点”的范围太广,就会导致国内城市在春节期间回流流动人口,使城市旅游接待数量大,旅游吸引力的范围灵活,决定了计量数据的数量。即使将旅游景点限制在景区内,也需要根据手机用户的不同行为数据来确定旅游行为。例如,为了区分博物馆里的游客和通过隔墙的过客,在穿越旅游区的公路上区分山地旅游区的游客和过路的游客,等等,需要计算和判断游客的行为是否在每个移动灯的后面。这些问题比我们想象的要复杂和困难得多,也不能通过高呼“大数据”的口号来解决。

虽然大数据的分析和计算还没有公布的过程和算法,但人们仍然认为,旅游大数据分析在国内旅游统计中的应用才刚刚起步,需要大量的实践和研究工作,因此报告中的数据可以作为实验室数据和重新研究,但作为测量数据的发布,似乎还不太情愿。

旅游业的蓬勃发展,旅游人口的快速增长,旅游行为的个性化、多样化和生活化,客观上大大增加了旅游统计的难度,对旅游统计提出了更高的要求。与其他发达国家相比,我们必须对流动人口集中在春节假期的10公里及6小时以上的旅游行为进行测量和分析,一些常识也会考虑到大量的数据和难以计算的数据。相比之下,春节期间流动人口的一部分,使得几年前火车票预订平台12306不堪一击。使用大数据分析方法无疑是解决国内旅游统计问题的主要途径,但我们也应该认识到,在这个过程中,我们应该解决更多的商业问题而不是技术问题,解决更多的行业认知问题而不是急于取得成功。驻马店市比南京更受欢迎,因此有必要对其原因进行细致的分析,如仅依靠中国电信单一运营商的数据、手机用户归属地点的确定、移动电话数据行为的分析、旅游吸引力的定义等,从而导致计算结果的误差。

旅游统计是旅游的基本业务,个别旅游目的地的统计数据被歪曲和取笑。例如,在同样的统计口径下,所谓的“井喷”增长对当地人口稀少、广域旅游、旅游桶下效应的影响,也可以进入、行走、进食、不睡觉、不堵塞,这是一个奇迹。

另一方面,少数管理人员、运营商甚至学者忽略了旅游统计的复杂性,面对旅游行为的多样化,甚至可以想象用托马斯库克时代的简单思想来想象当前的旅游统计数据。例如,在上世纪,在当时的交通条件下,国内旅游活动与过夜旅游基本相关,一天的旅游很少。现在,随着交通的快速方便,夜游已成为一日游,不能包含在统计范围内,然后得出结论,旅游活动越快就不能作为旅游活动?-我不知道

一个常见的场景是使用你认为是一个清晰的统计过程的数据来评估和分析你认为你知道的旅游业; 另一方面,你认为它是理所当然的混合了水,数据是假的,你不时地敲打评论。 一个脚踏实地的做法就是看旅游统计调查系统,特别是找几个省市的旅游统计业务人员了解实际的业务操作过程,仅此而已.. 有趣的是,当中国旅游研究院的学者转发朋友圈旅游统计基础知识的文章时,一些人对旅游统计提出了质疑和批评。

最后,让我们谈谈大数据。现在旅游大数据已经成为业界的常用语,甚至发展到了有数据的地步,如果你不在你面前加上一个“大”,你就会尴尬地说出来。有很多“旅游大数据类型”:“穿靴子、戴帽子”,在“数据”、“数据分析”等字前面加上“大”等字,表示跟上时代;“叹息海洋”,认为字数大,“大”是大数据,如果游客人数是数千万和数亿,当然是“大”;我不知道它是什么意思,但我认为添加“大数据”非常强大,然后它扩展到广泛的数据,技术或网络是大数据。说来话长,飞来飞去,却没有落地,未来还需要大量的业务实践探索。