数据分析与知识发现
    主页 > 期刊导读 >

浅析旅游大数据应用中的问题及解决思路

大众旅游时代的到来推进旅游业更具个性化,全域旅游的推行突破了旅游传统六要素,旅游业更加包罗万象。旅游业迫切需要能够“看得更远”“想得更广”的观察工具。旅游大数据的出现提供了这种可能。2016年至今,旅游大数据基础建设已趋于完备,对数据深层次的挖掘应用成为下一阶段旅游大数据的发展方向。在基础建设阶段,旅游大数据应用出现了一些问题,克服并解决这些问题对于更好发挥旅游大数据的作用,有着重要的意义。

一、旅游大数据应用中存在的问题

(1)隐私保护与收集“广”“深”的矛盾。根据统计理论,数据数量与结果精确度在数据质量相同的情况下,呈正相关。旅游数据的“广”与“深”是进行数据数据分析的首要条件。数据抓取之“广”,会涉及到参与到旅游行为的各类主体,包括个人、企业以及政府等;数据抓取之“深”,则会不可避免地对旅游主体的隐私造成一定的侵入甚至侵犯。因此隐私保护与收集“广”“深”的平衡是旅游大数据应用要面对的第一个问题。

(2)数据分析方法亟待完善。面对海量旅游数据信息,数据筛选和数据分析成为获取结果的重要环节,分析结果的可信度高低与两个环节的完成水平密切相关。由于数据分析主体掌握的数据数量、数据筛选、分析方法的不同,结果也会千差万别。一套有效的数据筛选和数据分析方法的出现迫在眉睫。正如学者杨旸、刘法建提出:“海量实时数据的处理方法的革新是大数据革命的核心”,这是发挥旅游大数据作用的重中之重。

(3)抓取能力与分析能力不对称。基础建设的成熟为旅游数据抓取提供了技术支持,但拥有数据不代表就能够正确获取信息,两者之间的重要桥梁就是数据分析。根据目前的旅游数据分析,一是专业化水平低,旅游数据分析过度依赖移动运营商,无法为旅游“量身定制”所需数据;二是专业旅游分析机构无法获得第一手的可靠数据,大数据基础建设耗资巨大,旅游数据成本难以降低。数据提供方和数据分析方如同站在峡谷两边的人,难以实现强强联合。

二、旅游大数据应用问题解决途径

(1)建立数据分类收集提示制度。旅游数据大致可分为两类,一类为身份标识模糊的数据,例如地域性旅游数据(出游地、目的地、交通方式选择等等)、旅游消费数据(消费结构、倾向、占比)等无法直接获取个人的信息,可直接抓取使用,发挥其时效性,以期指导旅游管理部门进行预警信息发布、高峰疏导等工作,也能够为旅游者、旅游经营者提供旅游决策参考;另一类为身份标识明显的数据,例如实名制旅游调查、个人住宿信息等,则是非经明确同意,不可以进行抓取使用的信息。目前身份隐私信息由民法与商法给予规范,但数据隐私并无明确规定,亟待在法律基础上制定数据分类收集提示制度,适应数据信息时代的需要。

(2)完善场景化数据分析法。场景化是一种定位法,广泛存在于艺术设计、产品营销等领域。笔者认为,场景化也可引入旅游数据分析。场景化如同定位锚,一方面圈定数据抓取的范围,大幅减少数据处理数量,为数据分析打好基础;另一方面提供了数据分析的角度,更能够满足旅游信息个性化的需要。目前场景化数据分析已经被业界关注,常见如特定时间段(如节假日)、特定地点(旅游景区、度假区等接待设施)以及特定需求(赏花、冰雪、温泉旅游偏好)的数据定制分析,已屡见不鲜。一定程度上,场景化数据分析法适度缓解数据抓取与数据分析的失衡,降低数据筛选难度,弥补当前数据筛选分析能力的短板,更好地发挥数据的时效性和针对性。

(3)架构融通有力的旅游数据网。从横向看,旅游数据提供者做为独立的点,相互之间要建立畅通的数据融通渠道,这对于数据的筛选和验证分析有着重要作用;从纵向看,早在2016年,国家旅游局就已提出建立国家-省-市-县四级旅游数据中心体制模式。以纵向四级机构为线,将分散的数据提供者联系起来,构建数据融通的网络。政府为旅游数据网络提供制度引导、政策扶持;数据提供者专心于提高数据收集效率;数据使用者提出使用需求,由政府牵头完成这一需求,这种模式一方面可以降低旅游数据使用成本,另一方面可以是数据结果更具有权威性。目前我国四级体制模式已基本建立完成,下一步需要通过政策和制度充分调动数据提供者的积极性,发挥数据分析者的优势,活跃旅游大数据应用网络上的每一个节点,以期旅游大数据应用更加稳定、成熟。