当下最流行的技术词汇可以概括为“云物移大智”,即云计算、物联网、移动互联网、大数据和智慧城市。“大数据”在其中占据着重要的地位,民航业是旅游行业中信息化水平比较高的,大数据的应用更是首当其冲。如何用好大数据,是民航运输链条上每个企业必须要回答的问题。
一、数据的生命周期
大数据首先是数据,既然是数据,那么从数据产生那一刻起,数据就有其生命周期。
数据根据其属性不同,实时价值耗散曲线也不相同。如上图所示,金融交易类的数据,其价值以毫秒计算,如股指期货的指数数据,其价值瞬间就耗散,几分钟之前的股指数据几乎没有任何价值。航班的库存(剩余座位)信息,随着机票销售的进行,剩余数量在不断变化中,可能20秒之前的剩余座位数据对现在已经不具备参考意义。天气预报、实时路况和机票价格数据,其有效时间可能会稍长一些,以小时计算。2、3个小时之前的路况拥堵信息,已经不能作为人们出行的参考依据了。还有一些数据有效性可能会更长一些,比如商品房的售价,汽车的零售价,商家报给消费者的价格,有效期会是几天的时间。
很多数据首先是快数据,其次才是大数据。那么就需要正确认识数据的生命周期,充分利用数据的实时价值,比如机票的价格数据,需要根据库存情况进行以小时为单位的动态调整。航班起飞后,这架航班上的机票销售数据就成为历史数据,实时价值丧失,这时候可以作为大数据的一部分,成为未来机票价格制定的参考依据。
二、快数据与大数据的互补
《大数据时代》几乎是大数据的起航号角,毫无疑问的成为畅销书,可以说在大数据行业几乎人手必备。在《大数据时代》开篇列举大数据的第一个案例就是Farecast的故事。美国著名的计算机专家发现航空公司机票价格制定比较混乱,不是越早买越便宜。于是就收集互联网上广泛存在的与机票价格有关的数据,在多达12000个价格样本的基础上,预测未来40天机票价格可能走势。然后通过不断调优,票价预测的准确度已经高达75%。作者通过这个例子想说明,大数据强调对于大量数据的处理,从而得出事物的相关性(机票价格的走势),而不是因果性(机票价格为什么降低)。
但现实是,作者关于Farecast的故事只讲了一半。Farecast于2009年被微软Bing搜索以1.15亿美元收购,整合为Bing Travel的一个功能。在2014年4月,Bing宣布关闭Farecast的机票价格预测功能。在大数据存储能力和处理能力越来越强大的今天,为什么Farecast反而停止运行了呢?原因不是Farecast出了问题,而是航空公司对于自身数据的充分利用,让Farecast的预测变得没有意义。欧美全服务航空公司过去普遍应用收益管理系统(Revenue Management System)来制定销售策略,但由于收益管理系统的数据输入都是历史数据,然后依靠数学算法进行模拟及预测,给出待售航班的销售策略。由于多种原因,收益管理系统一直都是离线处理,航空公司很少根据实时销售数据进行动态调整。随着IT技术的进步,航空公司不仅可以根据实时销售情况进行调整,而且还会综合分析已经购票乘客的行程,向旅客推荐复杂行程的购买建议(在哪里转机比较优惠)。
航空公司不仅根据历史数据进行收益管理,同时利用快数据进行动态调优,使得自身的价格策略满足了不同层次和不同类型的消费者的需要。所以作为单个出行的旅客,使用Farecast进行机票价格预测其意义已经不大了。这可能是Farecast功能关闭的主要原因,也是快数据与大数据互补的结果。
三、大数据关键词:跨界、后验、预测
大数据首先强调跨界。对于民航业来说,就是不仅仅拘泥于自身运行产生的数据,而是要多方合作,获取不同行业的数据进行相互补充和相互印证。比如,2014年11月是传统意义上航空淡季,但由于北京举办APEC会议而意外获得一个假期。这在任何收益管理系统中都是无法根据历史经验进行预测的,如果是大数据模式,则可以通过对网络新闻的舆情监控获知这一新闻热点,同时根据北京市民通过搜索引擎对于旅游目的地的浏览信息增多,寻找出热点旅游城市,进行有针对性的航班编排,提高主要目的地机票售价。这样不仅满足了人们的假期出行需要,而且还能获得良好的收益。
其次大数据往往体现出后验效应。由于大数据获取的是多个领域产生的历史数据,对于历史数据的整理与分析,可以验证各种情况发生因素。例如,对一个知名景区来说,可以根据移动运营商的服务的手机数量,结合景区监控视频自动分析,门票售卖情况,以及周边道路拥堵情况等多种信息,将这些信息综合为大数据样本,结合景区高峰时段接待人数和参观体验,可以梳理出一个模型,当景区承载量达到多少的时候,旅游体验开始下降,当周边的道路拥堵距离多长的时候,景区就要采取预备的限流措施等等。这些都是根据多方数据进行后验分析的结果。
最后,大数据最重要的功能就是预测。如上图所示,对于乘机旅客行为的分析,可以看出国内旅客乘机人数增长较快,同时乘机频次在下降,平均飞行距离在上升。这就说明,我国居民乘飞机出行越来越向普通人群扩散,根据年龄分布可以看出,商务旅客以男性为主,而年轻女性的乘机出行比例高于同年龄段男性。如果航空公司结合跨界的一些社区数据(如女性购物交流社区、驴友交流社区),就可以针对家庭中主要负责旅游决策的女性设计实用的组合产品,针对年轻时尚的女性设计个性化的旅游套餐,针对商务旅客的男性推广便捷租车等商务综合服务。
四、大数据思维与大数据应用
用户需要的是五毫米的钻孔,但很不幸他需要购买一个电钻。在大数据领域,航空公司面对的要么是大数据概念的宣贯,要么是大数据的技术讲解,如Hadoop、NoSQL。而笔者理解真正的大数据服务模式,就类似于民航的飞机,造飞机的厂商是少数,他们真正掌握飞机的设计原理和技术细节,开飞机的飞行员掌握驾驭飞机的技术,而乘客则只要知道坐飞机可以快速安全便捷的到达目的地就可以了。
未来真正掌握大数据技术的是少数的企业,它们提供大数据的基础设施,应用大数据的企业,不需要自建成本高昂的大数据储存和处理能力。作为航空公司,要想用好大数据,既不是着急去学习大数据的Hadoop技术,也不是去购置大数据硬件,而是要普及大数据思维,掌握大数据应用的本领。
所谓大数据思维,就是要认识到不同属性数据的价值,将数据的实时价值用足用好,当数据实时价值降低的时候,作为历史数据就可以成为大数据的重要数据源。不拘泥于本企业,本行业产生的数据,而是要围绕着旅客,从旅客在其他领域活跃的数据信息来判断旅游群体的特征,从而更好的为旅客服务。
掌握大数据应用,就是把握好大数据投资的火候。不是盲目去投资大数据基础设施,而是紧跟行业发展的趋势,掌握大数据应用的本领,为企业更好地应用数据服务。
我们处在信息的时代,数据的时代,不能因为害怕落后被时代淘汰,就焦虑和盲从;也要避免盲目的投资的冲动,为了大数据而大数据,从而浪费企业宝贵的资源。大数据时代一定会到来,航空公司正确理解数据,聚焦数据,才是迎接大数据“风口”的“正确姿势”。
作者 李洋