大家好,我是失踪人口雷肥的舍友。今天我向大家隆重介绍我和雷肥一起搞的一个新系列:大数据旅行指南
相信对于论坛的读者,无论你是撸卡狂魔还是普通驴友,在制定旅行计划时,总是有这么几个问题萦绕在脑海:
- 酒店/机票用点兑换划不划算?我到底有没有被坑?
- 在什么时候订酒店/机票最便宜?在什么时候兑换酒店/机票才能保证有房间/座位?
- 这么多家酒店/航司,哪家点数价值最高?这些点到底要转出去还是换酒店/机票划算呢?
- 老司机A说点数这么用好,老司机B说那么用好,那么对我而言,到底怎么搞才是最吼的?
在我们的博客和各大论坛上,关于这类的问题有许多讨论。各位老司机们也经常分享他们丰富的经验。然而我们也意识到,这些讨论往往对于具体的数据模型语焉不详,比如著名的博客PointsGuy从来没有公布给各大积分系统的估值的模型。大家在讨论中,给出的判断也往往基于有限的信息和粗略的估计。作为一般读者,在旅行经验极其有限的情况下,这些碎片化的知识往往会让自己陷入巨大的困惑之中。更重要的是,身为物理PhD的我和雷肥,是无法忍受任何没有数据支撑的讨论的。
因此,雷肥和我决定推出了这一系列的文章。我们希望从网上公开的信息中,通过网页抓取和一系列专业的数据研究,臭不要脸地蹭上大数据的车,来回答上面的问题。(这名字真的不是学术期刊杂志么,以后怎么算影响因子)
今天推出的是这个系列的第一篇:喜达屋(starwood)酒店分析报告。这份报告里我们将阐述的是喜达屋酒店和SPG点数情况的概览。欢迎大家在底下提出自己感兴趣的问题,我们会针对这些问题,补充工作,更新这篇paper的~
报告正文:
Contents
1. 喜达屋 (Starwood) 集团酒店概况
喜达屋(Starwood)酒店集团作为世界上最大的酒店集团之一,以其高质量的服务与良好的客户体验著称。而其会员计划 (Starwood Preferred Guest) 更是论坛里最受欢迎的酒店常旅客计划,也是许多旅行者出行的首选。在2018年喜达屋集团将完成与万豪集团的合并,成为世界上最大的酒店集团,届时常旅客计划将如何改变,我们将拭目以待。
题图是喜达屋酒店全球的分布。喜达屋在全球118个国家/地区拥共有1505家酒店,还有605家酒店将会在2020年之前开业。可以说近几年喜达屋扩张势头特别猛烈。喜达屋旗下一共有11个品牌,每个品牌的风格都有所不同。这11个品牌分别是:
- Four Points(福朋), Aloft(雅乐轩), Element(源宿), Sheraton(喜来登), Le Méridien(艾美), Westin(威斯汀), Design Hotels(设计酒店), Tribute Portfolio, The Luxury Collection(豪华精选), W hotel(W酒店), St. Regis(瑞吉)。
而这些品牌的定位,我们可以从他们SPG内部等级(Category,范围1~7,等级越高越豪华)构成来推断。
图1是喜达屋旗下各个品牌的等级构成,从中我们可以看出,SPG旗下的酒店集团分为三类:
- 第一类的是Four Points, Aloft为代表的经济型酒店,这类酒店的价格通常在150刀以下,是学生党旅游的首选。
- 第二类是以Element, Sheraton, Le Méridien, Westin, Design Hotels为代表的各类商务/旅行酒店,这类酒店主要满足商务人士的需要,价格在100~300刀,有极强的周期性(见后分析)。
- 第三类是以Tribute Portfolio, The Luxury Collection, W hotel, St. Regis为代表的高端酒店,这类酒店的价格往往在300刀以上,以高端商务客流和度假人群为主,而且这类酒店有强烈的品牌的主打特色,比如骚气的W hotel和奢华的瑞吉。
- 在所有的品牌中,御三家:喜来登(454家,30%), 福朋(242家,16%)和威斯汀(231家,15%)占据了61%的份额,也是世界范围内分布最广泛的酒店品牌之一。
更多关于酒店概况欢迎参考Colin大神的喜达屋酒店常旅客计划简介和ThunderFat的SPG积分指南系列。
2. 喜达屋酒店价格
2.1. 酒店平均价格分布
为了对酒店价格进行深入研究,我们从4月15号开始,每天抓取所有酒店的180天内的价格数据,连续抓取15天到现在,得到总共1505x15x180个数据点 (好啦我知道啦这个根本不是大数据但是就让我们蹭一下嘛)。
这些小数据们经过一系列处理,我们大致得出了每个酒店的平均最低价格(对抓取时间和时间的总平均)。下图是酒店最低价格分布的可视化,这个可视化汇总我们用箱型图(Boxplot):
箱型图解释:箱型图是价格分布的一种可视化。对于某个类型(比如Category 1)其酒店的价格分布用如下图形表示 :
1. 绿色的横线表示中位数,绿色的三角点表示平均数。
2. 蓝色方框的上沿表示前1/4分位数(即蓝色方框上方的数据是top 25%),蓝色方框的下沿表示后1/4分位数(即蓝色方框下方的数据是bottom 25%),蓝色方框上下沿圈起来的范围内包含了一半的数据点。
3. 蓝色延展线是蓝色方框以中位线为基准扩展3.5倍的范围,其表示一个理论上的最大/最小值估计。
4. 估计极限之外的数据点用专门的圆圈数据点表示。这里为了读数方便我们对价格采用了对数坐标。
从箱型图中我们可以看出,酒店价格与等级高度相关。每一个等级对应的箱子上半部分的酒店,是属于较贵的类别,适合用点换。而箱子下半部分的酒店,是属于性价比高的类别,适合直接用现金。因此读者们在评价一个酒店的价格到底值不值时,可以酒店用上面的图可以自行换算对比一下。以下是两个分析的例子:
纽约瑞吉(Category 7) 5月1号最低价是1073刀,对比Category 7的中位数~600刀,已经非常高了,所以用点或者cash+point换更值得。
香港喜来登(Category 5) 5月1号最低价是110刀,对比Category 5的中位数~240刀,是大大的良心价,建议直接刷卡预订。
最后我们来看看些小知识:SPG酒店平均价格是201.1刀,而平均价格最高和最低的前五名是:
最高价酒店 | 国家/地区 | 平均价格(USD) | 最低价酒店 | 国家/地区 | 平均价格(USD) |
---|---|---|---|---|---|
The St. Regis Maldives Vommuli Resort | 马尔代夫 | 1892 | 郑州上街雅乐轩 | 中国河南 | 26.3 |
St. Regis Residence Club, Aspen | 美国科罗拉多 | 1720 | 盐城雅乐轩 | 中国江苏 | 37.6 |
The Gritti Palace, a Luxury Collection Hotel, Venice | 意大利威尼斯 | 1384 | Four Points by Sheraton Makassar | 印度尼西亚 | 42.6 |
The St. Regis Bora Bora Resort | 法属波利尼西亚 | 1242 | 漯河福朋酒店 | 中国河南 | 42.9 |
W Maldives | 马尔代夫 | 976 | 佛山南海雅乐轩 | 中国广东 | 43.3 |
壮哉我马尔代夫,壮哉我大荷兰(咦?)。其实,在大中华区的SPG酒店不仅仅是便宜,从价格与服务综合来看,简直是业界良心啊。
2.2. 酒店价格随日期的变化
我想另一个大家比较关心的问题,就是价格随日期的变化啦。为此我们做了平均价格关于日期的变化图。
我们发现,相较于我们印象中的淡旺季,影响价格更多的其实是星期几。这是因为在SPG酒店中,主要的来源还是出差报销的商务客流。而这类的客源往往是在工作日入住,所以催高了周中的价格。因此大家如果在出行时,为了节省开支,可以选择周末入住(废话)。
但是这种价格的变化也不是对所有酒店都是一样的。我们把酒店根据周内价格的周期做了一个归类,结果如图:
我们可以发现,大部分酒店(Cat. 2-6)都是遵循着“周中高,周末低,周六小上扬”的趋势,波动幅度在上下8%左右。然而对于等级7的高端酒店,价格趋势确是反过来的。这是因为对于高端酒店来讲,商务客流就不再是主要的,而是来度假享受生活的有钱人们。所以反而周末会更高点。而对于低端酒店,价格则相对平稳。
2.3. 提前预定的天数与价格的关系
最后,我想大家最关心的问题莫过于,我提前多少天订才最划算?这个问题我们也非常关心。但是由于目前我们只有15天的数据,因此不能得出非常显著的结论。等我们数据积累到三个月左右,就可以对这个问题进行全面的分析了。敬请期待。
3. SPG 点数价值
最后我们来关注SPG的点数的价值,让我们来回顾下Colin大神在喜达屋酒店常旅客计划简介帖子里制作的这张兑换表:
SPG等级 | 免房 | C+P免房 | C+P订套 | P升套 | C+P等值于 | C+P每分成本/性价比 |
---|---|---|---|---|---|---|
1 | 2k周末 3k周中 | 1.5k+$30 | 3k+$75 | 3k | $30买0.5k $30买1.5k | $0.06 极差 $0.02 一般 |
2 | 3k周末 4k周中 | 2k+$35 | 4k+$95 | 4k | $35买1k $35买2k | $0.035 很差 $0.0175 一般 |
3 | 7k | 3.5k+$55 | 7k+$125 | 7k | $55买3.5k | $0.0157 好 |
4 | 10k | 5k+$75 | 10k+$175 | 10k | $75买5k | $0.015 好 |
5 | 空12k 忙16k | 6k+$110 | 12k+$275 | 12-16k | $110买6k $110买10k | $0.0183 一般 $0.011 非常好 |
6 | 空20k 忙25k | 10k+$180 | 20k+$450 | 20-25k | $180买10k $180买15k | $0.018 一般 $0.012 很好 |
7 | 空30k 忙35k | 15k+$275 | 30k+$625 | 30-35k | $275买15k $275买20k | $0.0183 一般 $0.01375 很好 |
3.1. SPG 点数平均价值
SPG的点数用法多变,可以用来订酒店,转航司,换万豪大礼包。那么,如何确定和比较这些点数之间的价值呢?又如何给SPG点数一个准确的估值?
如果我们只是进行简单而又粗暴的分析,SPG兑换酒店的平均价值只有1 : 2.04 cents左右。
然而我们需要强调的一点时,平均价值 ≠ 估值。在实际的估值中,我们必须考量每个酒店兑换的比率和用户的行为。因为显然每个酒店入住的频率是不一样的,我们也不会脑抽去兑换一看就是坑你的酒店。所以我们可以看到,一般各个论坛对于点数的估值都会远高于这个数字,比如PointsGuy中,SPG的估值是1:2.5 cents左右。正式因为具体涉及到估值模型将会非常复杂,因此我们必须强调,这个1:2.04的只是一个参考,参考在兑换的时候有没有被坑。而估值方面,目前由于作者拿到的数据有限,实在无法给出一个实打实的估值模型。不过,如果我们将酒店价值的分布箱型图画出来:
图3表明,大部分兑换价值大于1:2 cent的酒店都集中在Cat. 1&2的低端酒店中。大部分酒店的兑换率则是惨不忍睹,基本在1.6~1.8之间。而价值平均值与转航司的兑换率 1.6×1.25(2W点送5K点)= 2.0 基本相当,平均数而言并没有什么溢价。但是我们也注意到,点数价值的分布有肥尾(fat-tailed)的特征,也就是说,平均数能代表的信息有限。如果比起平局数,我们考虑具体分位数,比如把前25%分位数(就是盒子的上沿)作为一个估值的参考,也不失为一个很好指标。
3.2. 高点数价值SPG酒店
因为平均点数价值的肥尾特征,因此在实际情况中,如果我们能够选对兑换的酒店与时间,照样能够撸出巨大的价值。首先利用价格变化趋势,利用点数兑换工作日的酒店就是一个很好的提高酒店价值的方式。具体是否兑换,同样也可以参照我们在对价格箱型图的分析一样,比如还是上头的例子:
纽约瑞吉(Category 7) 5月1号最低价是1073刀,所需点数30K,平均价值3.5 cent。对比Category 7的中位数~1.4,已经非常高了,所以毫不犹豫用点或者cash+point换更值得。
香港喜来登(Category 5)5月1号最低价是110刀,所需点数16K(因为忙季),平均价值0.7cent, 对比Category 5的中位数~1.8cent,简直坑人,所以建议直接刷卡预订。
同时,我们也整理出了不同等级的酒店,点数价值最高的前三名:
酒店名 | 点数价值 | 酒店名 | 点数价值 | ||
---|---|---|---|---|---|
Category 1: | 哈尔滨香坊永泰喜来登 | 5.73 | Category 4: | Le Méridien Thimphu, 不丹 | 3.81 |
九寨沟喜来登度假酒店 | 5.53 | The Westin Turtle Bay Resort & Spa, 毛里求斯 | 3.66 | ||
清远狮子湖喜来登度假酒店 | 4.79 | Le Méridien Paro, Riverfront,不丹 | 3.56 | ||
Category 2: | Sheraton Norfolk Waterside Hotel, VA, 美国 | 4.58 | Category 5: | The St. Regis Astana, 哈萨克斯坦 | 4.17 |
ITC Kakatiya, a Luxury Collection Hotel, Hyderabad, 印度 | 4.42 | Trump Turnberry, a Luxury Collection Resort, 苏格兰 | 3.73 | ||
Four Points by Sheraton Detroit Novi, MI, 美国 | 4.4 | Le Méridien Delfina Santa Monica, CA, 美国 | 2.93 | ||
Category 3: | Sheraton Vancouver Airport Hotel, 加拿大 | 3.93 | Category 6 & 7: | The Gritti Palace, a Luxury Collection Hotel, Venice (Cat.7) , 意大利 | 3.23 |
Le Méridien Ile Maurice, 毛里求斯 | 3.85 | Shanti Maurice – A Nira Resort, St. Félix, a Member of Design Hotel, (Cat.6) 毛里求斯 | 3.17 | ||
Le Méridien Dallas by the Galleria, TX, 美国 | 3.37 | The St. Regis Mauritius Resort, (Cat. 6) 毛里求斯 | 3.15 |
壮哉天朝!!既有价格实惠,也有良心兑换。整体来讲,其实高价值兑换不乏许多热门旅游目的地的酒店(比如圣塔莫尼卡艾美和毛里求斯的度假村们)。而且我们看到Cat. 5的第二名竟然是Trump传说中在苏格兰投资的俱乐部,薅羊毛薅到美国总统身上,瑟瑟发抖。
而且,我们在爬数据的过程中,我们曾经观察到1:10,甚至最大为1:24的兑换率(虽然这个只出现在特定的时间地点,而且转瞬即逝)。因此,尽管平均数惨不忍睹,但是SPG点数如果用得好,是可以玩得非常开心。
3.3. 点数兑换Availability
点数价值搞清楚了,可也得有房间来兑换呀。通常读者们会关心我提前多少天预订才有可能订得到的问题。为此作了一张关于酒店现金预订与点数兑换的availability随提前预定时间的变化的图:
蓝色的利用现金预订的可预订率,红色是点数兑换的Availability,阴影部分是我们根据95%置信区间然后进行3次局部插值平滑过后得出的上下限(嘛反正就是估计的上下限)。我们可以看出,SPG整体的Availability还是很好的。即使是点数兑换,也有70%以上。随着时间的临近,在入住日3个月前,Availability开始缓慢下降。而在入住日前半个月,Availability会出现显著的下降(大家都是这时候订房呀)。最后到入住前一周竟然戏剧性地回升(大概有退房的)。因此如果要兑换,为了稳妥大家一定要预留2周以上的时间。显然,越早定越好。
4. 总结
以上就是我们目前关于SPG做的有意思的统计。其实我们掌握的数据远远不止这些。我们还有每个酒店总体的评分,是否有游泳池这类的feature。大家如果针对酒店有什么感兴趣的问题和建议,也可以在底下留言。我们会尽力更新这个报告回答大家的问题。谢谢大家一如既往的支持,请期待我们更多的分析报告。