🇲🇬🇲🇬 我们对内容（数据）的认识

但是数据呢？2011年，Netflix吹嘘数据在《纸牌屋》等节目的绿灯决策中发挥了作用，而该节目最终成为商业和批评上的成功。好莱坞认为这种想法荒谬——该系列是一个非常成功的英国戏剧系列的改编版，由广受赞誉的大卫·芬奇发起和执导，两届奥斯卡奖得主凯文·史派西担任主演。人们不需要阅读成千上万的“可识别个人信息”（PII）或参与数据就可以知道这可能是一个好的尝试，这正是HBO和FX都竞标的原因。自《纸牌屋》以来的这些年里，Netflix逐渐淡化了数据在绿灯决策中的作用。到2015年，特德·萨兰多斯表示，他们的绿灯决策基于70%的数据和30%的判断力，但判断力“是首要的”。到2018年，情况反过来了——70%的判断力，30%的数据。到2019年，这个比例变成了80%的判断力，20%的数据。

有人认为，Netflix讲话观点的转变是策略性的。为了建立其流媒体帝国，Netflix需要来自华尔街数十亿美元的债务和股权支持。当时，Netflix受益于向投资者表示，即使是作为“好莱坞”的后来者，公司丰富的数据收集和分析也将为其开发高管提供“用投资者的资金做货币球”节目的能力。但最终，在接入潮流已经到达高峰、Netflix的帝国已经建立并且内容潮流已经开始后，更重要的是Netflix能够在创意人才的竞争中胜出，而不是投资者资本。

2023年，无论意图如何，有几个显而易见的事情。首先，“数据”或许会在某种程度上提高一部剧集成功的几率，但这种好处远远不及创意开发、演员阵容、制作、营销、时机、赢得顶尖项目和人才、知识产权等因素的作用。其次，流媒体公司所进行的分析并不比好莱坞使用了几十年的数据更有帮助，也不会得到更多的运用。不同之处在于，虽然好莱坞只能进行调查、收集广泛的“评级”和观察试映观众，而流媒体公司则可以获得实时和面向客户的数据，例如“重新观看率”、“完成率”或“完成时间”。我们也知道，通过总观众数或每小时成本来评估一部剧集会导致错误的估值和错误的激励，例如将“观看”与“喜爱”混为一谈，以及膨胀的集数和时长。

推荐中数据的作用也在下降。今天登录 Netflix，个性化推荐的排列已被基于流行度的“现在流行”、“前十”和“流行于 Netflix”所替代，以及 Netflix 的特色原创节目。这似乎重申了前面提到的网络效应的作用：虽然观众A可能更喜欢节目A而不是B，其他因素相等的情况下，如果他们的B-E朋友也在看节目B，那么他们会更喜欢节目B。我过去曾经论述过产品的重要性与观看意图的负相关。当 Netflix 的 DVD 服务中有数百万个标题，而这些标题并没有成为 Netflix 特别重要的原创内容时，公司能够为其观众挑选“正确”的标题，或者至少提供帮助是至关重要的。但当 Netflix 转向流媒体服务时，其目录被缩减到数万个标题。此外，推荐错误的电影成本也大大降低了。如果顾客收到的DVD不是他们喜欢的电影，这对他们来说是个大问题，因为他们周六晚上就没东西可看了，而Netflix将被退回邮费，占用昂贵的库存（DVD），并有失去客户的风险。但是在流媒体服务中，尝试的成本仅仅是几分钟，如果一个推荐的内容不感兴趣，没有人会退订。随着Netflix的许可方变成了希望拥有自己的内容的竞争对手，Netflix的目录也进一步缩减。在美国，Netflix目前有7,000部电影，这意味着每次用户登录时，他们可能会看到所有选项的1-2％，并在一个月内看到10％以上。这不需要像Netflix的DVD服务一样大规模筛选。毕竟，相对较少的目录部分可以根据客户的需要进行排除（并非很多Van Damme的粉丝会看Cocomelon）。随着内容浪潮的兴起，服务通过其拥有独家权的头部内容来推动订阅者获取和市场差异化。这意味着顾客会为了访问某个特定的标题而订阅和登录，而不是为了访问一些模糊不清的“内容”。同时，对于他们的服务来说，让重大投注的原创内容成为热门节目变得至关重要，因此他们会大力推广它，即使是对于更喜欢许可内容的用户。

迪士尼+在2019年底推出是另一个很好的例子，说明意图与技术产品质量之间的关系。当时，该服务经常崩溃，用户界面几乎无法工作，推荐功能也不存在。主页会将错误的标题名称（例如，曼达洛人）加载到缩略图（WALL-E）中，而且该服务很少支持基本的“继续观看”功能，观众必须手动拖动到上次停止的位置。虽然服务确实会推荐内容，但它们实际上是硬编码的。如果您连续观看了《赛车总动员》和《赛车总动员2》，迪士尼+甚至不会推荐《赛车总动员3》。但这并不重要。那些想要迪士尼的人想要迪士尼+，即使从技术上讲，迪士尼应该推荐《赛车总动员3》——即使很难找到它，您也不会拒绝让孩子看它。最重要的是，许多迪士尼+用户并不想发现新内容——他们只想第200次看《冰雪奇缘》。

数据在影片库构成方面非常关键。在付费电视时代，网络的唯一目标是在每个时段中最大化收视率。这是因为每增加1%的收视率，网络就可以“卖出”大约1%的观众给广告商，并收取1%的广告收入（或更多，因为广告时段变得更加稀缺）。此外，网络的节目越受欢迎，它就能向付费电视分销商收取更高的费用。由于这些激励因素，网络在编排节目时广泛忽视了其“连贯性”，或者在8点、9点、9点半、10点等时段安排了哪些节目。一个晚上可能从一场现场的歌唱比赛转到半小时的情景喜剧，然后到一个60分钟的犯罪剧。类似的风格、流派和类型仅仅有助于获取和保留观众，如果8点和9点的节目吸引了同样的观众，那么两个节目可以一起营销，8点的观众可能会继续观看9点的节目，而9点的观众可能会早早到场发现8点的节目。但是，如果9点的时段通过关注不同的流派可以吸引更多的观众，即使失去了更多的8点观众，网络也会换上不同的节目。这种冷酷无情的方法被时段的有限数量所推动。例如，广播网络每周只有15个小时的“黄金时段”节目（周一到周五晚上8点至11点），意味着它们每周可以选择22个左右的节目播出（其中一些持续30分钟，因此22个超过了15小时）。由于相关原因，评论家相对简单地可以预测一个特定的黄金时段节目是否会被续订或取消，他们只需要将其收视率与网络整体黄金时段节目的平均收视率进行比较。

流媒体服务的运营方式与线性网络非常不同。大部分收入来自于月度订阅，这意味着成功不是取决于收集更多的观看分钟数，而是取决于获得下一个月的费用。与此同时，流媒体服务的节目数量没有预设的上限，不像传统电视网需要在有限的时间内安排节目，即每周的15小时“黄金时段”内。此外，流媒体服务想要每一个观众成为订阅者，因为它可以同时播放多个节目，所以选择一个目标受众并不意味着要忽略其他人。这些属性使绩效指标变得更加复杂。因此，我们看到了不同的节目安排和投资策略。

在流媒体时代，节目的观众数量仍然很重要：更多的人观看意味着更多的用户参与度。但流媒体服务的目标是最大化ARPU（每用户平均收入），这通过提高用户参与度来实现，同时还要增加订阅人数。因此，一切不变的情况下，拥有两个各自针对不同客户群的热门节目要比用两个热门节目吸引同一客户群更好。但同时，更好的方法是丰富地满足几个客户群而不是薄弱地满足许多客户群。数据对于实现这些目标至关重要，使服务能够了解哪些客户群体正在消费哪种类型的内容，并了解它们需要什么附加内容来保留这些参与度高的客户。同时，也要考虑节目如何直接促进用户留存和/或促进额外的消费。

数据在预测一系列的潜力方面也是非常宝贵的。流媒体平台会评估整体订阅用户以及预估观众已尝试该系列的数量，以及有多少观众会完整观看该系列，而不仅仅是试看或者看完前三集。他们还会考虑额外的营销投入或平台推广是否会导致更高的点击率。

这些复杂的计算方法解释了为什么很多流媒体决策似乎很难理解，例如为什么许多看似受欢迎的系列最终被取消或在几个季度后停播，为什么 HBO Max 删除了数百集Looney Tunes 中的部分剧集，同时又留下了数百集，以及为什么像 Disney+ 这样的服务在订阅用户和收入不断增长的情况下，却在减少而非增加漫威影片的输出量。等等。

但是，这些“复杂的数学方法”能否制作出更好的节目？或者至少，能否告诉我们更好的节目？

上一页我们对内容（分发）学到的东西下一页我们对内容（开发和成功率）的认知

最后更新于2年前