机械降神

如果你对游戏中AI的未来有强烈的期望,那你可能错了

机械降神
“太棒了,新的科技树……”

第一部分:战争迷雾

  • 引言:熊彼特式的谦逊

20世纪90年代中期,我加入了硅谷最热门的初创公司之一:PointCast。它承诺将互联网送到你面前,而无需你亲自去浏览。每个人都认为它将是下一个大热门。
当时的炒作热度极高。PointCast在获得任何有意义的收入之前,就拒绝了新闻集团4.5亿美元的收购要约——在当时这可是个天文数字。不到三年,这家公司就消失了。
看着我们的火箭飞船解体,令人深感谦卑。但真正的教训,也是自那以后每年都在不断强化的教训,是关于在技术变革时期如何预测未来。当时,最大的媒体巨头们对互联网将如何发展有许多极具说服力的观点。然而,没有人预见到实际发生的事情:像克雷格列表、YouTube、X、维基百科、脸书和Instagram这样的网站淘汰了大部分传统媒体和娱乐产业,随后网飞、Spotify和亚马逊完成了最后的一击。
从那以后,我多次看到同样的模式。当真正新的事物出现时,我们会通过之前事物的隐喻来理解它。AI似乎也不例外。

  • 人类不擅长思考未来

我们把未来想象成当下的一个略微升级版。历史上满是被新技术打得措手不及的人。
1914年,成长于维多利亚时代知识界的成年人无法想象即将到来的恐怖。他们以骑兵冲锋的方式卷入第一次世界大战,却发现自己在使用机枪、飞机、坦克和毒气作战。
面对快速变化,我们会寻求熟悉的事物。每一代人都在打最后一场战争。20世纪90年代的媒体巨头们将互联网视为数字纸张、“500频道”和“信息高速公路”。这些都是笨拙的比喻,暗示着他们已知事物的更快版本,即线性媒体。超文本的概念,即能够跨越不同想法而非直线推进的能力,并不符合他们的思维模式。

  • 时尚审计——信号还是噪音?

在《电子游戏高管德里克·祖兰德》一文中,我详细阐述了游戏行业陷入时尚潮流周期的趋势:VR、区块链、元宇宙。每一项都曾承诺成为行业的救星,但实际成效甚微。
AI具有与我列出的之前炒作周期相同的炒作特征,因此它值得受到同样的审视。
它是实实在在的吗?是的。AI已经融入我们日常使用的工具中,从写作助手到图像生成再到代码补全。数百万人已经将其融入工作和日常生活中。
它是新事物吗?是的。消费产品中上一波“AI”浪潮——像Siri这样的语音助手——功能有限且脆弱。像ChatGPT和Grok这样的系统在本质上有所不同,具备推理和创造能力。这种水平的艺术、音乐和代码生成在以前根本不存在。
这种体验是否有显著提升?答案是肯定的。对许多人来说,它几乎在一夜之间就变得不可或缺。一个简单的测试:从经常使用GPT或Grok的人那里拿走它们。留下的空白是即时且明显的。
按照这些标准,AI轻松通过了潮流检验。它带有泡沫的空洞炒作特征,但也具备根本性变革的现实效用。

第二部分:文明

机械降神
  • 将AI置于其历史背景中

我们生活在一个巨变的时代,因此,在人类传播的历史中找准自己的定位是很有必要的。我见过的关于这方面的最佳框架来自本·汤普森(Ben Thompson)在两篇不同的《战略洞察》(Stratechery)文章中提出的观点,分别在这里和这里。(这两篇文章需要付费阅读,但《战略洞察》绝对物有所值。)
汤普森将传播史描述为一系列的拆分过程,其中每一种新媒介都消除了思想流动中的一个瓶颈。

机械降神

在数十万年的时间里,唯一的交流方式是一个人直接对另一个人说话:产生一个想法,将其转化为语言,通过言语表达出来,通过重复进行复制,并一对一或亲自向小群体传播。

机械降神
机械降神

从在场状态中书写独立的言语,让思想跨越时空传播。这需要读写能力和人工抄写,因此传播宏大思想意味着雇佣大批抄写员和僧侣来手工抄写文本。

机械降神
机械降神

印刷机将创作与复制分离开来。古腾堡的发明用资本取代了劳动力,因为一台印刷机就能复制曾经需要一座修道院才能完成的工作。权力转移到了那些拥有印刷机并能大规模分发的人手中。

机械降神
机械降神

互联网将复制与传播分离开来。如今,思想能够以近乎零成本在全球范围内传播,消除了数百年来支撑出版商和广播公司的实体瓶颈。

机械降神
机械降神

AI现在正在将创意的产生与其具体化(即将创意转化为可用形式的行为)分离开来。它正在消除思想与表达之间的最后一道瓶颈:撰写文字、绘制图像、拍摄场景或编写系统代码。当你要求Midjourney为某个创意配图或让ChatGPT起草一封信时,你已经在将该创意的具体化工作外包出去。你负责构思思想,而让AI赋予其形式。

机械降神

汤普森描述的是线性媒体,即那种消费一次后价值就会衰减的内容。但游戏是基于共享规则构建的交互式系统和社区。此类系统的实体化与线性媒体不同,但模式是相同的。每一次拆分都会改变赢家和输家的身份,而AI也即将在游戏领域产生同样的影响。

三层工具

借助汤普森的框架,我们可以从证实或实现的角度来思考游戏中的AI,即想法如何变成现实的过程。变化的速度让预测变得徒劳,但那些已经在改变我们工作方式的工具就摆在我们面前。

  • 第一层——助力人类建设的电动工具

第一层是关于帮助人类开发更好游戏的工具,如今行业中大部分引人注目的活动都发生在这一层。

视觉实现:像Midjourney和Sora这样的工具如今已成为视觉创意原型制作的标准。它们用于最终制作仍过于粗糙,但更好的控制能力将迅速改变这一状况。传统动作捕捉成本高昂且会减缓迭代速度,因此Embark Studios构建了一个在程序物理模拟中训练的AI驱动的运动系统。在《ARC Raiders》中,角色通过试错来学习行走、奔跑和战斗,就像婴儿学习保持平衡一样。它尚未完全取代人类角色的动作捕捉,但已经为邪恶的死亡机器人提供了动力。

机械降神

可编程层:语音、对话和代码正融合为单一的软件层。曾经需要不同专业领域协作完成的工作——文案撰写人员编写数千行文本、演员在录音棚录制、程序员整合成果——如今正开始作为一个可编程系统协同运作。

像Eleven Labs这样的工具使小团队无需聘请专业演员或使用专业录音室就能制作语音表演。随着控制能力的提升,更多开发者将采用这项技术。编写NPC对话既昂贵又乏味,而且很少是游戏中最吸引人的部分,但基于更丰富素材训练的模型可以让互动更有意义、更具情感。正如史蒂夫·乔布斯40多年前设想的那样,我们正逐渐接近能让我们通过与亚里士多德交谈来“捕捉他的世界观”的工具。完全自主的编码仍遥不可及,但代码补全工具已经在加速开发、提高可靠性,并帮助更新旧的代码库。这些工具中的每一个都将以前的手动创意过程转变为可编程的工作:可编辑、可测试,并能响应实时创意迭代。
这些工具极大地提升了人类的创造力,加速了生产,并为小型工作室开辟了道路。它们的出现恰逢其时。自2017年以来,整个行业的开发成本几乎翻了一番,增长速度远远超过了消费者支出,其中大部分增长都投入到了美术和动画制作中。

  • 第二层——人类无法做到的事情

第二层更具变革性:能够自主行动的工具,做人类无法或不会做的事情。它们自行做决策,常常让我们感到惊讶。由于人们对它们的了解较少且难以控制,它们会产生一些可能非常出色也可能适得其反的突现行为。
大规模实时运营。2017年,Nexon韩国团队开始尝试使用早期AI工具来改进实时游戏运营,即对大型虚拟世界的管理。其中一个系统专注于《冒险岛》中的机器人检测:识别那些看似人类但实际上由脚本控制的角色。检测此类机器人出了名地困难,但却至关重要。AI能够更快地捕捉到它们,误报更少,且能大规模进行检测。
玩家们立刻就注意到了。随着现在脚本刷金者的消失,玩家们可以相信,除了明显是游戏设计的NPC之外,其他每个角色都是真实玩家。脚本越少,这个世界就越有生机,因为真正的玩家们可以一起交流、玩耍和享受乐趣。
随后,团队将目光转向了第一人称射击(FPS)游戏中的匹配机制。基于技能的匹配旨在让技能大致相当的玩家相互对抗。基本系统依赖于诸如击杀死亡比等粗略的指标,而人工智能(AI)则要有效得多。在几秒钟内,它就能分析键盘和鼠标操作模式,解读玩家的移动,从而确定玩家的技能水平。这更接近人类凭直觉判断能力的方式,而且要准确得多。
更有趣的是利用AI来组队,而不仅仅是匹配技能。在数千名在线玩家中,存在着一种最优组合,比如五个人组成的队伍与另外五个人竞争时会最有乐趣。这可能取决于游戏风格,而不仅仅是技能。也许我喜欢在后方狙击,而你喜欢向前冲锋。就像任何体育运动一样,玩家之间的默契很重要。
如今,AI能够实时观察并调整数千活跃用户的玩家动态,以人类无法企及的速度和规模进行评估和决策。根据Nexon的经验,这直接转化为更有趣的比赛、更高的用户留存率和更强的营收能力。
NPC自主思考:在此,AI直接控制敌人,用真正的自主性取代了预设的“如果-那么”逻辑。Embark Studios在《ARC Raiders》中测试了这一点,赋予其死亡机器人真正的智能,而非由设计师编写的行为模式。这个想法极具启发性。游戏设想了一个被恶意AI入侵的世界,你面对的不再是按脚本行动的敌人,而是看似有感知能力且一心要杀死你的机器。

结果令人毛骨悚然。在一次试玩中,我像卢克·天行者一样,跑到一个巨型蜘蛛机器人下面,攻击它脆弱的腹部。第一次这么做时,我成功命中了好几枪。第二次,它用导弹没能杀死我后,就直接坐下来把我碾碎了。我又惊又怕,同时也对AI邪恶的创造力印象深刻,不禁笑了起来。当我再次尝试时,它还是这么做,只是速度更快了。它已经学会了坐在我身上是最有效的战术。
最终,Embark保留了AI移动系统,但移除了控制战斗策略的部分。这些机器人太擅长杀戮,但缺乏足够的可调节性,无法让游戏始终保持趣味性。趣味性是比“杀戮”更复杂的适应度函数。教会AI不仅要获胜,还要创造乐趣,可能是游戏开发的下一个边界,这一边界可能会开启全新的游戏形式。

  • 第三层——改变媒介本身

下一个前沿领域超越了制造更好的工具或更智能的系统。它改变了游戏的本质。
尽管如今的一些对话达到了这个水平,但很多仍陷入停滞,这与互联网兴起之初的印刷和广播媒体并无二致。游戏和娱乐的历史表明,真正的变革就发生在这里。每一次重大浪潮都会重新定义游戏的可能性。GPU和CD-ROM让真正的3D世界成为可能。互联网催生了MMORPG。配备GPS芯片的手机让《精灵宝可梦Go》成为可能。
AI将是这一模式中的下一波浪潮。它远不止是降低生产成本,还预示着游戏意义的更深刻变革。如果过去的经验有任何借鉴意义,那么这一转变将催生多家市值数千亿美元的公司。

对未来的一瞥来自米奇·拉斯基(Mitch Lasky)和布莱克·罗宾斯(Blake Robbins)在他们的Gamecraft播客中的分享,自那以后,由前米哈游领导层创立的工作室Anuttacon推出了《星际低语》(Whispers from the Star)。在游戏中,你是斯特拉(Stella)的唯一联系人,她是一名年轻的天体物理学家,迫降在一个名为盖亚(Gaia)的外星行星上。你通过语音、文字和视频与她交流,你的话语决定了她如何生存、探索以及修复飞船。与处于困境中的有感知能力的生命交谈,比从对话树中选择选项更能立即引起情感共鸣。这是一个虽小但引人入胜的例子,展示了AI如何重新定义游戏这一媒介本身。

借助AI进行重塑

利用AI意味着重新思考我们如何使用工具、构建工作流程以及对创意工作进行迭代。
控制问题:传统工具是确定性的:特定条件(如果)触发特定动作(那么)。虽然游戏开发者一直在使用随机化,但这种随机化是由游戏设计师精心设计和调整的。
AI工具具有概率性。你可以用你想要的示例来训练和强化它们,而不是直接命令它们。这使得它们在依赖精确性的生产流程中令人沮丧。在我们等待可控性提高的同时,挑战在于决定哪些地方控制是至关重要的,哪些地方更适合接受变化,就像上面的例子一样。
早期的瑕疵:按照前一种媒介的标准,每一种新媒介诞生时都存在缺陷。像《冒险岛》这样的早期网络游戏画面粗糙,Jamdat或Zynga的早期手机游戏被视为玩具。早期EA体育游戏的摄像系统存在问题,但应对这些失败教会了设计师跳切和镜头角度的技巧,这些技巧后来变得非常成熟,又从电子游戏回到了体育转播中。
这些例子中的每一个都解锁了新的乐趣。AI也是如此:按照当前AAA级标准来看还很粗糙,但在它所能实现的可能性方面却很广阔。先驱者们会在打磨之前就看到其潜力。
增强,而非取代。人们很自然地会认为AI将取代整个部门,甚至是创意过程本身。但革命性的技术很少会将人类排除在外;它改变的是人类工作的性质。Excel并没有淘汰首席财务官,也没有缩减财务团队规模。它让他们变得更聪明。AI也将在游戏开发中发挥同样的作用,提升创作者的能力,并将他们的精力从低影响力的任务转移到高影响力的成果上。
艺术家们无需在Photoshop中手动绘制每一棵树,而是可以使用程序工具绘制整个环境,这些工具对生物群落的理解比任何艺术家都要深入。软件负责处理看起来自然的部分,让设计师能够专注于让游戏世界更有趣的部分。工作并没有消失,只是提升了一个层次。

第三部分:系统冲击

机械降神
“也许是时候重新思考我的思维模式了……”

类别错误

每一次媒介转变都始于一种分类错误。早期的电影是“拍摄的戏剧”。早期的电视是“有画面的广播”,常常是广播主持人坐在桌前,面前摆放着声音道具,对着镜头主持。早期的互联网是“屏幕上的报纸”。
中世纪的僧侣们一生都在手抄书籍,他们认为自己从事的是抄写手稿的工作,但实际上他们从事的是复制思想的工作。印刷机以一种僧侣们无法想象的规模更准确地完成了这项工作。世纪之交的马车制造商没有意识到他们实际上从事的是运输业,对汽车如此迅速地使他们的旧车型过时感到困惑不解。
如今,大多数关于AI的预测都将其视为一种节省成本的工具。我们能否从更好的思维模型中受益呢?

  • 软件取代好莱坞:

为AI构建更好的思维模式,需要摆脱行业对好莱坞的不健康迷恋:包括其隐喻、职位头衔、制作结构和“绿灯”决策机制。更健康的思维模式是将其类比为软件。独立开发者、桌游创作者和顶尖大型工作室已经在以这种方式思考了。
Embark Studios围绕代码重建了《The Finals》和《ARC Raiders》的制作流程。他们没有采用手绘大型环境的方式,而是使用卫星激光扫描的地形,将其导入建模工具,并通过程序生成树木、天气和河流。一开始速度较慢,但此后变得更快且更灵活。这体现了一种服务于创意目标的工程思维。
其他领域的软件优先型公司通常会这样做。亚马逊收购了机器人公司Kiva Systems,以减少仓库工人的步行距离,但这一举措很快就促使其对履约中心进行了全面重新设计,并大幅提高了生产率。一家新的航空航天公司哈德良(Hadrian)进一步发展了这一理念,建立了完全自动化的“工厂即服务”模式,通过AI将设计与制造直接联系起来。
新一波技术浪潮往往会促使人们进行彻底的重新思考。汽车不只是取代了马匹;它们催生了高速公路和郊区。传真和无线网络使远程工作和无纸办公成为可能。手机催生了基于照片和视频的社交网络。新工具创造的系统与它们所取代的系统截然不同。

  • 对数加速度

如今,进步的速度已超过了该行业以往所经历的任何时期。芯片和数据中心的基础设施层,以及软件模型的效率,其发展速度都远远超过了摩尔定律所描述的每18个月晶体管密度翻番的速度。

利奥波德·阿申布伦纳(Leopold Aschenbrenner)估计,前沿AI系统的有效计算能力每年大约增长5 – 10倍。模型规模已从2018年的约1亿个参数增长到如今的超过1万亿个。
关键在于发展趋势。虽然短期内有人担心AI建设正在推动不可持续的电力需求和债务负担,让人想起21世纪初电信业的兴衰,但长期的进步速度正在加快,而非放缓。只要这种规模扩张趋势持续,关于新工具将如何塑造游戏创作的具体预测就会比牛奶变质还快。

机械降神
  • 从老手技艺到初学者心态

每一次媒介变革都对新手有利。他们不会被旧的经验法则所束缚,所以行动更快。
固守过时的模式是商业中最常见的陷阱之一。21世纪初,在EA,我们以为凭借更高清的画面就能在韩国和中国市场取得成功。我们的世界观更看重画面保真度而非在线游戏体验。我们错了。同样的情况也出现在棒球界,比利·比恩意识到,取胜的关键不在于打点,而在于上垒。同样的模式也在科技领域反复上演。谷歌陷入了两难境地,一方面是过去凭借广告链接和网站网络建立的主导地位,另一方面是尚未明确的未来范式。英特尔即便在行业通过并行处理和协同处理实现跨越式发展时,仍坚持摩尔定律。
同样的转变也将降临到游戏开发领域。那些能够摆脱旧思维模式,以初学者心态重新出发的团队,将引领下一个时代。就像比利·比恩时代的棒球界一样,一旦新的模式变得显而易见,所有人都会追随,但真正的回报将属于那些率先行动的人。

投资者视角:价值的下一站

我们现在正处于游戏行业后工业化投资的时代。多年来,游戏首次站在了大规模增长浪潮的前沿。许多投资者开始有所察觉,但很少有人理解其内在机制。
AI将使制作高质量游戏的成本降低一个数量级。借助合适的工具,如今一家工作室只需花费约3000万美元,就能实现曾经价值3亿美元的AAA级游戏制作。瑞典的Embark公司已经通过对其开发体系进行基本的重新调整证明了这一点,而且他们仍处于早期阶段。其他公司也会纷纷效仿。

资本支出由其他方承担。互联网兴起之初,电信公司斥资260亿美元铺设光纤,但从中获取价值的却是Facebook。如今,游戏领域的AI也在呈现同样的态势。工具提供商在为平台提供资金,而游戏创作者则可以收获回报。对投资者来说,这意味着较低的投入成本和巨大的潜在上行空间。

机械降神

真正的故事不是节省成本,而是新需求。此前的每一波技术浪潮——GPU/CD-ROM、在线、移动——都使行业收入大致增长了3倍。它们通过催生全新类型的游戏来实现这一点,而这些新游戏又催生了新公司。AI浪潮也带来了类似的突破,它使以前不可能存在的游戏成为可能,并催生了将开发这些游戏的公司。我们现在面临着一个千载难逢的机会,可以创建能够再次使市场规模扩大3倍的公司。
做空的对象:那些凭借大规模团队来开发游戏而获得竞争优势的AAA级老牌企业。正如MicroProse和Firaxis的前首席设计师布莱恩·雷诺兹(Brian Reynolds)所说:“我过去是实时进行设计。现在在AAA级游戏中,我先设计游戏,然后要等24个月才能完成资产构建,之后才能重新开始设计。”AI消除了这种延迟,也消除了老牌企业的优势。曾经让AAA级发行商占据优势的大规模生产体系,如今却成了沉重的负担。
长期来看,没有遗留方法论束缚的团队具有决定性优势。他们可以使用新工具来创造新的玩法模式并开拓新市场。几乎每一个在平台变革中胜出的都是不受旧观念束缚的新公司。Roblox刚出现时看起来很疯狂,就像早期互联网上的Audible以及移动领域的Spotify和Waze一样。每一个都利用新技术创造了新的用户体验。在下一波浪潮中,同样类型的意外赢家将会涌现。
整个行业棋盘正被抛向空中。对投资者来说,现在是投资的最佳时机。

面向开发者:威胁与机遇

AI及相关工具将重塑创意经济。第一波围绕YouTube、Twitch和Pinterest等互联网平台兴起。第二波以Shopify和Roblox等工具为核心,这些工具使个人和小团队能够构建体验并从中获利。由AI驱动的下一波浪潮将更为深入,它将取代游戏开发中很大一部分产业环节:将创意方向转化为制作资产的大量艺术家、设计师和协调人员。曾经劳动密集型的运营支出(OpEx)将转变为自动化的资本支出(CapEx)。
这种转变在短期内会很痛苦。工业层雇佣了大量辛勤工作的人,他们通过商业领域中最复杂的管理系统之一组织起来。对于许多在这个结构中建立起职业生涯的人来说,这会让他们感到非常恐惧。但正是这种掏空工业层的变革,极大地扩展了创意层。它将影响力向上游转移,从协调转向创造。对于当今的开发者来说,充满希望的道路是朝着这个方向前进,掌握新工具,进行试验,并专注于设计、系统和创造力,而不是生产管理。
这一变化也削弱了大型发行商的传统权力。他们的优势在于规模化内容制作,即有能力通过融资和管理数千人来支撑一款游戏。随着制作成本飙升,能够参与竞争的公司越来越少,这种稀缺性强化了他们的主导地位。在拆分框架下,发行商控制着最后的瓶颈:支撑能力。AI消除了这一瓶颈,也消除了寡头垄断租金和权力的最后来源。
所以,虽然这对开发者来说可能看起来像是一场末日,但实际上这是对主宰游戏行业二十年的产业结构的清算。对创意人士而言,这是一次重生。将其类比为YouTube和TikTok时代的电影和电视制作公司,感觉很贴切。我们很快就会有更多创作者,而不是更少,是真正在创作东西的人,而不是管理他人的人。
没有迹象表明AI会取代那些想象新世界、设计系统并与他人合作创造乐趣的创作者。它将取代常规生产,而非创造力。最优秀的开发者会像伟大的艺术家曾经对待新颜料或新乐器那样对待这些工具:将其作为比以往更快、更远地探索想法的途径。未来的席德·梅尔、宫本茂、威尔·莱特或宋嘉其将是那些掌握这些工具来发明新玩法的人。AI不会取代人类的创造力,而是会拓展它,使最小的团队也能完成曾经需要最大规模团队才能完成的事情。

结论:重生

“在变革时期,学习者将继承世界,而有学问的人会发现自己装备精良,却要应对一个不复存在的世界。”

Eric Hoffer


AI不仅仅是一种工具,它本身就是媒介的变革。
它是一种意外出现并改写剧本的解围之神。它极大地提升了体验,主要由他人资助,还消除了在位者的最后一项结构性优势。
每一次真正的媒介转变起初都是陌生的,因此令人恐惧。我们关注的是失业、成本削减和熟悉的系统崩溃等明显的破坏。更难看到但重要得多的是它所创造的机会。
游戏领域的每一波新技术浪潮都使创作者数量成倍增长:从PC时代的数千人,到主机和在线时代的数十万人,到移动浪潮中的数百万人,再到像Roblox这样的UGC平台时代的数千万人。AI将再次推动这一增长,通过赋能新开发者并极大地拓展游戏开发中的创作者经济。
在《电子游戏高管德里克·祖兰德》一文中,我写道,我们常常把炒作周期错当成有意义的技术浪潮。这一次并非昙花一现,而是一次进化飞跃。每一次媒介变革都为通往更广阔的世界打开一扇门。进步属于那些能用初学者心态去看待它的人。

机械降神
“我唯一知道的就是我几乎一无所知。”

注:感谢宾·戈登(Bing Gordon),他促使我更深入地思考这个话题,并分享了许多深刻的见解。如有任何错误,均由我本人负责。

原创文章,作者:茶馆实习生,禁止转载:https://youxichaguan.com/archives/182268

(0)
茶馆实习生
上一篇 3小时前
下一篇 1小时前

相关推荐