Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

第20章|Agent 泡沫与监管铁门:狂飙后的第一脚刹车

一、回到山中

2024年8月2日,Character.AI 的公告没有使用戏剧化标题。它只叫《An update from Character.AI》。

公告说,Character.AI 已经与 Google 达成一项非独家授权协议,Google 将获得 Character.AI 当前大语言模型技术的访问权;同时,联合创始人 Noam Shazeer、Daniel De Freitas 以及部分团队成员将加入 Google。[1] 公告还说,Character.AI 将继续运营,继续服务用户,Dominic Perella 将担任临时 CEO。[1]

如果只看字面,这不是一次传统收购。Character.AI 没有宣布被 Google 买下,也没有宣布产品关闭。可在2024年夏天的硅谷,这种交易的行业含义并不需要太多翻译。路透社在同日报道中写道,Google 聘用了 Character.AI 的创始人并签署授权协议;报道还把这件事放在大型科技公司与 AI 创业公司之间新型交易的语境中。[2]

这是一种很符合生成式 AI 时代的安排。它不像旧时代并购那样干净利落:一家公司、一个价格、一份收购公告、一轮反垄断审查。它更像一条绕行路线:模型技术授权给大厂,创始团队进入大厂,原公司继续存在,用户继续聊天,投资人和监管者则需要重新理解这到底算什么。

Noam Shazeer 的名字,让这件事格外像一个回环。

2017年,他是 Google 论文《Attention Is All You Need》的共同作者之一。这篇论文提出 Transformer 架构,后来成为大语言模型繁荣的技术底座。[3] 那时,Transformer 还不是资本市场的咒语,也不是创业公司路演材料里的必备词。它是一篇机器翻译论文,是 Google 内部长期研究积累的一部分。

几年后,Shazeer 离开 Google,与 Daniel De Freitas 创办 Character.AI。它没有从企业办公、搜索或编程助手切入,而是从“人格化聊天”切入:用户可以创建角色,可以和虚构人物、历史人物、情感陪伴型机器人聊天。它不是最严肃的 AI 产品,却极早证明了一件事:大模型不只用于回答问题,也能制造关系感、陪伴感和连续互动。

这类产品的增长故事曾经非常迷人。一个聊天框、一批角色、一群用户,似乎就能绕开传统社交网络的沉重资产。但到2024年,模型创业公司的账本越来越难写。训练成本、推理成本、内容安全、应用商店分发、用户留存、订阅转化,每一项都不再是幻灯片角落里的“小字风险”。

Character.AI 的公告没有说“失败”。事实上,它仍然继续运营。可这则公告像一声刹车声:一个曾经试图在大厂之外建立人格化 AI 平台的明星创业公司,最终把当前模型技术授权给 Google,并让创始人回到 Google。

这不是 AI 熄火。它更像高烧中第一次摸到体温计。

二、反向收购时代

2024年夏天,Character.AI 不是孤例。

3月,Microsoft 宣布 Mustafa Suleyman 和 Karén Simonyan 加入公司,Suleyman 担任 Microsoft AI 的 CEO,负责 Copilot 等消费级 AI 产品。[4] Suleyman 此前是 Inflection AI 的联合创始人。随后,Inflection AI 宣布战略转向,强调其企业 API 和 AI Studio,并称 Inflection-2.5 将托管在 Microsoft Azure 上。[5]

6月,Adept 宣布与 Amazon 达成协议。Adept 的联合创始人 David Luan 和部分团队成员加入 Amazon,Adept 则与 Amazon 建立技术授权安排,并继续运营。[6]

到8月,Character.AI 与 Google 的协议让这个模式更加清晰:不是所有 AI 创业公司都会以传统方式被收购,也不是所有明星团队都会独立走到上市。大厂不一定需要吞下整个公司,创业公司也不一定能承受独自烧穿所有阶段的成本。双方在监管、资本和速度之间,找到了一种更复杂的中间地带。

媒体常用“reverse acquihire”或类似说法描述这种现象。旧式 acquihire 是大公司买下创业公司,主要为了团队;新的版本更绕:团队进入大公司,技术通过授权进入大公司,创业公司留下产品、部分团队和继续运营的公司主体。行业荒诞感正在这里出现——AI 公司一边宣称要重塑世界,一边发现最现实的增长路径可能是把最强的人和模型送回云计算巨头。

这不难理解。

大模型创业的第一阶段,叙事中心是“能力”:谁的模型更聪明,谁的聊天更自然,谁的上下文更长,谁能写代码、看图片、听声音。第二阶段,问题变成“单位经济”:每一次用户对话都要消耗算力,每一次图片生成都要付出推理成本,每一次产品爆红都可能带来服务器账单的爆红。

再往后,问题是分发。Google 有搜索、Android、Workspace、YouTube 和云。Microsoft 有 Windows、Office、GitHub、Azure 和企业销售渠道。Amazon 有 AWS 和电商基础设施。Apple 有设备、操作系统和应用生态。相比之下,许多模型创业公司的分发方式仍然是网页、App、API 文档、Discord、社交媒体热度和一轮又一轮产品猎奇。

这不是说创业公司没有机会。Anthropic、Mistral、Perplexity、ElevenLabs、Runway 等公司都在不同方向上寻找独立空间。可 Character.AI 事件提醒行业:在基础模型时代,独立性本身有成本。模型越强,成本越像重力;产品越大,合规、分发和商业化越像空气阻力。

对创始人来说,这种选择不只是公司叙事的改变。它也改变团队内部的生活秩序:一部分人进入大厂体系,另一部分人继续维护原有产品;研究路线、产品节奏、基础设施预算和用户承诺,都要重新排序。对用户来说,聊天窗口可能还在那里,但它背后的公司命运已经发生迁移。

2023年,硅谷喜欢说“护城河不存在”。到2024年夏天,另一句话开始变得刺耳:护城河也许不是模型参数,而是数据中心、电力合同、分发入口、法务团队和现金流。

三、Grok 的斜线进攻

同一个8月,AI 产品并没有降温。

xAI 发布 Grok-2 Beta。官方博客开头写道:“We are excited to release an early preview of Grok-2…”——“我们很高兴发布 Grok-2 的早期预览版。”[7] xAI 称,Grok-2 相比 Grok-1.5 在聊天、编码和推理方面取得显著提升,并同时推出较小版本 Grok-2 mini。[7]

Grok-2 的特殊之处,不只在模型本身,而在它所绑定的平台。它不是一个孤立网页里的聊天机器人。它被放进 X,放进 Elon Musk 控制的实时社交网络。对 xAI 来说,这是一条与 OpenAI、Anthropic、Google 不完全相同的路线:别人强调通用助手、企业 API、安全边界、办公集成;Grok 强调实时信息、社交语境、个人化语气,以及更鲜明的产品人格。

xAI 在发布中列出了内部评测和外部比较,并提到 Grok-2 曾以匿名模型形式出现在 Chatbot Arena 上。[7][8] 这类榜单有价值,但也需要谨慎阅读。Arena 反映的是用户偏好投票,不等同于所有任务上的绝对能力;排名会随时间、样本和模型更新而变化。2024年的模型公司都学会了展示排行榜截图,读者也逐渐学会了问一句:这是哪一天、哪个任务、哪个版本、哪个测试集?

Grok-2 更大的争议来自产品气质。

当 OpenAI、Anthropic 把“安全”“对齐”“政策边界”写进产品说明时,Musk 试图用另一种方式切入。他长期批评大型 AI 公司过度审查,xAI 的品牌也更强调“求真”一类表达。到了 Grok-2,X 平台上的用户很快把注意力转向图像生成与内容边界。The Verge 在8月报道,Grok 的新图像生成功能被用户用于生成政治人物、名人和受版权保护角色相关图像,文章强调其限制相对宽松。[9]

这里不能把“少限制”简单等同于“更真实”,也不能把“更安全”简单等同于“更无聊”。行业的荒诞在于:用户常常一边抱怨模型被阉割,一边在模型失控时要求平台负责;平台一边宣传自由表达,一边必须面对选举、名誉权、版权、儿童安全和品牌广告主。

Grok-2 说明,模型产品还有很多差异化空间。AI 不是只有一种语气,也不是只有一种价值排序。可是它也说明,当模型与社交平台结合,风险不再停留在实验室。一个模型回答错题,只是一次糟糕体验;一个模型在社交平台上生成、传播、再被截图扩散,问题会立刻进入公共信息空间。

对普通用户来说,这是一个新玩具。对平台运营者来说,这是内容治理的新变量。对广告主来说,这是品牌安全的新风险。对监管者来说,这是合成内容、政治传播和平台责任的老问题换了一台更快的发动机。

2024年夏天的产品经理们因此面对一个奇怪的等式:模型越有性格,传播越强;传播越强,治理越难;治理越严,性格又可能被磨平。

这不是技术白皮书里的难题。这是产品发布后的日常。

四、商业摄影的幽灵

如果说 Grok-2 代表文字、社交和实时信息的斜线进攻,Midjourney v6 系列则代表另一条更安静但更刺眼的路线:图像生成正在逼近商业摄影。

Midjourney v6 在2023年底进入 alpha。官方公告称,v6 带来更强的提示词跟随能力、更长提示词理解、更好的连贯性和模型知识,并改善图像提示与文字绘制等能力。[10] 到2024年7月,Midjourney 发布 v6.1。官方说明称,v6.1 带来更好的图像连贯性、更高质量、更准确的小细节、更好的纹理和皮肤表现,并提到标准图像任务大约快25%。[11]

对普通用户来说,这些更新可能只是“更好看”。对设计师、广告公司、电商商家、摄影师、图库公司和版权方来说,这些词要重得多。

“更好的小细节”意味着产品图里的边缘、手指、材质和光影更少穿帮。“更快”意味着创意探索的单位成本下降。“更连贯”意味着系列广告、人物设定和风格延展更接近可交付物。早期 AI 图像常被嘲笑为“六根手指的梦境”,到了 v6 系列,笑话还在,但笑声开始变短。

图像模型带来的行业荒诞感非常具体。过去,商业摄影需要摄影棚、灯光、布景、模特、修图、授权、场地、保险和排期。现在,一段提示词可以在几十秒内生成一张“像是已经拍完”的图。它不一定能直接替代高端摄影,也不一定能满足品牌法务审查,但它足以改变草图、提案、分镜、情绪板和低成本广告素材的生产方式。

对创作者来说,变化首先落在报价单和工作流上。一个独立设计师可能不需要理解扩散模型的数学细节,却会发现客户把“先用 AI 出几版看看”变成默认要求。一个摄影师不必相信 AI 会立刻替代棚拍,却会遇到预算更紧、周期更短、样片更多的项目。创意行业的个人劳动被卷入模型速度,并不需要通过宏大宣言发生;它常常先发生在一句“这个能不能今天下班前再出十版”。

与此同时,版权问题没有因为图像变美而消失。

视觉艺术家对生成式 AI 公司的诉讼在美国持续推进。2024年8月,美国加州北区联邦法院在 Andersen v. Stability AI 等案件中处理了针对 Stability AI、Midjourney、DeviantArt 等被告的部分动议,案件围绕训练数据、生成图像与版权侵权等问题展开。[12] 这些法律争议不只针对 Midjourney,也不只针对某一个模型。它们提出的是整个图像生成产业都绕不开的问题:模型训练时看过什么?输出与原作之间的关系如何判断?风格能否被保护?平台是否需要为用户生成内容承担责任?

广告行业的风险更现实。一个品牌可以喜欢 AI 图像的效率,却不一定愿意承担训练数据争议、肖像权争议、商标误用和舆论反噬。AI 图片越像商业摄影,越会进入商业摄影的责任体系。过去那种“只是玩玩”的免责空间正在缩小。

Midjourney 的进步因此有两面。它证明生成式 AI 的产品体验仍在快速提升,也证明技术越接近生产,越会撞上生产世界的规则。摄影棚可以被提示词部分替代,但合同、授权、审稿、品牌安全和责任链条不会自动消失。

AI 公司喜欢说“降低创作门槛”。这句话没有错。只是门槛降低后,门口的人更多,门后的纠纷也更多。

五、布鲁塞尔的铁门

就在 Character.AI 公告前一天,另一件事发生在大西洋彼岸。

2024年8月1日,欧盟委员会发布消息:“The AI Act enters into force.”——“《人工智能法案》正式生效。”[13] 这句话的语气比任何模型发布都冷静,却改变了 AI 行业的地形。

AI Act 不是一个简单的“允许”或“禁止”文件。它采用风险分类方法:某些 AI 实践被禁止,高风险系统承担更严格义务,通用 AI 模型也被纳入治理框架。欧盟委员会称,该法案旨在促进欧盟负责任的 AI 开发与部署。[13]

它的时间表也不是同一天全部落地。根据欧盟委员会说明,禁止类 AI 实践相关规则通常在生效后6个月适用;通用 AI 模型相关规则在约12个月后适用;大多数义务约在24个月后适用;部分高风险系统相关义务适用时间更晚。[13] 换句话说,2024年8月1日不是铁门完全关闭的一天,而是铁门开始落下的一天。

罚款上限让这道门有了重量。AI Act 官方文本规定,对被禁止 AI 实践等严重违规,罚款最高可达3500万欧元或企业上一财政年度全球年营业额的7%,以较高者为准。[14] 对大型科技公司而言,“全球营业额7%”不是象征性数字。它足以进入董事会、法务部和产品路线图。

Margrethe Vestager 并不需要出现在8月1日的某个现场,她早已代表了欧洲数字监管路线的一部分。2020年,欧盟发布人工智能白皮书时,她在公开发言中把欧盟立场概括为:在数字时代,信任不是可有可无的附属品。[15] 到2024年,这句话变得更加具体。

对模型公司来说,“信任”不再只是网页上的安全承诺,而可能变成文档义务、风险管理、数据治理、透明度报告、版权摘要、模型评估、事件通报和外部审计。硅谷发布会里的关键词是“更快”“更强”“实时”“多模态”;布鲁塞尔文件里的关键词是“风险”“义务”“合规”“罚款”“分阶段实施”。

两种语言并不天然敌对。欧洲也希望发展 AI,欧盟文件反复强调创新、竞争力和负责任部署。[13] 可两种语言的节奏完全不同。模型公司按周更新,监管制度按年实施;创业公司按融资周期讲故事,法律按责任链条问问题。

这道门最先改变的,往往不是 CEO 的演讲,而是公司里不太上镜的人:法务、政策、安全评估、数据治理、采购合规、产品文档团队。他们需要把一个模型从“可以发布”翻译成“可以在欧洲市场持续运营”。他们处理的不是科幻,而是表格、记录、流程、版本、供应商条款和事故响应预案。

这就是2024年夏天的现实刹车:不是不许开车,而是前方开始出现限速、收费站、年检和事故责任认定。

六、黄仁勋的账本

如果监管是制度边界,NVIDIA 的财报就是物理边界。

2024年8月28日,NVIDIA 发布2025财年第二季度业绩。总收入300亿美元,同比增长122%;数据中心收入263亿美元,同比增长154%。[16] 这些数字让“AI 热潮”从产品叙事落到了财务报表上。全世界都在谈模型,NVIDIA 的报表提醒市场:模型不是漂浮在云端的魔法,它运行在 GPU、HBM、高速互联、机柜、散热系统、数据中心和电力合同之上。

黄仁勋在财报新闻稿中说:“Hopper demand remains strong, and the anticipation for Blackwell is incredible.”——“Hopper 的需求仍然强劲,市场对 Blackwell 的期待令人难以置信。”[16]

这句话几乎是2024年 AI 基础设施的缩写。Hopper 是正在交付的现实,Blackwell 是被等待的未来。模型公司、云厂商、企业客户和资本市场都在看同一件事:下一代芯片能不能按时、按量、按成本进入数据中心。

NVIDIA 在2024年3月发布 Blackwell 平台,称其面向新一代 AI 计算需求,并强调性能、互联和能效提升。[17] 到8月财报季,市场关注的不只是发布会参数,而是供应链交付。AI 行业的浪漫词汇在这里被翻译成硬件词汇:封装、良率、HBM 供应、网络交换、液冷、机柜密度、能耗。

这也是为什么 NVIDIA 的财报变成了 AI 行业的温度计。OpenAI、Anthropic、Google、Meta、xAI、Microsoft、Amazon、Oracle,以及一长串模型和云公司,都在同一条供应链上排队。训练更大模型需要更多算力,服务更多用户需要更多推理算力,做多模态和视频生成又进一步推高需求。

对采购经理和基础设施团队来说,AI 革命不是一句“模型能力涌现”,而是一份交付排期、一张机柜布局图、一组功耗曲线和一份云账单。对创业公司来说,GPU 不只是技术资源,也是融资故事里的隐性股东:它不出现在 cap table 上,却决定 burn rate 的速度。

2024年的一个行业悖论是:AI 公司向用户展示的是“无形智能”,向供应商购买的却是最有形的工业产品。聊天框看起来轻盈,背后是巨大的资本开支。一个回答像一句话,一次训练像一座工厂。用户看到的是模型“秒回”,CFO 看到的是折旧、能耗和毛利率。

当模型能力飞快提升时,算力瓶颈会被短暂忽略;当所有公司都想把 AI 塞进搜索、办公、社交、手机、客服、编程和广告系统时,瓶颈就回来了。它不一定表现为“没有芯片”,也可能表现为芯片太贵、部署太慢、电力不足、网络不够、推理成本压不下来。

黄仁勋的账本让行业兴奋,也让行业清醒。兴奋的是,AI 需求真实到足以改写半导体公司的收入曲线;清醒的是,如果一家芯片公司的财报能牵动整个模型世界,那么所谓“智能爆炸”至少还要经过供应链排产表。

七、Agent 的泡沫边缘

2024年夏末,“Agent”成了另一个高频词。

它比“聊天机器人”更宏大。聊天机器人回答问题,Agent 要执行任务;聊天机器人给建议,Agent 要打开网页、填写表格、调用工具、写代码、订机票、查库存、发邮件、改 CRM、跑数据分析。它承诺把模型从“会说”推向“会做”。

这个方向并非空穴来风。前文已经写过,2024年春天的 Devin 演示把“AI 软件工程师”的想象推到台前;之后,函数调用、工具使用、长上下文、多模态理解、代码能力也在持续进步。企业确实需要能够处理流程的 AI 系统,而不是只会生成漂亮段落的文本机器。问题在于,“能演示”和“能可靠执行”之间隔着一条很长的河。

公开基准已经提示了难度。WebArena 论文构建了一个用于评估自主智能体的真实网页环境,任务涉及购物、论坛、GitLab、内容管理等场景。论文报告中,基于当时模型构建的智能体成功率仍显著低于人类基线。[18] OSWorld 则把评估环境推进到真实计算机操作系统,测试多模态智能体完成桌面任务的能力;论文同样显示,当时模型智能体与人类操作水平之间仍有明显差距。[19]

这些结果解释了为什么 Agent 在2024年同时像机会和泡沫。

机会在于,每个企业流程都有自动化空间。泡沫在于,演示视频里的 Agent 常常走在铺好的红地毯上:账号已经登录,网页结构没有变化,异常情况没有发生,权限边界没有触发,用户目标也足够清晰。真实世界则喜欢制造相反条件:网页改版、验证码、权限不足、字段歧义、系统超时、数据不一致、用户半途改变主意。

Agent 的可靠性问题不像聊天机器人答错一道常识题那么轻。一个文本回答错了,可以重问;一个 Agent 发错邮件、下错订单、删错文件、改错数据库,责任就不再是“模型幻觉”四个字能概括。企业客户会问:谁批准的?谁记录的?谁回滚?谁负责?日志在哪里?审计怎么做?权限如何最小化?如果它调用了第三方工具,事故链条怎么算?

因此,2024年夏末的 AI 行业出现了四道门槛。

第一道是成本。模型训练、推理、存储、带宽和工程维护都要钱,免费增长无法无限持续。Character.AI 的回流故事提醒人们,用户热情不等于商业闭环。

第二道是可靠性。Agent 要进入工作流,就必须从“多数时候看起来可用”走向“关键步骤可验证、可回滚、可审计”。这不是单靠更大模型就能解决的工程问题。

第三道是监管。AI Act 生效后,模型公司不能只按发布节奏生活。风险分类、透明度义务、版权和安全评估会逐渐进入产品周期。

第四道是分发。最强模型如果没有入口,仍要向拥有操作系统、办公套件、云平台、搜索、社交网络和企业销售渠道的大厂借路。Grok 绑定 X,Apple 把 AI 塞进设备,Microsoft 把 Copilot 放进 Office,Google 把 Gemini 放进搜索与 Workspace,都是对同一个问题的回答:模型要到用户面前,必须穿过分发之门。

这就是第20章的现实刹车。

2024年夏末,AI 没有熄火。相反,模型世界看起来更繁荣了:Grok-2 发布,Midjourney 图像更逼真,NVIDIA 收入暴涨,开源与闭源继续竞速,Agent 创业公司仍在路演材料里画出自动化未来。

可是繁荣背后,压力已经同时出现。创业公司被算力和分发吸回大厂;监管铁门开始落下;芯片、HBM、数据中心和电力成为资本市场的共同语言;Agent 从演示走向生产时,可靠性问题暴露出坚硬边界。

狂飙不是终点,而是筛选机制。能留下来的,不是发布会里最像科幻的产品,而是能跨过成本、可靠性、监管和分发四道门槛的系统。

当监管铁门落下、创业公司回流大厂、芯片成为资本市场温度计时,模型公司开始寻找新的能力曲线——推理模型、慢思考,以及 Agent 的操作系统化。

参考文献

  1. Character.AI, “An update from Character.AI”, 2024.08.02。
  2. Reuters, “Google hires founders of AI startup Character.AI, signs licensing deal”, 2024.08.02。
  3. Ashish Vaswani et al., “Attention Is All You Need”, NeurIPS, 2017。
  4. Microsoft, “Microsoft hires Mustafa Suleyman and Karén Simonyan to lead Microsoft AI”, 2024.03.19。
  5. Inflection AI, “The new Inflection”, 2024.03.19。
  6. Adept, “Update on Adept’s strategic partnership with Amazon”, 2024.06.28。
  7. xAI, “Grok-2 Beta Release”, 2024.08.13。
  8. LMSYS / Chatbot Arena, “Chatbot Arena Leaderboard”, 2024。
  9. The Verge, “Grok’s new AI image generator will make anything”, 2024.08.14。
  10. Midjourney, “V6 Alpha release notes / announcements”, 2023.12。
  11. Midjourney, “V6.1 release notes / announcements”, 2024.07.30。
  12. United States District Court, Northern District of California, “Andersen et al. v. Stability AI Ltd. et al., Order on Motions to Dismiss”, 2024.08.12。
  13. European Commission, “AI Act enters into force”, 2024.08.01。
  14. European Union, “Regulation (EU) 2024/1689 laying down harmonised rules on artificial intelligence”, Official Journal of the European Union, 2024.07.12。
  15. European Commission, “Remarks by Executive Vice-President Vestager on the White Paper on Artificial Intelligence”, 2020.02.19。
  16. NVIDIA, “NVIDIA Announces Financial Results for Second Quarter Fiscal 2025”, 2024.08.28。
  17. NVIDIA, “NVIDIA Blackwell Platform Arrives to Power a New Era of Computing”, 2024.03.18。
  18. Shuyan Zhou et al., “WebArena: A Realistic Web Environment for Building Autonomous Agents”, arXiv, 2023。
  19. Tianbao Xie et al., “OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments”, arXiv, 2024。