Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

第22章|非营利的裂缝:OpenAI 转型、马斯克诉讼与版权围城

一、浏览器里的聊天框,背后的机器

2024年秋天,许多用户仍然是从一个最普通的入口遇见 OpenAI:浏览器里的 ChatGPT,手机上的应用图标,或者某个办公软件、编程工具、客服后台里悄悄嵌进去的一行“AI”按钮。

表面上,它像一个产品。输入问题,等待回答,复制结果,继续工作。可是到了这一年9月至12月,越来越多的人开始意识到:这个聊天框并不只是一个网页。它背后有非营利董事会、营利实体、投资协议、云计算合同、版权诉讼、创始人纠纷、模型授权、监管审查,以及一条条随时可能改变的服务条款。用户看到的是回答速度,开发者看到的是 API 延迟;真正决定这套系统能不能继续运转的,却是公司法、版权法、资本市场和云基础设施。

OpenAI 自己在2024年10月2日的融资公告中给出过一个规模感:每周有超过2.5亿人使用 ChatGPT。[1] 这个数字让“公司治理”从一种内部事务变成公共依赖。一个普通用户当然不会每天阅读 Delaware Public Benefit Corporation 的法律说明,也不会研究 OpenAI 非营利母体与营利子公司的控制关系。可是如果这个工具已经进入学习、写作、编程、客服、咨询、翻译和企业流程,那么提供者的组织结构就不再是遥远的工商登记信息。它开始像电力公司的调度、银行的清算系统、云服务商的可用区一样,变成用户风险的一部分。

同一周,OpenAI 在 DevDay 2024 发布 Realtime API 等面向开发者的新能力,继续把模型推向应用层。[2] 这类发布会通常以演示开场:语音对话、低延迟响应、函数调用、实时交互。台上展示的是技术的顺滑,台下真实存在的是另一张表格:如果供应商重组,合同主体是否改变;如果版权诉讼败诉,某些训练或输出能力是否受限;如果投资协议改变控制权,路线图是否改写;如果云伙伴政策变化,成本是否上升;如果监管要求新增披露,产品是否延期。

这不是说每一个聊天请求都会被诉讼文件拦住。行业的荒诞感恰恰在于,大多数时候,一切仍然顺滑。用户照常提问,开发者照常调用,企业照常采购。可是在顺滑的表面之下,私人的制度设计已经成为公共依赖的组成部分。2024年秋冬,OpenAI 的非营利裂缝不再只是硅谷一家公司怎样安排董事会的故事。它开始提醒所有依赖 AI 基础设施的人:浏览器里的机器人并不住在浏览器里。

二、一只非营利的手和一台营利机器

要理解这条裂缝,必须先把 OpenAI 官方描述过的结构讲清楚,但不必把章程重新背诵一遍。

OpenAI 的使命表述长期围绕一个核心句子展开:确保通用人工智能造福全人类。[3] 2019年3月,OpenAI 宣布设立 OpenAI LP,解释理由是建设前沿 AI 需要的资本和人才远超传统非营利模式所能承受,因此建立一种“capped-profit”结构:允许投资和员工激励,但投资回报设上限,并由非营利实体控制。[4] 这是一种硅谷式混合装置:一边向资本市场承认“训练模型很贵”,一边向公共使命承诺“资本不能无限主宰”。

OpenAI 官方结构说明中反复强调,非营利组织及其董事会承担监督使命的角色,营利实体则承担融资、雇佣、产品化和运营功能。[3] 中性地说,这套设计试图同时满足三个目标:筹钱,留住人才,保留使命约束。怀疑地说,这套设计也把三种张力装进了同一个壳:投资人希望可预期回报,员工希望股权价值,公众希望安全与公共利益优先。

2023年11月的五天董事会危机已经足够著名,本章不再重走那条时间线;只需记住一点:那次事件让外界第一次如此直接地看到,OpenAI 的董事会结构会影响全球用户对一个 AI 产品的连续性预期。2024年3月,OpenAI 宣布新增 Sue Desmond-Hellmann、Nicole Seligman、Fidji Simo 三名董事,并让 Sam Altman 重返董事会;公司同时公开转述 WilmerHale 对2023年事件的审查摘要,称审查包括三万多份文件和多次访谈,并将危机归因于前董事会与 Altman 之间关系和信任破裂,而不是某个具体产品安全、财务或客户陈述问题。[5]

这份说明的作用,是给治理危机装上一个正式句号。但正式句号不是问题的终点。它只是把问题从“那五天发生了什么”转移到“这种结构能否长期承受资本密集型基础设施的压力”。在2024年秋冬,这个问题重新出现,而且更接近公司法和融资条款,而不是董事会新闻。

因为 OpenAI 此时已经不是一家只向研究同行展示论文的实验室。它有数以亿计的用户,有企业客户,有开发者生态,有与 Microsoft 的深度合作,有不断增长的算力需求。一个非营利母体控制营利实体的制度实验,在早期可以被看作理想主义者的组织创新;当它成为全球 AI 基础设施的一部分时,它就变成了公共风险管理问题。

三、九月以后,结构改革不再是内部话题

2024年9月25日,路透社援引知情人士报道称,OpenAI 正计划把核心业务重组为更传统的营利性公益公司结构,非营利组织仍将存在并持有权益,但控制方式可能发生变化。[6] 这类报道没有法院判决那样的确定性,必须按报道转述处理。可是它之所以引发广泛关注,正是因为它触碰了 OpenAI 结构中最敏感的部位:非营利控制到底还能控制什么。

一周后,10月2日,OpenAI 官方宣布完成66亿美元融资,投后估值达到1570亿美元。[1] 路透社同日报道称,这轮融资得到多方投资者支持,并把这笔融资放在 OpenAI 需要持续扩大算力和产品能力的背景下理解。[7] 66亿美元不是普通创业公司的一轮“增长资金”。它更像一张基础设施账单的预付款:GPU、数据中心、电力、网络、研究员、企业销售、安全测试、合规团队、法律费用,都会从“模型能力”这个词背后伸手要钱。

这正是 OpenAI 制度矛盾变得用户可见的原因。前沿模型竞争已经资本密集到一个程度:如果不打开更大融资通道,可能在算力和人才上落后;如果打开更大融资通道,组织就更像一家传统高估值科技公司;如果坚持非营利强控制,投资人会担心治理不确定性;如果削弱非营利控制,公众和早期支持者会追问使命约束是否被稀释。

12月27日,OpenAI 发布《Why OpenAI’s structure must evolve to advance our mission》。这一次,不再是“知情人士称”,而是公司自己的公开说明。OpenAI 表示,为推进使命,需要让结构演进;计划将现有营利实体转变为 Delaware Public Benefit Corporation,即特拉华州公益公司;非营利组织将持有该 PBC 的股份,并由独立财务顾问协助确定公平估值。[8]

PBC 是一个重要但容易被神化的词。它不是“公益”的自动保证书。它的意义在于,公司法框架允许企业在股东利益之外考虑公共利益和利益相关方。但它不能自动回答所有冲突:当公共利益与融资速度冲突时,谁让步?当安全部署节奏与收入目标冲突时,董事会怎样投票?当版权方要求授权费用、用户要求更低价格、投资人要求增长时,公共利益如何量化?

OpenAI 在12月说明中的核心叙事是:结构变化不是背离使命,而是为了给使命获得足够资源。怀疑者看到的则是另一面:当使命越来越依赖估值、股权和资本市场,使命本身也会受到估值和资本市场的牵引。两种判断都不能只靠口号解决。它们必须落到合同、董事会权限、投资人权利、监管披露、版权授权和用户保障上。

于是,2024年秋冬的 OpenAI 不再只是“非营利还是营利”的概念题。它变成一组操作性问题:如果一个小公司把客户服务建在 OpenAI API 上,OpenAI 的结构改革会不会影响长期价格?如果一家学校把教学辅助流程接入 ChatGPT,版权诉讼会不会改变可用内容?如果一家企业把内部知识库接入模型,未来控制权和数据政策是否稳定?这些问题没有发布会演示那么激动人心,却比演示更接近依赖者的日常。

四、案卷里的创始故事

OpenAI 的结构争议,在2024年还被另一条线推高:Elon Musk 的诉讼。

这里必须先把法律措辞钉牢。Musk 的诉状提出的是指控和主张,不是法院确认的事实。OpenAI 的博客和法庭回应是被告方立场,也不是法院最终裁判。2024年围绕 OpenAI 的公共叙事,很大一部分正是在“诉称”和“回应”之间形成的。

2024年8月5日,Musk 在加州北区联邦法院起诉 OpenAI、Sam Altman、Greg Brockman 等被告。[9] 诉状主张,Musk 参与创立和资助 OpenAI,是基于一个围绕安全、公益和开放原则的创立承诺;诉状还称,OpenAI 后来的商业化路线、闭源模型策略以及与 Microsoft 的关系,背离了这些承诺。[9] 到11月14日,Musk 提交第一份修订诉状,进一步把 Microsoft 置于争议中心,并加入围绕 OpenAI—Microsoft 关系的反垄断等主张。[10]

这些主张之所以会引起行业关注,不仅因为 Musk 是 OpenAI 早期参与者,也因为他后来创办了 xAI,成为同一赛道的竞争者。这个身份组合让诉讼天然复杂:案卷中既有创始承诺和公益叙事,也有控制权、竞争关系和市场结构。法律上,法院需要判断具体请求是否成立;叙事上,公众看到的是 OpenAI 早期“为了人类”的语言,如何在2024年的融资、云合约和产品收入中被重新解释。

OpenAI 的回应同样明确。2024年3月,OpenAI 发布《OpenAI and Elon Musk》,公开多封早期邮件,并称 Musk 当年也认为 OpenAI 需要远超最初想象的资金;OpenAI 还称,Musk 曾提出或支持更偏营利化、与 Tesla 更紧密结合等方向。[11] 12月13日,OpenAI 又发布《Elon Musk wanted an OpenAI for-profit》,继续以邮件和时间线回应 Musk 的诉讼叙事,核心立场是:Musk 现在攻击的营利化方向,并非他早年完全反对的东西;OpenAI 认为他的诉讼试图改写历史。[12]

把两边放在一起看,荒诞感不是来自某个人,而是来自行业结构本身。一个以公共使命起家的 AI 组织,后来需要由联邦诉状、博客邮件截图、反垄断主张和公司重组公告来解释“使命”怎样和资本、控制权、云服务、模型开放性共存。旧时代的创业争议常常围绕股份、创始人头衔和董事席位;AI 时代的创始争议还要加上训练数据、模型权重、公共安全和“全人类利益”。

这类诉讼即使短期内不改变产品,也会改变产品风险。企业采购部门会问:如果诉讼影响合作关系怎么办?开发者会问:如果法院要求限制某种商业安排怎么办?投资人会问:如果结构改革被拖延怎么办?用户一般不会阅读修订诉状,但他们会感受到价格、可用性、功能路线和服务稳定性的变化。法律文件从后台走向前台,正是基础设施化的标志。

五、版权围城:新闻业开始给训练数据标价

另一条围城来自版权。

2023年12月27日,《纽约时报》在纽约南区联邦法院起诉 Microsoft 和 OpenAI。[13] 诉状指称,被告未经授权使用《纽约时报》大量受版权保护内容训练大语言模型,并通过 ChatGPT、Bing Chat 等产品生成或展示与时报内容高度相似的输出,造成侵权和竞争损害。[13] 这些仍然是原告主张,不是法院裁判。但它击中了生成式 AI 的核心供应链:训练数据。

OpenAI 在2024年1月8日发布《OpenAI and journalism》回应,表示支持新闻业和出版生态,主张使用公开可得互联网材料训练模型属于合理使用;同时称模型逐字或近似复现训练材料的“regurgitation”是罕见问题,并表示正在减少这类现象。[14] 2月,OpenAI 相关被告在法庭文件中请求驳回《纽约时报》部分诉求,继续围绕合理使用、损害认定和具体法律请求展开抗辩。[15] Microsoft 也在同一案件中提交动议,要求驳回部分诉求,并从技术创新与版权边界角度提出抗辩。[16]

这场诉讼让新闻业和 AI 公司之间的分歧清楚浮出水面。新闻机构的逻辑是:记者采访、编辑核查、律师审稿、摄影制图、订阅系统和新闻品牌共同构成了昂贵的信息生产机器;如果 AI 公司把这些内容吸收进模型,再通过聊天框和搜索摘要把答案交给用户,原始新闻机构可能失去流量、订阅和议价能力。AI 公司的逻辑则是:模型训练是一种转换性学习,模型不是简单数据库;同时,复现问题可以通过技术手段降低,授权合作也可以并行推进。

到2024年秋天,这个争议已经从法庭扩散成商业谈判。10月8日,OpenAI 与 Hearst 宣布战略内容合作,OpenAI 产品将整合来自 Hearst 旗下报纸和杂志的内容,并提供归属和链接。[17] 更早一些,OpenAI 也已与其他出版机构达成内容授权合作。诉讼和授权并行,说明市场还没有稳定价格。有人选择起诉,有人选择授权,有人继续观望;这不是新闻业立场混乱,而是整个内容供应链正在重新估价。

版权围城改变了 OpenAI 的公共身份。一个研究实验室可以把互联网文本看作学习材料;一个估值千亿美元、面向全球收费、嵌入 Microsoft 产品体系的模型平台,则更难只用研究公益来解释数据来源。商业化越成功,内容生产者越会问:既然模型可以收费,为什么训练燃料不收费?模型越通用,出版机构越担心:如果答案直接出现在聊天框里,谁还回到原始报道?

这也是治理问题的第二层。第一层是“谁控制 OpenAI”。第二层是“OpenAI 使用的公共知识和专业内容由谁生产、谁付费、谁获益”。当 AI 成为信息入口,版权就不只是作者和公司之间的私权纠纷。它会影响新闻业的收入结构、用户获取信息的路径,以及公共知识生产能否继续维持。

六、一个开发小队的风险登记簿

最能说明变化的,不一定是某个会议室里的台词。公开信源很少记录一个小团队在白板前怎样讨论供应商风险;非虚构写作也不能替他们补上心理活动。更可靠的证据,反而写在开发工具和基础设施选择里。

2024年,越来越多 AI 应用不是直接把自己和某一个模型提供商焊死,而是在代码里放入“provider”抽象层。LangChain 在2024年发布 v0.2 时强调核心包更加“integration-agnostic”,也就是尽量不默认绑定具体模型、向量数据库或工具提供商。[18] 这种技术选择表面上是软件工程洁癖,实质上是风险管理:今天用 OpenAI,明天可能切 Anthropic、Google、Mistral、本地模型或多模型路由;今天担心延迟,明天担心价格,后天担心诉讼、条款和数据政策。

对一个只有几名工程师的小团队来说,OpenAI 的治理新闻可能不会以“伦理辩论”的形式出现,而会进入更平凡的清单:

第一,供应商连续性。OpenAI 若调整结构、融资条款或控制方式,路线图和资源分配可能变化。小团队未必能影响这些变化,但会承受接口、价格和模型可用性的后果。

第二,法律暴露。若版权诉讼导致某些训练、检索、输出或内容展示方式需要调整,依赖模型生成内容的产品就要重新评估合规文案、用户条款和赔偿责任。

第三,商业依赖。Microsoft 是 OpenAI 的重要合作伙伴和云基础设施力量。对开发者来说,这种深度合作既带来稳定算力和企业分发,也带来平台集中风险。一个创业产品如果同时依赖 OpenAI 模型、Azure 云资源和 Microsoft 企业生态,技术架构图看起来很漂亮,供应商集中度也很漂亮,漂亮到风险经理会多看两眼。

第四,运营可用性。2024年12月11日,OpenAI 状态页记录了 ChatGPT、API 和 Sora 不可用的事件。[19] 这类故障不是本章讨论的法律争议,却能让依赖者迅速理解“AI 基础设施”四个字的含义:当提供商异常,客户自己的产品也会异常。既然一次服务中断可以立刻传导,那么结构重组、诉讼限制、版权授权和云合作变化也可能以更慢但更深的方式传导。

这就是个人影响的真实形态。它通常不会表现为用户突然研究公司法,而是表现为工程师多写一个适配层,产品经理增加一个替代模型选项,销售合同里加入供应商变更条款,企业采购要求提供数据使用说明,法务要求确认生成内容的版权风险。AI 产品越像水电煤,用户越会关心水电煤公司是谁、受谁控制、账单怎样算、出了事谁负责。

2024年以前,许多开发者把模型供应商看成技术选择:哪家更便宜,哪家更快,哪家上下文更长,哪家函数调用更稳。2024年秋冬以后,供应商选择开始像制度选择:哪家治理结构更清楚,哪家诉讼风险可控,哪家版权授权更稳,哪家云依赖更透明,哪家条款变化更可预期。一个小团队的代码仓库里,provider abstraction 成了这个时代最朴素的政治经济学。

七、裂缝成为系统的一部分

到2024年底,OpenAI 的非营利裂缝已经不是一场偶发董事会风波的余震。它变成了生成式 AI 行业公共依赖的样本。

结构改革说明,前沿模型竞争已经昂贵到需要新的资本容器。66亿美元融资和1570亿美元估值说明,这不再是实验室预算,而是基础设施竞赛。Musk 诉讼说明,创始承诺、控制权、开放性和商业化路线会在案卷中重新争夺解释权。版权诉讼说明,训练数据不是“互联网上有就能用”的技术细节,而是新闻业、出版业和平台经济重新分账的核心。Microsoft 的角色说明,模型公司很难脱离云巨头和软件分发体系单独存在。

这些线索合在一起,指向一个更大的事实:当 AI 模型成为通用工具,提供者的私人制度安排就会变成公共风险。

谁控制模型,不再只是董事会名单问题,还包括谁提供算力、谁提供资金、谁拥有企业入口、谁掌握分发渠道。谁分享收益,不再只是投资人和员工的股权问题,还包括新闻机构、作家、图片机构、代码社区和互联网内容生产者是否获得许可费或议价权。谁承担风险,也不再只是安全团队和法务团队的问题,而会落到学校、企业、开发者、读者、作者和普通用户身上。

OpenAI 的故事之所以重要,不是因为它独自拥有这些矛盾,而是因为它把矛盾集中得足够醒目。公益使命与资本扩张,非营利控制与投资人预期,研究理想与产品收入,开放知识与版权许可,独立治理与云平台依赖,全都在同一家公司身上相遇。

更荒诞也更真实的是,裂缝没有让系统停止运行。相反,系统一边裂开,一边融资,一边发布 API,一边签内容合作,一边应诉,一边重组,一边服务每周数以亿计的用户。裂缝不是系统崩溃的声音,裂缝成了系统运行时发出的声音。

2024年秋冬,用户和开发者开始学会一件事:AI 风险不只在模型回答里,也在模型背后的制度里。聊天框看似轻盈,背后却压着公司法、版权法、云合同和资本市场。私人机构设计,已经成为公共依赖的一部分。

参考文献

  1. OpenAI,New funding to scale the benefits of AI,2024.10.02。
  2. OpenAI,Introducing the Realtime API,2024.10.01。
  3. OpenAI,Our structure,访问日期2024.12。
  4. OpenAI,Introducing OpenAI LP,2019.03.11。
  5. OpenAI,OpenAI announces new members to board of directors,2024.03.08。
  6. Reuters,OpenAI plans to restructure core business into for-profit benefit corporation, sources say,2024.09.25。
  7. Reuters,OpenAI raises $6.6 billion in funds at $157 billion valuation,2024.10.02。
  8. OpenAI,Why OpenAI’s structure must evolve to advance our mission,2024.12.27。
  9. Musk v. Altman et al.,Complaint,U.S. District Court, Northern District of California,2024.08.05。
  10. Musk v. Altman et al.,First Amended Complaint,U.S. District Court, Northern District of California,2024.11.14。
  11. OpenAI,OpenAI and Elon Musk,2024.03.05。
  12. OpenAI,Elon Musk wanted an OpenAI for-profit,2024.12.13。
  13. The New York Times Company v. Microsoft Corporation et al.,Complaint,U.S. District Court, Southern District of New York,2023.12.27。
  14. OpenAI,OpenAI and journalism,2024.01.08。
  15. The New York Times Company v. Microsoft Corporation et al.,OpenAI Defendants’ Memorandum of Law in Support of Motion to Dismiss,2024.02.26。
  16. The New York Times Company v. Microsoft Corporation et al.,Microsoft Corporation’s Memorandum of Law in Support of Motion to Dismiss,2024.02.26。
  17. OpenAI,Hearst and OpenAI announce strategic content partnership,2024.10.08。
  18. LangChain,LangChain v0.2 is out,2024.05.15。
  19. OpenAI Status,ChatGPT, API, and Sora unavailable incident,2024.12.11。