第9章|Claude、Llama与PaLM:追赶者给王座装上轮子
一、忙碌的一年
2023年春夏之交,大模型竞赛没有降温,只是从一个会场转到另一个会场。
上一章写到,中国公司在北京、杭州、深圳密集开火,把ChatGPT之后的压力翻译成本土发布会、行业客户和监管边界。与此同时,全球牌桌也在移动。ChatGPT和GPT-4已经把“智能”做成了网页、API和企业采购清单上的新名词。接下来的问题不再只是“谁能追上OpenAI”,而是“谁能把大模型变成自己的形态”。
2023年5月10日,Google I/O大会上,Sundar Pichai在开场不久说:“AI is having a very busy year.”——AI正经历非常忙碌的一年。[1]
这句话像一句朴素的天气预报,也像对整个行业的提醒。对研究团队来说,“忙碌”意味着模型报告、评测表格、训练语料、GPU集群和安全论文同时增加;对产品部门来说,“忙碌”意味着每一个已有入口都要重新解释:搜索不只是搜索,邮件不只是邮件,文档不只是文档,手机系统也不只是系统。过去需要在实验室展示的模型能力,开始被塞进Gmail、Docs、Search、Android和企业云服务。
Google的处境尤其复杂。它不是缺少AI研究积累。Transformer、TPU、DeepMind、Google Brain和一系列机器学习基础设施,长期构成Google在AI时代的技术资产。但ChatGPT的爆发证明,技术资产不自动变成产品心智。OpenAI把聊天框推到公众面前,用户用键盘和手指完成了市场教育。Google则必须回答另一个难题:一家掌握搜索、广告、浏览器、邮箱、地图、移动操作系统、办公套件和云计算的公司,怎样把生成式AI塞回自己的帝国机器,而不把机器本身拆坏。
Pichai在I/O上的答案,是把AI放进几乎所有核心产品叙事。Google当天发布的官方材料集中介绍了PaLM 2、Bard、Search Generative Experience、Workspace中的生成式AI功能,以及Android等产品中的AI更新。[2] 这不是单点发布,而是一张分发地图。OpenAI证明大模型可以成为独立入口;Google则试图证明,大模型也可以成为既有入口里的发动机。
这种打法有强大的优势,也有沉重的包袱。Alphabet 2022年年报显示,Google Search & other在2022年的收入为1624.50亿美元,Google advertising整体收入为2244.73亿美元。[3] 这组数字不是财报背景音,而是Google每一次生成式搜索实验脚下的地板。若AI答案直接满足用户,网页点击、广告展示、内容生态和商业分成都会被重新分配。创业公司可以把“颠覆搜索”写进融资故事;Google不能轻易把自己的现金牛改造成实验动物。
于是,2023年的Google I/O带着一种特殊的紧张。它看起来是追赶者的发布会,但台上站着的仍是互联网时代最强的分发机器之一。它必须追赶ChatGPT带来的产品心智,又不能把自己叙述成简单的追随者;它必须展示激进,同时让广告客户、云客户、开发者、内容网站和监管者相信,这种激进仍在可控范围内。
这也是2023年大模型战争后半场的共同气质。OpenAI仍是中心参照物,但追赶者们不再排队模仿同一个聊天框。Google把模型嵌入搜索和办公;Anthropic把安全与长上下文变成商业语言;Meta把权重开放给开发者;Inflection把AI塑造成个人助理;Mistral用欧洲创业公司的体量打出开放和效率牌。每家公司都承认同一个参照系,同时试图把比赛搬到自己的地盘。
王座没有倒下,但它开始装上轮子。
二、Google把模型塞回帝国机器
PaLM 2是Google在2023年5月递出的核心技术名片。
Google在《PaLM 2 Technical Report》中称,PaLM 2在多语言、推理和代码能力上相比PaLM有所改进;报告还提到,PaLM 2的训练语料包含多种自然语言和编程语言,并在多语言评估中涉及一百多种语言。[4] 这里需要谨慎:这不是一个可以简单翻译成“全面超过GPT-4”的结论。它更像Google向市场展示的一组能力坐标:Google仍然有基础模型研发能力,而且这些能力可以被部署到庞大的产品体系中。
I/O期间,Bard也被推向更大范围。Google官方博客称,Bard向180多个国家和地区开放,并增加日语、韩语等支持,同时计划接入更多视觉和工具能力。[5] Bard的意义不只在用户范围。它原本在ChatGPT的阴影中登场,承担着“Google版聊天机器人”的外部期待;到I/O时,Google努力把它放回更大的平台叙事里:Bard不是全部,而是Google模型能力的一种可见形态。
真正牵动Google商业神经的,是Search Generative Experience。Google在官方博客中介绍,新的生成式搜索体验可以帮助用户理解主题、发现不同视角,并继续追问。[6] 在演示逻辑里,用户不必只面对一串蓝色链接,而可以先看到AI生成的概览,再沿着链接和后续问题深入探索。这像搜索的自然演进,也像搜索广告商业模式需要重新谈判的开端。
荒诞感就藏在这里。过去二十多年,搜索引擎训练用户在关键词、链接和网页之间移动;生成式AI突然告诉用户,可以先不要移动,先让模型把网页世界摘要成答案。对用户,这是便利;对网站,这是流量问题;对广告系统,这是展示位置和商业意图捕捉问题;对Google,这是左手创造未来、右手保护利润表的问题。
在个体层面,这种变化并不抽象。一个依赖搜索流量的小型内容网站经营者,看到生成式摘要时,关心的不是“模型是否代表下一代信息入口”这样的大词,而是读者还会不会点进网页。一个在企业里负责知识管理的产品经理,关心的也不是PaLM 2在所有评测中的位置,而是能不能把公司文档、权限系统和审计流程接到AI功能里。大模型发布会说的是未来,落到每个岗位上,变成了点击、权限、账单和KPI。
Google的优势仍不能被低估。它有全球级用户入口,有云,有浏览器,有Android,有Workspace,有YouTube,有多语言服务经验和基础设施。大模型竞赛如果只看一次聊天产品的声量,Google显得迟缓;如果看十年尺度的分发和计算,Google仍是少数能把模型能力铺进十亿级产品的公司。
I/O上的产品线展示,正是这种战略的体现。Gmail可以帮用户写邮件,Docs可以生成草稿,Slides可以生成图像,Sheets可以辅助分析,Meet可以处理会议内容,Search可以生成概览。AI在这里不一定要成为一个有名字的“机器人”,它可以像拼写检查、自动补全和推荐算法一样,隐入软件日常动作。
但这种隐入也带来一个问题:当AI成为所有产品的功能,用户到底为谁付费?为模型能力付费,还是为办公套件付费?为搜索体验付费,还是继续由广告买单?OpenAI当时的路线相对清楚:ChatGPT订阅、API调用和企业服务。Google的路线更像一场大型内科手术:新器官必须接入旧血管,不能让病人死在手术台上。
Google给王座装上的第一只轮子,是分发。它告诉行业:模型能力固然重要,但谁能把模型放进用户已经每天打开的产品,谁就有资格重新定义比赛。
三、Claude 2:安全从道德姿态变成采购语言
如果说Google的问题是怎样把AI接入庞大的既有商业机器,Anthropic的问题则是怎样把“安全”做成一种市场能够理解的产品能力。
2023年7月11日,Anthropic发布Claude 2。官方博客开头写道:“Claude 2 has improved performance, longer responses, and can be accessed via API as well as a new public-facing beta website, claude.ai.”——Claude 2性能提升、回复更长,并可通过API以及新的公开测试网站claude.ai访问。[7]
这是一句标准产品发布语言,背后却有清楚的商业判断:企业客户不只需要模型聪明,还需要模型可控、可接入、可采购。Claude 2没有把自己包装成最会出圈的聊天机器人,而是把长上下文、代码能力、考试表现和安全训练方法放在一起,形成面向开发者和企业的叙事。
长上下文是Claude 2最容易被市场记住的指标。Anthropic在发布博客中写道:“Users can input up to 100K tokens in each prompt…”——用户每次提示最多可以输入10万tokens。[7] 对普通用户来说,10万tokens像一个技术单位;对律师、咨询顾问、金融分析师、工程团队和企业知识管理部门来说,它意味着可以把过去需要拆分、复制、重组的大段材料一次性交给模型处理。
这不只是炫技。一个律师助理处理几十页合同,一个投资分析师整理年报,一个工程师让模型阅读更长代码片段,他们遇到的第一道门槛往往不是模型会不会说话,而是上下文窗口够不够长。窗口太短,用户就要手工切块;切块之后,模型容易丢失前后关系;丢失关系之后,AI又变回一个需要人不断照看的工具。长上下文没有消灭幻觉,也不保证推理正确,但它改变了许多白领工作的交互成本。
Anthropic还公布了若干评测结果。公司称,Claude 2在美国律师资格考试多选部分得分76.5%,高于Claude 1.3的73.0%;在Codex HumanEval代码测试中得分71.2%,高于Claude 1.3的56.0%。[7] 这些数字不能直接等同于真实工作能力,也不能证明模型在所有任务中可靠。它们的作用更具体:让客户、媒体和投资人看到,Claude并不只是在谈安全,它也在能力竞赛中继续前进。
Anthropic的特殊性来自它对安全路线的持续强调。2022年,Anthropic研究人员发表“Constitutional AI: Harmlessness from AI Feedback”,提出用一组原则引导模型进行自我批评、自我修订,并使用AI反馈训练模型减少有害输出。[8] 这种方法后来被概括为“Constitutional AI”。它的行业意义,不在于公开证明大模型安全问题已经被解决——没有公开材料能支持这样的绝对判断——而在于把安全从发布会上的免责声明,放进模型训练和产品定位之中。
Dario Amodei是这一路线的代表人物之一。公开资料显示,他曾在OpenAI担任研究领导职务,后来参与创立Anthropic。[9] 这段履历常被写成OpenAI阵营分化的故事。但若只把它写成个人离合,就会错过更重要的产业事实:2023年以后,大模型竞争不只发生在能力榜单上,也发生在安全叙事、企业信任和监管适配上。
企业采购AI时的问题通常不浪漫。负责信息安全的人会问,数据是否进入训练;法务会问,输出错误谁负责;业务部门会问,模型是否能稳定处理内部文档;财务会问,调用成本是否可控;管理者会问,员工能否在不泄密的前提下使用。消费级热潮里,这些问题显得扫兴;采购流程里,它们是合同能否签下去的门槛。
这带来一种行业反差:OpenAI用ChatGPT让公众大规模感到“模型像人在回答”;Anthropic则努力让企业相信,模型不只是会回答,还能在规则边界内回答。前者占领心智,后者争夺信任。信任在技术狂飙时看起来慢,在企业预算里却很硬。
Claude 2给王座装上的第二只轮子,是安全与上下文。它证明追赶OpenAI不一定要用更高声量的消费者产品,也可以用更长输入、更稳健输出和更明确的安全方法,进入企业采购表。
四、Llama 2:Meta把权重变成战术
2023年7月18日,Meta和Microsoft宣布推出Llama 2。
这不是Meta第一次把大模型权重推向外部。上一章之前已经写过,LLaMA一代的非官方传播让开发者社区见识到“可下载模型”的扩散速度。Llama 2的不同在于:它不是泄露事故,而是官方发布;它不是单纯研究访问,而是带有商业使用许可的开放权重路线。Meta官方博客以“Meta and Microsoft Introduce the Next Generation of Llama”为题发布消息,并称Llama 2可免费用于研究和商业用途。[10]
Mark Zuckerberg在发布中说:“Open source drives innovation because it enables many more developers to build with new technology.”——开源推动创新,因为它让更多开发者能够基于新技术进行构建。[10] 这是Meta给出的战略解释。OpenAI把最强能力放在云端,通过API和产品收取价值;Meta则把权重交给开发者,让更多公司和个人在本地、私有云、边缘设备和特定场景中微调、量化、部署。
这里需要收窄说法。Llama 2并不是没有条件的公共财产。它使用Meta自己的许可协议,并附带可接受使用政策;对于月活用户超过一定规模的产品,许可中还有额外要求。因此,与其不加限定地称它为传统意义上的开源软件,不如说它是“开放权重加商业许可”的路线。这个差别在法务上重要,在产业上也重要:Meta既想得到开放生态的扩散速度,也保留对战略风险和超大规模竞争者的控制。
Llama 2技术论文列出了三个模型规模:7B、13B、70B;训练语料约2万亿tokens;同时发布了预训练模型和对话微调版本。[11] 这些数字在2023年的开发者社区有直接吸引力。7B和13B意味着更多人可以在相对有限的硬件上实验;70B意味着Meta保留较高能力上限;开放权重意味着研究者和创业团队可以围绕它做指令微调、检索增强、领域适配、量化压缩和部署优化。
对一个独立开发者来说,这种变化非常具体。闭源API像一条通向能力的高速公路,路况好,但收费、规则和出口都由平台决定;开放权重则像把发动机交到车库里,修理、改装、失败和责任都落到自己手上。前者让人快,后者让人有控制感。2023年的许多小团队并没有能力训练基础模型,却可以基于Llama 2做垂直微调、内部部署或成本优化。这就是开放权重的现实吸引力。
Meta的商业逻辑与Google和Anthropic都不同。Google有搜索和办公入口,要把AI吸进已有产品;Anthropic强调安全和企业可信;Meta在ChatGPT式消费者聊天心智上没有占到先手,但它拥有社交网络、广告系统、VR/AR野心和庞大工程资源。开放Llama 2,让Meta绕开“谁的聊天框最火”这个战场,直接争夺开发者生态底座。
Microsoft在这件事中的角色也带着云计算时代的荒诞感。2023年1月,Microsoft宣布与OpenAI延长合作,官方表述为多年、数十亿美元级别投资。[12] 半年后,它又与Meta合作,把Llama 2带到Azure和Windows生态。[13] 这不是简单的左右互搏,而是云厂商的现实:既可以投资闭源模型公司,也可以托管开放权重模型;既希望OpenAI成功,也希望企业客户在Azure上跑尽可能多的模型。对云来说,王座是谁的很重要,但算力账单同样重要。
Llama 2发布后,开发者社区围绕它产生大量衍生模型、量化版本和应用实验。这种扩散很难用一次发布会的掌声衡量。闭源模型的强大常常体现在排行榜和产品体验上;开放权重的强大则体现在无法完全统计的二次创新里。有人把它接入公司知识库,有人把它裁剪到消费级显卡,有人用它训练垂直领域助手,有人把它作为评测其他模型的基线。
Llama 2给王座装上的第三只轮子,是生态。它把竞争从“谁拥有最强模型”拉向“谁能成为最多应用的起点”。在这一层面,开放不是慈善,而是一种商业战略。
五、Pi:不争最强,争取贴近
同一年,另一条路线显得更柔软,也更难用传统评测衡量。
2023年5月,Inflection AI推出Pi。官方博客标题是“Meet Pi, your personal AI”。其中一句定义非常直接:“Pi stands for personal intelligence.”——Pi代表personal intelligence,个人智能。[14]
这个名字本身就在反对一种竞赛语言。它不强调“通用人工智能”的宏大,也不急着宣布超越哪个基准,而是把AI放进个人对话、陪伴、建议和日常交流里。Inflection官方介绍称,Pi被设计为一种友好、支持性的个人AI,可以进行自然流动的对话,提供友好建议和简明信息。[14] 这不是命令行文化,也不是企业API文化,而是消费互联网更熟悉的亲密界面。
Pi的路线回答了另一个问题:如果大模型最终进入每个人生活,它一定要以“工作效率工具”的姿态出现吗?ChatGPT的早期使用场景包括写代码、写邮件、总结材料、生成方案;Pi更强调对话体验本身。它试图让AI不像一个等待任务的实习生,而像一个随时可以交谈的对象。
但这里必须保持怀疑。陪伴式AI并不自动意味着更有价值,也不自动意味着更安全。温和语气可能提高用户好感,也可能掩盖错误信息;长期对话可能增强粘性,也可能带来情感依赖和隐私问题。公开材料能够确认的是,Inflection把产品定位放在“personal AI”上,并围绕对话体验建立品牌;不能据此推断用户一定会形成怎样的心理关系。
资本市场对这条路线给出了强烈回应。2023年6月29日,Inflection AI宣布完成13亿美元融资,投资方包括Microsoft、NVIDIA以及多位知名个人投资者。[15] 这一融资把Pi从一个产品实验推到大模型牌桌中央。它表明,2023年的投资人不只押注最强基础模型,也押注AI入口形态:如果未来每个人都有一个长期个人助手,那么控制这个助手的公司可能拥有新的用户关系。
Inflection的阵容也强化了这种想象。公司联合创始人包括DeepMind联合创始人Mustafa Suleyman、LinkedIn联合创始人Reid Hoffman等公开知名人物。[15] 这让Pi从一开始就不是小团队玩具,而是一张带有硅谷网络、资本和算力资源的牌。
与Google相比,Inflection没有全球搜索入口;与Meta相比,它没有开放权重生态;与Anthropic相比,它没有把安全方法作为最突出的商业标签。它押注的是另一种稀缺资产:用户愿意持续交谈的关系。大模型行业容易沉迷于参数和评测,但消费产品的历史反复证明,用户不一定总选择能力最强的工具,也会选择最顺手、最熟悉、最有情绪回报的界面。
Pi的困难也在这里。个人助理如果只会聊天,很快会被更强模型复制;如果要真正成为助手,就需要接入日历、邮箱、通讯录、支付、位置、工作流和第三方服务。那又把它带回前文已经出现的问题:工具调用、权限、安全和平台控制。一个温柔的聊天界面背后,迟早会出现冷冰冰的授权弹窗。
Pi给王座装上的第四只轮子,是产品形态。它提醒行业:大模型不一定只以“最强答案机器”的形式竞争,也可能以“最常被打开的个人界面”竞争。
六、Mistral 7B:巴黎递出的名片
2023年9月27日,Mistral AI发布Mistral 7B。
在此之前,这家法国创业公司已经引起欧洲科技圈注意。公开报道显示,Mistral AI由Arthur Mensch、Timothée Lacroix和Guillaume Lample等人创立,并在2023年完成大额种子融资。[16] 在一个由硅谷巨头、美国云厂商和GPU供应链主导的市场里,Mistral的出现带有清楚的地缘意味:欧洲不想只做监管者,也想在基础模型牌桌上拥有玩家。
Mistral 7B的发布方式简洁,甚至有点反发布会。官方博客没有铺陈宏大愿景,而是直接给出模型、性能和许可。Mistral写道:“Mistral 7B outperforms Llama 2 13B on all benchmarks we tested.”——Mistral 7B在其测试的所有基准上超过Llama 2 13B。[17] 这句话锋利,也必须按原文限定:是Mistral测试的基准,不是所有可能任务,更不是证明它全面超过更大的闭源模型。
Mistral 7B的参数规模约7.3B,并以Apache 2.0许可发布。[17][18] Apache 2.0的意义很实际:企业和开发者可以更放心地使用、修改和商用模型权重。与一些带有额外平台限制的开放许可相比,Apache 2.0更接近传统开源软件生态熟悉的法律框架。对创业公司来说,这是一种降低采用阻力的打法。
Mistral押注“小而强”。在2023年的行业叙事里,许多注意力被千亿参数、万卡集群和巨额融资吸走;Mistral提醒市场,模型能力并不只由体量决定。训练数据质量、架构选择、推理效率、上下文处理、部署成本和开发者体验,都能改变模型的实际竞争力。一个7B级模型如果足够好,可能比一个昂贵、封闭、调用成本高的大模型更适合大量垂直场景。
这条路线对欧洲尤其重要。欧洲公司在超大规模云基础设施和消费互联网入口上不占优势,如果完全复制OpenAI或Google路线,成本和分发都会吃亏。Mistral选择开放权重和高效率模型,相当于从另一个缝隙切入:先让开发者拿到可用、可改、可部署的模型,再逐步建立商业服务和企业客户。
对一个欧洲创业团队来说,这种许可和体量并不只是意识形态。它关系到能否在本地云上部署,能否向客户解释数据不必离开特定环境,能否在没有巨额API预算的情况下做原型。大模型战争在新闻标题里像巨头战争,在工程师的命令行里,常常体现为一个更朴素的问题:这模型能不能跑,成本能不能承受,法务能不能点头。
行业荒诞感再次出现:大模型竞赛看似越来越昂贵,却不断有小模型用“够好”和“便宜”打断巨头叙事。每当市场准备相信只有最大模型才能生存,就会出现一批7B、13B模型提醒大家,许多真实业务并不需要最强通用智能,只需要在特定约束下稳定、便宜、可控地完成任务。
当然,Mistral 7B也不能被神化。开放权重不等于没有成本,小模型不等于没有幻觉,基准领先不等于生产环境稳定。它的意义不在于终结大模型军备竞赛,而在于证明基础模型牌桌仍有新座位。欧洲创业公司不必等待巨头恩赐API,也可以带着自己的权重、许可和工程判断上桌。
Mistral给王座装上的第五只轮子,是效率。它让行业看到,追赶者不一定要造更大的王座,也可以把王座下面的轮子做得更轻、更便宜、更容易复制。
七、王座下面的轮子
到2023年秋天,OpenAI仍然是大模型竞赛的中心参照物。GPT-4和ChatGPT占据公众心智,开发者熟悉OpenAI API,企业客户开始围绕其能力设计流程。可是中心参照物不等于固定王座。Google、Anthropic、Meta、Inflection和Mistral从不同方向推来,王座开始移动。
Google推的是分发轮。它把PaLM 2、Bard、SGE和Workspace AI放进搜索、办公、移动系统与云服务。它的优势是入口,风险也是入口:生成式AI越强,越可能改写搜索广告和网页生态。
Anthropic推的是信任轮。Claude 2用10万tokens上下文、考试与代码评测、安全训练方法,向企业客户证明:模型不只要聪明,还要能被采购、被约束、被解释。安全在这里不只是伦理宣言,而是销售语言。
Meta推的是生态轮。Llama 2用开放权重和商业许可吸引开发者,让竞争从聊天产品转向模型底座。Meta不必让每个用户打开一个Meta聊天框,只要足够多开发者从Llama开始构建,它就能影响大模型应用的下游世界。
Inflection推的是关系轮。Pi把AI定义为personal intelligence,试图证明未来入口可能不是搜索框、代码编辑器或企业后台,而是一个用户愿意长期交谈的个人助手。它的挑战是从“会聊天”走向“能办事”,同时处理隐私、安全和权限边界。
Mistral推的是效率轮。Mistral 7B用7.3B级模型、Apache 2.0许可和强基准表现,告诉市场基础模型并非只有超大闭源路线。小而强、可商用、可部署,也是一种战略。
这些路线彼此竞争,也彼此补充。Google需要安全,Anthropic需要分发,Meta需要高质量模型,Inflection需要工具生态,Mistral需要商业化渠道。没有一家公司握有所有答案。2023年的大模型战争因此从单点爆发进入多阵营长期战:闭源API、开放权重、企业软件、搜索入口、个人助理、云平台、边缘部署,每一条路线都可能成为未来的主干,也可能只是过渡形态。
这场竞赛的关键问题也开始变化。早期问题是:谁能训练出更强模型?到2023年夏秋,问题变成:谁能以可承受成本持续训练和推理?谁能拿到高质量数据?谁能建立安全信任?谁能穿过监管边界?谁能控制分发入口?谁能让开发者和企业把自己的业务流程绑上来?
OpenAI没有被追赶者推下王座,但王座不再固定。Google把它推向搜索和办公,Anthropic把它推向安全采购,Meta把它推向开发者硬盘,Inflection把它推向个人对话,Mistral把它推向更轻的开放模型。每一只轮子都让行业少一点确定性,也多一点可能性。
这正是2023年大模型世界的开阔与紧张:领先者仍然领先,追赶者却不再只追同一条路。等模型能力逐渐趋近,真正决定胜负的可能不再是一次惊艳回答,而是分发、成本、监管、安全信任和生态控制权。王座还在,但它已经开始滑动;下一场战争,将在更大的制度、市场和社会边界中展开。
参考文献
- Google,Google I/O 2023 Keynote,2023-05-10。
- Google Blog,Making AI more helpful for everyone,2023-05-10。
- Alphabet Inc.,Form 10-K for the fiscal year ended December 31, 2022,2023-02-03。
- Google,PaLM 2 Technical Report,2023-05。
- Google Blog,Bard updates from Google I/O 2023,2023-05-10。
- Google Blog,Supercharging Search with generative AI,2023-05-10。
- Anthropic Blog,Introducing Claude 2,2023-07-11。
- Anthropic / Bai et al.,Constitutional AI: Harmlessness from AI Feedback,2022-12。
- Anthropic,Company / Team public materials,2023。
- Meta,Meta and Microsoft Introduce the Next Generation of Llama,2023-07-18。
- Meta AI,Llama 2: Open Foundation and Fine-Tuned Chat Models,2023-07。
- Microsoft,Microsoft and OpenAI extend partnership,2023-01-23。
- Microsoft,Microsoft and Meta expand their AI partnership with Llama 2 on Azure and Windows,2023-07-18。
- Inflection AI Blog,Meet Pi, your personal AI,2023-05。
- Inflection AI,Inflection AI announces $1.3 billion of funding,2023-06-29。
- Financial Times,French AI start-up Mistral raises €105mn seed funding,2023-06-13。
- Mistral AI Blog,Mistral 7B,2023-09-27。
- Mistral AI / Hugging Face,mistralai/Mistral-7B-v0.1 model card,2023。