刚刚,Together AI宣布完成8亿美元(约合人民币54亿元)融资,估值达到83亿美元(约合人民币564亿元)。
它做的事很简单:让企业更便宜地使用大模型,尤其是开源大模型。
本轮融资由沙特阿美旗下Aramco Ventures领投,Vista Equity Partners、General Catalyst、Emergence Capital、英伟达、Salesforce Ventures等参投。
这家公司上一轮融资估值还是33亿美元,如今已经翻了一倍多。
更关键是,Together AI年化收入已经达到11.5亿美元(约合人民币78亿元)。
01 在开源模型中找到商业机会
Together AI成立于2022年——与ChatGPT生在同一年。
Together AI的创始团队有很强的技术背景,而且亚裔占比不少。
创始人兼CEO普拉卡什(Vipul Ved Prakash)出生于印度新德里,曾就读于德里圣史蒂芬学院,学习数学、物理和计算机科学,后退学投身软件开发。曾联合创办网络安全公司Cloudmark和社交媒体搜索公司Topsy。Topsy被苹果收购后,他曾在苹果负责Siri搜索和AI相关工作。
CTO张策2008年本科毕业于北大数学系,在威斯康星大学麦迪逊分校获得博士学位。曾在苏黎世联邦理工学院、芝加哥大学教授计算机。他的研究主线是让机器学习更便宜、更可信、更容易被更多人使用。
团队还有几位牛人。
克里斯·雷(Chris Re)是斯坦福大学计算机科学教授,也是连续创业者,曾参与创办SambaNova、Snorkel,以及后来被苹果收购的Lattice和Inductiv,在机器学习系统和AI基础设施领域具有重要影响力。
特里·陶(Tri Dao,越南裔)是Together AI首席科学家,也是普林斯顿大学计算机科学系的助理教授,曾在克里斯·雷手下读博。他是FlashAttention的主要作者之一,这项研究让Transformer在GPU上跑得更快、更省显存。
珀西·梁(Percy Liang,华裔)是斯坦福基础模型研究中心主任,长期关注语言模型、开放模型和模型评测。
Together AI主要团队成员,(从左至右)上排分别是普拉卡什、张策、克里斯·雷、特里·陶;下排分别是珀西·梁、泽德莱夫斯基(首席产品官)、凯·马克(首席营收官)、史美成(音,财务副总裁)
ChatGPT爆火后,市场几乎只盯着闭源大模型,但Together AI押了另一边。
Together AI起初因为提供英伟达GPU访问而受到关注,随后开始扩展为一个帮助开发者构建、定制开源AI模型的平台。
Together AI客户留下来,不只是为了卡。他们需要的是一整套服务:模型选择、训练、微调、推理、部署、评估、GPU集群、专属端点、成本优化。
这就是Together AI的商业价值。
它不是卖一个“更聪明的AI”。它是在卖“更便宜、更稳定、更可控地使用AI”的能力。
02 调用Token,年入11.5亿美元
Together AI最值得注意的数字,不是8亿美元融资,而是11.5亿美元年度化订单额,客户包括Cursor、Cognition、Decagon等AI原生公司。
Together AI的收入增长极快。2024年2月,它的年化收入大约只有3000万美元;到2025年2月,这个数字已经超过1亿美元。今年,已经达到11.5亿美元。两年暴增了约38.3倍。
Together AI的赚钱方式是在大模型推理过程中,把分散的开源模型,变成企业愿意付费购买的生产系统。
包括以下几种——
第一,是推理API。
企业调用模型,就按tokens付费。100万tokens收费,不同模型价格不同。例如DeepSeek V4 Pro、MiniMax M3、Kimi K2.7 Code等模型都有输入、缓存输入、输出价格。
第二,是专属推理服务。
一些客户用量大,或者对延迟、稳定性、安全性有更高要求,就不能只用公共API。他们需要专属端点。Together AI价格页也明确写到,很多团队会从API调用开始,规模变大后迁移到专属端点。
第三,是微调。
企业不只想用通用模型。它们希望模型懂自己的业务、客户、文档、产品和流程。Together AI提供Fine-Tuning服务,按照训练和验证过程中处理的token量收费。价格页显示,不同模型规模、不同训练方式价格不同。
第四,是GPU集群。
有些客户仍然需要自己训练、微调或部署模型。Together AI也提供按小时计费的GPU能力。价格页显示,其GPU Clusters支持H100、H200、B200等硬件,按每GPU每小时收费。
这几项加在一起,就是Together AI的商业模式:赚的是企业用模型过程中的钱。
Together AI现在每月处理超过400万亿个开放模型推理token。一年前,这个数字只有约300亿。它的调用量在一年内增长了约1.3万倍。
这门生意之所以突然变大,是因为企业开始认真使用AI了。
客服机器人每天要回复客户。AI编程工具每天要生成和修改代码。销售系统要自动写邮件。金融系统要读文件。医疗系统要总结病历。AI Agent还会反复调用模型:先理解任务,再查资料,再调用工具,再生成结果,再检查错误。
每一步都要花钱。
前段时间,一则消息在硅谷刷屏:某家企业,一个月在Claude上的支出,高达5亿美元——折合人民币约33亿元,相当于每天烧掉超1亿元。
开源模型的机会来了。
企业不是每个任务都需要最贵、最强的闭源大模型。很多时候,它们只需要一个足够好、足够快、足够便宜的模型。
在OpenRouter上,开源模型处理的tokens占比从1月的34%升至6月的65%。背后是中国开源模型正在缩小与美国顶级模型的能力差距,同时给开发者更多定制和微调自由。部分模型价格低至每百万tokens 18美分,而顶级模型平均约为4美元。
因此,Together AI的平台让企业可以在DeepSeek、MiniMax、Kimi等开放模型上训练和运行AI工作负载,成本低于封闭系统。
Together AI讲了一个很令人吃惊的数字:企业使用开放模型通常可以实现6倍到20倍成本下降,Decagon迁移到Together AI后,推理成本下降了6倍。
推理不是一次性生意,客户一旦觉得能省钱,把业务流程接进去,就会持续产生账单。
03 最赚钱的AI赛道,英伟达巨头进场投资
Together AI不是唯一被资本追逐的推理基础设施公司。
上周,铅笔道报道Baseten完成15亿美元融资,估值达到130亿美元。而且,Baseten也专门提到,过去一年收入增长20倍,原因是企业对“推理”的需求增加。
而今年5月,Fireworks AI又被曝正在洽谈新一轮融资,目标估值可能达到150亿美元。
资本追逐它们,因为资本发现:大模型应用开始商业化后,真正持续产生账单的地方,是推理层。
这对中国公司很有启发。
金融、制造、政务、教育、医疗、客服、电商、办公软件,都有大量AI推理需求。这些场景不一定需要最强模型,但需要可控、便宜、安全、能接入业务流程的模型服务。
这意味着机会会出现在推理云、模型路由、国产芯片适配、行业模型部署、AI成本管理、Agent调度、私有化交付和运维服务等领域。
最后,再来看看投资方。Together AI和Baseten的投资方名单里,都出现了英伟达。
英伟达投这类公司并不奇怪。推理平台越多,GPU需求越大。Together AI早在2025年完成3.05亿美元融资时,就宣布要大规模部署英伟达Blackwell GPU。Together AI还预计,未来五年计算能力和基础设施规模将扩大约50倍。
除了卖GPU的英伟达,Together AI和Baseten这类公司也在变成芯片、能源、电力设备、制造和企业软件巨头共同押注的基础设施入口。
Salesforce也有理由进场。企业软件巨头最关心的是,AI能不能低成本、稳定地进入销售、客服、营销、办公和管理流程。投资Together AI,相当于提前卡位企业AI工作流背后的“算力水电煤”。
Aramco代表能源资本。AI推理看起来是软件生意,但背后要消耗大量电力、数据中心和算力资源。Schneider Electric是电气和数据中心基础设施相关公司,Pegatron则是电子制造和服务器供应链重要玩家。
Together AI和Baseten的融资,不只是两家创业公司的融资。它更像是一个产业信号:AI基础设施的竞争正在转向比谁能更便宜、更稳定地承接海量调用。
本文来自转载铅笔道 ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

微信扫一扫

