混合AI模型:Anthropic的新模型能够将传统大语言模型和推理能力结合,根据任务的复杂程度在快速响应和深度推理之间切换。开发者可以通过滑动条控制计算资源,调整推理时长。
商业编码任务表现优异:新模型在处理商业编码任务时表现出色,甚至超越了OpenAI的o3-mini-high,但在解决学术性问题(如竞赛编程问题)上不及o3-mini。
灵活设置:与OpenAI的固定设置不同,Anthropic模型提供了基于Token的精确控制,开发者可以根据需要调整为类似GPT-4o的非推理模式。
2月14日消息,在OpenAI于2024年秋季发布推理模型后,谷歌、阿里巴巴、高瓴资本等公司纷纷跟进,推出了自己的竞品。然而,作为重要竞争对手的Anthropic却一直未加入这场竞赛。
如今,谜底揭晓:Anthropic选择了一条略有不同的推理路径。
01 传统大语言模型与推理相结合
据外媒报道,Anthropic开发了一款混合型AI模型,将传统大语言模型(LLM)的能力与推理功能相结合。
这意味着,该模型在面对复杂问题时,会调用更多的计算资源进行推理;而在处理简单任务时,则能像传统LLM一样快速给出响应,无需消耗额外的计算资源。
据悉,Anthropic计划在未来几周内发布这款模型。
Anthropic新模型的特点是,客户可以控制每次查询所消耗的计算资源,即模型推理的时长。开发者通过滑动条调整设置,具体通过模型处理或生成的Token数量来衡量。如果将滑动条设置为“0”,开发者就可以把该模型当作普通的非推理AI使用,类似于OpenAI的GPT-4o。
相比之下,虽然OpenAI也提供了类似功能,允许开发者控制模型的推理时间,但其仅提供“低”、“中”、“高”三档设置。据称,开发者难以准确预测每种设置下模型实际处理的Token数量,这使得他们很难估算单次查询的成本。
02 OpenAI或借鉴了Anthropic思路
如今,OpenAI可能成为Anthropic的追随者。OpenAI首席执行官山姆·奥特曼在社交媒体上宣布,计划将Orion LLM作为GPT-4.5发布,这将是一款传统的、不具推理能力的模型。
随后,OpenAI将把GPT系列模型与“o”系列推理模型整合为一个统一的AI模型,这一策略显然借鉴了Anthropic的设计思路。
Anthropic与OpenAI在模型和产品设计上的差异,揭示了它们在AI市场中的不同定位。
OpenAI显然希望将ChatGPT打造成消费者或个体专业人士的首选应用,为此其推理模型采用了更简单易懂的设置方式。
而Anthropic则更加专注于企业市场,因此更加注重通过滑动条等功能,赋予开发者更精细的成本、速度和定价控制。
03 Anthropic新模型编程能力超过OpenAI o3-mini
据试用者透露,Anthropic即将发布的新模型在编程方面的表现尤为突出,这是生成式AI在企业应用中最具潜力的领域之一。当Anthropic的模型被允许以最大时间 “思考” 时,在某些编程基准测试中,其表现优于OpenAI当前最先进的推理模型,即设置为 “高” 推理能力的o3-mini模型。
尽管OpenAI的推理模型在解决学术性问题(如竞赛编程问题)上更具优势,但Anthropic的模型在处理企业工程师日常面对的编程任务时表现更为出色。
举例来说,Anthropic的模型可以更好地理解复杂的代码库,一次性就能生成可正常运行的完整代码。
04 AI模型市场出现两大竞争趋势
Anthropic显然希望这款新模型能帮助其快速实现营收目标,包括超越OpenAI,成为应用开发者的首选供应商。
然而,Anthropic尚未披露新模型的定价,它是否会比OpenAI最近发布的o3-mini推理模型更便宜也不得而知——由于o3-mini的定价低于OpenAI最受欢迎的GPT-4o,因此很受开发者青睐。
从目前的AI市场情况来看,似乎有两个竞争策略在同时进行:在AI技术发展的前沿,那些在推理或编程方面不断取得进展的模型将继续保持定价优势;而另一部分 “满足基本需求的” 模型则可能会在价格上互相削价竞争。
本文来自微信公众号“腾讯科技”,作者:金鹿
该文观点仅代表作者本人