风评转向很快,量化从股市敌对势力到掀起科技国运,仅用了一年时间。
DeepSeek R1的开源,几乎拉齐了中美大模型的代差,也重塑了量化行业的公众形象。对于过去两年深陷某种道德困境的量化私募行业而言,AI 实验室成为了当下一个不可忽视的风口。在巨大的社会价值面前,扩招的消息一个接着一个。
宽德Will Lab招募AI工程师,鸣石创世纪AI Lab招募AI科学家,蒙玺AI Lab招募机器学习实习生,黑翼、磐松、正定、启林、世纪前沿近期也加入AI抢人之争。
而头部量化之间,这场AI军备竞赛其实早已暗流涌动。
众所不周知的是,明汯已囤了数千张GPU卡,数万张CPU核,在金融数据的应用场景下AI算力可以达到400P Flops;九坤更是与微软亚洲研究院复现了DeepSeek R1模型,在此之前低调建立了Data Lab、AI Lab、水滴等多个AI实验室。
看起来DeepSeek已不仅是资本市场信心重启的重要催化剂,更变成了一些量化私募的OKR,激励他们以更重要的角色参与到时代进程里。
只是在与多位量化管理人交流后,笔者感受到一种温差:如火如荼的投产之下,各大建立AI实验室的量化在大语言模型能力上距离DeepSeek还很远。反过来,DeepSeek目前对量化投研的帮助也十分有限。
整个量化行业,集体投入到建设AI实验室的热情中,真实意图并不只是技术理想主义的追求。
量化难有下一个DeepSeek
开年以来,机构尽调量化私募时会多问一句,「你们家有多少张卡?」
虽说算力储备难与投资能力扯上多少关系,但在很多尽调机构眼里,卡的数量一定程度反映了量化私募的做成大模型的概率,对于一些销售机构而言,这也是衡量量化私募未来的某种标尺。
但一个显而易见的现实是,大多数量化私募目前并没有足以支撑做大模型的算力。
大模型的算力门槛相当之高。幻方是全国为数不多万卡集群的公司,2021年,幻方对「萤火2号」AI集群投入10亿,搭载了1万张A100显卡。2024年,DeepSeek V3官方报告训练大模型使用了2048块H800 GPU集群。中存算董事长陈巍测算,幻方实际的卡数2.78万张(A100+H20)+2048张H800,大概在3万张左右的规模。
多数量化私募并不具备如此阔绰的家底。
一名上海百亿量化管理人向远川透露:「当前购入大量先进显卡难度非常大,且成本高昂,建设大模型算力投入至少数十亿,这就要求量化每年至少有10亿利润。即便如此,人才成本、时间成本、团队磨合成本都不可忽略,未来几年基本不可能再出一个DeepSeek,弯道超车难度巨大。」
另一名百亿量化老板告诉远川,目前在算力和利润上符合做大模型条件的另外两家量化,只有九坤和明汯,「九坤规模体量足够大,而且比较学院派,跟清华北大联系密切,有足够的人才供给。」但据远川了解,九坤与幻方的方向并不相同,相较基础模型,他们更关注垂域模型并推动AI在应用领域的落地。
「而明汯,我觉得搞大模型不像老裘的风格,老裘还是希望在金融领域与国际顶级对冲基金竞争。」
简言之,量化做大模型最大的两个门槛是算力密度和人才密度,这两者与钞能力休戚相关。比如幻方没有融资的顾虑,拥有大部分量化以及大部分AI 创业公司都难以企及的「造血能力」。
这种「造血能力」创造了松弛的研发环境,DeepSeek 160人研发团队基本是没有海归背景和大厂背景的年轻人,BOSS直聘上DeepSeek招募的深度学习研究员年收入高达176万,超越了降薪背景下很多公募投研。在优渥待遇的前提下,研发人员还能从容地获得源源不断的输血支撑算法行业的巨量失败。
超额衰减的当下,多数量化自身规模尚不算殷实,面临着未来更激烈的内卷,更没有在芯片出口管制之前低价囤上数万张卡,错过了财富积累的黄金时间。
就算具备一切现实要素,创始人没有利润之上的价值取向也很难维系持续的重金投入,就像朱啸虎溢于言表的赞美,「梁文锋的想法确实不一样,他连几个亿的用户都不要,任何考虑赚钱的角度都太世俗了。」
蒙玺投资告诉远川,量化做大模型的窗口期已经过去了。「做这个的价值在哪里?DeepSeek是开源的,在他们的基础上改一改代码然后让大家眼前一亮,怎么可能?」
DeepSeek对投资帮助有限
DeepSeek横空出世以来,金融行业弥漫了一层焦虑,量化私募运用DeepSeek先进生产力,好比给本就强悍的策略增添了核动力。量化集体建设实验室加码AI,也意味着仅剩不多的超额未来或许会被加速榨干。
倍漾量化CEO冯霁判断:「三年内不使用AI的量化基金势必遭淘汰。」在他看来,DeepSeek是向那些仍然不相信AI力量的人,作最后一次的呼吁。
除了互联网行业,资管行业数十家机构已争先恐后地「接入」DeepSeek。中金测试其量化选股能力,发现2024年以来671b标准版DeepSeek-R1在行业轮动上有稳定超额[3]。大模型极大提高量化中后台制作路演材料的速率,VS Code+Github Copilot比炸鸡配啤酒还香。
虽然行业一片欢呼雀跃,但客观看DeepSeek在投研上的主要应用于两个维度,与其他大模型没有实质区别:
一是输入端拓宽另类数据获取方式。DeepSeek能分析新闻研报文本、语音、视频多个另类数据源,有很强的信息处理能力,不仅能从新闻中获取情绪因子,对专家访谈的回答质量也能定性判断。
鸣熙资本基金经理陈昊炜,曾就职于美国对冲基金Point 72。他想起一个有意思的细节,当上市公司高管回答投资者问题时,Point 72创始人Steve Cohen 喜欢聘请FBI的专家来对他们的微表情进行判断,观察他们表达是否自信,话语是否存在猫腻。诸如此类的细节,为美剧《亿万》打造主角提供了非常多的原型参考。
「具备多模态的能力的大语言模型能通过微表情变化进行情绪判断,把非结构化数据转变为结构化数据。」陈昊炜说。
二是输出端提高编程的效率。平方和投资对远川表示,最直观的变化是DeepSeek降低了投研人员在接触新的编程语言时的门槛,「VS Code等编辑器也集成诸多AI插件,实现从代码静态分析到动态优化建议的全链路赋能,便于编程人员的代码分析、优化和管理。」
DeepSeek是能够对代码层面的重构、金融语料的训练、另类数据的处理等投研流程提效增速,但百亿量化龙旗科技告诉远川,「至少目前而言,大模型处理的精细度还远远达不到我们的实际要求。」龙旗认为通过基本面研究,结合机器学习特别是深度学习来处理数据构建模型,对他们来讲比运用大模型更具实践意义。
蒙玺投资很早在本地部署DeepSeek,最大的用处是辅助编程,「通俗来说就是找BUG。」如果研究员Prompt写的足够好,还可给DeepSeek喂研报,让它自动去做因子。「不过在精细化层面,比如模型预测这块我们是不太可能让DeepSeek参与太多。」
对于绝大多数量化私募来说,DeepSeek等大模型对量化投资的实盘帮助有限。
从过程来看,大模型在处理文本及其逻辑上优势明显,量化投研则是数据处理上有更大需求,舆情类因子占比不大;从结果来看,DeepSeek有幻觉和生产内容随机性的局限,模型输出结果未必符合现在量化投研的严谨要求。
即使不聚焦DeepSeek,AI整体对量化也无法起到决定性作用。目前量化管理人的AI能力和基金的未来业绩并没有直接的正相关系,否则幻方就是业绩最好的量化的基金。
AI作为一种科技工具,现已被广泛应用于高频量价的因子挖掘。虽然AI在机器学习、深度学习、大数据处理等方面能提供超越人类思维的算法逻辑,为策略研发提供更多可能,但在当前市场AI更多是一种辅助工具,能发挥多少还得看管理人的水平。
特别是一些低频量化、具有独特数据处理逻辑与算法的私募对AI的依赖性并没有那么强,这样的团队市场上仍是主流,其中不乏业绩持续稳定的管理人。
既然时下大模型对量化投资帮助有限,量化私募距离做大模型还很远。那量化集体布局AI实验室的目的是什么?仅仅是看好量化未来的火拼,取决于各家AI实力?
DeepSeek对量化意味着什么?
在非量化金融人士眼里,国内量化做出DeepSeek似乎有其必然性。
因为DeepSeek降低训练成本,原本就属于量化的方法论,包括怎么针对卡的集群做更精准的调校,如何用浮点的精度调整文字模型。再加上量化对卡的使用较早,运用娴熟,对集群的理解比别人更强,所以很多人认为量化做出DeepSeek是一件自然的事情。
但在很多量化老板眼里,DeepSeek是一个无法复制的行业个例。
一个直观的对比:美国拥有D.E.Shaw、Two Sigma等远比幻方体量、实力强得多的量化基金,同样在AI领域积淀深厚,更是没有芯片制约,但做出世界级大模型的也不是他们。
在量化从业者们看来,DeepSeek诞生在量化行业本就是一个奇迹,不仅重振了人们对中国科技与中国资产的信心,也间接地改善了量化的展业环境。
舆论压力缓解的同时,量化的技术力量也引起了金融行业更广泛的重视。近日,深圳私募基金业协会召开私募量化机构调研座谈会,与16家头部量化共同探讨「AI+资产管理」,并对设立「量化创新实验室」推动产学研合作提供政策支持。
蒙玺投资办公地在上海,AI实验室却落地合肥。创始人李骧安徽人,毕业于中科大,当前是中科大金融硕士研究生指导老师。据远川了解,蒙玺的目的不是追赶DeepSeek,而是另辟蹊径吸引中科大的优秀学生,也有一部分回馈母校的情怀。
「我们做AI Lab是为了给中科大学生提供一些AI 相关的就业机会、实习机会。AI Lab如果能做出一些用到实盘的东西就非常成功了,如果能在主流期刊发表论文那就极度成功了。」蒙玺认为即使实现这些成果,距离做大模型还是很远。
另一方面,在大学边驻点是量化抢人的一种方式。比如李骧的校友,宽德创始人冯鑫就在北京高校边驻点时发现人大数学系90后天才少年徐御之,后者一路晋升为宽德合伙人并成为公司最大股东。相比之前,AI实验室总比量化炒股对顶级大学生更有吸引力。
过去,量化老板最大的困惑是找不到在中国商业社会的站位——除了为市场提供流动性,自身的价值意义在哪?如果作为一种普惠金融帮老百姓赚钱尚且算是一种意义,但私募百万申购门槛显然把这层意义挡在了门外。
直到DeepSeek的出现,为量化行业打样了一个实现社会价值的路径,量化老板的困惑也由此解开。某种程度上,量化私募集体设立AI实验室不是为了造出下一个DeepSeek,而是在一个 AI 正在从方方面面改变和重塑人们的工作和生活方式的时代里,将溢出的技术通过逐渐普及的应用反哺给更多的普罗大众。
本文来自微信公众号 “远川投资评论”(ID:caituandzd)
作者:沈晖
该文观点仅代表作者本人