梁文峰与DeepSeek:从量化投资到国产AI的崛起之路

燃爆国产AI

如果要问国内哪个AI大模型最火?那自然非DeepSeek莫属!

自从1月份发布DeepSeek R1之后,就彻底燃爆了国产AI。先是不到一周,就引发了英伟达股票暴跌17%。后续更是持续稳居,全球顶级AI大模型第一梯队。现在各行各业几乎都开始接入或已经接入DeepSeek,而DeepSeek也逐渐成为了国产AI的标杆产品!

Deepseek排名
那么能够打造出这样一款,“国运级”AI产品的DeepSeek公司,它的创始人梁文峰是一个怎样的人?他有着什么样的经历?他又是如何组建和管理DeepSeek,以至于能在众多AI产品中脱颖而出的呢?

梁文峰经历

求学阶段

1985年,梁文峰在广东省湛江市出生,父母都是小学老师。
湛江
2002年梁文峰成功考入浙江大学,主修电子信息工程专业。之后他选择继续深造,在2010年获得信息与通信工程硕士学位,硕士论文题目是:《基于低成本 PTZ 摄像机的目标跟踪算法研究》。
论文

投身金融

2008年,正值金融危机期间,梁文峰开始探索使用机器学习进行量化交易。毕业后他去往成都创业,在那里尝试将AI应用于不同的领域。但大部分的尝试都以失败收场,直到他开始将AI应用到金融领域。

2013年,梁文峰开始尝试使用AI来进行量化交易,并和浙大校友徐进一起,创立了杭州雅克比投资管理有限公司。

2015年,梁文峰和徐进又一起,创立了杭州幻方科技有限公司。也就是今天的浙江九章资产管理有限公司。

2016年,梁文峰和另外2位同学,共同创立了宁波幻方量化投资管有限公司。这个公司,主要依靠AI和数据分析,来指导投资。

2019年,梁文峰创立幻方人工智能,开始研究AI算法和AI应用。此时幻方管理的资产已经超过100亿元。当年8月30日,梁文峰发表了题为《程序员视角下中国量化投资的未来》的主题演讲,引发了热烈的讨论。他表示,确定什么是定量或非定量的标准是,投资决策是通过定量方法,还是由人做出。量化基金没有投资组合经理做出决策,而只是服务器。
演讲

转向AI

2020年,幻方投资数亿元,研发了“萤火一号”AI超级计算机。这台超级设备,占地相当于一个篮球场,计算能力相当于4万台个人PC。

2021年,梁文峰又带领团队,研发了“萤火二号”,投入超10亿元,搭载了约1万张英伟达A100显卡。同年幻方的资产管理规模也突破了1000亿,成为国内量化私募领域的“四大天王”之一。

创立DeepSeek

2023年,梁文峰宣布幻方的发展方向,将转向研究通用人工智能,并推出了DeepSeek。而且在美国对中国实施芯片限制之前,幻方已经购入了超过10,000个英伟达 A100 GPU。这为DeepSeek后续研发和训练LLM,提供了稳定的计算资源保障。
A100 GPU
2024年,DeepSeek V2发布,一发布就引发了AI价格战。当时DeepSeek V2 API的定价为:输入,1元/百万tokens、输出,2元/百万tokens。价格只有GPT-4 Turbo的1/100。 同年12月27日,又发布了 DeepSeek V3,并公布了长达53页的训练和技术细节。此时DeepSeek已经确定了,低成本、开源的发展策略。

2025年,梁文峰受邀出席了李强总理在北京主办的专家、企业家和教科文卫体等领域代表座谈会。并在会上。对2024年度政府工作报告征求意见稿提供了自己的意见和建议!
会议
同年1月20日,DeepSeek R1的发布,彻底燃爆了国产AI,这是一个性能比肩OpenAI o1正式版的国产大模型。训练只使用了2048块,符合美国出口管制版本的,英伟达H800 GPU,而训练成本只有OpenAI的1/20。
H800 GPU

牛人特质

爱写代码的CEO

2020年,当时幻方量化的一位员工,曾在公司博客中写道:老板本人每天都自己写代码、跑测试,这是他们与其他公司的不同之处。
写代码

励志改变

2021年期间,在还未转向AI之前,梁文峰就曾购入数千个英伟达GPU芯片,同时运行 High-Flyer。当时业内人都认为,这只是一个亿万富豪,想要寻找一些新奇的爱好。梁的一些商业伙伴,对他的印象是:一个颇有书生气的年轻人。梁文峰曾对朋友表示,自己想做些什么来改变AI领域的游戏规则。但是他的朋友认为只有阿里、百度这些巨头才有可能做到这一点。

然而梁文峰没有放弃自己的追求,并通过自己和团队的努力,终于研发出了可以影响整个行业的,顶级AI大模型。

选用人才

在选择团队成员上,梁文峰也有自己的一套规则。这主要体现在2方面

团队本土化

目前DeepSeek的研发团队,全部都是国内的程序员,没有海归人才。而且大部分都是应届毕业生,或毕业一两年的年轻人。可以说这是一个完全本土化、年轻化的研发团队。
合影

重视创造性

据业内人士透露,DeepSeek喜欢招聘工作经历不是那么丰富的人。员工的工作年限一般不超过5年,而那些拥有8年以上研发经验的人,甚至可能会被拒绝。这听起来有些不合理,因为企业都希望招聘经验丰富的人才,来帮助公司更好的发展,为什么DeepSeek会反着来呢?

据悉DeepSeek主要是担心,工作经验丰富的人包袱太重、缺乏创新的动力。

梁文峰曾表示:如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。在DeepSeek的研发团队中,很多年轻人都为公司的研发工作做出了重要贡献。比如2024届北大计算机学院软件研究所博士毕业生朱琪豪,2024年北京大学计算机学院计算语言所的博士毕业生代达劢;2023年中山大学博士毕业生郭达雅;以及曾传闻被雷军挖墙脚的,90后AI天才少女罗福莉。(已离职)
成员

结束

梁文峰的成功,离不开他独特的创新精神、坚韧的奋斗历程以及对未来的远见。从早期的量化投资到后来跨足AI领域,他凭借深厚的技术背景和敢于颠覆常规的思维方式,逐步带领团队创造了一个又一个突破。尤其是他对团队的选人标准,注重基础能力和创造性,而非单纯的经验积累,这为DeepSeek的迅速崛起提供了源源不断的创新动力。
VS
DeepSeek的成功,既是梁文峰个人坚韧不拔、敢于挑战的缩影,也是中国AI产业逐渐崭露头角的标志。凭借低成本、高性能的技术优势,DeepSeek迅速在全球AI大模型的竞争中占据一席之地,并推动了国产AI的飞跃发展。它不仅是国内AI技术的重要代表,更是对全球AI领域格局的一次深刻冲击,标志着中国在人工智能的竞争中,正逐步迈入顶尖行列。梁文峰和DeepSeek的故事,无疑将成为未来AI发展历程中的一段传奇。

  


梁文峰与DeepSeek:从量化投资到国产AI的崛起之路
https://syuanyuan708-github-io.pages.dev/2025/02/26/deepseek-梁文峰/
作者
陶渊小明
发布于
2025年2月26日
许可协议