DeepSeek“干崩”美股市场,中美AI竞争格局悄然改变

来源: 解放日报 

1月28日凌晨,多模态大模型Janus-Pro悄然上线,这也是国内AI创业公司DeepSeek在一个月内上线的第三款大模型。受到“DeepSeek冲击”影响,英伟达股价暴跌6000亿美元,甚至殃及美股和日股市场。

再赢一局

继大语言模型V3和推理模型R1之后,Deepseek毫无预兆地发布了多模态模型Janus-Pro,分别有10亿和70亿两个参数规模。几小时内,均在AI社区Hugging Face上引发了激烈的讨论。

DeepSeek公布的技术文档显示,Janus-Pro模型能实现文字和图像的双向识别,相当于AI能看懂图片并用文字描述,同时也能通过文字指令生成图片。

这并非是Deepseek首次推出多模态大模型,Janus-Pro是此前发布的JanusFlow的迭代版本。通过优化训练策略、扩展训练数据,Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。

DeepSeek披露的测试结果,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,也高于OpenAI DALL-E 3、Stable Diffusion在内的其他对比模型。

多模态模型Janus-Pro的测试结果。

几乎同一时间,通义千问也宣布开源视觉模型Qwen2.5-VL的多尺寸版本,其中旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军。新的Qwen2.5-VL能够更准确地解析图像内容,支持超1小时的视频理解。

“DeepSeek冲击”

或许DeepSeek自己都未曾想到,一个月内连发三款大模型,能给大洋彼岸的华尔街一记重创,被媒体称为“DeepSeek冲击”。

“DeepSeek-V3总训练成本仅为557.6万美元,而GPT-4o的成本高达1亿美元,但是两者却效果相当。”钟俊浩认为,DeepSeek的四两拨千斤,也让业界对算力需求有了重新的预估。

最先受到冲击的便是英伟达。美股时间1月27日收盘,英伟达公司股价下跌16.97%,市值一日内蒸发近6000亿美元,创下华尔街股票市值单日最大跌幅的纪录。其他半导体企业也受到波及,博通下跌17%,AMD下跌6%,微软下跌2%,纳斯达克综合指数跌去了3.1%,相当于损失超过1万亿美元。“DeepSeek冲击”并未止步于美股市场,日本股市也延续颓势,爱德万测试、东京电子、瑞萨电子等均迎来大跌。

突然爆火让DeepSeek遭遇网络攻击。

甚至连电力市场也受到冲击。美国联合能源公司股价下跌21%,电力“黑马”Vistra暴跌下跌29%,与OpenAI密切相关的核裂变反应堆公司Oklo,股价也止涨转跌,一日跌去25%。

真正的“OpenAI”

“这是开源模型的胜利。”图灵奖得主杨立昆将DeepSeek的成功,归因为“开放研究和开放源代码的力量”。

DeepSeek从创始之初坚持开源,V3、R1以及Janus-Pro等最新大模型均通过技术文档面向所有人公开。目前,已经有不少人通过公开技术路线,成功复现了DeepSeek的测试结果。

钟俊浩告诉记者,DeepSeek采用MIT许可协议,完全开源,不限制商用,且无需申请,并且明确允许用户可以随时随地访问这一资源,让每个人都能平等获取知识与信息。比如,DeepSeek-V3不仅开源了模型权重,还支持本地部署。开发者可以根据自己的需求对模型进行定制和优化,甚至可以将其部署到自己的服务器上,完全掌控数据隐私。

相比之下,冠以“open(开放)”为名的OpenAI反而走向了闭源道路,在GPT-3发布之后限制了对模型的访问权限,仅通过API提供服务,GPT-4同样隐藏了训练数据和模型权重,彻底闭源了。即便是GPT-2的开源也并非基于MIT许可协议,有相当多的限制。难怪不少人认同“DeepSeek才是真正的‘OpenAI’”。

无论是大模型能力的赶超,还是对美股市场的冲击,以及坚守开源的胜利,DeepSeek的成功,侧面也反映出中美在AI全球竞争地位也在悄然发生改变。

正如DeepSeek创始人梁文锋此前采访时说,过去很多年,中国公司习惯了别人做技术创新,然后拿过来做应用变现,现在随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。

DeepSeek的口号,或许便是最好的阐释——探索未至之境。

免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。

2、如因作品内容、版权和其他问题请与本站管理员联系,我们将在收到通知后的3个工作日内进行处理。