探索生活本源
传递多元价值

深度剖析!李开复为何认为国内基座大模型只剩三家?,李开复预测国内大模型新格局:DeepSeek、阿里、字节引领时代?

本文围绕创新工场董事长李开复关于国内基座大模型未来格局的判断展开,深入探讨了从“百模大战”到可能形成的DeepSeek、阿里巴巴、字节跳动三足鼎立局面的原因,分析了大模型发展背后的技术、资本、市场等因素。

近日,创新工场董事长李开复在接受彭博社采访时作出了一个大胆的判断:国内的基座大模型大概率将会只剩下DeepSeek、阿里巴巴、字节跳动三家。

在人工智能迅速走红之后,李开复与周鸿祎、李彦宏等行业大佬一样,时常对人工智能领域发表自己的见解。这一次,他提出未来国内大模型市场将从曾经群雄逐鹿的“百模大战”,逐渐演变成DeepSeek、阿里巴巴、字节跳动三足鼎立的局面。这一论断究竟是毫无根据的猜测,还是市场发展的必然趋势呢?

实际上,李开复对于自己的这番论断很可能是信心十足的。因为他所领导的零一万物,成为了全面拥抱DeepSeek旗下大模型的第一个“AI六小虎”成员。早在今年年初,当DeeppSeek – R1尚未引起广泛关注时,李开复就宣布零一万物未来不会再进行万亿参数模型的预训练,而是专注于务实、小而快且能以商业性价比来评估的模型。

其实,不仅仅是零一万物。在知名的“AI六小虎”中,除了得到众多资方支持的智谱之外,已经有四家在大模型的迭代方面按下了暂停键。而在“AI六小虎”之外的其他中小规模AI厂商,如今在大模型领域也几乎没了声响。从某种程度上来说,2023年那场如火如荼的“百模大战”反而是一种特殊现象。

回溯到2023年春季,国内AI赛道的“百模大战”迅速兴起。这是因为当时苦于缺乏投资标的的投资机构,终于找到了一个看似前景光明的赛道进行押注。大量资本的涌入成为了“百模大战”的导火索。彼时,经历了十余年快速发展的互联网行业投资突然放缓,大消费赛道也逐渐沉寂。国内投资圈甚至流传着这样一句话:“现在没啥好项目,凡是能跑出来的东西早被投完了。”

就在这个时候,ChatGPT的出现给市场注入了一剂强心针。投资机构期盼着AI能够成为下一个互联网。当ChatGPT的开发商OpenAI在做大语言模型(LLM)时,部分擅长Copy To China的国内企业自然纷纷效仿,投身到当时时髦的大模型开发中。

然而,AI大模型与互联网虽然都属于广义上的科技领域,但两者的底层逻辑截然不同。互联网是轻资产的代表,而大模型则是技术与资本双密集型的。大模型的训练不仅是一项技术活,需要有懂芯片、推理、模型、算法的专业人才,还具有资源密集型的特征,需要耗费海量的电力、冷却水以及算力。

以Meta的LLama3为例,其8B和70B模型的训练累积耗费了770万个GPU训练时长(GPU Hours),使用的是英伟达的H100 – 80GB显卡。按照AWS上12美元/机时的价格计算,这一训练的花费高达9240万美元。也正是因为如此,从2024年开始,一级市场的投资者对大模型逐渐望而却步,因为训练大模型实际上是只有巨头才能玩得起的游戏。

更要命的是,2024年初夏,这些巨头还发起了价格战,这让资源有限的中小厂商只能在一旁观望。到了2025年年初,DeepSeek凭借高效低成本的优势,一举成为AI行业的新标杆。而且,更让众多AI厂商感到紧张的是,DeepSeek的大模型还是开源的。

开源的DeepSeek引发了基座大模型的价值重估,也终结了“百模大战”。很多AI模型厂商都无法回答这样一个问题:“为什么要舍弃低成本且开源的DeepSeek,选择你的模型?”

归根结底,采取降成本、重落地路线的DeepSeek扛起了开源模型的大旗,并实现了与OpenAI并驾齐驱的发展态势,这是以往开源阵营的阿里Qwen、Meta LLama都未曾做到的。既然无法在短期内实现商业化,又难以在DeepSeek的压力下保持竞争力,二三线的国内AI厂商自然前途黯淡。

那么,李开复为什么会认为在众多一线AI大厂中,最后可能只剩下DeepSeek、阿里巴巴、字节跳动呢?

目前,DeepSeek的发展势头最为强劲,选择它是情理之中的事。而阿里巴巴的通义千问Qwen模型,虽然普通用户可能不太了解,但在AI开发者社区却享有极高的声誉,大量开发者甚至将其称为“源神”。他们最新的旗舰模型Qwen2.5 – Max也已经在Hugging Face上取得了优异的成绩。

所以,李开复支持DeepSeek和阿里,实际上是支持开源、信息平权的发展路线。毕竟,当训练超大规模的AI模型变成只有巨头才能承受的烧钱游戏时,如果这些巨头都不开源,他的零一万物可能就会被市场淘汰。

在DeepSeek和阿里之外,李开复选择了字节跳动而非腾讯、百度,也是有原因的。不久前,百度文小言、腾讯元宝先后接入DeepSeek,这表明他们对自研模型存在疑虑。而坚持闭源路线的字节跳动被李开复选中,并非是因为豆包大模型本身的表现格外突出,而是因为字节跳动旗下拥有抖音。

腾讯元宝在3月3日力压DeepSeek,成为App Store国区免费下载榜的冠军,但很快就被豆包反超。字节跳动仅仅通过一个举动就扭转了局势,即在3月5日宣布抖音App接入豆包的AI能力,打通了流量平台和AI产品。这意味着字节跳动轻松地让豆包获得了海量的用户。

抖音的日均使用时长突破了150分钟,无疑是字节跳动在AI领域立于不败之地的最大依仗。而且,为了豆包的发展,字节跳动甚至在抖音上拒绝了其他AI产品的投放。所以,除非抖音失去用户的青睐,否则豆包大模型几乎没有失败的可能。

一家技术领先(SeekSeek)、一家技术与市场兼备(阿里)、一家拥有取之不尽的流量(字节跳动),李开复这次的选择可谓是独具慧眼。

本文围绕李开复对国内基座大模型未来格局的判断展开,详细分析了从“百模大战”到可能形成的三足鼎立局面的原因。大模型训练的技术和资本密集特性,使得中小厂商难以承受,而巨头之间的竞争和策略调整,如DeepSeek的开源、阿里巴巴的技术实力、字节跳动的流量优势,决定了未来市场的走向。李开复的判断有其合理性,也反映了当前大模型市场的发展趋势。

赞(0)
未经允许不得转载:果源资讯 » 深度剖析!李开复为何认为国内基座大模型只剩三家?,李开复预测国内大模型新格局:DeepSeek、阿里、字节引领时代?

评论 抢沙发