探索生活本源
传递多元价值

DeepSeek惊艳登场,“海谈科技”专场剖析产业发展蓝图

本文围绕海富通基金、上海证券报共同举办的“海谈科技”DeepSeek专场展开,三位嘉宾探讨了DeepSeek技术突围的底层逻辑、AI应用落地情况,分析了其对产业发展和投资带来的影响,同时也提及了数据和伦理等关键问题。

近日,一场备受瞩目的行业盛会——“海谈科技”DeepSeek专场在海富通基金与上海证券报的共同操办下盛大举行。在这场专场上,复旦大学博导、上海市数据科学重点实验室主任肖仰华,达观数据首席财务官许涵卿,海通证券计算机行业、科技金融首席分析师杨林三位业界重磅嘉宾齐聚一堂。他们围绕着DeepSeek技术突围的底层逻辑以及AI应用落地的相关话题,展开了深入且富有前瞻性的探讨,共同探寻产业发展的新路径和投资的新方向。

“海谈科技”核心观点

DeepSeek在技术层面实现了多维度的突破。在底层训练模型的架构优化以及基于强化学习的训练策略优化等多个关键方面,其表现可圈可点;

当下,客户对于AI算力及解决方案的需求极为旺盛,热情高涨。AI技术在政务、教育等众多领域的落地进程正在不断加速;

数据安全在整个AI产业中占据着至关重要的地位,数据标注领域蕴含着巨大的投资机遇……

活动现场,嘉宾们再次聚焦DeepSeek,深入探讨其在产业发展和投资领域的重要意义。

开启中国AI新纪元

2025年中国农历春节期间,国产AI大模型DeepSeek横空出世。它凭借“低成本、高性能”的显著技术突破,一经推出便如一颗耀眼的新星,迅速吸引了全球AI产业界和资本市场的广泛关注,可谓是一夜之间风靡全球。

那么,DeepSeek现象缘何出现?其背后又隐藏着怎样的底层逻辑呢?

肖仰华对此进行了详细解读。他指出,DeepSeek的突破主要体现在三个方面。其一,采用了混合专家(MoE)架构。这种架构在以往的训练过程中常常会遭遇不可预测的损失尖峰,导致难以扩展。而DeepSeek成功解决了这一难题,为该架构的应用开辟了新的道路。其二,在数值精度上进行了优化。它采用FP8训练,这一标准超越了美国主要使用的FP16标准,展现出了强大的技术实力。其三,实现了资源效率的显著提升。仅使用2048个H800GPU(相当于1000 – 1500个H100GPU),就实现了与GPT – 4相当的AI性能,大大降低了资源成本。

DeepSeek的这一系列突破,让全球看到了中国在AI领域的强大力量,被视为“神秘的东方力量”。杨林形象地将其形容为“科技的国运时刻”,它的成功极大地增强了中国人的科技信心。

1月27日,DeepSeek应用在苹果应用商店取得了令人瞩目的成绩。它登顶了苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。同日,在苹果中国区应用商店免费榜上,DeepSeek也成功登顶,成为中国区第一。

许涵卿认为,“DeepSeek的成功,是开源的成功。”DeepSeek将模型权重、训练框架及数据管道全部开源,允许用户自由使用、修改和商业化。这一举措意义重大,它使得开发者和企业能够以较低的成本进行模型微调和应用开发,大大降低了AI技术的进入门槛。此外,以往一些关键基础行业的应用者会担忧云端数据的安全性,而DeepSeek允许下游应用者进行本地化的模型部署,有效消除了他们对数据安全和数据隐私的担忧。

端侧AI是中国机遇

许涵卿在谈及DeepSeek的突破时表示,作为企业,他们敏锐地察觉到了更多的产业机会。客户咨询和上马AI大模型产品的意愿显著增强,这表明端侧AI的发展已经势在必行。

许涵卿介绍说,早在2022年,达观数据就开始了大模型的前沿研究。以往,客户在上马大模型时会担心需要在GPU、大模型本身等方面投入大量的资金和资源。而DeepSeek的“低成本、高性能、安全性”特点让应用端客户兴奋不已。如今,一些政府机构、央地国企尝试AI大模型的意愿大幅提升。

DeepSeek的成本优势十分明显。其API定价为每百万tokens10美分,相比之下,成本仅为GPT – 4的十分之一,这无疑重新定义了AI经济模型。

DeepSeek的出现,推动了AI技术的低成本化和边缘化发展。云端和边缘处理的混合AI模型被认为是AI未来的发展方向,而端侧AI芯片和端侧小模型的场景应用恰恰是中国的优势所在,这无疑是中国AI产业发展的重大机遇。

不过,许涵卿也强调,在不同行业,端侧AI应用落地存在先后之分。当前,在日常需要AI协助的领域,如智能助手、chat bot等应用已经有了显著提升,但在司法等相对严肃的领域、B端客户领域,大模型的应用还需要一定的时间和过程。

杨林在谈及产业与投资机遇时介绍,2月份他们调研了多家上市公司,发现这些公司都在满负荷帮助客户测试大模型demo版本。大家之所以高度关注DeepSeek,是因为这种技术的跨越式进步会带动整个平台的切换,带来类似于互联网、移动互联网诞生时刻的世纪性投资机遇。

资本往往具有前瞻性,表现得更为乐观。杨林表示,从智算中心到算力芯片,从光模块到电力运维、节能散热等,围绕大模型本身及场景落地,资本市场看到了诸多投资机遇。DeepSeek发布后,更是开启了端侧AI领域的投资机遇,值得长期关注。

数据和伦理是关键变量

肖仰华认为,“虽然DeepSeek的技术报告并没有披露太多,但我们可以看到它的‘思维’质量非常高,这说明其有可能是对数据做了大量的精准标注及相应的筛选。”精细的数据处理是DeepSeek成功的重要因素之一。

在很多专家学者看来,国产大模型的发展需要走一条成本可控、安全可信的技术路线,而DeepSeek为这条路线增加了很大的可行性。

肖仰华还指出,以往大模型性能提升主要依靠堆积算力,而DeepSeek为大模型指出了低成本训练方向,这将影响整个大模型的发展方向,业界可以用更低的成本提升大模型的安全可靠性。

谈及数据问题,肖仰华认为,提升大模型的成熟度当前还存在两大瓶颈。一是数据孤岛现象普遍存在,二是数据的精细化标注还有待加强。这使得大模型无法完成有效的垂直领域训练,难以在专业场景发挥作用。

随着AI技术的快速发展,AI大模型在多个场景快速落地,正在重塑人的概念和内涵,进而给社会关系带来一系列挑战。

肖仰华强调,“以人为本,从这个角度出发,提前建立AI应用准则。”生成式人工智能技术的发展日新月异,需要以月为单位进行记录。然而,人类的情感、价值、伦理观念调整却十分缓慢,如何调和这一矛盾,是我们需要直面的挑战之一。科技普惠,人工智能的发展应始终坚持“服务于人”的本质。

本文围绕“海谈科技”DeepSeek专场,介绍了嘉宾们对DeepSeek技术突破、产业影响和投资机遇的看法。DeepSeek以其低成本、高性能的特点开启了中国AI新纪元,推动端侧AI发展,为中国AI产业带来机遇。同时,也指出了数据处理和伦理规范是大模型发展中需要解决的关键问题。

赞(0)
未经允许不得转载:果源资讯 » DeepSeek惊艳登场,“海谈科技”专场剖析产业发展蓝图

评论 抢沙发