
DeepSeek在春节长假时间的爆火出圈,让不少国产算力厂商和云劳动厂商看到了契机。
已往一周,已有包括壁仞科技、天数智芯等多家国产算力厂商,以及华为云、阿里云、腾讯云在内的繁密云劳动厂商纷纷晓示适配DeepSeek,在国产算力平台上提供DeepSeek开源模子的推理劳动。
现在,大模子关于算力的需求存在查验和推理两个方面。就本领难度而言,相较于提供推理劳动,查验完了的难度彰着更大,因为后者相等于是对大模子从0到1 的培养,无论是在计较性能、数据、精度等要求皆更高。这亦然为什么一众国产算力平台概况速即完了对DeepSeek的模子部署,但于今国内仍鲜有模子在查验层面基于国产算力平台的原因。
时于当天,讯飞星火仍然是现在国内惟逐一个基于世界产算力平台查验的大模子。本年1月15日,科大讯飞对外发布的深度推理模子讯飞星火X1,相通是首个使用世界产算力查验的深度推理模子。将来一个月内,X1还将有一次紧要版块升级,确保其在数学、讲授、医疗、科研等重要领域上永辽远于业内卓越水平。
科大讯飞此前对外先容,使用世界产算力查验大模子的难度远超业内同业。最初是世界产算力平台底座的繁难。2023年,科大讯飞联袂华为共同攻克多方面难关,得手打造出中国首个复古万亿参数查验的国产算力平台“飞星一号”。2024年10月,“飞星二号”也负责启动,将握续带来新模子、新算法的适配和智算集群界限的再次跃迁,给世界提供第二种选择。据先容,“飞星二号”首批算力将在2025年请托试用。
科大讯飞董事长刘庆峰此前在公司里面流露,自主可控的生态探索十分不易,他们30%的算力皆消耗在大模子查验的“无东谈主区”探索上。但尽管耗尽了多数的财力和时刻,科大讯飞仍然坚握使用国产算力,用了不到同业1/10的卡,作念了比别东谈主多几倍的任务。
和业内不少使用英伟达算力集群查验的大模子比拟,国产算力在性能、功耗上仍有一定差距。这是一条从未有东谈主走通、也莫得可鉴戒训导的繁重谈路。科大讯飞只是使用了1万张910B的国产算力卡,不仅取得了大模子研发上的先进恶果,何况在国产算力平台上完了了多数无东谈主区的适配和效力优化,不错说着实把国产算力应用到了极致。这远远比业内常见的基于英伟达算力集群的研发,更需要本领实力和计谋勇气。
从这个角度上来说,DeepSeek在在算法优化和资源应用上的翻新,与科大讯飞基于世界产算力平台查验的翻新,皆不错看作是中国大模子产业在有限的算力要求下、突破制约的不同目的的探索。
DeepSeek碎裂的是已往业内传统成见下的算力壁垒,让世界看到即便基于有限的算力,中国大模子仍然不错完了模子智商并列国际主活水平。DeepSeek的得手,甚而激发了市集对算力巨头们的看衰,已往一段时刻,包括英伟达在内的算力厂商股价集体暴跌,英伟达股价一天时刻内一度暴跌近17%。
科大讯飞则是坚握走出了一条从算力底座、算法本领到大模子查验的全栈自主可控的生态之路。这不仅是科大讯飞经久以来坚握东谈主工智能国度队的历史职责,亦然中国科技公司们在靠近好意思国东谈主工智能本领霸权的有劲反制举措。
好意思国自2022年开动对华履行芯片禁令,以收敛中国公司取得先进制程芯片。尔后禁令不停加码,本年1月禁令扩大到不容好意思国企业在半导体、东谈主工智能及量子领域的对华投资方面,试图全所在围堵中国科技产业。
新一轮通用东谈主工智能的发展不仅关乎科技产业,也关乎将来国度科研、安全乃至社会发展的方方面面。在日益垂危的国际场面下,中国的东谈主工智能产业必须坚握从起源的自主可控。
刘庆峰此前在公司里面示意,淌若咱们的东谈主工智能是构建在国外的芯片上,咱们在AI领域就不能能领有竞争的底气。“这即是为什么科大讯飞要坚握自主可控这条又难、又缺乏、又经久的阶梯,因为它太进攻了,这是咱们必须坚握的职责。”
为此,刘庆峰为科大讯飞2025年定下了明晰的计谋预备:坚握自主可控、面向民生刚需、面向国度计谋需求以及赋能科研与出产。
全栈自研的大模子研发之路,也让科大讯飞在以央国企为主的招投标市集上颇受深爱。昨年的招投标市集上,科大讯飞成为央国企中标数目、中标金额的双料第一,受到中石油、中石化、中海油等多家央国企单元的复古。
面向2025年,跟着DeepSeek的爆火,好意思国对算力管控力度或将进一步趋严。一些分析机构以为,好意思国或将以从此前的硬件制裁,高潮到开动对东谈主工智能本领全所在计谋围堵的新阶段。从这个角度上来说,科大讯飞下定决心构建的大模子全栈国产化本领更有计谋兴致及先发上风。
