登陆注册
18514

实地走访|通信领域“国家队”如何破解行业“算力焦虑”?

锤子财富2023-09-19 19:17:560
算力是数字化人工智能时代最重要的基础设施之一。上海市作为数字化转型的“排头兵”,在算力基础设施布局方面走在了前列。

算力是数字化人工智能时代最重要的基础设施之一。上海市作为数字化转型的“排头兵”,在算力基础设施布局方面走在了前列。

第一财经记者日前跟随工信部“算力中国行”(上海站)调研组走访了包括上海铁塔、中企通信、燧原科技等通信领域的多家企业,以深入了解我国算力基础设施全产业链的发展现状。

算力基础设施赋能千行百业

上海铁塔是通信基础设施建设的“国家队”,构建了全时空、多领域的数据采集方式。在AI大模型发展大潮下,上海铁塔也为AI模型部署和私域数据AI训练提供支撑。

在上海铁塔位于大虹桥的机房里,工作人员向记者展示了铁塔边缘算力基础设施,主要由GPU组成的边缘算力设施在通信机房里平稳运行。

据介绍,在全上海铁塔拥有2.9万个通信站址,具有安装数据设备条件的机房有1万多处。

上海铁塔副总经理张蕴洲告诉第一财经记者,上海铁塔正在持续深化行业共享和技术革新,加快变“通信塔”为“数字塔”、“通信机房”变“数据机房”。

“我们利用铁塔站址点多面广、站高望远等资源的优势,通过铁塔多类型传感器实现不同维度的数据采集。”他对第一财经记者表示。

关于算力如何赋能千行百业,张蕴洲表示:“大模型的迭代发展拉动了第一波算力浪潮,随着基于大模型所细分出的行业模型可以赋能千行百业,极大提升社会生产力;同时随着算力应用的丰富所带来的第二波算力浪潮,将考验社会算力基础设施的稳定性。放眼全国,中国铁塔210万座通信站址资源是天然边缘算力提供场所,可以为社会提供就近、可靠、安全、普惠的算力服务。”

基于铁塔“数据机房”的资源特点,上海铁塔行业拓展部高级经理潘海捷设想了一种业务架构,他认为集中式机房可用来训练迭代大模型,铁塔边缘机房训练中小模型和部署行业模型。这样可以发挥不同纬度的资源优势,差异化支撑起AI算力产业。

通信领域“国家队”不仅仅服务于国内的算力,而且也帮助企业“走出去”。中企通信就是这样一家企业。

中企通信通过提供“云网智安”一体化服务,联合母公司中信国际电讯CPC等,在全球五大洲布局网络服务据点超过165个,SD-WAN网关超过60个,网络可用性高达99.99%,为全球客户提供稳定、高效的网络服务。

近日,中企通信母公司中信国际电讯CPC宣布,将启动巴西全新网络据点,完善在金砖五国的服务覆盖及资源布局,实现更快速的全球无缝连接,赋能国际化客户高效全栈“云网智安”服务,帮助企业加速国际化运营和数字化发展。

中企通信位于宝山的上海云网融合数据中心,是中企通信三地六中心云网融合数据中心服务的重要据点。现场工作人员向记者介绍称,该数据中心作为国家A级数据中心,满足了高等级的基建要求,并融合了网络、云计算、信息安全、全球统一管理服务。值得一提的是,该中心创新地将AR技术融入数据中心服务中,打造了中企云时代数据中心DataHOUSE“AR千里眼”远程运维服务。

由于企业全球化业务对部署在不同区域的算力需求越来越高,中企通信数据科学及创新总监詹东东提到了算力调度的重要性。他表示:“尤其对于云计算和边缘计算协同的算力架构而言,最重要的是对算力的调度能力,对算力的需求很多时侯会分布在不同的区域,如何协同好,这也是我们很多客户正在思考的问题。”

他还表示,当异构算力越来越复杂,从一开始的GPU到现在的DPU、NPU等等,就涉及到协同算力接口的标准化问题。“我们希望通过与国产化的芯片厂商合作,构建算力底座,共同开发一些接口。”詹东东说道。

算力芯片破解“CUDA难题”

目前在国内,大部分的算力芯片硬件厂商都选择了兼容英伟达的CUDA软件平台。软硬件协同完善的生态是客户选择CUDA的根本原因,也是英伟达领先于其他算力芯片企业最核心的竞争力,算法工程师已经习惯了使用CUDA提供的工具库及其编程语言。CUDA也因此被认为是巩固英伟达硬件市场地位的“关键护城河”。

但长期依赖海外厂商的生态体系会遏制国内算力芯片企业构建自己的生态,无法探索出属于自己的AI计算之路。因此算力芯片企业面临着一个根本的矛盾:如果不兼容CUDA,市场推广过程将存在一定的困难;兼容CUDA,又会壮大别人,自己得不到成长。

在这一背景下,已经有国内算力芯片企业选择走自定义编程模型的路线,提供从硬件平台到开发者工具包、计算库和框架的一整套方案。

燧原科技是近年来备受关注的国内芯片厂商,该公司以对标美国英伟达公司最先进的人工智能芯片为目标。

在燧原科技位于浦东金桥的集群实验室里,工作人员向记者展示了该公司最新一代的人工智能芯片产品,是一种基于“小芯片”(chiplet)技术的AI处理器。燧原科技开辟了CUDA之外的编程模型TopsCC。

燧原科技产品市场总经理高平对第一财经记者表示:“兼容CUDA某种程度也算一种抄袭,产品的能力和技术发展的天花板都很明显,很难做出有差异化和市场竞争力的产品。虽然不兼容CUDA可能会带来一定的迁移成本,但如果产品的性价比足够好,综合来看,商业价值还是会很可观的。大模型时代CUDA的生态粘性在逐步降低,DSA架构的AI芯片会大放异彩。”

所谓DSA架构就是“领域专用架构”,这是一种相对于兼容CUDA的GPGPU而言的一种面相AI领域的专用计算架构体系。

高平给出建议,国内厂商协同定义自研编程模型,以此联合拓展开发者,集聚企业的力量,让更多的高校、商业伙伴使用。他认为,大模型的出现,也从一定程度上为国内产业走向联合提供了良好契机,从而有望合力打破英伟达的生态壁垒。

上海联通高管在调研中谈到目前中国算力挑战时介绍称,一是要解决供应链安全和自主可控方面的问题,二是要努力构建国产算力应用生态体系。

这位高管指出,AI芯片等产品的国产化正在积极推进过程中,但技术性能方面与国外产品仍有差距,而且目前缺乏有公信力的测试和对比;在国产算力生态体系方面存在的核心挑战是,芯片系统数据库和目前国外的体系和框架应用的适配性并不高,这在无形中提升了国产化产品的使用门槛。

她还提到,从政策制定方面来看,国内尚缺乏一些与算力相关的行业标准,对于算力的统一度量,网络的协议、算力资源应用和适配等方面没有形成统一的标准体系,建议自上而下推动制定行业标准,从而有利于整个算力生态的打造。

0000
评论列表
共(0)条
热点