湖南湘江新区城市馆展品故事汇⑥:国产AI的“最强大脑”

湘江早报全媒体记者 黄荣佳
【故事主角】
在综艺节目《最强大脑》中,挑战者们通过获取关键信息, 能从200根蜡烛中找到节目组想要的那一根蜡烛,从520杯水中寻到最初挑选出来的那一杯……强大的推理能力让观众们叹为观止。
如今,这样的“最强大脑”也在你的身边。当你打开电脑,向AI说出你想要找寻的内容,AI通过对关键词的分析和网上数据的匹配,两三秒内你想要的内容就出现在屏幕上。当你再次输入类似指令时,“聪明”的AI可以在更短的时间内找到你想要的内容,不仅速度更快、内容更加精确。
让AI如此“聪明”的背后,同样需要一颗“最强大脑”提供算力支撑。在湖南湘江新区城市馆里就有一颗国产AI“最强大脑”,它就是基于鲲鹏920处理器和昇腾AI处理器开发的推理服务器 ——兆瀚RA2300-A系列 AI推理服务器。
今天,让我们开讲兆瀚RA2300-A系列 AI推理服务器及其系列产品的故事。

超强算力 构筑国产化AI算力底座
近年来,围绕人工智能的话题持续火爆,百度、腾讯、华为、阿里等互联网巨头纷纷入局,各家企业的AI大模型产品也层出不穷,掀起人工智能应用热潮。2023年,AIGC又掀起了新一轮的科技革命,人工智能进入2.0时代。
数智时代的产业变革,需要大算力的硬核加持。发展人工智能,面对海量和多源的数据处理、大模型的训练与推理,都需要更大的算力支持。据业内专业机构测算,在乐观假设下,国内AI大模型在训练与推理阶段或产生相当于1.1万台至3.8万台高端AI服务器的算力需求。
面对日益增长的AI算力需求,国内智算中心、超算中心也在快速发展,国内厂商相继发布新款AI服务器,其中,湘江鲲鹏推出的兆瀚RA2300-A系列 AI推理服务器便是其中的佼佼者。
拥有鲲鹏920处理器和昇腾AI处理器“双重加持”的兆瀚RA2300-A系列 AI推理服务器,从先天条件上就实现了遥遥领先。同时,拥有最大8张昇腾Atlas全系列推理卡。依托超强的计算性能,能够为用户提供强大的实时推理能力,可广泛应用于OCR识别、语音识别、搜索推荐、内容审核、智慧城市、智慧交通等诸多中心侧大模型推理场景。
湘江鲲鹏昇腾产品负责人介绍:“目前,兆瀚RA2300-A系列 AI推理服务器在算力、精度、计算效率等方面处于国内领先水平,满足国内大部分的AI应用场景,我们的产品也提供给了国内的其他厂商用于广告、营销、短视频等领域的内容开发,正在逐步实现服务器的自主国产化。”
当前,湘江鲲鹏基于昇腾AI处理器,已成功构建了集AI推理服务器、AI训练服务器、AI小站、AI集群为系列的产品形态及面向“端、边、云”的全场景AI基础设施方案,覆盖深度学习领域推理和训练全流程,已应用至长沙人工智能创新中心、重庆人工智能创新中心等需要大算力、大模型的项目之中,为城市算力基础设施建设和千行百业数字化转型升级,持续构筑智能根基。

应用广泛 打造一站式AI开发平台
强大的算力让兆瀚RA2300-A系列 AI推理服务器在性能上遥遥领先,广泛应用于各大场景,是湘江鲲鹏研发团队高度的适配能力和反复测试、精益求精的结果。
据湘江鲲鹏昇腾产品负责人回忆,兆瀚RA2300-A系列 AI推理服务器从研发到生产样机需要一年的周期,但直到大批量生产和正式投入市场,整个研发团队又花了一年时间。
在一年的实践和摸索中,湘江鲲鹏的研发团队,围绕兆瀚RA2300-A系列 AI推理服务器在各大场景下的应用做硬件测试、程序调试、软件开发……不断完善、优化服务器性能。
谈起测试的整个过程,湘江鲲鹏昇腾产品负责人颇为感慨:“我们在测试阶段,会出现各种意想不到的硬件问题、硬盘数据问题、模型软件问题等各类情况,为了更好保障产品的质量,我们只能一项一项去实验。我们在做一次大模型的适配,可能会花费数十个小时甚至几天的测试工作,我们也需要不断地去测试、检验。”据湘江鲲鹏昇腾产品负责人回忆,仅在模型适配阶段,就测试了数十个大模型,适配工作量之大可见一斑。
正是在反复测试和不断调校中,才打造出了算力超强、性能强大及高度适配的兆瀚RA2300-A系列 AI推理服务器,与其系出同源的兆瀚RA5900-A系列 AI 训练服务器,共同组建起了从训练到推理的一站式AI开发平台,能够加速行业算法和应用开发,帮助企业实现安全、可信、可靠的AI落地,推动建设本地化的AI生态。
湘江鲲鹏相关负责人表示,未来将依托一站式AI开发平台,联合高校、算法厂商等合作伙伴联合创新,孵化AI行业应用,实现产学研用深度融合,构筑成熟AI生态体系。
【故事背景】
随着数字经济时代的加速到来,人工智能作为引领新一轮科技革命和产业变革的重要基础设施,日益融入经济社会各个领域,为我国数字经济发展持续提供核心驱动力。
当前,全球科技竞争态势进一步加剧,对我国核心技术领域自主创新也提出了更高要求。兆瀚 AI服务器作为国产服务器中的佼佼者,在长沙人工智能创新中心、重庆人工智能创新中心、中国联通等需要大算力、大模型的项目之中,为国家数字经济提供了强大的智能算力。
在新一轮的发展热潮中,长沙也吹响了打造全球研发中心城市的号角,新区作为长沙先进计算产业的集聚区,也是发展数字经济的“主阵地”。相信有了兆瀚RA2300-A系列 AI推理服务器等一批国产化先进设备的强大算力支撑,长沙将加速向“先进计算之城”“数字智慧之城”迈进,成为数字经济时代的“弄潮儿”。
>>我要举报

