国内首个移动端视觉大模型“橘洲”发布,离线时也可实现秒级图像生成

相链区块链

长沙晚报掌上长沙5月21日讯(湘江早报全媒体记者 黄荣佳)今日上午,国内首个基于国产算力预训练的视觉基座大模型——“橘洲”V1端侧版在湘江新区上线,它在智能手机上实现1024×1024分辨率图像的秒级生成,具有成本低、质量高、速度快、轻量级、可离线的特点。

5月21日,国内首个基于国产算力预训练的视觉基座大模型——“橘洲”V1端侧版在湘江新区上线。均为 黄荣佳 摄

据悉,“橘洲”视觉基座大模型由湖南汇视威智能科技有限公司(简称“汇视威”)自主研发,依托中科曙光算力,在较短时间内完成了近4000万张图片训练,成为全国首个在国产算力上完成整体训练和推理过程,并实现移动端部署的视觉基座大模型。

值得一提的是,“橘洲”视觉基座大模型创新性地解决传统视觉大模型推理成本高、数据隐私缺少保障、带宽和时延要求严苛等痛点,采取跨模型结构极限蒸馏技术,图片解码模型参数量是云端解码模型参数量的1/50;设计了高效的文生图预训练方法,将训练时间压缩到20小时;使用加速推理训练方法,出图从28步压缩至4步,能做到秒级生成高分辨率图片。

在发布会现场,行业专家及科技爱好者对“橘洲”V1端侧版进行测试,无论是还原古诗词画面,还是有特定描述的场景,“橘洲”在“断网”的情况下都能高度还原,强大的性能和稳定的输出效果都赢得了在场嘉宾的掌声。

现场嘉宾一起测试“橘洲”视觉基座大模型的性能。

“用智能手机自带的芯片就能运行,极大降低了算力成本,即使处于飞行模式也能正常操作,这是‘橘洲’视觉基座大模型最大的特点之一。我们期待与更多的企业合作共建行业生态,赋能千行百业,为中国人工智能参与全球竞争贡献力量!”汇视威创始人顾善植表示。

据了解,汇视威已经入驻世界计算·长沙智谷,作为长沙高新区麓谷产业园(简称“园区”)引进并培育的大学生创业企业,公司在发展过程和大模型开发过程中得到园区的持续“助攻”。位于世界计算·长沙智谷广场中央的“硅立方”,便是“橘洲”视觉基座大模型的算力支撑。公司在起步阶段,也是在园区的牵引下,早早成为长沙人工智能创新中心的生态伙伴,为后来的大模型开发打下了坚实基础。

“长沙为科技创新和企业发展提供了有力支撑,是青年人的创业沃土。”顾善植向记者坦言,“湘江新区的创业氛围真的很好,我们一路的发展中,感受到了园区的温暖关怀。不论是以前、现在,还是今后,湘江新区就是我最好的选择,无论公司规模发展到多大,我们的总部永远都会在湘江新区。”

【作者:黄荣佳】 【编辑:黄荣佳】
关键词:
>>我要举报
晚报网友
登录后发表评论

长沙晚报数字报

热点新闻

回顶部 到底部