直播回顾｜2025走进立体计算——湖南汇视威“橘洲”V1端侧版本发布会-掌上长沙

掌上长沙 5-20 15:55:33

　　5月20日，湖南汇视威智能科技有限公司（简称汇视威）发布文创作品《长沙星上数星星》，用朗朗上口的旋律和独具特色的歌词，演绎年轻人对长沙的热爱。

掌上长沙 5-20 15:56:54

　　5月21日，汇视威还将发布科创产品——“橘洲”视觉基座大模型，用另一种独特方式，对长沙城、长沙星乃至茫茫宇宙进行深情告白。据了解，21日汇视威将正式发布国内首个基于国产算力预训练的视觉基座大模型“橘洲”V1端侧版本。该模型在智能手机端实现了1024x1024分辨率图像的秒级生成，标志着移动AI生成技术进入实用化新阶段，对推动人工智能技术的广泛应用和可持续发展，无论是算力技术还是商业价值，都具有十分重大的意义。

掌上长沙 5-21 08:58:18

　　“橘洲”视觉基座大模型由湖南汇视威智能科技有限公司（简称“汇视威”）自主研发，依托中科曙光算力，在较短时间内完成了近4000万张图片训练，成为全国首个在国产算力上完成整体训练和推理过程，并实现移动端部署的视觉基座大模型。

　　视觉大模型是视觉人工智能的基础设施。由于其参数多、模型大、算力需求强，其推理过程需在服务器端实现，因此有着推理成本高、数据隐私缺少保障、带宽和时延要求严苛等弊端。

　　“橘洲”视觉基座大模型创新性地解决了这些痛点。其采取跨模型结构极限蒸馏技术，图片解码模型参数量是云端解码模型参数量的1/50；设计了高效的文生图预训练方法，将训练时间压缩到20小时；使用加速推理训练方法，出图从28步压缩至4步，能做到秒级生成高分辨率图片。

掌上长沙 5-21 09:01:48

制图/王斌

掌上长沙 5-21 09:03:00

　　“橘洲”视觉基座大模型与现在市面上的视觉大模型有什么区别？

　　关键在于“基座”。“在我们前期做产品设计时，更多地将‘橘洲’定位为一款面向开发者大模型底座，它的目标是为B端客户降低视觉大模型边端推理成本，这样B端的开发者基于我们提供的基座大模型，再去打造自己的移动端AI多模态应用，例如虚拟换衣、企业海报制作等。”汇视威创始人、董事长顾善植解释，“橘洲”像是一个毛坯房，具备了各种功能用房，但还需要B端合作伙伴“装修”好以后，才能让人们更好地使用，“当然如果你想直接住，也是可以的。”

　　记者了解到，为更好地向开发者提供服务，“橘洲”计划一个月迭代一个版本，并在开发者社区第一时间开源对应的推理模型，逐步实现从文生图、文生视频、视频理解等基座功能。“希望能和我们的应用生态合作伙伴一起，打造以‘橘洲’为基座的多模态视觉模型服务矩阵，赋能各类行业场景。”

5-21 09:04:25

掌上长沙 5-21 11:05:53

导播：冯启阳

编辑：刘天乐王聘

审核：肖文娟