金“荣”观|国产AI诸神混战,万兴“天幕”有何必杀技

相链区块链

湘江早报全媒体记者 黄荣佳

连日来,湖南卫视《歌手2024》节目相关话题持续火爆,成为全民讨论的热点,全网传播量超73亿。阔别4年,《歌手》这档老综艺回归首场便是“王炸”。

在5月10日,节目回归的当天,带来的不仅是居高不下的流量和热搜不断的摇人话题,《歌手2024》片头的震撼亮相,也为这场“王炸”开场酝酿了前奏。该片头部分视频画面由新区企业万兴科技旗下万兴“天幕”技术支持生成,画面超高的清晰度、精致的视觉细节和出色的流畅度,令不少观众都直呼惊艳过瘾!

“看到有新闻称《歌手》片头视频有天幕生成的内容,是否真实?”“万兴天幕大模型目前除了湖南卫视在用,还有没有其他公司或者电视台有用到?”“目前市场情况如何?”在一众热门话题中,万兴科技在投资者互动平台上也收到了频频提问。

据悉,自1月30日万兴“天幕”发布以来,短短四个月内,这个被誉为国产版“Sora”的音视频多媒体大模型,已率先在业内进行公测,并参与大型节目制作,展现出国产音视频生成式AI技术落地商业应用的可能,并驱动公司股价上涨。作为国产音视频生成式AI赛道的“先发者”,万兴“天幕”如何先声夺人,万兴科技在AI视频百团大战中的制胜秘诀,值得一谈。

万兴“天幕”具备包括文生主题视频、视频AI配乐、数字人播报等在内的多媒体功能。

先发 抢跑国产AI新“赛点”

2023年,Wind人工智能指数年内累计涨幅高达30%,市场毫不吝啬地用真金白银为AI“投票”。进入2024年,AI是这个时代的最大机会,依然是市场的共识。不同的是,对于这个机会的具体方向在哪,市场有了更清晰的认知。

首先,从竞争要素上看,“应用场景”已成为必要条件。2023年初,万兴科技董事长吴太兵就在接受媒体采访时表示,“大模型时代,应用为王”。

经过“百模大战”的洗礼,市场逐渐认识到,通用大模型的竞争是少数平台级巨头公司的游戏,对于绝大多数企业来说,比拼的是将AI技术应用于垂直场景中的能力。目前业界的主流观点也是,抓住“场景红利”,大模型向产业化、行业化、垂直化、深度定制的方向发展。

另外,从技术趋势上看,“音视频生成”方向已成为AIGC新的“主战场”。视频是当下信息密度最高的媒介形态,也是这个时代最主流的信息交互方式。数据显示,目前互联网流量的80%都是视频流量。

因此,相比图文生成,AI视频生成领域正愈发受到市场关注。Stability AI、Runway等明星独角兽,估值已达到10亿美元量级。而在2023年3月30日,腾讯发布全新的AI智能创作助手“腾讯智影”,推出了智影数字人、文本配音、文章转视频等AI创作工具。同年的3月27日,百度也正式推出“文心千帆”大模型平台,这是百度面向客户提供企业级大语言模型服务的平台,可实现三分钟做PPT、数字人直播带货、订机票和酒店等操作。

直至2024年Sora的横空出现,全球目光聚焦于这一领域。很显然,新的“赛点”已经出现。

在Sora卷起的风暴下,万兴科技携国内首个音视频大模型万兴“天幕”走到聚光灯下。

2024年1月30日,万兴科技在长沙面向全球市场发布湖南首个通过算法备案、中国首个音视频多媒体创作垂类大模型——万兴“天幕”,推进大模型进入2.0时代。该模型具备包括文生主题视频、文生3D视频、AI歌手、视频AI配乐、数字人播报等在内的“天幕”多媒体能力,多指标数据表现也远超行业平均水平。在4月28日,更是率先在业内进行公测,并向部分第三方开放API接口,以加速音视频领域的智能化创作进程。近期,万兴“天幕”参与《歌手2024》片头制作,并在节目回归当日,向全世界展示其文生视频的强大实力和行业应用实践方面的领先。

继AI生成文字、AI生成图片之后,生成式AI开始“卷”入音视频赛道,面向未来,万兴相关负责人如是说:“对于在视频创意应用领域深耕多年,同时手握‘天幕’音视频多媒体大模型的万兴科技而言,这是挑战,更是机会。”

面向视频生成的新“赛点”,有技术、有创新、有规模的万兴科技拥有十足底气。

蓄势 打造“模型+应用+生态”

应对新赛道的底气十足,源自万兴科技远在视频生成竞赛“枪响”之前的“蓄势待发”。

早在2016年,万兴科技就已经开始投入AI算法研发,这个动作始于其在做创意软件的过程中,对用户需求的洞察。在万兴科技,这种基于真实场景需求做战略布局的风格也延续至今。2020年左右,万兴科技开始将AI技术应用于其创意软件的流程功能中,对创意需求、创意灵感、创意策划、场景拍摄等环节进行赋能。短短两年后,万兴便推出了自己的第一款AIGC产品“万兴爱画”,以AI文生图为切入口加速AI布局。时间到了2023年,随着前期探索的正反馈显现,万兴开始围绕AI投入更多资源,沉下来做全方位的布局,为下阶段的抢跑“蓄力”。

首先,在底层技术方面,万兴成功研发出了“天幕”大模型。作为国内首个音视频多媒体大模型,它聚焦数字创意垂直领域,具有“多媒体”“垂直解决方案”及“本土化数据”三大特点。其研发训练的基础,是万兴科技多年来积累的15亿全球创作者及100亿本土化音视频数据沉淀,这也是“天幕”大模型的独特壁垒之一。

据了解,“天幕”主要应用于音视频生成场景,能够基于文本生成高质量主题视频、基于视频生成多样化风格的人物滤镜、基于文本生成高匹配度音乐,共涵盖近百项原子能力。其中,在文生视频能力上,“天幕”已实现不同风格、丰富场景及主题的连贯性,且一键生成时长能够达到“60秒+”。

用户通过输入需求,万兴“天幕”便可生成“60秒+”的视频。

其次,在应用落地方面,万兴科技用AI深度赋能原有产品,并开发多款AIGC全新应用。业绩报告显示,受益于技术研发加速落地,万兴科技稳步推进现有产品升级及新产品拓展,加码用户创作体验升级。

过去一年,万兴完成了万兴喵影/Wondershare Filmora等产品的大版本升级,多款产品上线AIGC功能。此外,万兴还打造了万兴播爆、Wondershare TruMate等AIGC新品,进一步探索AI在垂直场景中的落地应用。

具体来看, Wondershare Filmora重磅上线了AI文本成片/AI音乐生成器等AI生成功能,还创新推出创作助手Copilot,从内容生成、音视频剪辑到交互方式迎来多元AI化。万兴播爆通过AIGC数字人等技术,帮助用户生成真人营销视频,解决出海营销视频制作的痛点。在这些应用的开发和优化过程中,万兴也在不断探索和迭代其AI场景化落地能力。

最后,在生态建设方面,万兴2023年也做了不少动作。

其引入了OpenAI、百度等外部大模型能力;与微软、华为、阿里、科大讯飞、湘江实验室等海内外企业及科研机构开展合作;规划投资近10亿元的创意科学园已开工建设;通过积极参与全球行业活动广泛触达全球创意工作者等等。

死磕技术、深耕场景、构建生态,从年报来看,万兴科技2023年的此番“蓄势”也收获了市场的回应。财报显示,2023年万兴科技多条业务线增收显著,其中核心业务线视频创意营收达9.61亿元,占总收入比重增至65%,进一步巩固发展护城河。

领先 锚定大模型+矩阵化创新

前不久,在万兴科技公布的2023年年报中,公司营业能力和净利润依然保持着良好势头,但细细梳理发现,AI对其业绩直接驱动不够显著。

根据其近日召开的2023年度线上业绩说明会信息,万兴科技目前尚未推进AI收费商业化策略,其“天幕”相应技术成果也暂未全面落地产品。

但万兴科技也透露,从用户行为数据看出不少用户对AI创作的兴趣与需求,比如Wondershare Filmora/万兴喵影自去年10月底上线文本成片、AI音乐生成等功能后,一定程度带动内容服务需求和用户黏性的提升,年内实现素材资源订阅金额提升100%,进一步优化该产品的营收质量和效率。

同时,AI大模型对于工具类企业业绩的加持,正成为趋势。3月,美图披露2023年业绩报告表示,公司总收入与净利润增长主要得益于AI推动主营业务收入增长。该公司于去年发布AI视觉大模型,并应用于旗下影像与设计产品。同月,金山办公在财报发布后表示,公司将以协作和AI作为驱动业务增长的关键动力。其于去年7月推出基于大语言模型的智能办公助手WPS AI,已全面赋能旗下全线产品。与美图、金山办公分别侧重在图像、文本不同的是,万兴的大模型主要为音视频多媒体方向。

因此从业内看来,当前大模型在图像、文本领域的成熟度较高,在多媒体尤其是视频方向的发展还属于初期阶段,存在数据集缺失、视频内容结构及层级复杂、算力成本高等挑战,其成熟应用需要周期,但市场对视频方向的大模型有更大期许。目前,全世界有3.05亿视频创作者,43亿视频覆盖群体,视频需求非常大。视频方向的大模型有望助力企业触达更多的市场和用户。

但值得注意的是,万兴科技近年一直在推动“平台+创业者”的组织模式,这是一种适合小团队创业的内部创业孵化支撑体系,可快速推动产品创新团队的规模化复制,最终达到产品的矩阵化创新。

麦肯锡发布的《生成式人工智能的经济潜力:下一波生产力浪潮》显示,如果将63种生成式AI应用于各行各业,将为全球经济带来每年2.6万亿至4.4万亿美元的增长。诚然,在AI视频的新一波浪潮里,没有人能判断谁会是最后的赢家,但确定性更强的一定是那些不仅在技术上也在落地场景上跑在前面的玩家。AI是一场“长跑赛”,来到视频生成新“赛点”,有技术、有应用、有场景、有规模化创新机制的万兴科技有更多底气向未来冲刺。

【作者:黄荣佳】 【编辑:陶惠卿】
关键词:
>>我要举报
晚报网友
登录后发表评论

长沙晚报数字报

热点新闻

回顶部 到底部