全球最大开源视频生成模型国内首发 阶跃星辰上架阿里云魔搭社区

小刘

每经杭州2月21日电(记者叶晓丹)在2月21日开幕的全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。

全球最大开源视频生成模型国内首发 阶跃星辰上架阿里云魔搭社区
(图侵删)

此次在魔搭社区开源的两款模型,是近期全球多模态领域最热门的开源模型。Step-Video-T2V是基于300亿参数的文本转视频预训练模型,能够生成高达204帧的视频,在指令遵循、运动平滑性、物理合理性、美感度等方面表现均显著超过市面上既有的开源视频模型。

另一款上架模型Step-Audio,是业界首个产品级开源语音模型,参数规模多达1300多亿。根据Llama Question等5大主流公开测试,Step-Audio模型性能均位列第一,并在HSK-6(汉语水平考试六级)的测评中表现尤佳。

每日经济新闻

“展”看数博,“AI”意满满

报告:近9成中国包装企业已经或计划“出海”

演技上热搜!知名男星回应:希望下次不是三分钟

传统产业在这里重生

CPO概念震荡走强 剑桥科技涨停

32只个股连续上涨5个交易日及以上_2

山西一饭店坍塌已致13死,涉事建筑加盖“棚子”并有地下室

中国经济增长正换上强劲的新引擎

美股热门中概股盘前多数走高

地缘局势持续紧张 国际金价震荡收涨丨工行连线

新国标,管得住狂奔的“小电驴”吗?

十个最美赏秋园邀市民打卡

全球最大开源视频生成模型国内首发 阶跃星辰上架阿里云魔搭社区的相关内容

文章版权声明:除非注明,否则均为风扇网络原创文章,转载或复制请以超链接形式并注明出处。

取消
微信二维码
微信二维码
支付宝二维码