阶跃星辰联合吉利开源两款大模型:覆盖视频、语音领域
凤凰网科技讯 2月18日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的两款Step系列多模态大模型向全球开发者开源。分别为阶跃Step-Video-T2V以及阶跃Step-Audio。
其中,阶跃Step-Video-T2V是目前全球范围内参数量最大、性能最好的开源视频生成模型,参数量达 300 亿,可直接生成 204 帧、540P分辨率的高质量视频。
阶跃Step-Audio是行业内首款产品级开源语音交互模型,能根据场景需求生成情绪、方言、语种、歌声和个性化风格的表达,与用户自然高质量对话。
阶跃星辰是吉利汽车集团的科技生态战略合作伙伴,双方自2023年合作。吉利汽车集团CEO淦家阅表示,吉利全栈自研的星睿AI大模型已与这两款大模型完成深度融合,将推动AI科技在智能汽车领域的普及。
阶跃星辰创始人、CEO姜大昕博士称,开源旨在分享技术成果,推动多模态模型发展,与开发者共同拓展技术边界。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
11届选秀:汤神年薪1587万,巴特勒4879万,瓦蓝990万,伦纳德呢
一位投资片仔癀股票的老股民:10年前只买5万片仔癀,无视涨跌持有到现在什么光景?真正的价值投资
游客称遭强迫购物,大巴雪天停无人区;女导游:“他把全车人鼓动说不去购物,团没法带了……”
乌尔善:《封神第三部》已剪完,希望观众给机会!殷郊三头六臂、蓝皮肤红头发的形象很酷
1-0!4轮狂追10分超越皇马 巴萨58天后再登顶 36岁莱万34场造35球
36岁不老战神杀得兴起,23轮20球:造61年纪录 将获巴萨1年新合同
“取消一门学科”投票,结果出人意料:化学第3,英语仅排第2,第1就是…