新浪科技讯 8月21日下午消息,百度蒸汽机(MuseSteamer)音视频一体化模型宣布完成升级,业内首次实现多人有声视频一体化生成。其Turbo版、Lite版、Pro版及全系有声版全面开放,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
据介绍,百度蒸汽机是全球首个中文音视频一体化生成的I2V模型,其首创多模态潜在空间规划技术(Latent Multi-ModalPlanner), 能够自主协调多角色身份、情感与互动逻辑;同时深度中文场景适配,以超98%的还原度精准呈现中文语音细节与情感表达。在效果上能够实现电影级高清视频画面、逼真环境音效和自然人物语音的同步输出。百度官方同时表示,该系列大模型已经在百度搜索、营销等多个场景落地应用,且定价低至行业70%。
业内人士认为,除了质量提升,百度蒸汽机2.0也带来了创作成本大幅下降。知名视效指导姚骐在此次发布会现场展示了其用百度蒸汽机2.0制作的科幻短片《归途》,并表示:蒸汽机让好莱坞级大片镜头不再需要百万预算。