< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

阿里发布视频生成模型HappyHorse 1.1:五大维度全面升级

6月22日,阿里巴巴发布视频生成模型HappyHorse 1.1,较1.0版本,在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升级。

动态表现力是当前视频生成模型的共同难点。针对1.0版本部分画面动作迟缓、节奏不足的问题,1.1版本优化了运动建模与时序一致性能力,提升了动作的连贯性和力量感。

对于内容生产者而言,保持主体一致性可大大减少抽卡率。1.1版本支持9张角色参考图同时输入,保持商品细节、品牌元素、角色与场景的灵活组合和稳定性,多分镜与 N 宫格参考理解增强。这意味着在多角色短剧、直播带货、多人物广告等场景中,角色“变脸”情况可控。

在指令遵循方面,无论是简短描述还是复杂叙事输入,1.1版本对提示词的理解能力都有所增强。比如对于打斗等高强度动态场景,简洁的提示词便可理解。对于复杂提示词,镜头编排稳定性增强,可高质量完成多场景、多角色的连贯演绎。

1.1版本还在视觉质感和音频上做了专项优化。此前用户反馈集中的“油光感”“过度锐化”等问题得到显著缓解,保留了痘印、法令纹、毛孔等细节的真实感,可满足短剧、广告等对画面质感要求高的场景。台词表达更加自然,语速、停顿、语气能够根据场景与情绪变化动态调整。用户亦可在提示词中描述背景、环境音效等。

在技术规格上,HappyHorse 1.1与1.0版本一致,单次生成时长3到15秒,支持720p和1080p分辨率和自由宽高比。自发布以来,该模型已服务覆盖短剧制作、电商广告、品牌营销、游戏CG等内容生产场景,模型能力仍在不断迭代升级。HappyHorse官网(https://www.happyhorse.cn/)、阿里云百炼(https://bailian.console.aliyun.com/)和千问云(https://www.qianwenai.com/)已接入最新版本。

即日起,HappyHorse联合虎鲸文娱集团举办“Horsepower”AI影像大赛,优胜者将获百万商单合作,由著名导演、制片人张纪中等担任评委,诚邀海内外AIGC创作者加入,用户可在HappyHorse官网报名。

来源:*本文由HappyHorse提供,量子位获授权转载,观点归原作者所有。

版权所有,未经授权不得以任何形式转载及使用,违者必究。