1. 首页 > 快讯

AI电影又有突破!

7月4日,世界人工智能大会(WAIC 2024)在上海盛大开幕。

商汤科技在会上展示了其最新研发的Vimi大模型,这是首个针对C端用户的可控人物视频生成工具。

依托于商汤日日新大模型的先进技术,Vimi能够根据一张任意风格的照片生成与目标动作相匹配的人物视频。

此外,Vimi支持多种驱动方式,包括通过现有人物视频、动画、声音、文字等元素来实现人物视频的生成。

这一创新技术为C端用户带来了全新的互动体验。

精准表情控制!

首次实现分钟级可控

唯美人物视频生成

随着大模型和生成式AI技术的飞速进步,让静态照片中的人物生动起来已不再是新鲜事。

然而,目前市场上的产品在实际应用上仍面临许多挑战,例如人物动作和表情的精确控制难度大,用户常常需要不断尝试不同的Prompt以寻找最佳效果;一些产品的效果稳定性不足,导致人物外观和背景效果频繁变化;还有的产品仅能生成短暂的3~4秒视频,这些限制大大制约了视频创作者的创作自由。

面对这些实际应用中的问题,商汤科技推出了可控人物视频生成大模型Vimi,旨在提供更为精准和稳定的解决方案。

与仅能控制头部表情的技术不同,Vimi不仅能实现精细的人物表情调控,还能在人物半身区域内自然地控制肢体动作,并自动匹配合适的头发、服装及背景。

此外,Vimi还能合理生成光影变化,确保人物动作和视觉效果流畅而自然,画面和谐且美观。

更为关键的是,Vimi拥有出色的稳定性,能够稳定生成长达一分钟的单镜头人物视频,画面质量不会随时间延长而降低或失真,真正满足了娱乐和互动等场景对长时间稳定视频的高需求。

真C端可用!

轻松化身网红

满足女性用户娱乐创作需求

Vimi现已全面开放给C端用户,特别针对广大女性用户的娱乐创作需求。

用户仅需上传多角度的高清人物照片,便能自动生成数字化分身和多样风格的写真视频。

通过Vimi生成的视频,人物形象不再局限于简单的面部表情变化,而是结合手势、身体动作以及头发动态等元素,呈现出更为完整和谐的人物表现,为创作者提供丰富的视频素材,便于进行剪辑和二次创作。

对于自拍爱好者,Vimi提供了一个多功能平台,不仅可以进行聊天、歌唱和舞蹈等互动娱乐,还能通过简单的图片创作出富有趣味性的人物表情包,极大地丰富了玩法并激发了创造力。

更进一步,Vimi还推出了多种风格选项,如唯美的写真风和奇幻风格,让用户能够体验穿越不同维度的感觉,享受如同电影级别的视觉盛宴。

目前,80%的视频内容以人物为主要元素,并且随着短视频与直播平台的蓬勃发展,以人物为焦点的视频制作需求急剧上升。

遗憾的是,市场上缺乏高效的AIGC产品来生成可控制的人物视频,这对创作者的工作效率构成了挑战。

幸运的是,Vimi的出现完美解决了这一难题,它为C端视频创作者提供了一款既简便又实用的创作工具,极大地促进了人物类短视频的创作过程。

Vimi,这款领先的可控人物视频生成算法模型,标志着人工智能生成内容(AIGC)领域的一大步。

它依托商汤的先进技术,能够通过融合动作视频、动画、声音和文本等多种驱动元素来激活人物图像,创造出与目标动作完美匹配的人物视频。

Vimi不仅在控制性上独树一帜,其生成的视频在稳定性和长度上也超越了其他大型AI视频生成模型,能够持续产生长达几分钟的单镜头人物视频。

与传统仅能控制头部表情的技术不同,Vimi能够精确控制人物的面部表情和肢体动作,并创造出逼真的头发、服装和背景,同时支持光影效果的变化,确立了其作为首款稳定可控人物视频生成产品的地位。

产品优势

  • 可控人物

    可控生成高一致性的人物表情及肢体动作视频

  • 多种控制方式

    可以通过人物视频、动画参数、语音文字等输入驱动

  • 分钟级单镜头

    支持生成分钟级的单镜头人物视频

  • 生成合理的视频场景

    支持人物合理的头发、服饰、背景补全,并支持光影变化



本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.iotsj.com//kuaixun/3381.html

联系我们

在线咨询:点击这里给我发消息

微信号:666666