AI电影又有突破！

7月4日，世界人工智能大会（WAIC 2024）在上海盛大开幕。

商汤科技在会上展示了其最新研发的Vimi大模型，这是首个针对C端用户的可控人物视频生成工具。

依托于商汤日日新大模型的先进技术，Vimi能够根据一张任意风格的照片生成与目标动作相匹配的人物视频。

此外，Vimi支持多种驱动方式，包括通过现有人物视频、动画、声音、文字等元素来实现人物视频的生成。

这一创新技术为C端用户带来了全新的互动体验。

精准表情控制！

首次实现分钟级可控

唯美人物视频生成

随着大模型和生成式AI技术的飞速进步，让静态照片中的人物生动起来已不再是新鲜事。

然而，目前市场上的产品在实际应用上仍面临许多挑战，例如人物动作和表情的精确控制难度大，用户常常需要不断尝试不同的Prompt以寻找最佳效果；一些产品的效果稳定性不足，导致人物外观和背景效果频繁变化；还有的产品仅能生成短暂的3~4秒视频，这些限制大大制约了视频创作者的创作自由。

面对这些实际应用中的问题，商汤科技推出了可控人物视频生成大模型Vimi，旨在提供更为精准和稳定的解决方案。

与仅能控制头部表情的技术不同，Vimi不仅能实现精细的人物表情调控，还能在人物半身区域内自然地控制肢体动作，并自动匹配合适的头发、服装及背景。

此外，Vimi还能合理生成光影变化，确保人物动作和视觉效果流畅而自然，画面和谐且美观。

更为关键的是，Vimi拥有出色的稳定性，能够稳定生成长达一分钟的单镜头人物视频，画面质量不会随时间延长而降低或失真，真正满足了娱乐和互动等场景对长时间稳定视频的高需求。

真C端可用！

轻松化身网红

满足女性用户娱乐创作需求

Vimi现已全面开放给C端用户，特别针对广大女性用户的娱乐创作需求。

用户仅需上传多角度的高清人物照片，便能自动生成数字化分身和多样风格的写真视频。

通过Vimi生成的视频，人物形象不再局限于简单的面部表情变化，而是结合手势、身体动作以及头发动态等元素，呈现出更为完整和谐的人物表现，为创作者提供丰富的视频素材，便于进行剪辑和二次创作。

对于自拍爱好者，Vimi提供了一个多功能平台，不仅可以进行聊天、歌唱和舞蹈等互动娱乐，还能通过简单的图片创作出富有趣味性的人物表情包，极大地丰富了玩法并激发了创造力。

更进一步，Vimi还推出了多种风格选项，如唯美的写真风和奇幻风格，让用户能够体验穿越不同维度的感觉，享受如同电影级别的视觉盛宴。

目前，80%的视频内容以人物为主要元素，并且随着短视频与直播平台的蓬勃发展，以人物为焦点的视频制作需求急剧上升。

遗憾的是，市场上缺乏高效的AIGC产品来生成可控制的人物视频，这对创作者的工作效率构成了挑战。

幸运的是，Vimi的出现完美解决了这一难题，它为C端视频创作者提供了一款既简便又实用的创作工具，极大地促进了人物类短视频的创作过程。

Vimi，这款领先的可控人物视频生成算法模型，标志着人工智能生成内容（AIGC）领域的一大步。

它依托商汤的先进技术，能够通过融合动作视频、动画、声音和文本等多种驱动元素来激活人物图像，创造出与目标动作完美匹配的人物视频。

Vimi不仅在控制性上独树一帜，其生成的视频在稳定性和长度上也超越了其他大型AI视频生成模型，能够持续产生长达几分钟的单镜头人物视频。

与传统仅能控制头部表情的技术不同，Vimi能够精确控制人物的面部表情和肢体动作，并创造出逼真的头发、服装和背景，同时支持光影效果的变化，确立了其作为首款稳定可控人物视频生成产品的地位。

产品优势

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：https://www.iotsj.com//kuaixun/3381.html