商汤科技数字文娱事业部总经理栾青：未来三到五年，更多大模型应用场景将逐步解锁

界面新闻记者 | 陈振芳界面新闻编辑 | 文姝琪
目前商汤投建的国产化人工智能算力集群已拥有GPU是5.4万块，总运营算力总运营峰值是2万P，公司在上海临港正在投建全国最大规模人工智能数据中心，全国算力节点遍及上海、广州、重庆、深圳、福州等地。
在视频生成领域，商汤在7月发布首个“可控”人物视频生成大模型Vimi，该模型主要面向C端用户，支持聊天、唱歌、舞动等多种娱乐互动场景。Vimi可生成长达1分钟的单镜头人物类视频，画面效果不会随着时间的变化而劣化或失真，通过一张任意风格的照片就能生成和目标动作一致的人物类视频，通过已有人物视频、动画、声音、文字等多种元素进行驱动。
其次，AI视频生成将重塑传统视频制作工作，整合音视频创作的流程方法变为一个整体，降低AI视频内容的制作门槛，并以全新视频交互界面展现。
当前，AI视频生成有两大方向，一是用文字提示生成视频；另一个则是用其他信号，比如可控的逻辑性信号。例如动画设计师会捕捉人体和自然信号，再让人工智能学习，最终完成。这样生成的人物不仅合理，还能随着可控的信号进行变化。
“当前人们每天看到的视频80%都是人物为主题的视频。”
栾青认为，随着AGI技术在视频领域的深入，除了生产效率的变化，更多的是全新体验。大模型的能力可以让普通人更好的进行创作。

维修服务

长江号运营中心

商汤科技数字文娱事业部总经理栾青：未来三到五年，更多大模型应用场景将逐步解锁 | REAL大会

维修服务

长江号运营中心

商汤科技数字文娱事业部总经理栾青：未来三到五年，更多大模型应用场景将逐步解锁 | REAL大会

n扫码访问手机端