界面新闻记者 | 陈振芳界面新闻编辑 | 文姝琪
目前商汤投建的国产化人工智能算力集群已拥有GPU是5.4万块,总运营算力总运营峰值是2万P,公司在上海临港正在投建全国最大规模人工智能数据中心,全国算力节点遍及上海、广州、重庆、深圳、福州等地。
在视频生成领域,商汤在7月发布首个“可控”人物视频生成大模型Vimi,该模型主要面向C端用户,支持聊天、唱歌、舞动等多种娱乐互动场景。Vimi可生成长达1分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,通过一张任意风格的照片就能生成和目标动作一致的人物类视频,通过已有人物视频、动画、声音、文字等多种元素进行驱动。
其次,AI视频生成将重塑传统视频制作工作,整合音视频创作的流程方法变为一个整体,降低AI视频内容的制作门槛,并以全新视频交互界面展现。
当前,AI视频生成有两大方向,一是用文字提示生成视频;另一个则是用其他信号,比如可控的逻辑性信号。例如动画设计师会捕捉人体和自然信号,再让人工智能学习,最终完成。这样生成的人物不仅合理,还能随着可控的信号进行变化。
“当前人们每天看到的视频80%都是人物为主题的视频。”
栾青认为,随着AGI技术在视频领域的深入,除了生产效率的变化,更多的是全新体验。大模型的能力可以让普通人更好的进行创作。
界面新闻记者 |









