观察丨巨人网络公开“千影”有声游戏大模型 据巨人观
12月12日消息,巨人网络在2024年度中国游戏产业年会上公开“千影 QianYing”有声游戏生成大模型,加码“游戏+AI”赛道。“千影 QianYing”包含游戏视频生成大模型YingGame、视频配音大模型YingSound,实现了有声可交互游戏视频生成的新突破。
和此同时,巨人网络启动“千影共创规划”,基于大模型底座技术,对外放开模型技术、模型应用、原创游戏项目等方面的合作共创、应用落地、人才招募,加速布局“游戏+AI”从降本增效给倾败式创造的快速转化。
YingGame由巨人网络AI实验室联合清华大学SATLab研发,是首个实现人物多样运动和特点化、具备强物理模拟特性的游戏视频生成大模型,可生成放开全球游戏视频,通过文本、图像或键盘、鼠标操作实现人物动作的交互控制,并自定义游戏人物,同时具备更好的游戏物理仿真特性,无需传统游戏的3D模型制作和引擎渲染环节。结合自研视频配音大模型YingSound,能够根据画面生成和之匹配的复杂音效,实现有声游戏视频。
YingSound是由巨人网络AI实验室、西北工业大学ASLP Lab和浙江大学联合研发的视频配音大模型(Video-to-Audio Model,V2A),拥有超强的时刻对齐、视频语义领会能力,无需人工输入提示词,端到端为各类视频生成多种类型的高精细度音效,涵盖真正场景视频、动漫视频和游戏视频等,具备多样化应用场景泛化能力。
现在以来,大模型技术在视频领域取得了突破性进展。对于游戏行业,视频生成能力有望替代传统游戏生产方法,极大进步游戏发行内容的创作效率;长期来看,其涌现出对3D模型的领会以及强大的物理全球仿真能力和泛化能力,将对游戏生产管线、交互方法、游戏方法产生深远影响,被认为是完全由数据驱动的下一代“游戏引擎”。
巨人网络表示,“千影 QianYing”有声游戏大模型展示了通过文字描述实现游戏创新的一种可行性,目前尚处于技术打磨阶段,AI实验室将持续推进模型能力的更新迭代。
巨人网络已建立起以自研大模型为核心的全方位基础能力,拥有行业领先的AI 工业化生产全流程化解方法。旗下通用认知对话大模型“GiantGPT”、语音大模型“Bailing-TTS”、高效编码大模型“CodeBrain”等在核心游戏业务规模化应用,已形成高效的生产链路闭环。首创基于自研多智能体大模型的最新产品范式,实现大模型在复杂决策场景落地从0到1的突破。随着“千影 QianYing”有声游戏生成大模型的公开,巨人网络实现了多模态全矩阵布局。
现在初,巨人网络董事长史玉柱提出该企业在“游戏+AI”领域的愿景,希望寻觅打造壹个AI游戏孵化平台,旨在降低游戏开发的门槛,让普通人也能开发游戏。“千影 QianYing”游戏大模型的新鲜进展,意味着这一愿景迈出了新一步。