谷歌推出通用AI代理SIMA:3D游戏世界的全能AI玩家
近日,台湾电影《周处除三害》在大陆热映,口碑持续攀升,引发讨论。该电影引用历史典故“周处除三害”,讲述了通缉犯陈桂林以恶除恶、自我救赎的故事。3月14日,有历史学者向南都记者表示,该电影引用我国传统典故讲述故事,体现了两岸文化一脉相承、同根同源。江苏宜兴周王庙。3月14日,南京大学明史中心特约...
划重点:
🤖 无需源代码或API,通过文本和图像提示执行操作
🎮 与多个游戏工作室合作,SIMA在多款中展现卓越性能
🔍 由多种大模型组成的SIMA,模仿人类感知、思考、规划和执行
正文:
近日,谷歌DeepMind的研究团队宣布推出一款面向3D虚拟环境的通用AI代理——SIMA。这一创新成果标志着AI技术在游戏领域的应用迈出了重要一步。SIMA的独特之处在于,它能够无需游戏的源代码或定制API,仅依赖于用户提供的图像和简单文本指令,就能像人类玩家一样在游戏世界中自由行动。
SIMA的研发过程中,DeepMind与八家游戏工作室紧密合作,将其在《无人深空》、《模拟山羊3》、《Teardown》、《挖矿模拟器》等多款知名3D游戏中进行了广泛测试。测试结果显示,SIMA能够执行超过600种基本操作,包括挖矿、驾驶飞船、制作装备等,且每项操作的完成时间平均不超过10秒。
SIMA的架构设计灵感来源于人类的身体构造,由多种大模型组合而成。其中,视觉感知模型相当于AI的“眼睛”,负责处理图像观察并提取关键信息;大语言模型则是“大脑”,解析和理解自然语言指令;建模规划模型扮演“思维”的角色,通过强化学习规划最佳行动策略;最后,控制和执行模型作为“四肢”,将动作序列转化为实际的游戏控制指令。
在数据收集和预处理方面,SIMA采用了先进的技术手段。研究人员从商业游戏中收集了大量数据,并通过数据清洗、转换和标准化等步骤,确保了数据的质量和一致性。这些工作为SIMA的学习和执行提供了坚实的基础。
谷歌DeepMind的研究人员表示,他们将继续迭代和提升SIMA的通用代理能力,期望未来SIMA能在现实生活中为用户提供更多帮助。
技术报告:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.*