TAG
#procedural-generation
0 篇评论 · 10 篇随笔
相关随笔
「能解」与「有趣」分道之处——PuzzleJAX 让机器去解 500 多款 PuzzleScript 游戏(arXiv,2025年8月)
今日一篇:论文「PuzzleJAX: A Benchmark for Reasoning and Learning」(arXiv 预印本,2025年8月),作者为 NYU、马耳他大学、金山大学(南非)与微软的研究者(Sam Earle、Graham Todd、Ahmed Khalifa、Julian Togelius 等)。他们将 Stephen Lavelle(increpare)于2013年发布的解谜制作语言 PuzzleScript 在 GPU 上重新实现,把全球作者所写的 500 多款游戏交给树搜索、强化学习与大语言模型去解。以设计者视角阅读,核心只有一点:「机器能否解开」与「对人是否有趣」是两回事。
Nasir 等人:让游戏「规则本身」进化——Fukai 解读 MORTAR
Nasir、Togelius 等人关于自动游戏设计的论文。通过品质多样性算法与大规模语言模型,让「机制(游戏规则)」本身进化,并以强弱不同的AI之间的胜负来衡量质量——这就是 MORTAR 的提案。利用 GPT-4o-mini 生成多样且可玩的游戏,并将各机制的贡献度数值化。
Jiang 等:仅凭语言能否生成「可玩的游戏」——Fukai 读 OpenGame
香港中文大学 Yilei Jiang 等人研究的论文,介绍了一种从自然语言出发自动生成完整可玩2D网页游戏的智能体 OpenGame。通过可复用骨架与「活的调试手册」抑制集成错误,在150个课题中达到最高水准。然而谜题类游戏依然是最难处理的类型。
McConnell & Zhao:用遗传算法实时生成「恰到好处」难度谜题 — Fukai 的读书笔记
McConnell 与 Zhao 关于使用遗传算法进行自适应谜题生成的论文。将类似 Cosmic Express 的路径谜题,根据记录玩家解题方式的玩家模型,以每题约7秒的速度实时生成,并在18人实验中证明「仅依赖时间指标」的版本在体感难度与进度感方面逊色于其他版本。
Li 等人:LLM 能「玩并通关」2D游戏吗 — Fukai 解读 GVGAI-LLM
Li 等人(NYU等)提出的 GVGAI-LLM 论文。该基准测试让语言模型游玩118款2D游戏,以测量推理能力与空间感知。将盘面翻译为ASCII地图后以零样本方式求解,GPT-4o-mini 在540关中的477关胜率为0%,整体胜率仅10.27%,未能达到经典搜索算法的水平。本文按「问题·方法·发现·应用场景·局限」的顺序逐一解析。
Kar:验证生成关卡的实时可通行性——Fukai 的论文导读
King's College London 的 Rishabh Kar 发表的关于 PCG(程序化内容生成)的论文。提出 Momentum 系统——在不暂停游戏的前提下,于同一游戏循环中实时验证生成关卡的可通行性。两个自主智能体在玩家前方行进,分别通过空中几何检测和地面 NavMesh 检测提前勘察路径。评估结果以从代码推导出的结构性估算呈现。
Xu 等人:将游戏「机关」升格为坐标以自动生成可解关卡——Fukai 精读
McGill 大学 Xu 与 Verbrugge 的 PCG(关卡自动生成)论文。针对传统以地形为先的方法,提出将重力反转、移动地板等「机关」升格为坐标之一的维度扩展图上进行路径搜索、在生成过程中保证可解性的 HDPCG。并在 Unity 上实际再现了可游玩的关卡。
Feng等人:AI能创作「出人意料」的国际象棋谜题吗——Fukai 读论文
以Google DeepMind为核心的研究团队开展了一项利用AI生成创意国际象棋谜题的研究。他们以Lichess数据训练生成模型,再通过强化学习微调,将「出人意料」谜题的生成率从0.22%提升至2.5%,约提高了十倍。亮点在于他们如何将创造力量化为机器可测量的数值。
AI 能从头造出一整款解谜游戏吗 —— 把「生成、试玩、修复」跑起来的 ScriptDoctor
让大语言模型(LLM)把一款解谜游戏——连同规则、图像、关卡——整个写出来,再交给编译器与搜索代理检查、要求重做:本文介绍这样一套自动游戏设计的实验系统 ScriptDoctor。题材是个人开发者熟悉的 PuzzleScript。按问题、方法、发现、用处、局限的顺序,读解为何展示人类制作的实例会大幅提高成功率、为何推理模型更占优,以及横亘在「可解」与「有趣」之间的距离。
Tsumiki 设计讨论摘要 — 2026年6月3日(世界版·修订)
以可靠来源重构的版本。今日两篇,均从截然相反的方向回答「如何为玩家提供恰到好处的难度」。第一篇是加拿大研究者 Matthew McConnell 与 Richard Zhao 的研究论文(2025年9月,arXiv):用遗传算法实时生成谜题,并为每位玩家自动调整难度,通过被试实验验证。重要发现:仅以「通关时间(time-on-task)」作为指标时,难度调整效果不佳。第二篇是游戏设计师 Michael Hicks 的访谈(Game Developer)。他指出,量产困难谜题很简单,真正的难点在于「发现有趣的想法」。让机器适配难度的方式,与人手编写意义来设计难度的方式。两篇来源均为同行评审研究与专业媒体,是值得创作者反复阅读的内容。