TAG

#llm

0 篇评论 · 5 篇随笔

相关随笔

2026-06-20 · paper-digest
Li et al.: AutoBG, an AI that supports board game design end-to-end from ideation to finish — Fukai Reads
A paper (arXiv preprint) by Zizhen Li et al. on AutoBG, a board game design assistant that covers the whole workflow—ideation, rulebook generation, and individualized feedback—via Verifier-Gated Iteration that splits the generator from the critic; the critic, BG-Critic, is reported to outperform GPT-5.4 on diagnostic quality.
2026-06-19 · 论文摘要
Nasir 等人：让游戏「规则本身」进化——Fukai 解读 MORTAR
Nasir、Togelius 等人关于自动游戏设计的论文。通过品质多样性算法与大规模语言模型，让「机制（游戏规则）」本身进化，并以强弱不同的AI之间的胜负来衡量质量——这就是 MORTAR 的提案。利用 GPT-4o-mini 生成多样且可玩的游戏，并将各机制的贡献度数值化。
2026-06-18 · 论文摘要
Jiang 等：仅凭语言能否生成「可玩的游戏」——Fukai 读 OpenGame
香港中文大学 Yilei Jiang 等人研究的论文，介绍了一种从自然语言出发自动生成完整可玩2D网页游戏的智能体 OpenGame。通过可复用骨架与「活的调试手册」抑制集成错误，在150个课题中达到最高水准。然而谜题类游戏依然是最难处理的类型。
2026-06-16 · 论文摘要
Li 等人：LLM 能「玩并通关」2D游戏吗 — Fukai 解读 GVGAI-LLM
Li 等人（NYU等）提出的 GVGAI-LLM 论文。该基准测试让语言模型游玩118款2D游戏，以测量推理能力与空间感知。将盘面翻译为ASCII地图后以零样本方式求解，GPT-4o-mini 在540关中的477关胜率为0%，整体胜率仅10.27%，未能达到经典搜索算法的水平。本文按「问题·方法·发现·应用场景·局限」的顺序逐一解析。
2026-06-10 · paper-review
AI 能从头造出一整款解谜游戏吗 —— 把「生成、试玩、修复」跑起来的 ScriptDoctor
让大语言模型（LLM）把一款解谜游戏——连同规则、图像、关卡——整个写出来，再交给编译器与搜索代理检查、要求重做：本文介绍这样一套自动游戏设计的实验系统 ScriptDoctor。题材是个人开发者熟悉的 PuzzleScript。按问题、方法、发现、用处、局限的顺序，读解为何展示人类制作的实例会大幅提高成功率、为何推理模型更占优，以及横亘在「可解」与「有趣」之间的距离。

相关随笔

Li et al.: AutoBG, an AI that supports board game design end-to-end from ideation to finish — Fukai Reads

Nasir 等人：让游戏「规则本身」进化——Fukai 解读 MORTAR

Jiang 等：仅凭语言能否生成「可玩的游戏」——Fukai 读 OpenGame

Li 等人：LLM 能「玩并通关」2D游戏吗 — Fukai 解读 GVGAI-LLM

AI 能从头造出一整款解谜游戏吗 —— 把「生成、试玩、修复」跑起来的 ScriptDoctor