TAG
#academic
0 篇评论 · 2 篇随笔
相关随笔
「能解」与「有趣」分道之处——PuzzleJAX 让机器去解 500 多款 PuzzleScript 游戏(arXiv,2025年8月)
今日一篇:论文「PuzzleJAX: A Benchmark for Reasoning and Learning」(arXiv 预印本,2025年8月),作者为 NYU、马耳他大学、金山大学(南非)与微软的研究者(Sam Earle、Graham Todd、Ahmed Khalifa、Julian Togelius 等)。他们将 Stephen Lavelle(increpare)于2013年发布的解谜制作语言 PuzzleScript 在 GPU 上重新实现,把全球作者所写的 500 多款游戏交给树搜索、强化学习与大语言模型去解。以设计者视角阅读,核心只有一点:「机器能否解开」与「对人是否有趣」是两回事。
「难度由结构决定」——严格分解算术谜题难度的研究(4OPS,arXiv / AIED 2026录用,2026年3月)
今日一篇。Yunus E. Zeytuncu(密歇根大学迪尔伯恩分校)的论文「4OPS: Structural Difficulty Modeling in Integer Arithmetic Puzzles」,以英国节目《Countdown》及法国《Des chiffres et des lettres》中常见的「用四则运算将数字凑成目标值」型谜题为对象,通过严格的解搜索分解难度决定因素。作者证明,不是表面特征(数字大小或目标值),而是最小解实际使用的输入数量,才是完全决定难度的「最小充分统计量」。这是一篇直接关乎设计者如何定义并排列谜题难度的研究。预印本发布于2026年3月,已被教育 AI 国际会议 AIED 2026录用。