2026-07-05 · paper-digest
Aryan et al.: 行き詰まると世界が変わる——静的なRL環境を「適応の試験場」に変える AbideGym — Fukai が読む
Abide AI の Aryan らによる強化学習の環境設計の論文(preprint)。訓練環境が最初から最後まで固定だとAIがもろくなる問題を、プレイ中にAIの「手が止まったこと」を引き金にルールや地形を変える AbideGym で扱い、覚えた手順を崩して立て直しを促す設計と既存手法との比較を示した(実験結果は未掲載)。