18:47 · 2026年1月14日 · 周三 × MiniMax 掏出了一个测验模型是否听话的 Bench:https://huggingface.co/datasets/MiniMaxAI/OctoCodingBench/blob/main/README_CN.md