进化测试 - 认知中枢

点击下方按钮开始测试

向记忆系统发送10个关于Tony的问题，检测命中率

测试原理

每个问题预设了关键词（来自MEMORY.md中的核心认知）。
用 memory-query.py 语义搜索每个问题，检查返回结果是否包含预设关键词。
命中率 = Agent被问到这个问题时，能从记忆中找到多少依据。

80%以上 = 优秀，Agent已深度理解 50%-80% = 一般，部分认知还没形成记忆 50%以下 = 需关注，Agent对这方面了解不够

Agent进化测试台