--
点击下方按钮开始测试
向记忆系统发送10个关于Tony的问题,检测命中率
测试原理
每个问题预设了关键词(来自MEMORY.md中的核心认知)。
用 memory-query.py 语义搜索每个问题,检查返回结果是否包含预设关键词。
命中率 = Agent被问到这个问题时,能从记忆中找到多少依据。

80%以上 = 优秀,Agent已深度理解    50%-80% = 一般,部分认知还没形成记忆    50%以下 = 需关注,Agent对这方面了解不够