Agent进化测试台
测试你的AI团队对你了解多少 · 10道关键问题
--
点击下方按钮开始测试
向记忆系统发送10个关于Tony的问题,检测命中率
测试原理
每个问题预设了关键词(来自MEMORY.md中的核心认知)。
用 memory-query.py 语义搜索每个问题,检查返回结果是否包含预设关键词。
命中率 = Agent被问到这个问题时,能从记忆中找到多少依据。
80%以上 = 优秀,Agent已深度理解 50%-80% = 一般,部分认知还没形成记忆 50%以下 = 需关注,Agent对这方面了解不够
用 memory-query.py 语义搜索每个问题,检查返回结果是否包含预设关键词。
命中率 = Agent被问到这个问题时,能从记忆中找到多少依据。
80%以上 = 优秀,Agent已深度理解 50%-80% = 一般,部分认知还没形成记忆 50%以下 = 需关注,Agent对这方面了解不够