技术博客arXiv cs.CL·15 小时前

SePO：通过自我进化优化提示词的智能代理

原标题：SePO: Self-Evolving Prompt Agent for System Prompt Optimization

速览

SePO提出了一种自我进化提示优化方法，将提示代理自身的系统提示也作为优化目标。该方法采用自我指涉设计，通过开放式进化搜索同时改进任务代理和自身提示，并维护候选提示档案。在数学、推理、科学、代码和逻辑等五大基准测试中，SePO的表现均优于Manual-CoT、TextGrad和MetaSPO，平均准确率提升4.49分。预训练获得的提示优化技能还能泛化到未见过的任务中。

AI 深度解读

AI 正在阅读原文并生成深度解读…（首次约 20–40 秒，之后秒开）

查看原文 →arxiv.org

SePO：通过自我进化优化提示词的智能代理

速览

AI 深度解读

相关推荐