← 返回信息流
技术博客arXiv cs.CL·15 小时前

SePO:通过自我进化优化提示词的智能代理

原标题:SePO: Self-Evolving Prompt Agent for System Prompt Optimization

速览

SePO提出了一种自我进化提示优化方法,将提示代理自身的系统提示也作为优化目标。该方法采用自我指涉设计,通过开放式进化搜索同时改进任务代理和自身提示,并维护候选提示档案。在数学、推理、科学、代码和逻辑等五大基准测试中,SePO的表现均优于Manual-CoT、TextGrad和MetaSPO,平均准确率提升4.49分。预训练获得的提示优化技能还能泛化到未见过的任务中。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org