Anthropic官方提示词课爆火:同一模型从全挂到全过,只改了这个!
同一个模型,同一套任务,从全部失败到全部通过,中间只差提示词和工作流。
这不是段子,是Anthropic两周前官方讲座《The Prompting Playbook》的实测结果。
一、小模型也能逆袭
Anthropic用Sonnet 4.6做了一组零售排班测试。
第一轮,最基础的提示词,推理能力明显不够,测试几乎全挂。
中间几轮不断优化提示词,部分开始通过,但token上限带来新问题。
第五轮,搭了一个"生成、评价、修复"的循环,所有测试
资讯
admin
2026-06-05
2