
一家成立仅几个月的公司,估值就干到了1亿美元。
它做的事很简单:帮AI Agent省token钱。省到什么程度?同样的任务,成本直接砍掉75%。
一、Agent公司正在被token账单逼死
一个Agent完成一次任务,背后可能跑十几步,每一步都在烧token。
模型调用成本1元,用户付费1.15元,毛利只有15%。而行业生死线是30%。
很多Agent公司不是死于产品不行,是死于越用越亏。
二、四层架构,刀刀砍在成本上
第一层,智能路由。不是每一步都需要最强模型。OpenSquilla在调用前先判断任务复杂度,简单任务用便宜模型,复杂任务才上旗舰。把token成本从事后结算变成调用前决策。
第二层,上下文管理。很多Agent把所有Skill说明、历史记忆、网页内容一股脑塞进prompt。OpenSquilla按需加载,用不到的不加载,无关的不召回。
第三层,MetaSkill。用户说一个目标,AI自动拆步骤、选Skill组合、安排依赖关系。用户只管提需求,Harness负责编排。
第四层,可进化。用户纠正了三次才满意的任务,系统会记住这些纠正,下次不再从零开始。
三、华为大模型团队出来创业
创始人王云鹤曾任华为大模型负责人,CTO韩凯是原实验室首席研究员。两人长期研究模型压缩和高效计算。
他们押注的是:模型提供能力,应用定义场景,Harness决定成本的下限。
四、为什么Harness突然这么重要?
Claude Code、OpenClaw、Codex,所有顶级Agent产品都在卷Harness。
因为模型能力正在拉平,真正拉开差距的是模型外面那层系统——怎么调度、怎么编排、怎么省钱。
OpenSquilla开源在GitHub上,已经成了热门项目。
当所有Agent公司都在烧钱的时候,能帮他们省钱的人,反而先赚到了钱。
你觉得,Harness会成为AI创业的下一个万亿赛道吗?
4个AI无法律小镇15天:一个4天灭绝,一个主动自杀
C++之父直言AI代码难验证:资深开发者宁愿退休也不愿接盘!
Bintrail为MySQL补齐时间旅行查询短板,无需改代码即可回溯历史数据!
面壁智能三值量化突破:6倍省显存,600亿参数模型装进手机!
京东JoyInside提出AI World:让硬件像人一样主动融入物理世界,服务家庭生活!
微软叫停内部Claude Code:一场"用不起"背后的三重困境!
李沐团队发布语音模型新杀器:111种语言、零样本克隆、实时对话!
Oracle XStream CDC实测:37000 TPS下性能影响全面评估!
Waymo无人车再陷积水困境,特斯拉FSD却越开越像老司机!
SillyTavern角色卡:AI时代闷声发财的隐秘赛道,利润率超80%!