返回资讯中心

AI跨越可靠性阈值,自我加速引发管理变革

36氪精选阅读约 12 分钟

原始报道

来自 36氪精选

36kr.com

打开原文

先看摘要

这条新闻在讲什么

Anthropic发出全球警告,认为AI正接近递归自我改进的临界点,呼吁暂停研究。OpenAI后训练团队负责人Yann Dubois在访谈中揭示,AI能力增长是连续的,但用户体验到‘有用性’的跳跃源于跨过‘可靠性阈值’。OpenAI在去年12月跨过此线后,AI开始自我加速,尤其在编程场景中,研究人员利用AI加速研发,形成正反馈回路。Dubois指出,AI构建更像‘手艺’而非科学,垂直领域的Harness(编排系统)已接近AGI,但持续学习仍是难题。对管理者而言,AI正从‘刷题选手’进化为‘职场打工人’,企业需重新思考人机协作、组织效率和员工技能转型。

站内正文

详细内容

这里展示站内保存的新闻正文,支持划线和批注;需要核对来源时,可以打开原始报道。

Anthropic全球警告,OpenAI已跨“可靠性阈值”:AI自我加速启动

2026年06月07日 07:00 刚过及格线,AI已经开始给自己提速

AI圈平地一声雷!

Anthropic向全人类发出警告:停止研究AI!

Anthropic内部数据显示,AI正在加速AI的发展,通往递归自我改进的路径或已浮现。

换句话说,AI正在接近「自己造自己」的临界点。

这一进程比Anthropic预想的更快,所以Anthropic呼吁减缓或暂停AI研究。

而与此同时,OpenAI 后训练团队负责人 Yann Dubois 在最新访谈中,给出了一个更微观但同样令人深思的视角:

AI进化不是突然开挂,而是刚过合格线!

在最新访谈中,他揭秘了多项内部视角:

AI能力的增长是线性的、连续的,但用户体验到的「有用性」却是离散的、跳跃的。

因为在达到某个「可靠性阈值」之前,AI只是一个会变戏法的玩具;一旦跨过那个点,它就成了能托付工作的员工,会自我加速。

这个阈值,OpenAI在去年12月左右才跨过了这道坎。

此外,Yann Dubois提出了反直觉的论断:AI构建更像「手艺(Craft)」而非「科学」。

这个洞察极具张力:在这个最强调硬核算力的领域,最终胜出的竟然是类似炼金术的「flare(直觉/灵感)」。

他还提出「最后一公里的AI红利」。

如果现在冻结所有模型,只靠做垂直应用(Harness),我们其实已经能实现AGI了。

瓶颈不在模型大脑,而在「权限、连接和数据」。这直接给正在观望的开发者泼了一盆冷水,同时也指明了金矿所在。

可靠性阈值已过,AI自我加速

过去几周,AI圈热闹不断:GPT5.5发布、Claude Mythos也出来了。

尤其是在网络安全、AI智能体写代码这块,给人的感觉真是日新月异,AI的进展让人感觉像突然「跳了一大格」。

Dubois的说法很不客气:能力提升其实一直挺连续,大家之所以觉得像坐了火箭,是因为中间隔着一道「可靠性门槛」。

门槛没跨过去之前,AI像个聪明但爱闯祸的实习生:能写、能算、能出主意,但你不敢把活彻底交给它。

门槛跨过去之后,你才敢让它「真上岗」。

他判断OpenAI大概是在「去年12月」跨过了这条线,于是才出现了外界感受到的「阶梯式跃迁」。

更刺激的是第二层原因:当模型足够好,它会反过来加速研发本身。

这就是Anthropic最担心的事。

Dubois提到,尤其在编程场景里,研究人员自己天天写代码,模型一变强,等于全员多了个不睡觉的搭档——既能帮研究者把工具链搭起来,也能在训练下一代模型时「以AI养AI」。

加速回路一旦转起来,就会越转越快,最近几个月「越来越猛」并不奇怪。

这也发生在Anthropic内部,到2026年第二季度,人均每个季度贡献的代码,已经是2024年第一季度的8倍。

第三个推动力,来自强化学习(RL)的「转型升级」。

早期像o1这类推理模型,主要在「可验证奖励」的任务上猛刷分——数学题、编程竞赛,因为对错清清楚楚,奖励好定义。

但过去一年,他们把在竞赛里练出来的那套工具,往更真实、更模糊的工作场景迁移:不再只优化「有标准答案的题」,而是优化「用户觉得真有用的东西」。

一句话:从刷题选手,开始往职场打工人进化。

AI工程师不是科学家,AI是「养」出来的

可一旦走进真实世界,麻烦就来了:可靠性怎么提?

Dubois给了个非常直白的「概率模型」:

既然现在很多都是AI智能体(agentic)系统,你可以粗暴地想成「每两分钟就有一定概率犯错」;运行时间越长,最终答案翻车的概率就越高。

所以所谓「提升可靠性」,本质就是不断把这个「每两分钟出错率」压下去。

这是AI智能体固有的硬骨头。

这也解释了为什么Dubois说,AI的构建更像「手艺活」,不像课本里的「科学实验」。

现实流程往往是:先靠经验、直觉、反复试错把东西做出来,甚至带点「炼金术」味道;等它真能跑、真能用,再回头补更科学的解释与方法论。

他还提到一个颇具反转的小插曲——

当年ChatGPT公开说用了RL,他第一反应是「太复杂了吧,用监督微调(SFT)就够了」,这也正是他在Stanford做Alpaca时想验证的思路。

但后来事实显示,一旦模型规模跨过某个水平,RL真的会「突然开始好用」,只是代价不低——采样很多答案、判断哪些对、哪些错,算力和系统工程都很烧钱。

垂直领域Harness已达AGI

说到「把AI拉进现实」,绕不开最近创业圈最爱挂在嘴边的词:Harness(编排系统)。

有人把它当成AI智能体的「外挂骨架」,也有人怀疑它迟早被模型「吃掉」。

Dubois的态度很现实:

短期内,垂直场景的Harness很值,能把可靠性从80%推到85%。

但前提是你得接受:模型在持续变强,Harness也得反复重调。

想做一个长期稳定、放之四海而皆准的「通用Harness」,他认为基本走不通。

甚至他还抛出一句很「挑衅」的判断:如果今天把现有模型「冻住」,只认真打磨Harness并围绕它训练,很多领域的人可能会「明显感到通用人工智能(AGI)的味道」。

最后一公里

但真正让Dubois既兴奋又皱眉的,是「持续学习(continual learning)」这道老大难。

三年前ChatGPT刚火时,他和朋友甚至认真讨论过要不要创业做个性化记忆与持续学习。

当时他们觉得「6个月内OpenAI就会搞定」,于是没做;三年后他人都进OpenAI了,却发现这事仍没真正解决。

现在模型的尴尬在于:第一天空降到公司,可能比多数新员工还顶用(起点高);但之后基本「保持原样」,因为它不会在特定环境里越干越懂你、越干越高效。

人类学习曲线是往上爬的,AI这条线却容易变平。

把AI的曲线从「平的」掰成「持续上升」的,Dubois认为会是接下来最重要的问题之一。

所以,创业公司还有没有空间做垂直应用?

Dubois给的答案很干脆:不但有,而且很大。

因为真正的瓶颈往往不是「模型够不够聪明」,而是最后一公里——权限怎么给、数据怎么接、连接器怎么打通、怎么嵌进具体业务流程。

大模型在天上飞得再高,不落地也只能当烟花;而把它拽到地面、让它拿到该拿的钥匙、打开该开的门,反而是最有含金量的苦活累活。

参考资料:

https://x.com/Potatoloogs/status/2062494654885749126

https://www.youtube.com/watch?v=DhD1zZ8w8Mw&t=3s

本文来自微信公众号“新智元”,作者:ASI启示录,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。

AI 读后整理

对 HR 和管理者意味着什么

本文核心信息是AI已跨越‘可靠性阈值’并开始自我加速,对企业和组织管理产生深远影响。首先,AI从‘玩具’变为‘员工’,意味着企业可以将其嵌入核心业务流程,但同时也面临可靠性、持续学习等挑战。管理者需评估AI在招聘、培训、绩效管理等HR场景的落地可能性,例如用AI自动化筛选简历、辅助面试评估,但需警惕模型偏差和犯错概率。其次,AI自我加速将加速技能过时,员工需要持续学习以适应新工具;HR部门应设计灵活的培训计划,提升员工与AI协作的能力。最后,OpenAI的内部经验表明,AI发展更像‘手艺活’,依赖直觉和试错,这提示企业在引入AI时不必追求完美方案,而应快速迭代、小步快跑。组织文化需鼓励实验和容错,以充分利用AI红利。

RELATED

相关阅读

AI+HR

Harness Engineering:AI应用效率提升的关键

Harness Engineering是AI圈新概念,核心是为大模型搭建外围控制系统,包括规则、检验机制、工具等,确保模型输出准确可靠。它强调从机制上避免重复犯错,而非临时纠正。该方法由HashiCorp联合创始人提出,迅速成为行业共识。研究显示,同一模型因Harness设计不同,性能差距可达6倍。未来AI核心竞争力将从模型本身转向Harness搭建水平,HR和管理者可借鉴此思路优化AI工具在招聘、培训等场景的应用。

行业动态

DeepSeek登美企软件趋势榜第一,AI成本成关键

据美国企业支出管理平台Ramp最新报告,DeepSeek登上其“软件趋势榜单”第一,成为该平台上增速最快的软件之一。报告显示,美国企业客户正在寻找OpenAI和Anthropic的低成本替代方案,一些公司愿意直接采用价格更低的中国大模型。Ramp首席经济学家指出,这反映了企业在AI支出上更加看重成本。此前,DeepSeek R1在2025年初曾引发全球关注,但B端采用率短暂冲高后回落。如今,随着美国AI成本居高不下,企业开始审视AI投资回报率,性价比成为关键。DeepSeek近期宣布API永久降价75%,进一步吸引全球客户。

案例研究

Anthropic用Claude实现95%业务分析自动化

Anthropic在官方博客中分享了其内部使用Claude进行业务分析的经验,实现了95%的查询自动化和约95%的准确率。文章指出,AI数据分析的核心难点并非SQL生成,而是数据本身的歧义性,包括概念实体不匹配、数据过时和检索失败。Anthropic提出了智能体分析栈,包括数据基础层、事实来源、技能和验证四层,其中技能层带来了最大的准确率提升,从21%跃升至95%以上。然而,该系统会随时间衰减,需要持续维护。文章强调,结构比模型更强更重要,且准确率的最后几个百分点需要高昂成本。

讨论 0

登录 后可发表评论

  • 还没有讨论,欢迎第一个发言。

分享到