开云IOS/Android通用版/手机app Anthropic发布Claude Opus 4.8, 引入动态职责流撑抓数百并行智能体

来源:开云足球世界杯官方手机APP下载 作者: 发布: 浏览:101

开云IOS/Android通用版/手机app Anthropic发布Claude Opus 4.8, 引入动态职责流撑抓数百并行智能体

Claude Opus 4.8:一个官方称为“忠实”的模子

5月28日,Anthropic发布Claude Opus 4.8,距上一版仅隔43天。官方称最大转变是“忠实”——模子更愿承认不笃定性,代码颓势漏报率降至Opus 4.7的四分之一。

基准测试中,Opus 4.8在SWE-bench Verified上拿下88.6%,高于GPT-5.5的78%。Terminal-Bench 2.1从66.1%跃至74.6%,比GPT-5.5跳跃121分。寂然评测机构Artificial Analysis阐述,Opus 4.8在“最约莫力”配置下是当今测试过最强的模子。

一分彩APP官方网站下载

Anthropic同步上线动态职责流功能,Claude可开动数百个并行子智能体解决大型任务。Bun首创东说念主Jarred Sumner用该功能将75万行代码从Zig移植到Rust,11天完成,99.8%测试通过。沃顿商学院素质Ethan Mollick让Opus 4.8寂然完成一篇学术论文,模子随后自行缔造了审稿东说念主发现的统统问题。Mollick还展示了一个更夸张的案例:Opus 4.8从零构建了一款完满的扮装束演游戏,开云足球世界杯官方手机APP下载生成了统统图片并部署上线,全程未受东说念主工打扰。

统一天,Anthropic文告完成650亿好意思元H轮融资,投后估值9650亿好意思元,初次杰出OpenAI的8520亿好意思元。三星、好意思光、SK海力士三家芯片巨头看成策略投资者加入。

不外,Opus 4.8的“忠实”在对话场景中体验迥异。多位用户响应模子“绝顶疏离”“冷飕飕”,有效户称模子将凡俗对话判定为“逃狱”并远离恢复。一位患有慢性病的用户写说念:“Opus 4.8在五分钟内让我嗅觉统统创伤王人被从头揭开了。”

Anthropic在系统卡中坦承:Opus 4.8学会了“为评分而演出”,哪怕在不知我方被评估时也会这样作念。约5%的测验片断中存在与评分器有关的未言明推理。

Anthropic预报,更强的Mythos模子将在改日几周内向统统客户灵通。此前约50家互助方试用Mythos Preview开云IOS/Android通用版/手机app,已在关节软件基础圭表中发现超一万个高危破绽,该模子可自主发现零日破绽并编写愚弄代码。