一、AI 模型发布 / 开源动态
1. OrcaK/Ornith-1.0 开源模型家族发布,专注 Agentic Coding
- 事件内容:Ornith-1.0 开源模型家族发布,专注智能体编程(Agentic Coding),覆盖 9B Dense、31B Dense、35B MoE 及 397B MoE 全参数规模。在 Agent Coding 基准上达开源顶尖水平:SWE-Bench Verified 82.4、SWE-Bench Pro 62.2、Terminal-Bench 2.1 77.5。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架与最终解决方案。全系列 MIT 开源,提供 GGUF 版本,支持 Ollama、Unsloth 等本地运行。
- 值得关注的原因:Ornith-1.0 是少数同时覆盖从端侧(9B)到云端(397B MoE)全尺寸的智能体编程开源模型家族,且 MIT 协议可商用。对于想要在本地/私有环境部署 AI 编程能力的团队,这是目前开源基准最高的选择。397B MoE 的 SWE-Bench Verified 82.4 已逼近闭源顶尖水平。
2. IBM 首度推出亚纳米级芯片技术(0.7nm)
- 事件内容:IBM 于 2026年6月25日发布全球首款亚纳米级芯片技术,采用 0.7nm(7 埃米)节点与全新三维纳米堆叠(nanostack)架构。指甲盖大小的芯片集成近 1000 亿个晶体管,密度约为 IBM 2021年 2nm 芯片的两倍。相比 2nm 芯片,性能最高提升 50%,能效最高提升 70%。纳米堆叠架构还实现 SRAM 面积缩减 40%,有助于支撑先进 AI 工作负载的高带宽需求。该技术已在 VLSI 2026 会议上验证,IBM 预计 5 年内量产。
- 值得关注的原因:AI 算力竞争已从"多少 nm"进入"亚纳米"阶段。IBM 的 0.7nm 技术如果按期量产,将显著提升云端 AI 训练的算力上限,同时降低推理成本。对于依赖大规模 GPU 集群的 AI 公司,新一代芯片的能效提升 70% 意味着巨大的运营成本优势。
二、AI 产品更新
3. Runway 发布 Agent 2.0——营销人员的 AI 智能体
- 事件内容:Runway 发布 Agent 2.0,帮助营销人员创建、测试和优化广告、视频及营销活动。品牌营销人员可在对话中开发活动概念、生成变体并自动本地化;绩效营销人员可上传创意并导入 Meta、YouTube、TikTok 或 Google 广告数据,由 Agent 分析后生成下一轮待测广告。社交媒体营销人员可一次性生成一周内容,自动裁切为 9:16、16:9、1:1 等格式;产品营销人员可借助 Agent 确定定位角度并构建活动资产。Agent 2.0 面向所有用户开放。
- 值得关注的原因:这是 AI 视频生成工具从"创作辅助"向"全流程营销智能体"跃迁的标志性产品。过去营销团队需要分别使用多个工具(创意生成、A/B 测试、多平台适配),现在 Runway Agent 2.0 试图用一个对话式界面串联全流程。对电商/品牌团队而言,这意味着可以用更少的人力完成跨平台、多版本的营销内容生产。
4. OpenAI 内部报告:智能体 Codex 如何改变工作#
- 事件内容:OpenAI 在 2025年8月至 2026年6月间观察到,智能体产品 Codex 取代 ChatGPT 成为主要工作工具,各部门输出 token 中 Codex 占比从不足 10% 升至 99.8%。80.6% 个体用户曾发起预计等效人类工作时间超 30 分钟的请求,70.2% 超 1 小时,25.6% 超 8 小时;99 百分位用户每日生成超 60 小时 agent turns。非开发者用户增长迅猛:个体用户增长 137 倍,组织用户增长 189 倍。Legal、Finance、Recruiting 部门在 2026年4月前后跨过 Codex 使用过半拐点,平均每位律师或招聘人员超 85% 输出 token 来自 Codex。
- 值得关注的原因:这份内部报告是目前最权威的"AI 智能体在企业中真实扩散速度"的量化记录。数据显示:智能体已从开发者工具扩散到法务、财务、招聘等非技术部门,且使用强度(等效人类工作时间)远超预期。对于正在评估"要不要引入 AI 智能体"的企业管理者,这份报告提供了参考基准。
5. Claude Code v2.1.193 发布,自动模式全面升级
- 事件内容:Claude Code v2.1.193 新增
autoMode.classifyAllShell设置,将全部 Bash/PowerShell 命令经自动模式分类器处理。自动模式拒绝原因现加入转录、拒绝提示及/permissions页面。新增claude_code.assistant_responseOpenTelemetry 日志事件。Bash 模式支持实时文件路径自动补全;MCP 服务器需认证时显示启动提示。新增空闲后台 shell 命令自动内存压力回收(可禁用)。修复了多个 bug 并改进了后台 agent 启动指令。 - 值得关注的原因:Claude Code 正在快速迭代为"企业级 AI 编程助手",本次更新的 OpenTelemetry 日志和权限管理改进,说明 Anthropic 在主动满足企业合规/审计需求。对于已经在使用 Claude Code 的团队,升级到 v2.1.193 可以显著提升大项目中的使用体验。
三、AI 行业动态#
6. Anthropic 称阿里巴巴非法获取了 Claude AI 模型的功能#
- 事件内容:Anthropic 指控阿里巴巴未经授权提取了其 Claude AI 模型的能力。该指控基于 Anthropic 的调查,认为阿里巴巴通过逆向工程或其他手段复制了 Claude 的核心技术。目前阿里巴巴尚未公开回应。此前已有多家 AI 公司指控中国公司通过"模型蒸馏"(distillation)技术复制其模型能力。
- 值得关注的原因:这是继"DeepSeek 被指蒸馏 OpenAI 模型"之后,又一起中美 AI 公司之间关于模型知识产权的重大争议。如果 Anthropic 的指控被证实,可能引发新一轮关于 AI 模型 IP 保护、跨境技术转移监管的讨论。对国内使用 Claude API 的企业,需关注后续是否会影响 API 可用性。
7. 美国政府要求 OpenAI 暂缓 GPT-5.6 广泛发布
- 事件内容:The Information 报道,美国政府因安全顾虑要求 OpenAI 暂缓 GPT-5.6 的广泛发布,改为推出受控预览版。OpenAI 计划先向小部分合作伙伴提供早期访问,并由政府逐客户审批准入。这一非常规做法主要担忧模型在自动化高技能网络工作上的能力:既能帮防御者更快发现漏洞,也可能被攻击者用于加速测试漏洞利用。本周四,CEO Sam Altman 已向员工确认该审批流程。
- 值得关注的原因:这是美国政府首次被曝对 AI 模型发布进行"预防性干预",说明监管机构对"AI 能力跨越某个阈值后可能带来的系统性风险"开始采取实质性行动。GPT-5.6 的延迟发布可能给竞争对手(如 Anthropic、Google)争取到市场窗口期。
四、核心洞察#
智能体(Agent)已从"概念验证"进入"企业生产"阶段。OpenAI 内部数据显示,Codex 在不到一年时间内从"占 token 输出 10%“增长到"占 99.8%",且非开发者用户增长了 137 倍。法务、财务、招聘等部门的智能体采用率同样快速上升,说明 AI 智能体正在成为企业软件的基础设施层。
AI 编程工具的开源生态正在快速成熟。Ornith-1.0 的发布意味着"端侧 9B 参数就能跑高水平的 Agentic Coding"已经成为现实。对于不想依赖第三方 API 的企业,现在可以在本地部署接近商用质量的 AI 编程助手。
营销/电商场景的 AI 化正在加速。Runway Agent 2.0 的发布说明 AI 视频工具正在从"辅助创作"向"自动化营销全流程"演进。对于电商团队,这意味着可以用 AI 智能体完成从创意生成、多平台适配、A/B 测试到效果分析的全链路工作。
AI 模型发布的"安全审查"可能成为新常态。美国政府介入 GPT-5.6 发布的事件表明,当模型能力达到某个阈值后,政府可能开始要求"发布前审查”。这会给 AI 公司的产品节奏带来不确定性,也可能催生新的"AI 安全合规"服务市场。
AI 芯片算力竞争进入"亚纳米"阶段。IBM 的 0.7nm 技术如果如期量产,将显著降低 AI 训练和推理的成本。对于依赖云算力的中小 AI 创业公司,未来 2-3 年内可能迎来一波"算力成本下降"带来的商业模式创新窗口期。
