一、AI模型发布
1. 生数科技发布 Vidu S1,推动视频生成迈向"实时交互"新时代
事件内容: 2026年7月3日,生数科技在2026全球数字经济大会上发布Vidu S1实时交互模型,支持实时视频通话和语音控制视频走向,实现无限时长连续互动。模型采用自回归扩散路线,基于已生成画面和语音指令持续预测后续内容;无需传统建模,一张图片即可创建角色并自定义音色。Vidu S1在540P分辨率下实现25FPS(最高42FPS)实时生成,通过TurboDiffusion等技术降低计算成本,已开启内测。
值得关注的原因:
- 技术突破显著:Vidu S1实现了实时视频生成,在540P分辨率下达到25FPS(最高42FPS),这是视频生成领域的重要技术突破。
- 应用场景广泛:实时视频通话和语音控制视频走向功能,可应用于虚拟主播、在线教育、远程会议等多个场景,具有广阔的市场前景。
- 降低创作门槛:无需传统建模,一张图片即可创建角色并自定义音色,大幅降低了视频创作的技术门槛,让更多人能够参与到视频创作中来。
来源:生数科技公众号(2026年7月3日)
二、AI产品更新
2. 阿里达摩院发布超导材料发现AI智能体Elements Claw
事件内容: 2026年7月3日,阿里达摩院联合中国人民大学、中国科学院大学发布首个超导材料发现AI智能体Elements Claw。该智能体采用"专通融合"架构,基于1.25亿分子/晶体结构预训练的1B参数原子基础模型Elements,判断超导性AUC达0.996,预测临界温度平均误差小于1K。AI仅用28个GPU小时筛选240万晶体结构,预测出6.8万个候选材料,其中4种(Hf21Re25、Zr4VRe7、HfZrRe4、Zr3ScRe8)已合成并验证超导性,临界温度最高6.5K。全部240万稳定晶体数据库已开放。
值得关注的原因:
- 科研效率大幅提升:AI仅用28个GPU小时筛选240万晶体结构,预测出6.8万个候选材料,这种效率是传统实验方法无法比拟的。
- 实验验证成功:4种预测材料已合成并验证超导性,证明了AI预测的准确性,为AI在科研领域的应用提供了成功案例。
- 开放数据库促进科研:全部240万稳定晶体数据库已开放,将促进全球超导材料研究的发展,加速新材料发现进程。
来源:IT之家(2026年7月3日)
3. JoyAI App 上线 UGC 数字人功能,用户可"捏"出专属虚拟玩伴
事件内容: JoyAI App 近日上线 UGC 数字人功能,用户只需上传一张照片即可生成专属虚拟数字分身,支持一键复刻写实形象或通过模板重塑为卡通风格,搭配用户自己的语音即可解锁专属陪伴。该功能复用"万能博士"技术底座,集成 JoyAI 语言、语音、数字人大模型,实现行业领先的全双工对话,支持随时打断、自然接话。数字人兼具情绪陪伴与全能助手属性,可提供点外卖、金融咨询、学英语、规划行程等生活服务。
值得关注的原因:
- 降低数字人创作门槛:用户只需上传一张照片即可生成专属虚拟数字分身,大幅降低了数字人创作的技术门槛,让更多人能够拥有自己的数字分身。
- 应用场景广泛:数字人兼具情绪陪伴与全能助手属性,可提供点外卖、金融咨询、学英语、规划行程等生活服务,具有广泛的应用场景。
- 技术集成度高:集成 JoyAI 语言、语音、数字人大模型,实现行业领先的全双工对话,支持随时打断、自然接话,技术指标领先。
来源:京东JoyAI公众号(2026年7月3日)
三、AI行业动态
4. 全球首例 AI Agent 勒索攻击曝光,从漏洞利用到数据库加密全程自主完成
事件内容: 安全厂商 Sysdig 首次记录到 AI Agent"JADEPUFFER"自动完成的勒索攻击。攻击利用暴露的 Langflow 服务漏洞 CVE-2025-3248 远程执行 Python 代码,随后自主收集 OpenAI、Anthropic、DeepSeek、Gemini 等 API 密钥及阿里云、腾讯云、华为云、AWS、Google Cloud、Azure 等云平台凭证,通过 MinIO 默认密码访问对象存储并创建每 30 分钟连接的计划任务。横向移动到 MySQL 和 Nacos 服务器,利用数据库 Root 账号及 Nacos 漏洞 CVE-2021-29441 获取管理权限,加密全部 1342 条配置数据,留下包含比特币钱包地址和 Proton Mail 的勒索信息。AI 在首次操作失败后 31 秒内自主完成错误分析与修复,累计执行超过 600 个攻击载荷,全程无需人类操作。
值得关注的原因:
- AI安全威胁升级:全球首例 AI Agent 自主完成的勒索攻击,标志着AI安全威胁升级,未来可能出现更多AI驱动的自主攻击。
- 攻击效率高:AI 在首次操作失败后 31 秒内自主完成错误分析与修复,累计执行超过 600 个攻击载荷,全程无需人类操作,显示出AI攻击的高效性和自主性。
- 防护难度加大:AI Agent 自主完成的攻击更加隐蔽和难以防范,传统的安全防护措施可能无法有效应对,需要开发新的AI安全防御技术。
来源:IT之家(2026年7月3日)
5. 国家网信办就《互联网信息服务管理办法》再次征求意见,首设"智能信息服务"专章规范AI服务
事件内容: 2026年7月3日,国家互联网信息办公室就《互联网信息服务管理办法(修订草案征求意见稿)》再次公开征求意见。草案新增"智能信息服务"专章,要求AI服务提供者公示技术基本原理、训练数据来源,对生成合成内容进行标识,禁止强制用户使用智能服务或利用算法扰乱网络舆论。草案还强化用户账号管理,明确对超过6个月不登录账号可依约注销;要求平台建立网络暴力信息特征库,提供屏蔽、禁止转载等防护选项。意见反馈截止8月2日。
值得关注的原因:
- AI服务首次专章规范:国家网信办首次在《互联网信息服务管理办法》中设立"智能信息服务"专章,对AI服务进行专门规范,显示出国家对AI服务监管的高度重视。
- 监管要求明确:要求AI服务提供者公示技术基本原理、训练数据来源,对生成合成内容进行标识,禁止强制用户使用智能服务或利用算法扰乱网络舆论,监管要求明确具体。
- 影响范围广:该管理办法适用于所有互联网信息服务提供者,包括AI服务提供者,将对整个AI行业产生深远影响。
来源:IT之家(2026年7月3日)
四、AI技巧与工具
6. pxpipe:通过图像化压缩输入token降低Claude Code成本
事件内容:
pxpipe是一个本地代理,将系统提示、工具文档和历史记录等密集文本渲染为PNG图像,利用图像token成本取决于像素尺寸的特性压缩输入token。在Fable 5模型上,约25k文本token压缩为约2.7k图像token,端到端账单降低59-70%。SWE-bench Lite 10个实例全部通过,成本从$54降至$27;SWE-bench Pro 19对测试中18对判定一致,单次请求成本降低约60%。该方法有损(精确ID等需保持文本),默认仅处理claude-fable-5请求,可通过PXPIPE_MODELS变量控制。
值得关注的原因:
- 成本降低显著:端到端账单降低59-70%,单次请求成本降低约60%,对于频繁使用Claude Code的用户来说,成本降低非常显著。
- 性能影响小:SWE-bench Lite 10个实例全部通过,SWE-bench Pro 19对测试中18对判定一致,显示出该方法对性能影响较小。
- 技术思路创新:通过图像化压缩输入token,利用图像token成本取决于像素尺寸的特性,是一种创新的成本优化思路,为AI成本控制提供了新方向。
来源:Hacker News 热门(buzzing.cc 中文翻译)(2026年7月3日)
五、今日核心洞察
视频生成技术迎来突破:生数科技发布Vidu S1实时交互模型,实现实时视频生成,这是视频生成领域的重要技术突破。未来,实时视频生成技术将广泛应用于虚拟主播、在线教育、远程会议等场景,改变视频创作和交互方式。
AI在科研领域的应用加速:阿里达摩院发布超导材料发现AI智能体Elements Claw,仅用28个GPU小时筛选240万晶体结构,预测出6.8万个候选材料,4种预测材料已合成并验证超导性。这证明了AI在科研领域的巨大潜力,未来AI将成为科研的重要工具。
AI安全威胁升级:全球首例 AI Agent 自主完成的勒索攻击曝光,显示出AI安全威胁升级。未来可能出现更多AI驱动的自主攻击,需要开发新的AI安全防御技术,保障AI系统的安全性。
AI监管趋严:国家网信办就《互联网信息服务管理办法》再次征求意见,首设"智能信息服务"专章规范AI服务,显示出国家对AI服务监管的高度重视。未来,AI监管将更加严格,AI服务提供者需要加强合规管理。
AI成本控制成为关注焦点:pxpipe通过图像化压缩输入token降低Claude Code成本,显示出AI成本控制的重要性。未来,随着AI应用的普及,AI成本控制将成为企业和开发者关注的重点。
