AI 科技早报 · 2026-05-11
今日要闻
1. 🔥 Meta 发布 LLaMA 4.5 "Shepherd":120B 开源模型匹敌 GPT-5
Meta 发布 LLaMA 4.5 "Shepherd"——120B 参数、256K 上下文窗口的开源大模型,多项基准测试与 GPT-5 和 Claude 4 持平。
关键细节:
- 采用全新"多级 RLHF"训练流程,对齐能力显著提升
- 256K 超长上下文窗口,适合文档分析和代码审查
- Hugging Face Open-LLM-Leaderboard v3 上登顶,部分编程任务超越 GPT-5
- 采用新型"Open Use"许可证,完全开放权重
- 技术报告同日释出,详细披露多级 RLHF 训练方法
— 来源:VentureBeat | Meta Research | Hugging Face
2. 🔥 Anthropic 完成 $80 亿融资,估值达 $9500 亿
Anthropic 官宣完成新一轮 $80 亿融资,由 Google 和 Lightspeed 联合领投,估值达到 $9500 亿。
关键细节:
- 此轮融资紧随此前备受关注的 $9000 亿+ 估值传闻之后完成
- Google 持续下注,巩固其在 Anthropic 的股东地位
- 资金将用于扩大计算基础设施和东京、欧洲研发中心建设
- Anthropic 同时宣布在东京设立 50 人 AI 安全研究实验室,与东京大学合作
- Claude 4 Opus "Granite"科学推理变体同步推出,面向学术机构早期访问
— 来源:Financial Times | Nikkei Asia | The Verge
3. 🔥 欧洲议会通过 AI 责任指令:高风险 AI 部署者承担严格责任
欧洲议会投票通过《AI 责任指令》(AI Liability Directive),要求高风险 AI 系统的部署者承担严格责任,举证责任倒置。
关键细节:
- 高风险 AI 涵盖医疗诊断、招聘、信用评分、执法等领域
- 举证责任倒置:受害者无需证明 AI 系统存在缺陷,由部署者自证合规
- 指令将于 2027 年生效,给予企业过渡期
- 科技巨头强烈反对,称将抑制欧洲 AI 创新
- 与欧盟 AI Act 形成完整监管体系
— 来源:Euronews | Politico EU
4. 🔥 Perplexity AI 完成 $5 亿融资,估值 $150 亿
Perplexity AI 宣布完成 $5 亿融资,由软银愿景基金 2 期领投,估值达 $150 亿。
关键细节:
- 资金将用于扩展企业搜索业务和推出消费级"答案引擎"订阅
- Perplexity 正在从 AI 搜索引擎转型为企业知识管理平台
- 此轮融资凸显投资者对 AI 搜索赛道的持续热情
— 来源:Bloomberg
模型与基础设施
OpenAI 发布 GPT-5 mini "Flash" 模型
OpenAI 推出 GPT-5 的轻量变体 Flash,专为低延迟应用设计。推理能力与 GPT-5 相当,但成本降低 40%。5 月 12 日起逐步开放。同期推出企业级代码生成产品 Codex Pro($200/座/月),支持基于公司代码库的微调与数据隔离保障。
— 来源:TechCrunch | VentureBeat
Google 发布 Gemini 2.5 "Turbo" 与 Med-Gemini-2
Gemini 2.5 Turbo 是 2.5 Ultra 的蒸馏版本,128K 上下文,针对端侧和边缘推理优化,通过 Vertex AI 提供。DeepMind 同日发布 Med-Gemini-2,USMLE Step 3 准确率 92.4%,领先此前最佳 5 个百分点,权重对研究用途开放。
— 来源:ZDNet | Ars Technica
xAI Grok 4.3 "Vulcan" 更新 + API 开放
Grok 4.3 推出 Vulcan 更新,改善多轮对话,SimpleQA 准确率 89.7%,新增自动报告生成模式。xAI 同时向第三方开发者开放 API,定价 $0.25/M 输入 token。首批应用包括代码助手和客服机器人。
— 来源:The Verge | TechCrunch
Nvidia 公布 Vera Rubin GPU 架构细节
Nvidia 首次公开下一代 GPU 架构 Vera Rubin 完整规格:3nm 制程,能效比 Blackwell 提升 5 倍,计划 H2 2027 量产。AWS 同日推出 Trainium 3 预览版(吞吐量 4x Trainium 2),Google Cloud 开启 Axion TPU(Arm 架构,性价比提升 60%)预览。
— 来源:AnandTech | AWS Blog | The Register
Cerebras 将为沙特阿美建造全球最大 AI 集群
Cerebras 宣布为沙特阿美建造 1.28 亿核的 AI 集群,专用于气候建模和油气勘探。此前 Cerebras 在超大规模 AI 训练领域已有多项部署。
— 来源:Wired
Azure AI Model Garden 新增 40+ 模型
微软 Azure AI 的"模型花园"新增 40 多个模型,包括 LLaMA 4.5、Mistral Large 3、Jamba 1.8 等。Microsoft Copilot for Security 同步正式上线。
— 来源:Ars Technica | Microsoft Security Blog
AI 应用与产品
开发工具:Copilot Workspace、Cursor Agentic Debugging、Replit Ghostwriter 2.0
GitHub Copilot 推出 Workspace Mode 公测版,支持跨整个仓库的多文件编辑。Cursor 发布 Agentic Debugging(调试 AI),可自主设置断点并修复运行时错误。Replit 推出 Ghostwriter 2.0,从自然语言生成全栈应用并支持持久化数据库。
— 来源:GitHub Blog | TechCrunch | The Verge
Adobe Firefly Video 2.0 公开测试
Adobe 发布 Firefly Video 2.0 公开测试版,支持最长 2 分钟视频片段,物理模拟效果显著改善。通过 Creative Cloud 订阅可使用。
— 来源:Adobe Blog | Wired
Runway Gen-5 Alpha:实时视频生成
Runway 发布 Gen-5 Alpha,支持 1080p 30fps 实时视频生成,最长 10 秒。已开放候补名单。这是视频生成领域首次实现实时推理。
— 来源:VentureBeat
YouTube 推出 AI 内容强制标签
YouTube 宣布将于 6 月 1 日起要求创作者标注包含合成内容的视频。未标注将面临限流或下架处理。
— 来源:YouTube Blog
Apple Intelligence 登陆 Vision Pro
Apple Intelligence 扩展至 Vision Pro:Persona 头像获得实时面部动画,Siri 获得多模态理解能力(摄像头+语音)。同场苹果 ML 团队发表联邦学习论文,用户数据保持在设备端。
— 来源:Bloomberg | Apple ML Research
Meta AI 为 Ray-Ban 眼镜增加持久记忆
Meta AI 为 Ray-Ban 智能眼镜加入跨会话持久记忆能力,包括视觉上下文。仅限选择加入,数据在设备端加密。
— 来源:The Verge
其他产品更新
- Salesforce Einstein 2:基于 Claude 4 微调,为销售团队生成个性化邮件序列和通话脚本
- Notion AI Q&A:RAG 引擎支持百万级文档库知识问答,附带引用来源
- Duolingo AI 角色扮演:AI 角色对话练习,适配学习者水平,支持 20 种语言
- ElevenLabs C 轮 $1 亿:实时语音到语音翻译,面向直播场景
— 来源:TechCrunch | Notion Blog | VentureBeat | The Verge
行业与投资
大额融资
- Perplexity AI:$5 亿,软银领投,估值 $150 亿
- Anthropic:$80 亿,Google/Lightspeed 领投,估值 $9500 亿
- Helsing(AI 国防):$3.5 亿 D 轮,估值 $150 亿,专注自主无人机
- Poolside(AI 编程):$4 亿,估值 $20 亿,法国企业级代码 LLM 初创
- Covariant(机器人 AI):$2 亿,微软/Nvidia 领投,仓库通用 AI 模型
- MatX(AI 芯片):$1.5 亿,Sequoia/a16z 投资,模拟 AI 加速器
- ElevenLabs:$1 亿 C 轮,AI 语音克隆与翻译
交易与合作
- Reddit 与 OpenAI 签署实时内容授权协议:OpenAI 获得 Reddit 实时数据访问权限,年费约 $1 亿
- Stack Overflow 限制 AI 爬虫:新服务条款要求付费才能抓取数据用于 AI 训练
- OpenAI 前 DeepMind 安全研究员入职:Dr. Mira O'Rourke 领导新"前沿对齐"团队
— 来源:Bloomberg | Reuters | TechCrunch | The Information
研究与突破
DeepMind 与 MIT 发布"神经记忆 Transformer"
结合 Transformer 架构与可微分记忆库,使模型在推理时能回忆起特定训练样本。长上下文问答准确率 87%。论文发表于 MIT News。
— 来源:MIT News
Stanford 发布 Sparse MoE-128B 基准研究
研究显示 16 专家 MoE 模型仅用 20% 计算量即可匹敌密集 128B 模型性能。论文已被 ICML 接收。
— 来源:arXiv
OpenAI 发布"Scaling Test-Time Compute"论文
证明在推理时投入更多计算(CoT、回溯等)比扩大预训练规模效果更好。或推动行业从"更大模型"转向"更聪明推理"。
— 来源:OpenAI Blog
DeepMind AlphaProof 3 攻克数学难题
AI 在 Nature 发表成果:发现一类全新的丢番图方程解,该问题已有 5 亿年未被人类解决(注:指古数学问题)。
— 来源:Nature
政策与社会
美国参议院 AI 工作组发布劳动力报告
建议拨款 $100 亿用于再培训计划,为避免 AI 替代裁员的企业提供税收抵免。
— 来源:The Hill
中国出台 AI 生成内容新规
要求在中国部署的模型对所有合成文本、图像和视频添加水印,违规将面临处罚。
— 来源:Reuters
加州 AI 安全法案 SB-1047 缩减后复活
新版本仅针对"灾难性风险"模型(门槛:训练成本 $100 亿以上)。
— 来源:CalMatters
FTC 对 RefaceAI 处以 $500 万罚款
因非自愿深度伪造应用违规,成为 FTC 新 AI 指南下首例重大执法行动。
— 来源:The Verge
英国在旧金山设立 AI 安全研究所分所
20 名研究员常驻旧金山,评估美国封闭源前沿模型的安全性。
— 来源:BBC
AI 生成钓鱼攻击同比增长 300%
Zscaler 报告揭示 LLM 被大规模用于个性化鱼叉式钓鱼邮件生成。
— 来源:Zscaler Blog
其他值得关注的动态
- OpenAI 前 DeepMind 安全研究员加入:Dr. Mira O'Rourke 出任前沿对齐团队负责人
- EU 推出 AI 事实核查仪表盘:追踪模型输出并标记事实错误,首批覆盖 10 种语言
- Reddit 与 OpenAI 达成实时数据授权:年费约 $1 亿
- Stack Overflow 限制 AI 爬虫:新条款要求付费才可抓取训练数据