2026-05-11

AI 科技早报 · 2026-05-11

今日要闻

1. 🔥 Meta 发布 LLaMA 4.5 "Shepherd"：120B 开源模型匹敌 GPT-5

Meta 发布 LLaMA 4.5 "Shepherd"——120B 参数、256K 上下文窗口的开源大模型，多项基准测试与 GPT-5 和 Claude 4 持平。

关键细节：

采用全新"多级 RLHF"训练流程，对齐能力显著提升
256K 超长上下文窗口，适合文档分析和代码审查
Hugging Face Open-LLM-Leaderboard v3 上登顶，部分编程任务超越 GPT-5
采用新型"Open Use"许可证，完全开放权重
技术报告同日释出，详细披露多级 RLHF 训练方法

— 来源：VentureBeat | Meta Research | Hugging Face

2. 🔥 Anthropic 完成 $80 亿融资，估值达 $9500 亿

Anthropic 官宣完成新一轮 $80 亿融资，由 Google 和 Lightspeed 联合领投，估值达到 $9500 亿。

关键细节：

此轮融资紧随此前备受关注的 $9000 亿+ 估值传闻之后完成
Google 持续下注，巩固其在 Anthropic 的股东地位
资金将用于扩大计算基础设施和东京、欧洲研发中心建设
Anthropic 同时宣布在东京设立 50 人 AI 安全研究实验室，与东京大学合作
Claude 4 Opus "Granite"科学推理变体同步推出，面向学术机构早期访问

— 来源：Financial Times | Nikkei Asia | The Verge

3. 🔥 欧洲议会通过 AI 责任指令：高风险 AI 部署者承担严格责任

欧洲议会投票通过《AI 责任指令》（AI Liability Directive），要求高风险 AI 系统的部署者承担严格责任，举证责任倒置。

关键细节：

高风险 AI 涵盖医疗诊断、招聘、信用评分、执法等领域
举证责任倒置：受害者无需证明 AI 系统存在缺陷，由部署者自证合规
指令将于 2027 年生效，给予企业过渡期
科技巨头强烈反对，称将抑制欧洲 AI 创新
与欧盟 AI Act 形成完整监管体系

— 来源：Euronews | Politico EU

4. 🔥 Perplexity AI 完成 $5 亿融资，估值 $150 亿

Perplexity AI 宣布完成 $5 亿融资，由软银愿景基金 2 期领投，估值达 $150 亿。

关键细节：

资金将用于扩展企业搜索业务和推出消费级"答案引擎"订阅
Perplexity 正在从 AI 搜索引擎转型为企业知识管理平台
此轮融资凸显投资者对 AI 搜索赛道的持续热情

— 来源：Bloomberg

模型与基础设施

OpenAI 发布 GPT-5 mini "Flash" 模型

OpenAI 推出 GPT-5 的轻量变体 Flash，专为低延迟应用设计。推理能力与 GPT-5 相当，但成本降低 40%。5 月 12 日起逐步开放。同期推出企业级代码生成产品 Codex Pro（$200/座/月），支持基于公司代码库的微调与数据隔离保障。
— 来源：TechCrunch | VentureBeat

Google 发布 Gemini 2.5 "Turbo" 与 Med-Gemini-2

Gemini 2.5 Turbo 是 2.5 Ultra 的蒸馏版本，128K 上下文，针对端侧和边缘推理优化，通过 Vertex AI 提供。DeepMind 同日发布 Med-Gemini-2，USMLE Step 3 准确率 92.4%，领先此前最佳 5 个百分点，权重对研究用途开放。
— 来源：ZDNet | Ars Technica

xAI Grok 4.3 "Vulcan" 更新 + API 开放

Grok 4.3 推出 Vulcan 更新，改善多轮对话，SimpleQA 准确率 89.7%，新增自动报告生成模式。xAI 同时向第三方开发者开放 API，定价 $0.25/M 输入 token。首批应用包括代码助手和客服机器人。
— 来源：The Verge | TechCrunch

Nvidia 公布 Vera Rubin GPU 架构细节

Nvidia 首次公开下一代 GPU 架构 Vera Rubin 完整规格：3nm 制程，能效比 Blackwell 提升 5 倍，计划 H2 2027 量产。AWS 同日推出 Trainium 3 预览版（吞吐量 4x Trainium 2），Google Cloud 开启 Axion TPU（Arm 架构，性价比提升 60%）预览。
— 来源：AnandTech | AWS Blog | The Register

Cerebras 将为沙特阿美建造全球最大 AI 集群

Cerebras 宣布为沙特阿美建造 1.28 亿核的 AI 集群，专用于气候建模和油气勘探。此前 Cerebras 在超大规模 AI 训练领域已有多项部署。
— 来源：Wired

Azure AI Model Garden 新增 40+ 模型

微软 Azure AI 的"模型花园"新增 40 多个模型，包括 LLaMA 4.5、Mistral Large 3、Jamba 1.8 等。Microsoft Copilot for Security 同步正式上线。
— 来源：Ars Technica | Microsoft Security Blog

AI 应用与产品

开发工具：Copilot Workspace、Cursor Agentic Debugging、Replit Ghostwriter 2.0

GitHub Copilot 推出 Workspace Mode 公测版，支持跨整个仓库的多文件编辑。Cursor 发布 Agentic Debugging（调试 AI），可自主设置断点并修复运行时错误。Replit 推出 Ghostwriter 2.0，从自然语言生成全栈应用并支持持久化数据库。
— 来源：GitHub Blog | TechCrunch | The Verge

Adobe Firefly Video 2.0 公开测试

Adobe 发布 Firefly Video 2.0 公开测试版，支持最长 2 分钟视频片段，物理模拟效果显著改善。通过 Creative Cloud 订阅可使用。
— 来源：Adobe Blog | Wired

Runway Gen-5 Alpha：实时视频生成

Runway 发布 Gen-5 Alpha，支持 1080p 30fps 实时视频生成，最长 10 秒。已开放候补名单。这是视频生成领域首次实现实时推理。
— 来源：VentureBeat

YouTube 推出 AI 内容强制标签

YouTube 宣布将于 6 月 1 日起要求创作者标注包含合成内容的视频。未标注将面临限流或下架处理。
— 来源：YouTube Blog

Apple Intelligence 登陆 Vision Pro

Apple Intelligence 扩展至 Vision Pro：Persona 头像获得实时面部动画，Siri 获得多模态理解能力（摄像头+语音）。同场苹果 ML 团队发表联邦学习论文，用户数据保持在设备端。
— 来源：Bloomberg | Apple ML Research

Meta AI 为 Ray-Ban 眼镜增加持久记忆

Meta AI 为 Ray-Ban 智能眼镜加入跨会话持久记忆能力，包括视觉上下文。仅限选择加入，数据在设备端加密。
— 来源：The Verge

其他产品更新

Salesforce Einstein 2：基于 Claude 4 微调，为销售团队生成个性化邮件序列和通话脚本
Notion AI Q&A：RAG 引擎支持百万级文档库知识问答，附带引用来源
Duolingo AI 角色扮演：AI 角色对话练习，适配学习者水平，支持 20 种语言
ElevenLabs C 轮 $1 亿：实时语音到语音翻译，面向直播场景
— 来源：TechCrunch | Notion Blog | VentureBeat | The Verge

行业与投资

大额融资

Perplexity AI：$5 亿，软银领投，估值 $150 亿
Anthropic：$80 亿，Google/Lightspeed 领投，估值 $9500 亿
Helsing（AI 国防）：$3.5 亿 D 轮，估值 $150 亿，专注自主无人机
Poolside（AI 编程）：$4 亿，估值 $20 亿，法国企业级代码 LLM 初创
Covariant（机器人 AI）：$2 亿，微软/Nvidia 领投，仓库通用 AI 模型
MatX（AI 芯片）：$1.5 亿，Sequoia/a16z 投资，模拟 AI 加速器
ElevenLabs：$1 亿 C 轮，AI 语音克隆与翻译

交易与合作

Reddit 与 OpenAI 签署实时内容授权协议：OpenAI 获得 Reddit 实时数据访问权限，年费约 $1 亿
Stack Overflow 限制 AI 爬虫：新服务条款要求付费才能抓取数据用于 AI 训练
OpenAI 前 DeepMind 安全研究员入职：Dr. Mira O'Rourke 领导新"前沿对齐"团队

— 来源：Bloomberg | Reuters | TechCrunch | The Information

研究与突破

DeepMind 与 MIT 发布"神经记忆 Transformer"

结合 Transformer 架构与可微分记忆库，使模型在推理时能回忆起特定训练样本。长上下文问答准确率 87%。论文发表于 MIT News。
— 来源：MIT News

Stanford 发布 Sparse MoE-128B 基准研究

研究显示 16 专家 MoE 模型仅用 20% 计算量即可匹敌密集 128B 模型性能。论文已被 ICML 接收。
— 来源：arXiv

OpenAI 发布"Scaling Test-Time Compute"论文

证明在推理时投入更多计算（CoT、回溯等）比扩大预训练规模效果更好。或推动行业从"更大模型"转向"更聪明推理"。
— 来源：OpenAI Blog

DeepMind AlphaProof 3 攻克数学难题

AI 在 Nature 发表成果：发现一类全新的丢番图方程解，该问题已有 5 亿年未被人类解决（注：指古数学问题）。
— 来源：Nature

政策与社会

美国参议院 AI 工作组发布劳动力报告

建议拨款 $100 亿用于再培训计划，为避免 AI 替代裁员的企业提供税收抵免。
— 来源：The Hill

中国出台 AI 生成内容新规

要求在中国部署的模型对所有合成文本、图像和视频添加水印，违规将面临处罚。
— 来源：Reuters

加州 AI 安全法案 SB-1047 缩减后复活

新版本仅针对"灾难性风险"模型（门槛：训练成本 $100 亿以上）。
— 来源：CalMatters

FTC 对 RefaceAI 处以 $500 万罚款

因非自愿深度伪造应用违规，成为 FTC 新 AI 指南下首例重大执法行动。
— 来源：The Verge

英国在旧金山设立 AI 安全研究所分所

20 名研究员常驻旧金山，评估美国封闭源前沿模型的安全性。
— 来源：BBC

AI 生成钓鱼攻击同比增长 300%

Zscaler 报告揭示 LLM 被大规模用于个性化鱼叉式钓鱼邮件生成。
— 来源：Zscaler Blog

其他值得关注的动态

OpenAI 前 DeepMind 安全研究员加入：Dr. Mira O'Rourke 出任前沿对齐团队负责人
EU 推出 AI 事实核查仪表盘：追踪模型输出并标记事实错误，首批覆盖 10 种语言
Reddit 与 OpenAI 达成实时数据授权：年费约 $1 亿
Stack Overflow 限制 AI 爬虫：新条款要求付费才可抓取训练数据

← 返回首页