Pablo早报

2026-05-11

AI 科技早报 · 2026-05-11

今日要闻

1. 🔥 Meta 发布 LLaMA 4.5 "Shepherd":120B 开源模型匹敌 GPT-5

Meta 发布 LLaMA 4.5 "Shepherd"——120B 参数、256K 上下文窗口的开源大模型,多项基准测试与 GPT-5 和 Claude 4 持平。

关键细节:

— 来源:VentureBeat | Meta Research | Hugging Face


2. 🔥 Anthropic 完成 $80 亿融资,估值达 $9500 亿

Anthropic 官宣完成新一轮 $80 亿融资,由 Google 和 Lightspeed 联合领投,估值达到 $9500 亿。

关键细节:

— 来源:Financial Times | Nikkei Asia | The Verge


3. 🔥 欧洲议会通过 AI 责任指令:高风险 AI 部署者承担严格责任

欧洲议会投票通过《AI 责任指令》(AI Liability Directive),要求高风险 AI 系统的部署者承担严格责任,举证责任倒置。

关键细节:

— 来源:Euronews | Politico EU


4. 🔥 Perplexity AI 完成 $5 亿融资,估值 $150 亿

Perplexity AI 宣布完成 $5 亿融资,由软银愿景基金 2 期领投,估值达 $150 亿。

关键细节:

— 来源:Bloomberg


模型与基础设施

OpenAI 发布 GPT-5 mini "Flash" 模型

OpenAI 推出 GPT-5 的轻量变体 Flash,专为低延迟应用设计。推理能力与 GPT-5 相当,但成本降低 40%。5 月 12 日起逐步开放。同期推出企业级代码生成产品 Codex Pro($200/座/月),支持基于公司代码库的微调与数据隔离保障。
— 来源:TechCrunch | VentureBeat

Google 发布 Gemini 2.5 "Turbo" 与 Med-Gemini-2

Gemini 2.5 Turbo 是 2.5 Ultra 的蒸馏版本,128K 上下文,针对端侧和边缘推理优化,通过 Vertex AI 提供。DeepMind 同日发布 Med-Gemini-2,USMLE Step 3 准确率 92.4%,领先此前最佳 5 个百分点,权重对研究用途开放。
— 来源:ZDNet | Ars Technica

xAI Grok 4.3 "Vulcan" 更新 + API 开放

Grok 4.3 推出 Vulcan 更新,改善多轮对话,SimpleQA 准确率 89.7%,新增自动报告生成模式。xAI 同时向第三方开发者开放 API,定价 $0.25/M 输入 token。首批应用包括代码助手和客服机器人。
— 来源:The Verge | TechCrunch

Nvidia 公布 Vera Rubin GPU 架构细节

Nvidia 首次公开下一代 GPU 架构 Vera Rubin 完整规格:3nm 制程,能效比 Blackwell 提升 5 倍,计划 H2 2027 量产。AWS 同日推出 Trainium 3 预览版(吞吐量 4x Trainium 2),Google Cloud 开启 Axion TPU(Arm 架构,性价比提升 60%)预览。
— 来源:AnandTech | AWS Blog | The Register

Cerebras 将为沙特阿美建造全球最大 AI 集群

Cerebras 宣布为沙特阿美建造 1.28 亿核的 AI 集群,专用于气候建模和油气勘探。此前 Cerebras 在超大规模 AI 训练领域已有多项部署。
— 来源:Wired

Azure AI Model Garden 新增 40+ 模型

微软 Azure AI 的"模型花园"新增 40 多个模型,包括 LLaMA 4.5、Mistral Large 3、Jamba 1.8 等。Microsoft Copilot for Security 同步正式上线。
— 来源:Ars Technica | Microsoft Security Blog


AI 应用与产品

开发工具:Copilot Workspace、Cursor Agentic Debugging、Replit Ghostwriter 2.0

GitHub Copilot 推出 Workspace Mode 公测版,支持跨整个仓库的多文件编辑。Cursor 发布 Agentic Debugging(调试 AI),可自主设置断点并修复运行时错误。Replit 推出 Ghostwriter 2.0,从自然语言生成全栈应用并支持持久化数据库。
— 来源:GitHub Blog | TechCrunch | The Verge

Adobe Firefly Video 2.0 公开测试

Adobe 发布 Firefly Video 2.0 公开测试版,支持最长 2 分钟视频片段,物理模拟效果显著改善。通过 Creative Cloud 订阅可使用。
— 来源:Adobe Blog | Wired

Runway Gen-5 Alpha:实时视频生成

Runway 发布 Gen-5 Alpha,支持 1080p 30fps 实时视频生成,最长 10 秒。已开放候补名单。这是视频生成领域首次实现实时推理。
— 来源:VentureBeat

YouTube 推出 AI 内容强制标签

YouTube 宣布将于 6 月 1 日起要求创作者标注包含合成内容的视频。未标注将面临限流或下架处理。
— 来源:YouTube Blog

Apple Intelligence 登陆 Vision Pro

Apple Intelligence 扩展至 Vision Pro:Persona 头像获得实时面部动画,Siri 获得多模态理解能力(摄像头+语音)。同场苹果 ML 团队发表联邦学习论文,用户数据保持在设备端。
— 来源:Bloomberg | Apple ML Research

Meta AI 为 Ray-Ban 眼镜增加持久记忆

Meta AI 为 Ray-Ban 智能眼镜加入跨会话持久记忆能力,包括视觉上下文。仅限选择加入,数据在设备端加密。
— 来源:The Verge

其他产品更新


行业与投资

大额融资

交易与合作

— 来源:Bloomberg | Reuters | TechCrunch | The Information


研究与突破

DeepMind 与 MIT 发布"神经记忆 Transformer"

结合 Transformer 架构与可微分记忆库,使模型在推理时能回忆起特定训练样本。长上下文问答准确率 87%。论文发表于 MIT News。
— 来源:MIT News

Stanford 发布 Sparse MoE-128B 基准研究

研究显示 16 专家 MoE 模型仅用 20% 计算量即可匹敌密集 128B 模型性能。论文已被 ICML 接收。
— 来源:arXiv

OpenAI 发布"Scaling Test-Time Compute"论文

证明在推理时投入更多计算(CoT、回溯等)比扩大预训练规模效果更好。或推动行业从"更大模型"转向"更聪明推理"。
— 来源:OpenAI Blog

DeepMind AlphaProof 3 攻克数学难题

AI 在 Nature 发表成果:发现一类全新的丢番图方程解,该问题已有 5 亿年未被人类解决(注:指古数学问题)。
— 来源:Nature


政策与社会

美国参议院 AI 工作组发布劳动力报告

建议拨款 $100 亿用于再培训计划,为避免 AI 替代裁员的企业提供税收抵免。
— 来源:The Hill

中国出台 AI 生成内容新规

要求在中国部署的模型对所有合成文本、图像和视频添加水印,违规将面临处罚。
— 来源:Reuters

加州 AI 安全法案 SB-1047 缩减后复活

新版本仅针对"灾难性风险"模型(门槛:训练成本 $100 亿以上)。
— 来源:CalMatters

FTC 对 RefaceAI 处以 $500 万罚款

因非自愿深度伪造应用违规,成为 FTC 新 AI 指南下首例重大执法行动。
— 来源:The Verge

英国在旧金山设立 AI 安全研究所分所

20 名研究员常驻旧金山,评估美国封闭源前沿模型的安全性。
— 来源:BBC

AI 生成钓鱼攻击同比增长 300%

Zscaler 报告揭示 LLM 被大规模用于个性化鱼叉式钓鱼邮件生成。
— 来源:Zscaler Blog


其他值得关注的动态