✦ 新技术情报聚合

追踪AI浪潮
不让有价值的信息从指缝溜走

覆盖大模型进展、开源工具、行业动态，帮你省下筛选的时间，把精力留给真正重要的事。

🔥 Grok 3 Claude 4 Gemini 2.5 Llama 4 GPT-5 Stable Diffusion 4

本月重点

Grok 3 超越 GPT-4o
开源推理模型新王座

xAI 发布的 Grok 3 在 MMLU、GPQA 等基准测试中刷新纪录，超越 GPT-4o 与 Gemini 2.0 Ultra。其思维链推理能力显著增强，在数学与代码任务上表现尤为突出。

思维链推理多模态开源待定

📊

MMLU 得分

92.4

🧮

GPQA（博士级）

85.1

💻

HumanEval

90.3

🚀

训练算力

10万卡时

行业风向

Stargate Project 5000亿美元AI基建计划

OpenAI、微软、软银联合启动史上最大AI基础设施投资，计划未来4年投入千亿美元建设AI算力集群。

2026年1月基础设施

大模型动态

查看全部 →

闭源旗舰

GPT-5 Turbo 发布

上下文窗口扩展至200k token，多模态理解能力大幅提升，推理速度较GPT-4快3倍。

OpenAI · 2026-05 推荐

闭源旗舰

Gemini 2.5 Ultra 预览

Google I/O 发布，Ultra版本在复杂推理任务中超越GPT-5，多语言支持达100+语言。

Google · 2026-05 推荐

开源

Llama 4 405B 开源

Meta正式开源4050亿参数版本，在多项基准上逼近GPT-4 Turbo，企业可私有部署。

Meta · 2026-04 热点

开源

DeepSeek V4 发布

国产开源推理旗舰，MoE架构，128k上下文，数学与代码能力对标GPT-4o，开源可商用。

深度求索 · 2026-05 推荐

端侧

Gemini Nano 3 上线

可在手机本地运行的Gemini Nano第三代，内存占用压缩50%，离线多模态理解可用。

Google · 2026-04 工具

推理

o3-mini 全面开放

OpenAI o3推理系列最小成员上线，API成本降至GPT-4o的1/10，适合生产级推理任务。

OpenAI · 2026-03 推荐

开源工具 & 平台

查看全部 →

AI编程

Cursor 0.4

AI代码编辑器集成Claude 4 Sonnet，Tab智能补全准确率大幅提升，支持项目级代码理解。

搜索

Perplexity AI Pro

基于实时网络的AI搜索引擎，支持Deep Research模式，可生成完整研究报告。

图像

Flux Pro 1.2

Stable Diffusion原团队新作品，真实感图像生成超越Midjourney V7，开源可商用。

本地部署

Ollama 0.5

本地大模型运行工具，支持Llama4/Grok3等主流模型，一键启动，Mac/Windows/Linux。

论文 & 研究

查看全部 →

基础研究

测试时计算扩展新范式

DeepMind提出在推理阶段动态分配算力，测试时Scaling Law或将成为下一代模型竞争焦点。

DeepMind · 2026-05

安全对齐

超级对齐2.0：弱到强泛化

OpenAI公开超级对齐技术细节，用小模型监督大模型的对齐方法正式开源，降低安全研究门槛。

OpenAI · 2026-04

多模态

原生多模态统一架构

字节跳动提出端到端原生多模态模型，文本/图像/视频/音频统一表征，无缝融合理解与生成。

字节跳动 · 2026-05

近期动态

Grok 3 超越 GPT-4o开源推理模型新王座

Stargate Project 5000亿美元AI基建计划

GPT-5 Turbo 发布

Gemini 2.5 Ultra 预览

Llama 4 405B 开源

DeepSeek V4 发布

Gemini Nano 3 上线

o3-mini 全面开放

Cursor 0.4

Perplexity AI Pro

Flux Pro 1.2

Ollama 0.5

测试时计算扩展新范式

超级对齐2.0：弱到强泛化

原生多模态统一架构

追踪AI浪潮
不让有价值的信息从指缝溜走

Grok 3 超越 GPT-4o
开源推理模型新王座