覆盖大模型进展、开源工具、行业动态,帮你省下筛选的时间,把精力留给真正重要的事。
xAI 发布的 Grok 3 在 MMLU、GPQA 等基准测试中刷新纪录,超越 GPT-4o 与 Gemini 2.0 Ultra。其思维链推理能力显著增强,在数学与代码任务上表现尤为突出。
OpenAI、微软、软银联合启动史上最大AI基础设施投资,计划未来4年投入千亿美元建设AI算力集群。
上下文窗口扩展至200k token,多模态理解能力大幅提升,推理速度较GPT-4快3倍。
Google I/O 发布,Ultra版本在复杂推理任务中超越GPT-5,多语言支持达100+语言。
Meta正式开源4050亿参数版本,在多项基准上逼近GPT-4 Turbo,企业可私有部署。
国产开源推理旗舰,MoE架构,128k上下文,数学与代码能力对标GPT-4o,开源可商用。
可在手机本地运行的Gemini Nano第三代,内存占用压缩50%,离线多模态理解可用。
OpenAI o3推理系列最小成员上线,API成本降至GPT-4o的1/10,适合生产级推理任务。
AI代码编辑器集成Claude 4 Sonnet,Tab智能补全准确率大幅提升,支持项目级代码理解。
基于实时网络的AI搜索引擎,支持Deep Research模式,可生成完整研究报告。
Stable Diffusion原团队新作品,真实感图像生成超越Midjourney V7,开源可商用。
本地大模型运行工具,支持Llama4/Grok3等主流模型,一键启动,Mac/Windows/Linux。
DeepMind提出在推理阶段动态分配算力,测试时Scaling Law或将成为下一代模型竞争焦点。
OpenAI公开超级对齐技术细节,用小模型监督大模型的对齐方法正式开源,降低安全研究门槛。
字节跳动提出端到端原生多模态模型,文本/图像/视频/音频统一表征,无缝融合理解与生成。