大模型迭代与开源基建推进成本周AI核心
Claude 3.7 Sonnet and Claude Code
提升代码推理与多模态效率,重新定义大模型实用化基准
GPT-4.5
优化多模态理解与上下文处理,引发"前沿模型"争议
Apple says it will add 20k jobs, spend $500B, produce AI servers in US
推动美国本土AI硬件产能,缓解供应链依赖
DeepSeek open source DeepEP – library for MoE training and Inference
降低MoE模型开发门槛,加速高效大模型落地
China tells its AI leaders to avoid U.S. travel over security concerns
加剧AI地缘割裂,阻碍跨区域研究协作
FFT替代自注意力成高效模型新方向
《The FFT Strikes Back》论文提出的方法,在保持性能的同时降低计算复杂度,为大模型轻量化提供新思路
AI设计硬件突破人类理解边界
AI生成芯片结构超越传统范式,性能提升显著但可解释性降低,预示硬件优化进入"黑箱"时代
开源MoE基建工具链爆发
DeepSeek等厂商推出MoE训练/推理库,解决部署难题,加速产业应用
DeepEP
一站式MoE训练推理库,支持高效并行与动态路由
FlashMLA
Hopper GPU专用MLA解码 kernel,大幅提升推理速度
DeepGEMM
轻量高效FP8 GEMM实现,支持细粒度缩放优化
3FS
AI workload优化文件系统,提升大规模数据读写效率
OlmOCR
开源PDF文本提取工具,基于视觉语言模型超越传统OCR精度
Apple的5000亿美元AI服务器投资标志着科技巨头向AI硬件垂直整合的深度迈进,既为美国本土AI产业注入动力,也反映出对供应链不确定性的应对。Microsoft取消部分数据中心租约则暗示其正在调整基建布局,转向更高效的新型硬件或云原生架构。
地缘政治因素持续影响AI发展:中国对AI人才赴美旅行的警示,加上技术出口限制,可能导致中美在核心技术研发上进一步分化。这种割裂不仅减缓全球AI安全标准统一进程,也可能错失跨文化协作的创新机遇。