量子芯片与多模态模型成核心焦点
Willow, Our Quantum Chip
Google发布Willow量子芯片,推动量子计算实用化进程
Sora is here
OpenAI正式推出Sora视频生成模型,多模态AI能力迈上新台阶
Gemini 2.0: our new AI model for the agentic era
Google DeepMind升级Gemini至2.0,聚焦智能体时代的任务执行能力
GM exits robotaxi market, will bring Cruise operations in house
通用汽车终止Cruise外部融资,机器人出租车商业化遇冷
Google Willow芯片的发布标志着量子硬件向实用化迈进,未来可能解决AI无法处理的复杂优化、材料模拟问题,为AI突破提供新算力基础。
Sora(视频)、Trellis(3D网格)、BlenderGPT(3D建模交互)的出现,说明多模态不再局限于图文,而是向动态视频、三维空间及自然语言控制延伸,扩展AI应用场景。
Phi-4(小模型复杂推理)、LLM内存优化技术(降75%成本)的进展,表明小模型在特定任务上性能接近大模型,且部署门槛更低,将推动AI向边缘设备普及。
BlenderGPT
自然语言控制Blender建模,降低3D创作技术门槛
Trellis – 3D mesh generative model
生成高质量结构化3D网格,支持复杂形状的自动化设计
Phi-4: Microsoft's Newest Small Language Model
13B参数小模型,复杂推理能力媲美大模型,资源需求仅为1/10
New LLM optimization technique
内存优化技术减少LLM显存占用75%,支持低配置设备运行大模型
Byte Latent Transformer
Meta研究:用字节级patch替代token,提升序列建模效率与扩展性
大厂在前沿技术领域竞争白热化:OpenAI以Sora巩固多模态领先地位,Google则通过Willow(量子)+Gemini 2.0(agentic)双线出击,试图在算力与模型架构上同时突破。而GM退出robotaxi市场的事件,反映出自动驾驶商业化仍面临技术成熟度、成本控制与监管的多重挑战,落地节奏可能慢于预期。此外,OpenAI与Elon Musk的历史争议再次被提及,凸显AI公司早期治理结构对长期发展的深远影响。
量子芯片、Sora、Gemini 2.0、多模态、小模型、LLM优化、3D生成、agentic
注:所有链接均指向原文,点击可查看详细内容。
阅读时间约3分钟
数据来源:2024.12.09-12.16 AI领域热点新闻
撰写:AI技术周报专家团队
© 2024 AI技术周报
(注:最后一段版权信息可选,若不需要可删除)