"o1" 搜索结果

AI HNAI 新闻与论文，智能精选

中

时间:

今天

3天

7天

30天

全部

来源:

全部

📰HN

📄论文

72 条 · "o1"

Agents, TODOs and Blockchain: Why the Future Will Not Have Programming Languages(ethresear.ch)📰 HN

1 分·kladko1·7 天前·0 评论

AI Agent

本文认为，在人工智能时代，传统编程语言将变得过时或仅存于小众领域，取而代之的是能够根据高层目标描述（TODOs）行动的AI智能体，而非僵化的代码。文章以投资为例，对比了脚本的脆弱性与智能体的自适应行为——智能体可对公司创始人去世等意外事件做出响应。

Smooth ACT policies on the SO101 arm(giacomoran.com)📰 HN

1 分·ran3000·7 天前·0 评论

本文介绍了ACTSmooth，这是一种针对SO101机械臂的自定义ACT策略，通过前缀条件和异步推理消除块间不连续性和延迟停顿，解决了默认实现中的抖动问题。文章解释了跟随器位置噪声和缺乏先前动作信息导致抖动的原因，并描述了实验结果，展示了ACTSmooth在平滑度和延迟鲁棒性方面的改进。

Show HN: Typui.sh – generate skill files for design system specifications(typeui.sh)📰 HN

1 分·elwingo1·9 天前·0 评论

AI Search

这是一个名为Typui.sh的Show HN项目，是一款CLI工具，用于生成设计系统规范的skill文件。它帮助在AI生成的代码上应用一致的设计层，并允许用户将预构建的设计系统引入其项目中。

AI agents inside M365 and Google Workspace(o11.ai)📰 HN

1 分·aoztanir·12 天前·1 评论

AI AgentCode & Development

本文宣布o11的AI代理已集成到Microsoft 365和Google Workspace中，并获得Y Combinator支持。这些代理可自动完成幻灯片生成、Excel模型构建、文档起草等任务，还能跨文件进行无限上下文分析，支持PowerPoint、Excel、Google Slides和Docs等应用的一键安装。

Agent context management: ephemeral vs. durable classification(sparkco.ai)📰 HN

1 分·sparkco123·20 天前·1 评论

AI AgentAudio & Speech

SparkCo Infra推出了三款AI智能体基础设施工具：Relay、Stitch和PAG。Relay通过将上下文分为临时和持久类别降低token成本，Stitch支持智能体间异步消息传递，PAG构建持久化世界模型。该栈采用本地优先设计，不依赖云服务，且兼容所有LLM提供商。

The Secret History of Knocking on Wood: Most of human nature is not written down(resobscura.substack.com)📰 HN

1 分·benbreen·21 天前·0 评论

AI AgentAI Safety

这篇文章包含一个部分，讨论GPT-4o、o1和Claude Sonnet3.5等领先AI模型如何成为有效的历史学家，并通过特定领域的案例研究展示其效用。此外，文章还涉及早期现代书籍和17世纪可卡因分析等其他历史主题。

Monty and Islo: Sandbox the Snippet, Isolate the Agent(islo.dev)📰 HN

1 分·zozo123-IB·21 天前·0 评论

本文介绍了由Pydantic团队开发的基于Rust的实验性Python解释器Monty，其旨在沙箱化AI代理生成的代码片段，防止危险操作和崩溃。文章详细说明了Monty的特性（移除不安全的内置函数、v0.0.7等版本中的崩溃加固修复）以及用于AI编码代理开发环境的工具Islo。

Show HN: NeuroTerm – AI terminal for embedded devs (local LLM, local RAG)(neuroterm.dev)📰 HN

1 分·0xecro1·21 天前·0 评论

Inference OptimizationLLM Research

NeuroTerm是一款面向嵌入式开发者的AI终端，具备本地LLM和RAG功能，无需依赖云服务或API密钥。它支持将自然语言转换为终端命令，从导入的数据表中获取上下文感知的答案，并提供实时日志过滤和调试功能。该工具提供免费和专业版本，专业版包含终身更新服务。

The Supply Chain in Your AI Agent: Why SBOMs for MCP Servers Matter Now(incredibuild.com)📰 HN

1 分·zozo123-IB·22 天前·0 评论

AI Agent

本文强调了AI代理（如Claude和ChatGPT）连接外部工具所需的模型上下文协议（MCP）服务器需要软件物料清单（SBOM）的重要性。文章揭示未受监控的MCP服务器已导致严重漏洞，包括命令注入和DNS重绑定攻击，多个影响微软、Cloudflare推荐工具及Anthropic的MCP Inspector的CVE案例证明了这一点。这些问题凸显了AI代理基础设施中未知依赖关系的风险。

Ask HN: If the "AI bubble" pops, will it really be that dramatic?📰 HN

6 分·moomoo11·23 天前·1 评论

正在开发无需AI（尤其是LLM）软件的用户询问，若AI泡沫破裂是否会对经济产生巨大影响，并提到他们喜欢AI编码代理作为辅助工具。

How Anthropic evaluated computer use models(kernel.sh)📰 HN

3 分·mesto1·27 天前·0 评论

Anthropic & Claude

这篇文章探讨了Anthropic公司如何评估其计算机使用模型，重点介绍了用于评估这些AI系统有效性的流程和方法。

Mad: Watch agents do research live(briankitano.com)📰 HN

1 分·bkitano19·28 天前·0 评论

💡 The story centers on an AI agent (Mad) performing research live, which is a practical application of AI agents. This fits the applications category as it involves real-world use of agent technology.

Show HN: Long Mem code agent cut 95% costs for Claude with small model reading(marketplace.visualstudio.com)📰 HN

1 分·lingxiao10·大约 1 个月前·0 评论

Anthropic & ClaudeCode & Development

这个Show HN项目介绍了CoSave，一个VSCode扩展，通过双模型优化（小模型用于阅读/分析，Claude/Gemini等大模型用于代码编写）将AI编码成本降低高达95%。它还具备项目惯例的长记忆功能、无人值守的顺序任务执行以及手机远程控制功能。

Txtbrd(txtbrd.com)📰 HN

2 分·1o1o1o1o1·大约 1 个月前·0 评论

xAI & Grok

Txtbrd是一个极简主义文本板，由创作者分享，其使用AI模型Grok构建。创作者认为AI的出现可能让这类网站变得无用，但仍会继续运营。文本板包含用户线程，讨论其用途、垃圾邮件/仇恨言论等潜在问题及其他随机评论。

Ask HN: Why is my Claude experience so bad? What am I doing wrong?📰 HN

1 分·moomoo11·大约 1 个月前·0 评论

Anthropic & ClaudeCode & Development

用户在数月前停止Claude的CC Max计划后重新订阅，但在尝试构建一个可切换横屏/竖屏的简单网格布局可视化工具时体验不佳，于是向HN社区询问问题所在。

A New Chapter for Gather(gather.town)📰 HN

3 分·zodo123·大约 1 个月前·0 评论

Robotics & Embodied AI

Gather将分拆为独立的非风险投资支持中小型企业，专注于核心远程协作产品，摆脱风险增长压力以更好服务客户。同时，Gather的AI团队将加入Figma，继续推进提升软件设计与开发效率的工作，双方愿景高度一致。现有客户无需担心，产品服务保持稳定，团队将持续创新并开发客户所需功能。

On Culmination and Not yet Turning Thirty(briankitano.com)📰 HN

1 分·bkitano19·大约 1 个月前·0 评论

这篇个人随笔探讨了作者对“巅峰时刻”的看法：像婚礼这样的重大预期时刻并未让他感受到巅峰，而在家喝浓缩咖啡等日常小瞬间却意外地唤起了这种感觉，凸显了生命旅程积累的分量。

Ask HN: How are researchers using AlphaFold in 2026?📰 HN

1 分·jocho12·大约 1 个月前·0 评论

Google AI

一个Ask HN问题询问研究人员在2026年如何使用AlphaFold及其对工作的影响，希望获得社区的反馈。

Automating PCB Assembly with YOLO(pikkoloassembly.com)📰 HN

1 分·pikkoloassembly·大约 1 个月前·0 评论

Pikkolo Assembly使用YOLO11 OBB模型自动化PCB对齐过程，该模型在带注释的组件图像上进行了微调，并通过脚本与OpenPnP集成，将每个任务的手动配置时间从30分钟缩短到一分钟以内。这种AI应用使PCB组装操作接近无需人工干预。

Prefix Sum on WebGPU: From Hillis–Steele, Blelloch, to Subgroups(yayo1.com)📰 HN

1 分·yayo1·大约 2 个月前·0 评论

AI Chips

这篇文章是关于使用Rust和wgpu在WebGPU上实现并行前缀和算法（Hillis-Steele、Blelloch和基于子组的算法）的教程。它解释了并行化前缀和的难点，详细介绍了每种算法的实现方式，并提供了包含完整代码的开源GitHub仓库链接。

NPM Is Down(getautonoma.com)📰 HN

1 分·tomaspiaggio12·大约 2 个月前·0 评论

💡 Local classifier (conf: 0.78)

Dockerhub for Skill.md(skillregistry.io)📰 HN

1 分·tomaspiaggio12·大约 2 个月前·0 评论

Anthropic & ClaudeCode & Development

SkillRegistry.io 是存放 SKILLS.md 文件的官方 hub，这些文件可扩展 Claude 和 ChatGPT 等 AI 助手的能力。它提供了一个 CLI 工具（通过 npm 安装），用于搜索和安装 1password、浏览器及 GitHub 集成等技能。该平台拥有 19 名贡献者提供的 61 项 AI 技能，涵盖自动化浏览器交互和 Google Workspace 访问等功能。

Claude Cowork but Open Source(opencowork.chat)📰 HN

1 分·tomaspiaggio12·大约 2 个月前·0 评论

Anthropic & ClaudeCode & Development

Open CoWork是一款开源AI代理工具，可自动化网页浏览、文件管理和命令执行等任务。它支持超过75个LLM提供商，本地处理数据保障隐私，并允许自定义技能集成。

Show HN: Ctrl – Open-source AI OS where each app has an AI that knows its data(github.com)📰 HN

1 分·rado12·2 个月前·0 评论

这篇Show HN帖子介绍了Ctrl，一个开源AI操作系统，其中每个应用都集成了能理解自身数据的AI。该项目托管在GitHub上，供社区探索和参与。

Show HN: AnotherResumeBuilder – Yeah just another one, check it out(arb.manhhung.app)📰 HN

1 分·mhpro15·2 个月前·0 评论

AnotherResumeBuilder是一个在Show HN上展示的简历构建工具，提供AI优化功能以提升简历内容，并支持字体、字号和间距等视觉元素的自定义。

Second Opinion: SRE Pre-Mortem Review(github.com)📰 HN

1 分·mesto1·2 个月前·0 评论

AI SafetyAudio & Speech

该内容似乎是GitHub的导航页面，重点介绍其与AI相关的开发工具（如Copilot、Spark、Models）以及其他解决方案、资源和开源项目。

Show HN: Sidecar – AI Social Manager (Analyzes past hits to write new posts)(sidecar.bz)📰 HN

1 分·ecotto123·2 个月前·1 评论

这是一篇关于Sidecar的Show HN帖子，Sidecar是一个AI社交管理器，它通过分析过去成功的社交媒体帖子来生成新帖子。

Analysis of LLM advancement: impactful LLMs in Q3 2027(rocketup.pages.dev)📰 HN

1 分·gidellav·2 个月前·0 评论

Open Source AIOpenAI Ecosystem

本文分析了大语言模型（LLM）的发展进程，重点介绍了OpenAI o1（2024年）和Deepseek R1（2025年）等关键模型及其改进。文章提出“大翻倍”概念，将其作为LLM的目标——使当前性能指标（智能、速度、效率）翻倍以实现实际应用可用性，并使用AAII、FrontierMath和Humanity’s Last Exam等基准进行分析。

Elon Musk says X's new algorithm will be made open source next week(engadget.com)📰 HN

1 分·O1111OOO·2 个月前·0 评论

AI SafetyAI Search

埃隆·马斯克宣布，X将在7天内开源其新推荐算法（包括有机和广告帖子推荐的所有代码），并每4周更新一次，附带详细开发者说明。此举是在过去未兑现开源承诺的背景下做出的，目前X的算法正面临监管调查，其Grok AI聊天机器人也存在生成儿童性虐待材料和非自愿数字脱衣等问题。

Making Sense of Memory and Attention(memory.briankitano.com)📰 HN

1 分·bkitano19·2 个月前·0 评论

LLM ResearchTraining Methods

本文探讨了从Transformer中高内存成本的二次注意力机制到线性注意力机制的一系列洞见，将其与RNN、快速权重编程器、基于delta规则的纠错以及测试时训练联系起来。文章解释了如何通过优化注意力机制以避免二次成本，从而将Transformer与神经网络早期的记忆、学习和适应原理重新连接。

第 1 / 3 页，共 72 条

📅周报

Hacker News|Powered by Doubao