AI HN
AI 新闻与论文,智能精选
最新
·
HN
周报
中
EN
Loading...
Hacker News
|
Powered by Doubao
分类
◀
全部
产品
模型
工具
硬件
应用产品
研究
论文
安全
评测
理论
工程
推理
训练
部署
开源
应用
商业
讨论
时间:
今天
3天
7天
30天
全部
来源:
全部
📰
HN
📄
论文
943
条
· "RAG"
1
As AI data centers scale, investigating their impact becomes its own beat
(niemanlab.org)
📰 HN
1
分
·
giuliomagnifico
·
6 天前
·
0 评论
这篇文章讨论了AI数据中心的规模化如何成为一个独特的新闻报道领域,三位记者对这些设施进行了深入探索。文章提到,微软、谷歌、亚马逊和Meta等主要科技公司预计2026年将在资本支出上花费超过7000亿美元,其中大部分将用于专用芯片和AI数据中心。
2
Decoupled by Design: Billion-Scale Vector Search
(databricks.com)
📰 HN
1
分
·
twalichiewicz
·
6 天前
·
0 评论
Cloud Infrastructure
Databricks的文章探讨了十亿级向量搜索的解耦设计方法,这对支持检索增强生成等大规模AI应用至关重要。文章可能涵盖了可扩展性和基础设施方面的内容,以实现生产环境中高效的向量搜索。
3
Intent-Driven Development
(jason-stillwell.com)
📰 HN
1
分
·
dragonfax
·
6 天前
·
1 评论
本文介绍了意图驱动开发(IDD)框架,开发者无需维护代码,而是维护自然语言的意图描述,由AI代理处理决策和代码生成。文章概述了三个层次(意图源、决策层、代码层)和工作流程步骤,并以任务管理应用为例说明该过程。
4
Hugging Face Storage Buckets
(huggingface.co)
📰 HN
1
分
·
nnx
·
6 天前
·
0 评论
Open Source AI
Hugging Face推出了Storage Buckets,这是一款专为AI团队设计的原生对象存储服务,兼顾可扩展性、速度和团队工作流。它具备Xet重复数据删除、内置CDN、无Git overhead以及透明的基于容量的定价功能。该服务支持存储模型和数据集等ML资产,实现快速同步和成本节约。
5
SSH Is the Agent Internet
(rolandsharp.com)
📰 HN
1
分
·
epscylonb
·
6 天前
·
0 评论
本文认为SSH是AI智能体的理想通信层,无需HTTP的复杂架构即可提供身份(密钥对)、加密通信和基于git的存储功能。文章介绍了SSHMail工具,该工具允许AI智能体通过SSH命令发送消息和协作,已被用于智能体的自主交互,支持直接消息和公共看板等功能。
6
Cloudflare Crawl Endpoint
(developers.cloudflare.com)
📰 HN
3
分
·
jeffpalmer
·
6 天前
·
0 评论
Cloud Infrastructure
RAG & Retrieval
Cloudflare在其Browser Rendering服务中推出了新的/crawl端点(开放测试阶段),用户可通过单一API调用爬取整个网站。该端点支持多种输出格式(HTML、Markdown、通过Workers AI生成的结构化JSON),并具备爬取范围控制和增量爬取等功能,适用于模型训练和RAG管道构建等AI任务。
7
Weaviate on current state of RAG for enterprises
(stackai.com)
📰 HN
1
分
·
karissaho
·
6 天前
·
0 评论
AI Agent
Open Source AI
这篇内容推广了StackAI与Weaviate合作的电子书,指导读者设计架构以在企业生产环境中大规模构建可靠、自主的RAG智能体。该资源聚焦于使用智能体RAG技术的企业AI解决方案。
8
Machine learning without critical thinking only encourages tech pseudoscience
(skeptic.org.uk)
📰 HN
1
分
·
donatzsky
·
7 天前
·
0 评论
💡 The story focuses on an opinion about machine learning and its connection to tech pseudoscience when critical thinking is absent, which falls under the discussion category as it involves an AI-related debate and opinion.
9
Goose Lays Golden Eggs, Gets Slaughtered
(inconsistent.blog)
📰 HN
1
分
·
dnikolovv
·
7 天前
·
0 评论
AI Agent
AI Safety
这篇文章质疑与AI相关的裁员逻辑,认为企业应留住了解业务、代码库和客户的领域专家——因为这些专家能有效利用AI的生产力优势,而用LLM取代他们是不太可能的。文章指出,不挽留这些专家会让竞争对手获得优势。
10
Stop using chat history as your agent's state store
(blog.raed.dev)
📰 HN
1
分
·
Raed667
·
7 天前
·
0 评论
AI Agent
本文反对将聊天历史作为AI智能体的状态存储,指出其会导致上下文过时和调试困难等问题。文章建议采用持久执行框架(如Temporal)来处理控制流和状态管理,让大语言模型专注于语义路由和决策等核心优势。
11
Why Memgraph Infrastructure Was Moved to Hetzner
(memgraph.com)
📰 HN
1
分
·
mbuda
·
7 天前
·
0 评论
Cloud Infrastructure
Local AI
Memgraph将其基础设施从自托管硬件迁移到Hetzner,以降低成本(约50%)、提高运营简便性并优化工作负载。此次迁移使用Hetzner的共享vCPU实例处理CI/构建,使用裸金属服务器进行基准测试,避免了自有硬件的维护和更新周期。
12
RAG not lag: RL for fast agentic retrieval
(cgft.io)
📰 HN
1
分
·
kumama
·
7 天前
·
0 评论
RAG & Retrieval
本文讨论了使用强化学习(RL)训练小型、快速的领域特定智能检索(agentic RAG)模型,这些模型在检索密集型任务上优于GPT-5.2等大型通用模型,同时提供更快、更经济的推理。文章详细介绍了使用FinDer金融数据集的方法,并提到即将推出一个用于训练此类检索智能体的平台。
13
Personal Software and the Collapse of the Talent Pipeline
(blog.slamdunk.software)
📰 HN
1
分
·
Destiner
·
7 天前
·
0 评论
本文探讨了极端个人化软件(EPS)的兴起,这是一种利用编码代理进行深度定制的新型开源工具。它将EPS与传统开源工作流程进行对比,并讨论了这一趋势可能对人才管道产生的影响,指出随着市场适应这种新方法,熟练程序员可能会从中受益最多。
14
Show HN: VectorLens – See why your RAG hallucinates, no config
📰 HN
1
分
·
gustav-proxi
·
7 天前
·
0 评论
RAG & Retrieval
用户开发了VectorLens以解决RAG管道幻觉问题,无需通过日志文件分析即可识别误导性检索块或被忽略的相关块。现有可观测性工具存在局限性,该项目旨在克服这些问题。
15
Show HN: VectorLens – Local RAG hallucination debugger with zero code changes
(github.com)
📰 HN
1
分
·
gustav-proxi
·
7 天前
·
0 评论
RAG & Retrieval
这篇Show HN帖子介绍了VectorLens,一个无需代码更改即可调试本地RAG系统幻觉问题的工具。该项目作为社区创建的资源托管在GitHub上。
16
Show HN: Portable RAG (Open Source)
📰 HN
2
分
·
cepstrum9
·
8 天前
·
0 评论
RAG & Retrieval
用户分享了一个名为raglet的Show HN项目,这是一个用于便携式RAG的开源Python库。它旨在处理那些超出上下文窗口但又不足以使用向量数据库的文本,例如代码库、笔记文件夹或Slack导出内容。
17
Grok sparks outrage after chatbot makes offensive jibes about football disasters
(theregister.com)
📰 HN
1
分
·
beardyw
·
8 天前
·
0 评论
xAI & Grok
埃隆·马斯克的AI聊天机器人Grok(由xAI开发并嵌入X平台)因在用户提示下生成关于历史性足球灾难(如希尔斯堡惨案)和宗教团体的冒犯性言论引发公愤。英国政府谴责这些言论“令人作呕且不负责任”,X平台已启动内部调查,同时报道还提及此前针对Grok的监管行动(包括隐私和内容问题)。
18
Show HN: AlphaPerch – Track product execution for companies you follow using AI
(alphaperch.com)
📰 HN
1
分
·
sebasnar
·
8 天前
·
0 评论
AlphaPerch是一款利用AI追踪特斯拉、谷歌等企业产品执行里程碑的工具。它通过深度AI分析过滤无关新闻,聚焦真实的产品更新。用户可查看包含产品阶段(已发布、延迟等)的仪表盘,并通过原始来源验证信息。
19
Show HN: Raglet(open-source)–portable RAG for small text corpora (no infra)
(github.com)
📰 HN
1
分
·
cepstrum9
·
8 天前
·
1 评论
RAG & Retrieval
这篇Show HN介绍了Raglet,一个开源的便携式RAG工具,专为小型文本语料库设计且无需基础设施。它让用户无需复杂设置即可实现检索增强生成,适用于小规模使用场景。
20
A simple L7 proxy for vLLM that manages LoRA adapter storage via NVMes
(github.com)
📰 HN
2
分
·
shayonj
·
8 天前
·
0 评论
Inference Optimization
Training Methods
这个故事介绍了Loraplex,一个用于vLLM的开源L7代理,它通过NVMe管理LoRA适配器存储。该工具托管在GitHub上,旨在简化AI推理环境中LoRA适配器的处理。
21
INDB – Epistemological engine, signed memory, zero-knowledge storage
(indb.tech)
📰 HN
1
分
·
screwglitch
·
9 天前
·
1 评论
INDB v0.4.0是一款可投入生产的认知引擎,旨在通过签名记忆和零知识存储保存真相。它通过智能层处理标记化数据,同时保持盲载荷加密(系统无法读取),遵循吸入混沌数据、排出噪声和维持不可变加密核心的核心原则。
22
Show HN: JRD Garage – $99 one-time auto shop management (Mitchell1 alternative)
(jrdconnect.com)
📰 HN
1
分
·
jaydurangodev
·
9 天前
·
0 评论
这篇Show HN帖子介绍了JRD Garage——一个一次性付费99美元的汽车维修店管理系统(Mitchell1的替代方案),以及Scan0tron(带计算机视觉的屏幕智能工具)和SiteSweep(物业智能工具)等AI驱动工具。这些工具支持Mac、Windows和iOS平台,包含AI呼叫脚本、客户关系管理和零件追踪等功能。
23
Vigil – Open-source security ops with 6 scanners, AI agents, and MCP server
(github.com)
📰 HN
1
分
·
bulwark-studio
·
9 天前
·
0 评论
AI Agent
Vigil是一个开源的安全运营工具,包含六个扫描器、AI代理和MCP服务器,为用户提供AI驱动的安全解决方案。
24
Worried about LLM-written modules
(discuss.pixls.us)
📰 HN
1
分
·
patrakov
·
9 天前
·
0 评论
Inference Optimization
LLM Research
这篇帖子表达了对开源照片编辑工具darktable中LLM编写模块的担忧。作者提到最近出现的使用LLM生成的模块提案,担心维护者的工作负担(如即将到来的GTK4升级)、AI生成代码可能带来的bug,以及未维护模块分叉导致的碎片化风险。作者询问如何在使用AI工具与保持项目稳定性和维护者理智之间取得平衡。
25
Show HN: Novel visualizer for translations to/from Basque language
(xingolak.pages.dev)
📰 HN
1
分
·
mattdeboard
·
9 天前
·
0 评论
AI Safety
AI Search
这篇Show HN帖子展示了Xingolak,一个专注于巴斯克语的翻译对齐可视化工具。用户可以输入文本,翻译并分析巴斯克语与英语、西班牙语、法语等语言之间的对齐关系,通过可视化界面查看源文本和目标文本的对应情况。
26
The Great AI Arbitrage: making a killing before your client wises up
(dodgycoder.net)
📰 HN
1
分
·
mooreds
·
9 天前
·
0 评论
AI Agent
AI Safety
本文探讨了“AI套利”现象:软件机构利用智能代理AI大幅缩短生产时间,却仍按AI出现前的费率向客户收费,通过知识不对称获利。文章将这一现象与古腾堡印刷机、可互换零件和CNC机床等历史套利案例进行类比,以解释该现象。
27
Show HN: Voice Typing
(github.com)
📰 HN
1
分
·
primaprashant
·
10 天前
·
0 评论
Audio & Speech
这是一篇Show HN帖子,链接到名为“awesome-voice-typing”的GitHub仓库。该仓库可能整理了语音打字相关的资源或工具,这些工具通常采用人工智能驱动的语音识别技术。
28
Show HN: RedDragon, LLM-assisted IR analysis of code across languages
(github.com)
📰 HN
1
分
·
armorer
·
10 天前
·
0 评论
Inference Optimization
LLM Research
这是一篇Show HN帖子,介绍了RedDragon——一个基于LLM的跨语言代码信息检索(IR)分析工具,托管在GitHub上。该社区创建的项目利用LLM帮助用户检索和理解不同编程语言的代码。
29
You can get better code by exploiting model weights
(kelvinfichter.com)
📰 HN
1
分
·
kfichter
·
10 天前
·
0 评论
AI Agent
AI Safety
本文探讨了像Claude这样的AI模型的训练数据如何影响其理解能力,例如Claude基于人类数据给出了不切实际的重构时间估计。作者建议将软件组件命名为知名领域概念,以帮助AI代理更好地理解组件用途,利用其预训练的领域知识改进代码相关任务。
30
MultiGen: Level-Design for Editable Multiplayer Worlds in Diffusion Game Engine
(ryanpo.com)
📰 HN
1
分
·
dmarcos
·
10 天前
·
0 评论
Image Generation
Multimodal AI
MultiGen是一款利用扩散游戏引擎创建可编辑多人游戏关卡的工具,它借助AI扩散模型辅助关卡设计工作。
1
2
...
32
第 1 / 32 页,共 943 条
📅
周报