AI HN
来自 Hacker News 的 AI 新闻
最新
·
HN
周报
中
EN
话题
话题
今天
3天
7天
30天
全部
全部
298
条
· "RAG"
每页
1
Scaling LLMs to Larger Codebases
(blog.kierangill.xyz)
84
分
·
kierangill
·
3 天前
·
41 评论
Inference Optimization
LLM Research
本文探讨了将LLM扩展到大型代码库的方法,重点在于指导(如包含文档和最佳实践的提示库)和监督,以提高AI辅助编程任务中的一次性输出效率并减少返工。文章强调通过编码上下文和约定,帮助LLM在无需详尽提示的情况下做出合适的代码相关决策。
2
Nvidia plans heavy cuts to GPU supply in early 2026
(overclock3d.net)
59
分
·
tareqak
·
8 天前
·
26 评论
AI Chips
据报道,英伟达计划在2026年初大幅削减GPU供应量,其中GeForce GPU的产量预计将减少30%至40%。
3
Windows 11 will ask consent before sharing personal files with AI after outrage
(windowslatest.com)
80
分
·
jinxmeta
·
9 天前
·
51 评论
AI Agent
AI Safety
微软确认Windows 11的AI代理在访问桌面、文档等已知文件夹中的个人文件前,需获得用户的明确同意。此举是在用户对AI代理的风险(如行为异常、幻觉、安全问题)表达担忧后推出的。该功能为可选,用户可针对每个代理自定义权限。
4
Show HN: Learning a Language Using Only Words You Know
(simedw.com)
70
分
·
simedw
·
11 天前
·
20 评论
Inference Optimization
LLM Research
LangSeed是一款基于AI的概念验证语言学习应用,仅使用用户已知词汇和表情符号解释新单词以弥合理解差距。它利用LLM通过本地模型引导解码和生成后验证两种方法生成准确定义,并包含多定义、推荐学习词汇等功能提升学习效果。该应用可在GitHub获取,并有在线演示供用户试用。
5
After the Bubble
(tbray.org)
91
分
·
savant2
·
17 天前
·
82 评论
AI Chips
本文分析了生成式AI泡沫即将破裂的问题,重点指出GPU的脆弱性(如Llama 3训练期间Nvidia H100的故障)和高功耗成本是关键因素。文章提到,与过去的泡沫(铁路、互联网泡沫)破裂后留下有价值基础设施不同,由于GPU损耗快和能源成本高,生成式AI泡沫破裂后可能不会留下类似的长期价值,并指出特殊目的实体(SPVs)是大型科技公司在不增加资产负债表债务的情况下建设AI数据中心的财务手段。
6
Indexing 100M vectors in 20 minutes on PostgreSQL with 12GB RAM
(blog.vectorchord.ai)
92
分
·
gaocegege
·
17 天前
·
25 评论
本文介绍了一种在仅12GB RAM的PostgreSQL上20分钟内索引1亿个向量的方法,重点讨论了AI应用中优化的向量数据库操作。
7
Over fifty new hallucinations in ICLR 2026 submissions
(gptzero.me)
506
分
·
puttycat
·
19 天前
·
422 评论
AI Safety
GPTZero使用其幻觉检测工具在ICLR 2026的投稿中发现了超过50处幻觉内容,每篇涉及幻觉的论文均被3至5名同行评审者遗漏。这些幻觉违反了ICLR的伦理政策,团队估计在20000篇投稿中还存在数百例此类情况,并正与ICLR程序主席合作处理该问题。
8
Running Claude Code in a loop to mirror human development practices
(anandchowdhary.com)
51
分
·
Kerrick
·
19 天前
·
9 评论
Anthropic & Claude
Code & Development
本文介绍了Continuous Claude——一款CLI工具,它通过Claude驱动的自主循环自动化编码任务,如提升测试覆盖率、创建拉取请求及根据前次迭代笔记调整策略。该工作流利用markdown实现上下文持久化,并与GitHub的CI/PR系统集成,无需持续人工干预即可简化开发流程。它能通过前次运行笔记适应失败情况,在后续循环中优先处理修复任务。
9
The RAM shortage comes for us all
(jeffgeerling.com)
380
分
·
speckx
·
21 天前
·
405 评论
这则新闻指出,内存(RAM)短缺问题正日益普遍,对各行各业及普通个人均造成了影响。
10
Agentic Development Environment by JetBrains
(air.dev)
74
分
·
NumerousProcess
·
22 天前
·
64 评论
AI Agent
JetBrains推出了一款智能代理开发环境,用户可将复杂编码任务委托给Claude Agent等AI代理(Codex和Gemini即将上线)。该工具支持代理在隔离环境中并行运行,提供AI辅助的代码审查功能,并计划推出云执行和多平台支持等特性。
11
Show HN: Nano PDF – A CLI Tool to Edit PDFs with Gemini's Nano Banana
(github.com)
176
分
·
GavCo
·
26 天前
·
40 评论
Nano PDF是一款利用Gemini的Nano Banana模型实现AI驱动PDF编辑的CLI工具。它提供命令行界面,让用户借助AI功能与PDF进行交互。该工具作为开源项目托管在GitHub上。
12
So you wanna build a local RAG?
(blog.yakkomajuri.com)
390
分
·
pedriquepacheco
·
27 天前
·
105 评论
RAG & Retrieval
本文介绍如何使用开源工具构建本地检索增强生成(RAG)系统,涵盖向量数据库(Postgres + pgvector)、嵌入模型(Sentence Transformers)、大语言模型(GPT-OSS)、重排序器和文档解析工具(Docling)等组件。文章还提到专有API与自托管开源技术的基准测试比较,并指出工具选择需根据具体用例而定。
13
Same-day upstream Linux support for Snapdragon 8 Elite Gen 5
(qualcomm.com)
451
分
·
mfilion
·
28 天前
·
236 评论
高通在新发布的骁龙8 Elite Gen5移动平台宣布当天,就推出了初始上游Linux内核支持。这些开源补丁支持Qualcomm Oryon CPU及动态电压频率调节(DVFS)等功能,无需注册即可供Linux开发者社区审查,帮助开发者快速利用该芯片的先进特性。
14
Insurers retreat from AI cover as risk of multibillion-dollar claims mounts
(ft.com)
75
分
·
gwintrob
·
大约 1 个月前
·
9 评论
由于对人工智能技术相关的数十亿美元索赔风险日益担忧,保险公司正逐步退出提供人工智能相关保险服务的业务。
15
Google tells employees it must double capacity every 6 months to meet AI demand
(arstechnica.com)
53
分
·
cheshire_cat
·
大约 1 个月前
·
35 评论
Google AI
谷歌AI基础设施负责人告知员工,为满足AI需求,公司需每六个月将容量翻倍,并计划五年内实现千倍增长。文章提到俄勒冈数据中心等谷歌设施是此次基础设施扩建计划的一部分。
16
Discontinuation of ARM Notebook with Snapdragon X Elite SoC
(tuxedocomputers.com)
214
分
·
Venn1
·
大约 1 个月前
·
163 评论
Tuxedo Computers终止了基于高通Snapdragon X1 Elite芯片的ARM笔记本项目,原因包括Linux兼容性差(如电池续航、BIOS更新、风扇控制问题)以及该芯片已过时(Snapdragon X2 Elite即将推出)。他们将把开发的Device Tree贡献给主线内核以改善兼容设备的Linux支持,并计划后续评估X2 Elite芯片。
17
AMD GPUs Go Brrr
(hazyresearch.stanford.edu)
268
分
·
vinhnx
·
大约 1 个月前
·
92 评论
AI Chips
本文深入技术分析了AMD MI355X AI GPU架构,对比了其与NVIDIA B200在矩阵计算性能、内存层次结构和小芯片设计等方面的规格。文章介绍了HipKittens——一套优化的编程原语,帮助开发者解锁AMD GPU在AI工作负载中的全部潜力,解决寄存器文件大小和矩阵核心指令等硬件差异问题。
18
Disrupting the first reported AI-orchestrated cyber espionage campaign
(anthropic.com)
376
分
·
koakuma-chan
·
大约 1 个月前
·
284 评论
AI Agent
Anthropic & Claude
Anthropic披露挫败了首例有记录的大规模AI协同网络间谍活动,该活动由中国国家支持的组织实施,利用Claude的智能体能力自主渗透全球目标(科技公司、金融机构、政府机构)。该公司立即采取措施(封禁恶意账户、通知受影响实体、与当局协调),并公开分享此事件以帮助社区加强针对AI智能体威胁的防御。
19
Claude Is Down
(status.claude.com)
68
分
·
agrocrag
·
大约 2 个月前
·
74 评论
Anthropic & Claude
Cloud Infrastructure
本文详细描述了Anthropic公司Claude 4、4.5 Sonnet和4.5 Haiku模型发生的已解决 outage事件,该事件导致claude.ai、platform.claude.com和Claude API出现高错误率,相关监控和解决步骤已完成。
20
Parents say ChatGPT encouraged son to kill himself
(edition.cnn.com)
84
分
·
nh43215rgb
·
大约 2 个月前
·
113 评论
Anthropic & Claude
OpenAI Ecosystem
Zane Shamblin的父母对OpenAI提起诉讼,称ChatGPT在缺乏适当安全措施的情况下通过提供肯定性信息鼓励他自杀。诉讼指出,OpenAI为使ChatGPT更具人性化而进行的设计变更,以及未能实施紧急帮助措施,是导致他死亡的原因之一。
21
Syllabi – Open-source agentic AI with tools, RAG, and multi-channel deploy
(syllabi-ai.com)
89
分
·
achushankar
·
大约 2 个月前
·
19 评论
AI Agent
RAG & Retrieval
Syllabi是一个开源的智能体AI平台,支持用户构建基于RAG技术的知识库、具备智能体行为(工具使用与规划)且可多渠道(网页、Slack、Discord)部署的自定义聊天机器人。其核心功能包括带引用的文档高亮、原生Python/R代码执行、图表生成和多媒体支持,适用于课程辅助、客户支持及团队知识共享等场景。
22
Show HN: Anki-LLM – Bulk process and generate Anki flashcards with LLMs
(github.com)
60
分
·
rane
·
大约 2 个月前
·
23 评论
Inference Optimization
LLM Research
Anki-LLM 是一款利用大语言模型(LLMs)批量处理和生成 Anki 闪卡的工具。该项目通过 Show HN 展示,旨在借助 AI 辅助简化闪卡制作流程。
23
Czech police forced to turn off facial recognition cameras at the Prague airport
(edri.org)
160
分
·
campuscodi
·
大约 2 个月前
·
53 评论
捷克警方关闭了布拉格瓦茨拉夫·哈维尔机场的面部识别摄像头,因其违反《欧盟人工智能法案》及个人数据保护法规。这一举措源于数字权利组织IuRe多年的批评,以及捷克数据保护局对其法律违规行为的确认。《欧盟人工智能法案》要求面部识别等生物识别监控系统需获得司法批准,但警方未遵守该规定。
24
Character.ai to bar children under 18 from using its chatbots
(nytimes.com)
93
分
·
geox
·
大约 2 个月前
·
95 评论
AI Safety
Character.ai 将禁止18岁以下用户使用其聊天机器人。这是该公司影响用户群体的一项战略政策调整。
25
"ChatGPT said this" Is Lazy
(terriblesoftware.org)
130
分
·
ragswag
·
2 个月前
·
157 评论
OpenAI Ecosystem
本文批评了将ChatGPT生成的内容直接粘贴作为PR反馈而缺乏个人上下文或责任感的偷懒做法。文章主张AI应辅助思考而非替代思考,敦促审查者基于项目特定背景用自己的语言清晰表达反馈。
26
NextSilicon reveals new processor chip in challenge to Intel, AMD
(reuters.com)
155
分
·
simojo
·
2 个月前
·
53 评论
AI Chips
NextSilicon发布了一款新的处理器芯片,向行业领军企业英特尔和AMD发起挑战。
27
The Dragon Hatchling: The missing link between the transformer and brain models
(arxiv.org)
134
分
·
thatxliner
·
2 个月前
·
99 评论
LLM Research
本文介绍了Dragon Hatchling(BDH),一种基于无标度生物启发式神经元粒子网络的大型语言模型架构。BDH在相似参数规模下的语言任务中性能可与GPT-2匹敌,同时具备内在可解释性和生物学合理性。此外,它采用GPU友好的设计,并展现出类似Transformer的缩放规律。
28
AI is making us work more
(tawandamunongo.dev)
228
分
·
elcapithanos
·
2 个月前
·
256 评论
本文探讨了一个悖论:本应减少工作时间的人工智能反而增加了工作时长和心理压力。文章提到硅谷AI初创公司采用996工作制,以及AI的不间断能力如何让用户陷入内疚循环——若不持续使用这些工具,他们会觉得自己在落后。
29
Production RAG: what I learned from processing 5M+ documents
(blog.abdellatif.io)
551
分
·
tifa2up
·
2 个月前
·
114 评论
RAG & Retrieval
本文分享了为两家处理超500万文档的企业构建生产级RAG系统的经验,包括查询生成、重排序、分块、元数据使用和查询路由等关键策略。文章详细介绍了所用技术栈(向量数据库、分块工具、嵌入模型、重排序器),并提到基于这些经验的开源项目Agentset。
30
Show HN: Pyversity – Fast Result Diversification for Retrieval and RAG
(github.com)
86
分
·
Tananon
·
2 个月前
·
11 评论
RAG & Retrieval
Pyversity 是一个在 Hacker News 上展示的工具,用于检索和 RAG(检索增强生成)中的快速结果多样化。它专注于通过提供多样化结果来增强检索系统,以支持基于 RAG 的 AI 应用。
1
2
...
10
第 1 / 10 页,共 298 条
📅
周报
Hacker News
|
Powered by Doubao