AI HN
AI 新闻与论文,智能精选
最新
·
HN
周报
中
EN
Loading...
Hacker News
|
Powered by Doubao
分类
◀
全部
产品
模型
工具
硬件
应用产品
研究
论文
安全
评测
理论
工程
推理
训练
部署
开源
应用
商业
讨论
时间:
今天
3天
7天
30天
全部
来源:
全部
📰
HN
📄
论文
441
条
· "NVIDIA"
1
Jensen Huang: AI is a five layer cake
(blogs.nvidia.com)
📰 HN
1
分
·
salkahfi
·
6 天前
·
0 评论
AI Agent
AI Chips
英伟达首席执行官黄仁勋在博客文章中将人工智能描述为一个五层蛋糕。文章内容可能从英伟达的视角概述了人工智能技术的分层结构。
2
X-Plane Is Coming to Apple Vision Pro with Nvidia CloudXR
(x-plane.com)
📰 HN
1
分
·
CharlesW
·
6 天前
·
0 评论
AI Chips
AI Safety
高级飞行模拟器X-Plane将于今年春天晚些时候通过Nvidia CloudXR 6.0登陆Apple Vision Pro。该集成支持沉浸式空间体验,包括注视点渲染流和基于ARKit的驾驶舱跟踪功能,融合物理与数字世界。一旦visionOS 26.4发布,配套应用将在App Store上线。
3
Testing Nvidia's FP4: Running 70B LLMs on a Single RTX 5090 with Real Benchmarks
(ai.gopubby.com)
📰 HN
2
分
·
Aedelon
·
6 天前
·
0 评论
AI Chips
Inference Optimization
本文测试了英伟达的FP4量化技术(NVFP4),旨在在RTX 5090 GPU上运行700亿参数的大型语言模型(LLM)。文章涵盖了内存减少(比FP16少3.5倍VRAM)、性能提升(同一GPU上FP4比FP8快1.6倍)和精度下降(大型模型<1%)等关键发现。此外,还提到了硬件要求(仅限Blackwell系列GPU)以及非Blackwell用户的替代方案,如通过llama.cpp使用GGUF格式。
4
CUDA-morph: PyTorch .cuda() code on AMD/Intel/Ascend without rewrites
(github.com)
📰 HN
1
分
·
josephahn291215
·
7 天前
·
0 评论
AI Chips
CUDA-morph是一个开源项目,可让PyTorch的.cuda()代码在AMD、Intel和Ascend硬件上运行而无需重写。它解决了英伟达CUDA与非英伟达GPU在AI/ML工作负载中的兼容性问题。
5
Nvidia Is Planning to Launch an Open-Source AI Agent Platform
(wired.com)
📰 HN
1
分
·
spenvo
·
7 天前
·
0 评论
AI Chips
英伟达计划推出一个开源的AI智能体平台,帮助开发者更轻松地构建和部署AI智能体。这一开源举措旨在促进AI智能体生态系统中的协作。该平台的推出可能通过提高工具的可访问性,塑造AI智能体开发的未来。
6
NVIDIA Triton Inference Server
(docs.nvidia.com)
📰 HN
1
分
·
teleforce
·
7 天前
·
0 评论
AI Chips
NVIDIA Triton推理服务器是一款开源的推理服务软件,支持从多种深度学习和机器学习框架部署AI模型,可在云、数据中心、边缘及嵌入式设备上运行。它为多种查询类型提供优化性能,并包含模型管理API、健康端点和指标,便于集成到Kubernetes等部署框架中。
7
Nvidia's Groq Plot Thickens
(thechipletter.substack.com)
📰 HN
1
分
·
rbanffy
·
7 天前
·
0 评论
AI Chips
这篇文章讨论了英伟达针对AI推理芯片竞争对手Groq的战略举措。它属于一系列涵盖AI硬件动态的内容,包括行业竞争和架构分析。
8
AluminatiAI – per-job GPU cost tracking (Nvidia-smi shows watts, not dollars)
📰 HN
1
分
·
AluminatiAi
·
7 天前
·
0 评论
AI Chips
AluminatiAI是一款用于按任务跟踪GPU成本的工具,填补了nvidia-smi的功率数据与云账单月度总额之间的空白。它帮助计算单个AI训练实验的实际成本,尤其是针对每GPU每小时2-3美元运行的H100集群。
9
Show HN: Agentic CLI, Gideon Wins Nvidia GTC Golden Ticket for AI Innovation
(github.com)
📰 HN
1
分
·
tarique192
·
7 天前
·
0 评论
AI Chips
这篇Show HN帖子介绍了Gideon,一个智能代理CLI工具,它获得了Nvidia GTC人工智能创新金奖。该工具托管在GitHub上,帖子可能重点展示了其功能以及在AI领域获得的认可。
10
Broadcom May Become the Biggest Counterbalance to Nvidia
(nextplatform.com)
📰 HN
1
分
·
rbanffy
·
8 天前
·
0 评论
AI Agent
AI Chips
本文阐述了博通过去收购Computer Associates和VMware所产生的利润如何使其能够发展AI XPU业务,从而有望成为英伟达在AI芯片市场的主要竞争对手。文章强调CEO Hock Tan的集团战略是其进入AI领域的关键推动力。
11
Nvidia backs AI data center startup Nscale as it hits $14.6B valuation
(cnbc.com)
📰 HN
1
分
·
voxadam
·
8 天前
·
0 评论
AI Chips
英伟达投资了AI数据中心初创公司Nscale,该公司估值已达146亿美元。此次投资体现了英伟达在支持AI基础设施方面的战略重点。
12
Cutie Fly: CuTe Layout Representation and Algebra, CuTeDSL, FlyDSL
(ianbarber.blog)
📰 HN
1
分
·
matt_d
·
10 天前
·
0 评论
AI Chips
LLM Research
本文讨论了AI布局代数的最新进展,包括FlashAttention4论文、AMD基于CuTeDSL的开源工具FlyDSL,以及多篇关于CuTe布局概念形式化的学术论文。文章强调这些研究成果和工具如何提升AI模型优化和开发效率。
13
Unpacking the deceptively simple science of tokenomics
(theregister.com)
📰 HN
1
分
·
samizdis
·
10 天前
·
0 评论
AI Chips
本文探讨了大规模AI推理的复杂经济学,指出最大化token吞吐量需要平衡效率(每瓦/每美元的token数)与用户体验(交互性)。文章引用了英伟达对每瓦token数的重视,以及SemiAnalysis的InferenceX基准测试,该测试展示了B300配置的token吞吐量与用户交互性的帕累托曲线,突出了最佳性能的“Goldilocks区”。
14
Controlling Floating-Point Determinism in NVIDIA CCCL
(developer.nvidia.com)
📰 HN
1
分
·
matt_d
·
10 天前
·
0 评论
AI Chips
本文介绍了NVIDIA CCCL 3.1版本中的CUB库如何引入单阶段API来控制归约算法中的浮点确定性。文章详细说明了三种确定性级别(not_guaranteed、run_to_run、gpu_to_gpu)以及性能与可复现性之间的权衡,包括使用可复现浮点累加器(RFA)实现跨GPU的一致性。
15
Nvidia PersonaPlex 7B on Apple Silicon: Full-Duplex Speech-to-Speech in Swift
(blog.ivan.digital)
📰 HN
1
分
·
ipotapov
·
12 天前
·
0 评论
Apple AI
Code & Development
本文介绍了qwen3-asr-swift库,该库可在Apple Silicon上通过MLX运行NVIDIA的PersonaPlex7B模型,实现全双工语音到语音功能。该库支持流式处理、语音识别、文本转语音和多语言合成,并使用4位量化模型以提高推理效率。它通过单一模型直接处理音频输入输出,消除了传统的三步处理管道。
16
Jensen Huang says Nvidia is pulling back from OpenAI and Anthropic
(techcrunch.com)
📰 HN
1
分
·
jnord
·
12 天前
·
0 评论
AI Chips
Anthropic & Claude
英伟达首席执行官黄仁勋表示公司将减少与OpenAI和Anthropic的合作,但他的解释引发的疑问多于答案。
17
Chaos and Dystopian news for the dead internet survivors
(fubardaily.com)
📰 HN
1
分
·
anonnona8878
·
12 天前
·
0 评论
AI Agent
AI Chips
这篇文章涵盖了人工智能相关的商业和政策更新,例如英伟达从OpenAI和Anthropic的投资中战略性撤退,以及主要科技公司签署白宫承诺以减轻AI模型训练对电网的影响。文章还包括政治、科技和金融领域的各种混乱新闻信号。
18
What Are the Most Promising FinTech Startups to Watch in 2026?
(analyticsinsight.net)
📰 HN
1
分
·
journey2s
·
13 天前
·
0 评论
AI Chips
Anthropic & Claude
本文探讨了2026年值得关注的最具前景的金融科技初创公司。文章还包含人工智能相关的突发新闻,例如英伟达计划向OpenAI投资300亿美元,以及美国军方在之前的限制下仍使用Claude AI。
19
WarpSpeed automatically rewrites Nvidia core library, achieves 3.6-100x speedup
(doubleai.com)
📰 HN
6
分
·
laginimaineb
·
14 天前
·
0 评论
AI Chips
Code & Development
doubleAI的WarpSpeed是一款用于GPU性能工程的AI系统,可生成NVIDIA cuGraph库的超优化版本。该系统在多种图算法和GPU架构上实现了3.6到100倍的速度提升,性能超过专家编写的内核。
20
Nvidia to invest $4B in two photonics companies
(cnbc.com)
📰 HN
1
分
·
voxadam
·
14 天前
·
0 评论
AI Chips
Cloud Infrastructure
英伟达将向Lumentum和Coherent两家光子学公司各投资20亿美元,总计40亿美元。此次投资旨在开发先进的光学和硅光子技术,以支持人工智能基础设施和网络建设。
21
Chasing the Chip Smugglers
(thewirechina.com)
📰 HN
1
分
·
NN88
·
15 天前
·
0 评论
AI Chips
💡 The title suggests the story focuses on smuggling Nvidia AI chips, which involves trade regulations and policy issues, aligning with the business category.
22
Nvidia and Global Telecom Leaders Commit to Build 6G on AI-Native Platforms
(nvidianews.nvidia.com)
📰 HN
2
分
·
zinekeller
·
15 天前
·
0 评论
AI Chips
英伟达与包括英国电信集团、德国电信、爱立信、诺基亚和T-Mobile在内的全球电信领导者联盟承诺,将在开放、安全的AI原生平台上构建6G网络。该倡议旨在将电信基础设施转变为支持物理AI的AI驱动系统,以实现数十亿自主设备的运行并增强安全性。此次合作聚焦于软件定义的无线架构,推动未来连接领域的创新和互操作性。
23
Is Nvidia's post-Rubin roadmap shifting toward inference-first architectures?
(buysellram.com)
📰 HN
1
分
·
jamesbsr
·
15 天前
·
1 评论
AI Chips
本文探讨了NVIDIA即将在2026年GTC大会上发布的Feynman硬件路线图,该路线图标志着从训练优先架构向推理优先设计的转变。文章强调了低延迟、可预测的尾部延迟和效率对支持实时智能体AI应用的必要性,并提到NVIDIA整合了Groq的LPU技术以及可能的英特尔代工厂合作。
24
Sam Altman: We raised a $110B round from Amazon, Nvidia, SoftBank
(twitter.com)
📰 HN
2
分
·
tosh
·
18 天前
·
0 评论
AI Chips
Amazon AI
Sam Altman宣布从亚马逊、英伟达和软银筹集了1100亿美元的资金。考虑到Altman在OpenAI的角色以及参与公司对AI的浓厚兴趣,这笔投资很可能与AI相关项目有关。
25
OpenAI raises $110B at $730B pre-money valuation from Amazon, Nvidia, & SoftBank
(openai.com)
📰 HN
1
分
·
rvz
·
18 天前
·
0 评论
AI Chips
Amazon AI
OpenAI完成1100亿美元融资,投前估值7300亿美元,投资方包括亚马逊、英伟达和软银。这笔资金将用于扩大AI基础设施、提升全球影响力,推进通用人工智能(AGI)惠及全人类的使命。与亚马逊和英伟达的战略合作伙伴关系将增强计算能力和企业AI创新。
26
Scaling AI for Everyone
(openai.com)
📰 HN
2
分
·
meetpateltech
·
18 天前
·
0 评论
AI Chips
Amazon AI
OpenAI宣布了一轮1100亿美元的投资,投前估值达7300亿美元,投资方包括软银、NVIDIA和亚马逊。该公司与亚马逊和NVIDIA建立战略合作伙伴关系,扩展计算基础设施,以让更多用户和企业使用ChatGPT和Codex等AI产品。这笔资金还增强了OpenAI基金会在健康和AI韧性领域的慈善能力。
27
Nvidia and Analyslop
(wheresyoured.at)
📰 HN
1
分
·
7777777phil
·
18 天前
·
0 评论
AI Chips
这篇文章讨论了英伟达的年度收益报告,指出其超出预期并上调了展望。文章强调超大规模企业占英伟达数据中心收入的50%以上,而来自非“七大”公司的收入持续下降。作者还提到其付费newsletter包含对英伟达及AI相关主题的详细分析。
28
Nvidia Linux Driver fork with P2PDMA support enabled on non-SoC platforms
(github.com)
📰 HN
2
分
·
milaaaaaaa
·
18 天前
·
0 评论
AI Chips
该故事链接到一个Nvidia Linux驱动的GitHub仓库分支,该分支在非SoC平台上启用了P2PDMA支持。这个开源项目增强了GPU功能,与依赖Nvidia硬件的AI工作负载相关。
29
DeepSeek withholds latest AI model V4 from US chipmakers including Nvidia
(business-standard.com)
📰 HN
1
分
·
iamnothere
·
18 天前
·
0 评论
AI Chips
Open Source AI
文章报道,AI公司深度求索(DeepSeek)正将其最新AI模型V4对包括英伟达在内的美国芯片制造商进行限制。这一决定是深度求索在其AI模型向美国特定实体开放问题上的一项战略举措。
30
Why NVLink Is Nvidia's Secret Sauce Driving a 10x Performance Boost in MoEs
(hpcwire.com)
📰 HN
1
分
·
rbanffy
·
19 天前
·
0 评论
AI Chips
这篇文章探讨了英伟达的NVLink技术为何是混合专家(MoE)模型实现10倍性能提升的关键因素。文章可能会分析NVLink如何通过改善GPU间通信来增强MoE模型的性能。
1
2
...
15
第 1 / 15 页,共 441 条
📅
周报