"H100" 搜索结果

AI HNAI 新闻与论文，智能精选

中

时间:

今天

3天

7天

30天

全部

来源:

全部

📰HN

📄论文

44 条 · "H100"

Real-world GPT-OSS-20B benchmark on L4, L40S and H100 (latency, tokens/SEC)(devforth.io)📰 HN

1 分·dotnot·23 天前·0 评论

AI ChipsOpenAI Ecosystem

本文对开源模型GPT-OSS-20B在L4、L40S和H100 GPU上进行基准测试，以衡量生产环境下的延迟、token吞吐量和成本效率等实际性能指标。文章还讨论了数据隐私问题如何推动企业考虑自托管LLM来解决影子AI风险，并概述了使用LLM API、本地提供商的主权AI以及本地硬件等策略。

Show HN: I track GPU rental prices – same H100 ranges from $0.80 to $3.19/HR(gpuperhour.com)📰 HN

1 分·hwspeed·29 天前·0 评论

AI Chips

这篇Show HN帖子介绍了一款跟踪多个云提供商实时GPU租赁价格的工具。它包含H100、V100和RTX系列等型号的数据，显示每小时租金及美国、芬兰、英国等地区的可用性。

Meta's Grand Teton Brings Nvidia Hopper to Its Data Centers(blogs.nvidia.com)📰 HN

1 分·onurkanbkrc·大约 1 个月前·0 评论

AI ChipsMeta AI

Meta发布了其下一代AI平台Grand Teton，这是一个由NVIDIA H100 GPU（基于Hopper架构）驱动的数据中心系统。该平台的网络带宽是Meta之前Zion系统的两倍，主机与GPU之间的带宽是四倍，支持更大的AI模型训练集群，并拥有更多内存以运行更大的模型。此外，它还提高了能源效率，H100加速服务器比纯CPU服务器节能高达300倍。

nanochat can now train GPT-2 grade LLM for –$73 (3 hours on single 8XH100 node)(twitter.com)📰 HN

1 分·tosh·大约 1 个月前·0 评论

这篇报道称，AI工具nanochat现在能够以约73美元的成本和仅3小时的时间，在单个8XH100节点上训练GPT-2级别的大型语言模型（LLM），凸显了其训练效率的提升。

AI Subscription vs. H100 [video](youtube.com)📰 HN

1 分·owenpalmer·大约 2 个月前·0 评论

AI Chips

💡 The title focuses on comparing an AI subscription with Nvidia H100 hardware, indicating a discussion or debate topic rather than a product launch, research paper, or business update.

Show HN: Floating-point drift between Apple M1 and H100 is real📰 HN

1 分·luxiedge·大约 2 个月前·0 评论

AI ChipsApple AI

用户发布了一篇Show HN帖子，称Apple M1和H100 GPU之间的浮点漂移是真实存在的，反驳了其“不可避免”的说法。他们提到在使用NumPy和PyTorch运行安全关键的数学工作负载时，两种硬件平台的结果不一致。

Furiosa: 3.5x efficiency over H100s(furiosa.ai)📰 HN

1 分·written-beyond·2 个月前·0 评论

AI Chips

FuriosaAI推出了NXT RNGD服务器，这是一款基于其RNGD加速器的一站式AI推理解决方案。它为关键AI工作负载提供高性能，可无缝集成到现有数据中心，预装了Furiosa SDK和LLM运行时以便应用安装后立即服务，并采用标准PCIe互连以避免专有基础设施。

"TSMC's U.S. Production Costs 2.4 Times Higher Than That in Taiwan"(newsletter.semianalysis.com)📰 HN

1 分·cwwc·2 个月前·0 评论

报道称台积电在美国的生产成本是台湾地区的2.4倍。作为AI计算组件的领先芯片制造商，这种成本差距可能影响AI硬件的定价和可用性。该故事可能探讨台积电海外工厂运营对AI供应链的影响。

Data on AI Chip Sales(epoch.ai)📰 HN

1 分·thunderbong·2 个月前·0 评论

AI ChipsGoogle AI

Epoch AI发布了一个AI芯片销售公开数据库，估算了英伟达、AMD、谷歌、华为等主要芯片设计商销售的专用AI加速器数量。该数据集包含芯片型号细分信息以及计算能力（以H100等效值衡量）等指标，不同芯片设计商的估算置信度存在差异。

The Ridiculous Engineering of the World's Most Important Machine [video](youtube.com)📰 HN

1 分·choult·2 个月前·0 评论

💡 The title references a critical machine likely related to AI compute (e.g., Nvidia H100 chip), which aligns with the hardware category focusing on AI chips and compute.

Veritasium: The Ridiculous Engineering of ASML Machine [video](youtube.com)📰 HN

1 分·sbt567·2 个月前·0 评论

AI Chips

这个故事聚焦于ASML光刻机器的工程细节，这些机器对于生产用于英伟达H100 GPU等AI硬件的先进半导体至关重要。内容可能探讨了这些机器的技术复杂性及其在AI芯片生产中的作用。

Bluetooth Headphone Jacking: A Key to Your Phone [video](media.ccc.de)📰 HN

1 分·AndrewDucker·2 个月前·0 评论

AI AgentAI Safety

研究人员发现Airoha蓝牙音频芯片中存在三个漏洞，这些芯片被用于索尼WH1000-XM5等AI功能耳机中，可导致设备完全被控制，并通过可信关系攻击配对的智能手机。他们展示了漏洞演示、检测工具，并批评制造商在更新通知方面对用户沟通不足。

The "setup tax" on AWS H100s is killing iterative research📰 HN

1 分·miyamotomusashi·3 个月前·0 评论

AI ChipsAmazon AI

这篇文章探讨了使用AWS H100实例与分布式消费级RTX4090 GPU微调70B参数AI模型的成本经济性，指出H100的“设置成本”可能阻碍迭代研究。

Who Invented the Transistor?(people.idsia.ch)📰 HN

1 分·todsacerdoti·3 个月前·0 评论

AI Chips

本文探讨了晶体管发明的历史，强调Julius Edgar Lilienfeld在1925-28年申请的场效应晶体管（FET）专利是现代计算机和智能手机中使用的基础设计。文章将其与贝尔实验室1948年的点接触晶体管（后者为死路）进行对比，并提及后续的FET变体以及Lilienfeld与贝尔实验室之间的优先权争议。

The "4-Hour Barrier": Forensic Audit of Sm_90 Logic Decay on Nvidia H100📰 HN

1 分·Stan_Byriukov·3 个月前·0 评论

AI Chips

作者对NVIDIA H100硬件上的自主推理模型进行了审计，发现了行业忽视的系统性确定性稳定性衰减问题。这些模型在模拟中表现出100%的可靠性，但在H100硬件的实际部署中存在问题。

After the Bubble(tbray.org)📰 HN

91 分·savant2·3 个月前·82 评论

AI Chips

本文分析了生成式AI泡沫即将破裂的问题，重点指出GPU的脆弱性（如Llama 3训练期间Nvidia H100的故障）和高功耗成本是关键因素。文章提到，与过去的泡沫（铁路、互联网泡沫）破裂后留下有价值基础设施不同，由于GPU损耗快和能源成本高，生成式AI泡沫破裂后可能不会留下类似的长期价值，并指出特殊目的实体（SPVs）是大型科技公司在不增加资产负债表债务的情况下建设AI数据中心的财务手段。

Are we repeating the telecoms crash with AI datacenters?(martinalderson.com)📰 HN

241 分·davedx·3 个月前·194 评论

本文将AI数据中心的繁荣与2000年代电信业崩溃进行对比，强调供需动态差异。与电信业光纤容量的指数级提升不同，AI GPU的每瓦性能增长正在放缓，而GPU功耗（如Blackwell B200的1000-1200W TDP）却大幅上升，表明AI基础设施具有独特的基本面。

US startup Substrate announces chipmaking tool that it says will rival ASML(reuters.com)📰 HN

89 分·outrun86·5 个月前·71 评论

AI Chips

美国初创公司Substrate宣布推出一款芯片制造工具，声称可与ASML的产品竞争，而ASML的工具对于生产AI系统所用的高端半导体至关重要。

Diamond Thermal Conductivity: A New Era in Chip Cooling(spectrum.ieee.org)📰 HN

78 分·rbanffy·5 个月前·43 评论

AI Chips

本文探讨了钻石热导率作为芯片冷却的新方案，这是包括高性能GPU等AI硬件在内的先进计算系统的关键需求。

America’s semiconductor boom [video](youtube.com)📰 HN

191 分·zdw·5 个月前·136 评论

AI Chips

这篇报道聚焦美国的半导体热潮，强调其与AI的相关性，因为半导体在驱动AI计算和相关硬件系统方面发挥着关键作用。

Processing Strings 109x Faster Than Nvidia on H100(ashvardanian.com)📰 HN

216 分·ashvardanian·6 个月前·26 评论

AI Chips

StringZilla v4是首个支持CUDA的SIMD优先字符串处理库版本，现已发布。它提供快速的编辑距离计算（500+ GigaCUPS），引入了基于AES的哈希和52位MinHash等新哈希函数，并支持信息检索、数据库和生物信息学等大规模工作负载。该库基于Apache 2.0开源协议，可通过pip安装。

Launch HN: RunRL (YC X25) – Reinforcement learning as a service(runrl.com)📰 HN

71 分·ag8·6 个月前·22 评论

本文介绍了由YC支持的强化学习即服务平台RunRL。该平台允许用户使用自定义奖励函数优化AI模型，集成OpenAI、Anthropic等现有AI API，并获取H100 GPU等训练所需的计算资源。平台为研究者和开发者提供SDK，同时有自助和企业级定价选项。

Deploying DeepSeek on 96 H100 GPUs(lmsys.org)📰 HN

285 分·GabrielBianconi·7 个月前·80 评论

AI ChipsOpen Source AI

LMSYS团队使用SGLang在96块H100 GPU（12个节点×8）上部署了DeepSeek大语言模型，采用预填充-解码分离和大规模专家并行技术。该实现达到了高吞吐量（对于2000 token输入，每个节点每秒处理52.3k输入token和22.3k输出token），性能与DeepSeek官方报告相当，成本仅为其API的五分之一，且完全开源并提供可复现的实验指导。

The Future of Compute: Nvidia's Crown Is Slipping(mohitdagarwal.substack.com)📰 HN

144 分·wilson090·11 个月前·120 评论

AI Chips

💡 The story discusses Nvidia's slipping dominance in the compute market, which is directly linked to AI hardware (e.g., GPUs like H100 used for AI training/inference), aligning with the hardware category.

The Tiny Star Explosions Powering Moore's Law(spectrum.ieee.org)📰 HN

131 分·mcharawi·大约 1 年前·13 评论

AI Chips

💡 The story discusses EUV light source, a critical technology for manufacturing advanced semiconductors (e.g., Nvidia H100) that power AI compute systems.

Huawei's Ascend 910C delivers 60% of Nvidia H100 inference performance(tomshardware.com)📰 HN

118 分·sien·大约 1 年前·61 评论

AI Chips

💡 The story focuses on Huawei's Ascend 910C AI chip and its inference performance relative to Nvidia's H100, which directly falls under the hardware category covering AI chips and compute.

CUDA Moat Still Alive(semianalysis.com)📰 HN

221 分·pella·大约 1 年前·172 评论

AI Chips

💡 The story discusses benchmarks of AI chips (Nvidia H100/H200, AMD MI300x) and CUDA's competitive advantage, which are core to AI hardware and compute.

Exploring inference memory saturation effect: H100 vs. MI300x(dstack.ai)📰 HN

57 分·latchkey·超过 1 年前·12 评论

AI Chips

💡 The story explores inference memory saturation effects by comparing Nvidia H100 and AMD MI300x chips, which are critical AI hardware components for compute and inference tasks.

U.S. chip revival plan chooses sites(spectrum.ieee.org)📰 HN

177 分·pseudolus·超过 1 年前·127 评论

AI Chips

💡 The story about the U.S. chip revival plan choosing sites relates to semiconductor manufacturing infrastructure, which is critical for AI compute (e.g., chips like Nvidia H100 used in AI data centers).

Ultraprecise method of aligning 3D semiconductor chips invented(techxplore.com)📰 HN

170 分·thebeardisred·超过 1 年前·24 评论

AI ChipsAI Safety

💡 The story focuses on an ultraprecise method for aligning 3D semiconductor chips, which are key components in AI hardware like Nvidia's H100 (using 3D stacking). This directly relates to AI-related chips and compute, fitting the hardware category.

第 1 / 2 页，共 44 条

📅周报

Hacker News|Powered by Doubao

时间:

今天

3天

7天

30天

全部

来源:

全部

📰HN

📄论文

44 条 · "H100"

Real-world GPT-OSS-20B benchmark on L4, L40S and H100 (latency, tokens/SEC)(devforth.io)📰 HN

1 分·dotnot·23 天前·0 评论

AI ChipsOpenAI Ecosystem

Show HN: I track GPU rental prices – same H100 ranges from $0.80 to $3.19/HR(gpuperhour.com)📰 HN

1 分·hwspeed·29 天前·0 评论

AI Chips

Meta's Grand Teton Brings Nvidia Hopper to Its Data Centers(blogs.nvidia.com)📰 HN

1 分·onurkanbkrc·大约 1 个月前·0 评论

AI ChipsMeta AI

nanochat can now train GPT-2 grade LLM for –$73 (3 hours on single 8XH100 node)(twitter.com)📰 HN

1 分·tosh·大约 1 个月前·0 评论

AI Subscription vs. H100 [video](youtube.com)📰 HN

1 分·owenpalmer·大约 2 个月前·0 评论

AI Chips

💡 The title focuses on comparing an AI subscription with Nvidia H100 hardware, indicating a discussion or debate topic rather than a product launch, research paper, or business update.

Show HN: Floating-point drift between Apple M1 and H100 is real📰 HN

1 分·luxiedge·大约 2 个月前·0 评论

AI ChipsApple AI

Furiosa: 3.5x efficiency over H100s(furiosa.ai)📰 HN

1 分·written-beyond·2 个月前·0 评论

AI Chips

"TSMC's U.S. Production Costs 2.4 Times Higher Than That in Taiwan"(newsletter.semianalysis.com)📰 HN

1 分·cwwc·2 个月前·0 评论

Data on AI Chip Sales(epoch.ai)📰 HN

1 分·thunderbong·2 个月前·0 评论

AI ChipsGoogle AI

The Ridiculous Engineering of the World's Most Important Machine [video](youtube.com)📰 HN

1 分·choult·2 个月前·0 评论

💡 The title references a critical machine likely related to AI compute (e.g., Nvidia H100 chip), which aligns with the hardware category focusing on AI chips and compute.

Veritasium: The Ridiculous Engineering of ASML Machine [video](youtube.com)📰 HN

1 分·sbt567·2 个月前·0 评论

AI Chips

Bluetooth Headphone Jacking: A Key to Your Phone [video](media.ccc.de)📰 HN

1 分·AndrewDucker·2 个月前·0 评论

AI AgentAI Safety

The "setup tax" on AWS H100s is killing iterative research📰 HN

1 分·miyamotomusashi·3 个月前·0 评论

AI ChipsAmazon AI

这篇文章探讨了使用AWS H100实例与分布式消费级RTX4090 GPU微调70B参数AI模型的成本经济性，指出H100的“设置成本”可能阻碍迭代研究。

Who Invented the Transistor?(people.idsia.ch)📰 HN

1 分·todsacerdoti·3 个月前·0 评论

AI Chips

The "4-Hour Barrier": Forensic Audit of Sm_90 Logic Decay on Nvidia H100📰 HN

1 分·Stan_Byriukov·3 个月前·0 评论

AI Chips

After the Bubble(tbray.org)📰 HN

91 分·savant2·3 个月前·82 评论

AI Chips

Are we repeating the telecoms crash with AI datacenters?(martinalderson.com)📰 HN

241 分·davedx·3 个月前·194 评论

US startup Substrate announces chipmaking tool that it says will rival ASML(reuters.com)📰 HN

89 分·outrun86·5 个月前·71 评论

AI Chips

美国初创公司Substrate宣布推出一款芯片制造工具，声称可与ASML的产品竞争，而ASML的工具对于生产AI系统所用的高端半导体至关重要。

Diamond Thermal Conductivity: A New Era in Chip Cooling(spectrum.ieee.org)📰 HN

78 分·rbanffy·5 个月前·43 评论

AI Chips

本文探讨了钻石热导率作为芯片冷却的新方案，这是包括高性能GPU等AI硬件在内的先进计算系统的关键需求。

America’s semiconductor boom [video](youtube.com)📰 HN

191 分·zdw·5 个月前·136 评论

AI Chips

这篇报道聚焦美国的半导体热潮，强调其与AI的相关性，因为半导体在驱动AI计算和相关硬件系统方面发挥着关键作用。

Processing Strings 109x Faster Than Nvidia on H100(ashvardanian.com)📰 HN

216 分·ashvardanian·6 个月前·26 评论

AI Chips

Launch HN: RunRL (YC X25) – Reinforcement learning as a service(runrl.com)📰 HN

71 分·ag8·6 个月前·22 评论

Deploying DeepSeek on 96 H100 GPUs(lmsys.org)📰 HN

285 分·GabrielBianconi·7 个月前·80 评论

AI ChipsOpen Source AI

The Future of Compute: Nvidia's Crown Is Slipping(mohitdagarwal.substack.com)📰 HN

144 分·wilson090·11 个月前·120 评论

AI Chips

The Tiny Star Explosions Powering Moore's Law(spectrum.ieee.org)📰 HN

131 分·mcharawi·大约 1 年前·13 评论

AI Chips

💡 The story discusses EUV light source, a critical technology for manufacturing advanced semiconductors (e.g., Nvidia H100) that power AI compute systems.

Huawei's Ascend 910C delivers 60% of Nvidia H100 inference performance(tomshardware.com)📰 HN

118 分·sien·大约 1 年前·61 评论

AI Chips

💡 The story focuses on Huawei's Ascend 910C AI chip and its inference performance relative to Nvidia's H100, which directly falls under the hardware category covering AI chips and compute.

CUDA Moat Still Alive(semianalysis.com)📰 HN

221 分·pella·大约 1 年前·172 评论

AI Chips

💡 The story discusses benchmarks of AI chips (Nvidia H100/H200, AMD MI300x) and CUDA's competitive advantage, which are core to AI hardware and compute.

Exploring inference memory saturation effect: H100 vs. MI300x(dstack.ai)📰 HN

57 分·latchkey·超过 1 年前·12 评论

AI Chips

💡 The story explores inference memory saturation effects by comparing Nvidia H100 and AMD MI300x chips, which are critical AI hardware components for compute and inference tasks.

U.S. chip revival plan chooses sites(spectrum.ieee.org)📰 HN

177 分·pseudolus·超过 1 年前·127 评论

AI Chips

Ultraprecise method of aligning 3D semiconductor chips invented(techxplore.com)📰 HN

170 分·thebeardisred·超过 1 年前·24 评论

AI ChipsAI Safety

第 1 / 2 页，共 44 条

📅周报