AI HN来自 Hacker News 的 AI 新闻
EN
今天
3天
7天
30天
全部
52 · "GPT-5"
每页
1
Show HN: Turn raw HTML into production-ready images for free(html2png.dev)
6 ·alvinunreal·2 天前·3 评论
Anthropic & ClaudeCode & Development
html2png.dev是一项免费API服务,可将原始HTML转换为生产级图像(PNG、JPEG、WebP、PDF等格式)。它专为LLM智能体设计,支持智能体通过HTTP请求直接使用,无需任何配置,并允许在HTML中使用Tailwind CSS和Google Fonts。生成的资源公开且临时,适用于Claude和GPT-5等智能体系统。
2
GPT-5.2-Codex(openai.com)
540 ·meetpateltech·7 天前·296 评论
Code & DevelopmentOpenAI Ecosystem
本文介绍了GPT-5.2-Codex,这是一款面向专业软件工程和防御性网络安全的先进智能体编码模型。它是OpenAI的新发布产品,旨在推动现实世界软件工程和网络能力的前沿发展。用户可通过文中提供的npm命令安装该模型。
3
I ported JustHTML from Python to JavaScript with Codex CLI and GPT-5.2 in hours(simonwillison.net)
270 ·pbowyer·9 天前·141 评论
Code & DevelopmentOpenAI Ecosystem
Simon Willison 使用 Codex CLI 和 GPT-5.2 在约4小时内将 Emil Stenström 的 Python 版 JustHTML HTML5 解析器移植到 JavaScript。最终的 JS 库(justjshtml)通过了 html5lib-tests 套件中的9200个测试,Willison 在过程中几乎没有手动操作,还同时完成了装饰圣诞树和观看电影等家庭活动。
4
GPT-5.2(openai.com)
189 ·meetpateltech·14 天前·3 评论
Code & DevelopmentOpenAI Ecosystem
这篇报道介绍了OpenAI推出的GPT-5.2模型,属于该公司最新的技术进展之一。内容发布在OpenAI官网的“最新进展”板块下,虽被截断,但推测涵盖了模型性能和特性等相关细节。该模型与GPT-5.1、Sora 2等一同被列为OpenAI的重要更新。
5
GPT-5.2(openai.com)
1195 ·atgctg·14 天前·1080 评论
Code & DevelopmentOpenAI Ecosystem
这篇文章主要关于OpenAI推出GPT-5.2,这是其GPT系列的新成员。内容包含模型性能等部分(尽管被截断),显示了该模型的进步细节。它属于OpenAI语言模型产品的最新更新之一。
6
DeepSeek-v3.2(huggingface.co)
63 ·meetpateltech·25 天前·1 评论
Open Source AI
DeepSeek-V3.2模型发布,该模型兼顾计算效率与推理、智能体性能。其包含适用于长上下文的DSA注意力机制、可扩展强化学习框架(高性能变体超过GPT-5)及智能体任务合成 pipeline,并在2025年IMO和IOI中获金牌。
7
Building more with GPT-5.1-Codex-Max(openai.com)
483 ·hansonw·大约 1 个月前·319 评论
OpenAI发布了新模型GPT-5.1-Codex-Max,该模型具备前沿编码能力,在速度和成本效率上有所提升,支持长时间运行任务,并包含构建安全AI代理的相关功能。这是OpenAI的一项产品发布,内容标签和结构均表明了这一点。
8
GPT-5.1 for Developers(openai.com)
112 ·tedsanders·大约 1 个月前·29 评论
这篇文章介绍了面向开发者的GPT-5.1模型发布,包含高效推理、自适应推理、新增无推理模式、扩展提示缓存以及增强的编码能力等特性。此外,文章还提及apply_patch和shell等新工具,以及定价、可用性和模型评估相关内容。
9
GPT-5.1: A smarter, more conversational ChatGPT(openai.com)
555 ·tedsanders·大约 1 个月前·726 评论
OpenAI Ecosystem
OpenAI发布GPT-5.1作为GPT-5系列的升级版本,包含Instant(更友好、更智能)和Thinking(推理能力更强、简单任务速度更快)两个变体。此次更新让ChatGPT更具对话性且更易于定制,今日开始向所有用户推出,首先面向付费用户。
10
Benchmarking leading AI agents against Google reCAPTCHA v2(research.roundtable.ai)
124 ·mdahardy·大约 2 个月前·97 评论
Google AI
本文对三个领先的AI智能体(Claude Sonnet4.5、Gemini2.5 Pro和GPT-5)解决Google reCAPTCHA v2挑战的能力进行基准测试,发现Claude Sonnet4.5的总体成功率最高(60%),其次是Gemini2.5 Pro(56%)和GPT-5(28%)。不同类型的CAPTCHA任务表现差异显著,所有模型在静态挑战中表现最佳,跨瓷砖挑战中表现最差,而GPT-5的不佳表现主要归因于过度推理导致超时。
11
Reverse engineering Codex CLI to get GPT-5-Codex-Mini to draw me a pelican(simonwillison.net)
168 ·simonw·大约 2 个月前·76 评论
Code & DevelopmentOpenAI Ecosystem
Simon Willison对OpenAI开源的Codex CLI工具(基于Rust)进行逆向工程,添加"codex prompt"子命令,以直接访问部分发布的GPT-5-Codex-Mini模型。他使用Codex的危险模式编译和修改该工具,添加了自定义提示、模型选择和系统消息等功能——利用开源漏洞,因为OpenAI尚未打算让公众直接访问该模型。
12
GPT-5-Codex-Mini – A more compact and cost-efficient version of GPT-5-Codex(github.com)
56 ·wahnfrieden·大约 2 个月前·54 评论
该新闻宣布发布GPT-5-Codex-Mini,这是GPT-5-Codex的一个更紧凑且成本效益更高的版本,可通过OpenAI的Codex GitHub仓库获取。
13
Sam Altman's pants are on fire(garymarcus.substack.com)
210 ·toomuchtodo·大约 2 个月前·125 评论
AI & EmploymentMeta AI
这篇文章链接到Gary Marcus的Substack帖子,内容涉及对Sam Altman的批评,评论区讨论了AI行业救助、潜在失业等社会影响,同时包含关于LLM局限性和GPT-5过度炒作的相关文章链接。
14
Developers are choosing older AI models(augmentcode.com)
183 ·knes·大约 2 个月前·176 评论
Anthropic & ClaudeCode & Development
本文分析了生产环境中开发者对AI模型(如Sonnet4.5、Sonnet4.0和GPT-5)的采用模式,发现团队正基于任务特性选择模型而非单纯追求新版本。文章对比了各模型的行为差异:Sonnet4.5更注重深度内部推理(导致更高token输出和稍低吞吐量),而Sonnet4.0倾向于频繁调用工具以快速完成任务;同时还探讨了模型的计算足迹和缓存利用率等指标。
15
OpenAI researcher announced GPT-5 math breakthrough that never happened(the-decoder.com)
430 ·Topfi·2 个月前·234 评论
OpenAI Ecosystem
一篇关于OpenAI研究员宣布GPT-5在数学领域取得突破,但该突破随后被证实不存在的报道。
16
GPT-5o-mini hallucinates medical residency applicant grades(thalamusgme.com)
195 ·medicalthrow·2 个月前·119 评论
ThalamusGME针对其AI工具Cortex(使用GPT-5o-mini)解析医疗 residency 申请成绩时出现的不准确问题作出回应。该工具通过AAMC合作向ERAS项目免费提供,已立即纠正错误;建议审核人员对照官方成绩单验证数据。
17
LLMs are getting better at character-level text manipulation(blog.burkert.me)
138 ·curioussquirrel·2 个月前·108 评论
Anthropic & ClaudeCode & Development
本文探讨了较新的大语言模型代际(如GPT-4.1、GPT-5变体、Claude Sonnet4)在字符级任务(如句子中特定字符替换和字符计数)上的性能提升,与早期模型(GPT-3.5、GPT-4)相比。文章展示了测试结果,表明这些较新的模型即使在某些情况下禁用推理功能也能可靠完成此类任务,而旧模型则表现不佳。
18
GPT-5-Codex is a better AI researcher than me(seangoedecke.com)
64 ·codeclimber·3 个月前·36 评论
作者分享了作为业余爱好者使用GPT-5-Codex进行AI研究的经历,包括修改训练脚本、运行实验和提出下一步建议。文章详细描述了Codex自主行动与作者选择之间的迭代循环,提到了token使用成本,并指出Codex能够从之前的笔记继续研究。
19
What GPT-OSS leaks about OpenAI's training data(fi-le.net)
348 ·fi-le·3 个月前·82 评论
OpenAI Ecosystem
本文分析了OpenAI的GPT-oss开源权重模型,以揭示其训练数据的细节。它利用令牌嵌入范数识别可能未出现在训练中的令牌(低范数)和频繁出现的令牌(高范数,如编码相关术语)。该分析还暗示GPT-5的训练数据包含成人网站的短语,并讨论了作为对抗性输入的glitch令牌。
20
The QMA Singularity(scottaaronson.blog)
80 ·frozenseven·3 个月前·32 评论
Scott Aaronson与Freek Witteveen在arXiv上发表论文,研究量子复杂度类QMA中黑箱放大的限制,证明双指数完备性是此类过程的最优解。文章提到GPT-5为其论证提供了一个函数建议,而一位人类评论者提出了更优的替代方案,解决了一个未解决的问题。
21
Spectral Labs releases SGS-1: the first generative model for structured CAD(spectrallabs.ai)
319 ·JumpCrisscross·3 个月前·65 评论
Spectral Labs发布了SGS-1,这是首个用于结构化CAD的生成模型,可从图像或网格生成可制造的参数化3D几何图形。该模型在基准测试中优于GPT-5和HoLa,展现出强大的空间理解能力,适用于设计装配支架等实际工程任务。
22
Tau² benchmark: How a prompt rewrite boosted GPT-5-mini by 22%(quesma.com)
197 ·blndrt·3 个月前·65 评论
本文讨论使用Tau²基准测试评估GPT-5-mini在电信领域智能体交互中的性能,其初始成功率为55%。文章随后详细介绍了如何通过Claude重写提示词将GPT-5-mini的成功率提升22%,重点在于增强AI智能体的可靠性和处理智能体任务的能力。
23
GPT‑5-Codex and upgrades to Codex(simonwillison.net)
57 ·amrrs·3 个月前·15 评论
Code & DevelopmentOpenAI Ecosystem
OpenAI发布了针对编码任务优化的GPT-5变体模型GPT-5-Codex,目前已集成到VS Code扩展和Codex CLI等工具中,计划很快开放API访问。该模型的主要功能包括改进的代码审查、基于任务复杂度的动态思考时间以及更出色的重构性能。
24
Addendum to GPT-5 system card: GPT-5-Codex(openai.com)
250 ·wertyk·3 个月前·141 评论
本文介绍了GPT-5-Codex系统卡片的补遗。GPT-5-Codex是GPT-5的优化版本,专注于智能体编码任务,通过强化学习在真实世界编码任务上训练,可本地或云端使用。补遗概述了该模型的全面安全措施,包括针对有害任务和提示注入的模型层面训练及产品层面缓解手段。
25
GPT-5-Codex(openai.com)
396 ·meetpateltech·3 个月前·137 评论
Code & DevelopmentOpenAI Ecosystem
这篇文章介绍了Codex的升级,使其更快、更可靠,在实时协作和任务处理方面表现更出色。此外,文章还提到了Codex CLI、IDE扩展、Codex云服务以及代码审查等新功能。
26
GPT-5 Thinking in ChatGPT (a.k.a. Research Goblin) is shockingly good at search(simonw.substack.com)
52 ·klelatti·4 个月前·13 评论
OpenAI Ecosystem
本文讨论了集成在ChatGPT中的GPT-5(被称为Research Goblin),强调其在搜索任务中的出色表现。评论区包含对Claude和OpenAI Codex等相关AI工具的询问,以及对Claude Skills和AI智能体等主题的提及。
27
GPT-5 Thinking in ChatGPT (a.k.a. Research Goblin) is good at search(simonwillison.net)
361 ·simonw·4 个月前·255 评论
OpenAI Ecosystem
本文讨论了ChatGPT中GPT-5(被作者称为Research Goblin)在搜索任务中的出色表现,称其能高效处理各类简单或复杂的查询。文中举例包括调查希思罗机场弹性自动步道的更换时间、识别雷丁市的某栋建筑、研究英国星巴克是否售卖蛋糕pops等,GPT-5通过Bing支持的搜索工具提供了全面结果。
28
From GPT-4 to GPT-5: Measuring progress through MedHELM [pdf](fertrevino.com)
127 ·fertrevino·4 个月前·96 评论
这则新闻关注通过MedHELM基准来衡量从GPT-4到GPT-5的进展,可能旨在评估它们在医疗AI能力方面的提升。
29
Claim: GPT-5-pro can prove new interesting mathematics(twitter.com)
256 ·marcuschong·4 个月前·150 评论
有人声称,人工智能模型GPT-5-pro具备证明新的有趣数学结论的能力。
30
Teaching GPT-5 to Use a Computer(prava.co)
94 ·Areibman·4 个月前·23 评论
这则新闻报道了旨在训练先进AI模型GPT-5与计算机系统交互并有效利用其功能的相关举措。
第 1 / 2 页,共 52 条
📅周报
Hacker News|Powered by Doubao