本文作者:adminddos

苏州少儿搏击散打(报名咨询)1891-5555-567::苏州少儿武术散打(报名咨询)1891-5555-567:-历经两年研发,GPT-5终亮相!奥特曼:这是全球最先进的AI模型

adminddos 2025-08-08 07:20:25 7 抢沙发
苏州少儿搏击散打(报名咨询)1891-5555-567::苏州少儿武术散打(报名咨询)1891-5555-567:-历经两年研发,GPT-5终亮相!奥特曼:这是全球最先进的AI模型摘要: ...

北京时间 8 月 8 日凌晨 1 点,OpenAI 推出其最新大型人工智能模型 GPT-5,这是公司迄今最智能、快速且实用的 AI 系统。

OpenAI 首席执行官萨姆 · 奥特曼(Sam Altman)称,GPT-5 如同博士级专家团队,内置推理能力,能在编码、数学、写作、医疗和视觉感知等领域提供专家级回答,显著超越前代模型。

GPT-5 现通过 ChatGPT 向所有用户开放,包括免费、Plus、Pro 和 Team 用户。免费用户首次体验推理模型,达到限额后切换至 GPT-5 mini。Plus 用户享有更高使用限额,Pro 用户可无限制访问 GPT-5 及更强大的 GPT-5 Pro。企业版和教育版用户将在约一周后获得访问权限。OpenAI 还为开发者提供 GPT-5、GPT-5 mini 和 GPT-5 nano 三种 API 版本,满足不同需求。

AIME

GPT-5 在多项基准测试中创下新高:数学(AIME 2025 无工具得分 94.6%)、编码(SWE-bench Verified 74.9%,Aider Polyglot 88%)、多模态理解(MMMU 84.2%)和医疗(HealthBench Hard 46.2%)。

GPT-5 显著减少 " 幻觉 ",在匿名 ChatGPT 流量测试中,回答包含事实错误的概率比 GPT-4o 低 45%,推理模式下比 OpenAI o3 低 80%。

在 LongFact 和 FActScore 等事实性基准测试中,GPT-5(带推理)的幻觉率约为 o3 的六分之一,确保长篇内容更准确。OpenAI 引入 " 安全完成 " 训练,模型在处理模糊或双重用途问题时提供高层次、安全的回答,并透明解释拒绝原因,欺骗率从 4.8% 降至 2.1%。

OpenAI 在 GPT-5 开发过程中进行了广泛的安全评估,包括 5000 小时的测试。OpenAI 称,GPT-5 不会直接拒绝回答可能存在风险的问题,而是采用 " 安全完成 " 策略,提供符合安全限制的高层次回答,以避免潜在危害。

在简报会上,OpenAI 展示了 GPT-5 的 " 氛围编码 " 功能,即用户通过简单的文字提示即可生成软件。OpenAI 的研究人员要求 GPT-5 开发一个帮助英语使用者学习法语的网页应用,需具备吸引人的主题,包括闪卡、测验和每日进度跟踪功能。

OpenAI 在两个 GPT-5 窗口中输入相同提示,模型在几秒内生成了两个不同的应用。OpenAI 的研究人员表示,这些应用 " 有些粗糙 ",但用户可根据需要进一步调整 AI 生成的软件,例如更改背景或添加新标签。

微软首席执行官萨蒂亚 · 纳德拉(Satya Nadella)周四在 X 平台发帖称:" 难以相信当前距奥特曼在雷德蒙德向世界首次展示 GPT-4 仅过去两年半时间,技术进步之快令人惊叹。" 他指的是 2023 年 2 月奥特曼在微软华盛顿总部展示 GPT-4 的场景。

根据微软的博客文章,GPT-5 将迅速集成到微软产品中,包括 Microsoft 365 Copilot、面向消费者的 Copilot 以及供开发者将 AI 模型融入第三方应用的 Azure AI Foundry。

企业文件管理公司 Box 近几周对 GPT-5 进行了广泛测试。Box 首席执行官亚伦 · 列维 ( Aaron Levie ) 表示,以往 AI 模型在处理复杂数学或长文档逻辑时常失败,但 GPT-5 是 " 彻底的突破 "。他在接受 CNBC 采访时表示:" 该模型能保留更多信息,并运用更高水平的推理和逻辑能力进行决策。"(文 / 腾讯科技特约编译无忌,编辑 / 博阳)

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,7人围观)参与讨论

还没有评论,来说两句吧...