GPT
发表时间:2025年12月12日浏览量:
财经新闻网12月12日电(编辑石正成)在谷歌被迫拉响“红色警报”后,OpenAi终于在周四推出了最新的GPT-5.2系列。图为OpenAi官方网站截图。 OpenAI 宣布,GPT-5.2 是迄今为止在“专业知识工作”中表现最好的模型系列,在创建电子表格、创建演示文稿、理解图像、编写代码和理解长上下文方面优于上一代产品。 GPT-5.2 提供三个不同的版本: Instant,一种针对互联网检索、翻译和写作等一般查询的速度优化模型;思考,超越复杂的结构化工作,如编程、数学、长文档分析等;以及顶级 Pro 型号,旨在为难题提供最大的准确性和可靠性。 OpenAi 特别强调,GPT-5.2 被认为是最适合现实世界专业用途的模型。我在评估 44 个职业的工作任务的 GDPVAL 测试中,70.9% 的人表现优于或等于领先的行业专业人士,包括创建销售演示、会计电子表格、制造流程图或短视频。在评估涵盖44个职业的知识型工作任务的GDPVAL测试中,70.9%的比较结果优于或等于行业领先的专业人士。此外,在金融AI领域,GPT-5.2思维的输出结果明显优于GPT-5.1。 OpenAI给出的例子表明,GPT 5.2思维在创建人力资源规划模型、股权结构表和项目管理表的任务上相比GPT-5.1思维有了明显的改进。除了OpenAI提供的创建PPT和Excel表格的示例外,OpenAI还表示GPT-5.2刷新了编码、数学、科学、视觉、长文本推理和工具使用方面的基准结果。钍该公司表示,这些改进将带来“更可靠的类似代理的工作流程、可用于生产的代码以及能够处理大规模上下文和现实世界数据的复杂系统。”在横向比较方面,GPT-5.2 认为在几乎所有列出的设置中都略微优于 Gemini 3 和 Anthropic 的 Claude Opus 4.5。提升书,从现实世界的软件工程任务(SWE-Bench Pro)和博士级别的科学知识(GPQA diamante)到抽象推理和模式发现(arc-agi 套件)。在几乎所有列出的清晰度测试中,GPT-5.2 思维略优于 Anthropic 的 Gemini 3 和 Claude Opus 4.5。 Openai 产品负责人 Max Schwarzer 周四还报告称,GPT-5.2 的认知反应比上一代减少了 38% 的错误,使模型在日常决策、研究和写作中更加可靠。从周四开始,GPT - 5.2 将向所有付费 ChATGPT 用户和 API 用户发布。那么这款新品多么适合“打工”的模式即将揭晓。作为Openai对Google的反击,GPT-5.2只是“第一击”。 Revealed公司首席执行官奥特曼周四表示,下周将给用户带来一些“圣诞小礼物”。他周四还表示,Gemini 3对公司各项指标的影响比最初担心的要小。他还表示,OpenAi 预计将在明年 1 月“以非常强劲的状态”退出当前的红色警报状态。图为奥特曼社交媒体帖子截图。 Openai 首席产品官 Fidji Simo 周四还宣布,已开始在一些地区推出年龄估计系统。该措施旨在控制 ChatGPT 对 18 岁以下用户的回复内容。西莫还表示,公司希望在明年第一季度推出“成人模式”之前推出这一功能。有点遗憾的是,周四的新品发布会似乎主要集中在新车型的辨识度上化功能,而不是启动新的图像生成器。从今年开始,一些令人惊叹的新产品发布都与图像和视频生成产品有关。奥特曼的《红色警戒》也注意到了图像生成能力的提升。此前有报道称,OpenAI 计划于明年 1 月发布新机型,具有更好的成像能力和更完整的个性化功能,但该公司周四并未证实这一传闻。
特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(如有,包括照片和视频)由网易HAO用户上传发布,网易HAO为社交媒体平台,仅提供信息存储服务。 
