您的位置：首页 > 实时讯息 >

OpenAI，重大发布！奥特曼发声

0次浏览发布时间：2025-04-15 07:03:00

每经编辑：毕陆名

北京时间4月15日凌晨1点，OpenAI进行了技术直播发布了最新模型——GPT-4.1。

除了GPT-4.1之外，还有GPT 4.1-Mini和GPT 4.1-Nano两款模型，在多模态处理、代码能力、指令遵循、成本方面实现大幅度提升。特别是支持100万token上下文，这对于金融分析、小说写作、教育等领域帮助巨大。

图片来源：OpenAI官网截图

当日，OpenAI首席执行官奥特曼表示，GPT-4.1（以及-Mini和-Nano）现已在API中可用。

由于GPT-4.1的发布，OpenAI宣布将会淘汰刚发布不久的GPT-4.5，其能力可见一斑。

目前，如果想体验GPT-4.1而无法通过API身份验证的小伙伴，微软已经在Azure OpenAI上线了该模型，可以使用了。

GPT-4.1最大亮点之一就是支持100万tokens上下文，这也是OpenAI首次发布长窗口模型。

与前代模型相比，GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano能够处理多达100万tokens的上下文，是GPT-4o的8倍。

OpenAI在Long Context Evals上对长文本进行了测试，测试结果显示，GPT-4.1系列的三个模型均能够在语料库的任何深度找到目标文本，无论是开头、中间还是结尾，甚至在长达100万tokens的上下文中，模型依然能够准确地定位目标文本。

OpenAI还在Multi-Round Coreference进行了测试，通过创建合成对话来测试模型在长上下文中的理解和推理能力。在这些对话中，用户和助手交替进行对话，用户可能会要求模型生成一首关于某个主题的诗，接着要求生成另一首关于不同主题的诗，然后可能要求生成一个关于第三个主题的短故事。模型需要在这些复杂的对话中找到特定的内容，例如“第二篇关于某个主题的短故事”。

测试结果显示，GPT-4.1在处理长达128K tokens的数据时显著优于GPT-4o，并且在长达100万tokens的上下文中依然能够保持较高的性能。在编码能力测试中，SWEBench评估将模型置于Python代码库环境，让其探索代码库、编写代码和测试用例。结果显示，GPT-4.1的准确率达到55%，而GPT-4o仅为33%。

该测试中，模型会收到一个代码库和问题描述，然后其需要生成补丁来解决该问题，模型的表现会高度依赖于所使用的提示和工具。

在多语言编码能力测试方面，Ader polyglot基准测试涵盖多种编程语言和不同格式要求。GPT-4.1在差异性能上较GPT-4o提升一倍，在处理多语言编程任务、代码优化和版本管理时更高效。

在指令遵循能力测试中，OpenAI构建内部评估体系，模拟API开发者使用场景，测试模型对复杂指令的遵循能力。每个样本包含分属不同类别的复杂指令，并分难度等级。在困难子集评估中，GPT-4.1远超GPT-4o。

在多模态处理测试的视频MME基准测试中，GPT 4.1对30~60分钟无字幕视频进行理解并回答多项选择题，取得72%的成绩，达到当前最佳水平，在视频内容理解上实现重大突破。

价格方面，GPT-4.1系列在性能提升的同时，价格更具竞争力。GPT-4.1相比GPT-4o价格降低26%，而GPT-4.1 Nano作为最小、最快且最便宜的模型，每百万token的成本仅为12美分。

当地时间4月14日，OpenAI首席执行官山姆·奥特曼在社交平台透露，接下来的一周将发布很多新产品。本月初，他曾表示将在数周内发布o3、o4-mini，未来几月内发布GPT-5。

根据OpenAI在其官网上发布的公告，OpenAI两年前推出的人工智能模型GPT-4将于本月底从聊天机器人ChatGPT中“退役”。OpenAI表示，从4月30日起，GPT-4将被GPT-4o“完全取代”，后者是ChatGPT目前的默认模型。不过，GPT-4仍可通过OpenAI的API使用。

OpenAI写道，“在正面评估中，GPT-4o在写作、编码、STEM等方面一直超过GPT-4。此外，最近的升级进一步改进了GPT–4o的指令遵循、问题解决和会话流程，使其成为GPT-4的自然继承者。”

GPT-4于2023年3月推出，被用于ChatGPT和微软的Copilot聊天机器人。GPT-4模型具有多个版本，还拥有多模态功能，这允许它们同时理解图像和文本。OpenAI首席执行官奥尔特曼当时还表示，GPT-4的规模庞大，培训成本超过1亿美元。

后来在2023年11月，OpenAI推出GPT-4 Turbo模型，这是一种更快且更便宜的模型。

去年5月，GPT-4o被推出，其在多模态功能方面更加强大，据时任OpenAI首席技术官穆拉蒂表示，GPT-4o中的“o”代表了“全能”。

每日经济新闻综合OpenAI官网

免责声明：本文内容与数据仅供参考，不构成投资建议，使用前请核实。据此操作，风险自担。

每日经济新闻

本文分类：实时讯息
本文标签：模型测试指令能力代码上下文长达多模
浏览次数：0 次浏览
发布日期：2025-04-15 07:03:00
本文链接：https://www.lebk.net/news/5GDEm75Dyb.html

上一篇 > “挖掘机指数”折射一季度中国经济起步平稳
下一篇 > 周二你需要知道的隔夜全球要闻

康佳集团正式成为华润集团旗下业务单元
康佳专业化整合发布会15日在深圳举行。康佳正式成为华润集团旗下科技与新兴产业板块的业务单元。国务院国资委副主任李镇在发布会上表示，希望康佳融入华润集团后，加快转型升级，积极培育新的产业增长点，在推动产业高质量发展上展现新担当；强化科技创新，在关键核心技术领域实现新突破；推动整合运作，在体制机制改革上

时间：2025-08-17 08:35:00
事关脑机接口七部门发布重磅文件
河北新闻广播2025-08-08 08:20:06日前，工业和信息化部、国家发展改革委、教育部、国家卫生健康委、国务院国资委、中国科学院、国家药监局发布关于推动脑机接口产业创新发展的实施意见。到2027年脑机接口关键技术取得突破到2027年，脑机接口关键技术取得突破，初步建立先进的技术体系、产业体

时间：2025-08-08 08:44:00
债市进入“交易元年”、短债基金迎历史机遇、AI或将重塑消费……三大基金经理最新研判
编者按：当前资本市场正经历前所未有的变革与挑战，如何借助专业投研力量优化资产配置，成为投资者迫切关注的核心命题。与此同时，中国公募基金行业正经历从规模扩张向高质量发展的深刻生态变革，基金经理队伍的迭代更新与投研体系的深度重塑，为市场注入全新活力。在行业变革与市场波动交织之际，券商中国推出《基金经理周

时间：2025-07-22 10:47:00
聊天机器人惹祸，马斯克旗下公司致歉
当地时间12日，美国企业家埃隆·马斯克旗下的人工智能公司xAI为其聊天机器人Grok赞美希特勒等言论致歉，并解释说，事件由系统更新后误用一段已被废弃的代码造成，相关代码现已被移除。xAI在其社交媒体官方账号上写道：“我们为许多人经历的（Grok的）可怕行为深表歉意。”据《纽约时报》报道，7月8日，G

时间：2025-07-14 06:41:00
实测谷歌Gemma 3n：偏科明显，但这才是端侧大模型的答案
有一说一，最近国内的AI大模型圈，属实有点安静了。先不谈大伙万众瞩目的DeepSeek-R2了，这玩意除了半真半假的爆料以外，没有一点动静，有种哪怕再过半年时间，也不一定能够落地的感觉。去年打得你来我往的AI四小龙，今年好像也和小猫一样蔫了，说是大家都在闷声鼓捣着自己的东西，但愣是什么都没有端出来，

时间：2025-07-06 09:06:00