手机版
您的位置: 首页 > 实时讯息 >

OpenAI,重大发布!奥特曼发声

0次浏览     发布时间:2025-04-15 07:03:00    

每经编辑:毕陆名

北京时间4月15日凌晨1点,OpenAI进行了技术直播发布了最新模型——GPT-4.1。

除了GPT-4.1之外,还有GPT 4.1-Mini和GPT 4.1-Nano两款模型,在多模态处理、代码能力、指令遵循、成本方面实现大幅度提升。特别是支持100万token上下文,这对于金融分析、小说写作、教育等领域帮助巨大。

图片来源:OpenAI官网截图

当日,OpenAI首席执行官奥特曼表示,GPT-4.1(以及-Mini和-Nano)现已在API中可用。

由于GPT-4.1的发布,OpenAI宣布将会淘汰刚发布不久的GPT-4.5,其能力可见一斑。

目前,如果想体验GPT-4.1而无法通过API身份验证的小伙伴,微软已经在Azure OpenAI上线了该模型,可以使用了。

GPT-4.1最大亮点之一就是支持100万tokens上下文,这也是OpenAI首次发布长窗口模型。

与前代模型相比,GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano能够处理多达100万tokens的上下文,是GPT-4o的8倍。

OpenAI在Long Context Evals上对长文本进行了测试,测试结果显示,GPT-4.1系列的三个模型均能够在语料库的任何深度找到目标文本,无论是开头、中间还是结尾,甚至在长达100万tokens的上下文中,模型依然能够准确地定位目标文本。

OpenAI还在Multi-Round Coreference进行了测试,通过创建合成对话来测试模型在长上下文中的理解和推理能力。在这些对话中,用户和助手交替进行对话,用户可能会要求模型生成一首关于某个主题的诗,接着要求生成另一首关于不同主题的诗,然后可能要求生成一个关于第三个主题的短故事。模型需要在这些复杂的对话中找到特定的内容,例如“第二篇关于某个主题的短故事”。

测试结果显示,GPT-4.1在处理长达128K tokens的数据时显著优于GPT-4o,并且在长达100万tokens的上下文中依然能够保持较高的性能。在编码能力测试中,SWEBench评估将模型置于Python代码库环境,让其探索代码库、编写代码和测试用例。结果显示,GPT-4.1的准确率达到55%,而GPT-4o仅为33%。

该测试中,模型会收到一个代码库和问题描述,然后其需要生成补丁来解决该问题,模型的表现会高度依赖于所使用的提示和工具。

在多语言编码能力测试方面,Ader polyglot基准测试涵盖多种编程语言和不同格式要求。GPT-4.1在差异性能上较GPT-4o提升一倍,在处理多语言编程任务、代码优化和版本管理时更高效。

在指令遵循能力测试中,OpenAI构建内部评估体系,模拟API开发者使用场景,测试模型对复杂指令的遵循能力。每个样本包含分属不同类别的复杂指令,并分难度等级。在困难子集评估中,GPT-4.1远超GPT-4o。

在多模态处理测试的视频MME基准测试中,GPT 4.1对30~60分钟无字幕视频进行理解并回答多项选择题,取得72%的成绩,达到当前最佳水平,在视频内容理解上实现重大突破。

价格方面,GPT-4.1系列在性能提升的同时,价格更具竞争力。GPT-4.1相比GPT-4o价格降低26%,而GPT-4.1 Nano作为最小、最快且最便宜的模型,每百万token的成本仅为12美分。

当地时间4月14日,OpenAI首席执行官山姆·奥特曼在社交平台透露,接下来的一周将发布很多新产品。本月初,他曾表示将在数周内发布o3、o4-mini,未来几月内发布GPT-5。

根据OpenAI在其官网上发布的公告,OpenAI两年前推出的人工智能模型GPT-4将于本月底从聊天机器人ChatGPT中“退役”。OpenAI表示,从4月30日起,GPT-4将被GPT-4o“完全取代”,后者是ChatGPT目前的默认模型。不过,GPT-4仍可通过OpenAI的API使用。

OpenAI写道,“在正面评估中,GPT-4o在写作、编码、STEM等方面一直超过GPT-4。此外,最近的升级进一步改进了GPT–4o的指令遵循、问题解决和会话流程,使其成为GPT-4的自然继承者。”

GPT-4于2023年3月推出,被用于ChatGPT和微软的Copilot聊天机器人。GPT-4模型具有多个版本,还拥有多模态功能,这允许它们同时理解图像和文本。OpenAI首席执行官奥尔特曼当时还表示,GPT-4的规模庞大,培训成本超过1亿美元。

后来在2023年11月,OpenAI推出GPT-4 Turbo模型,这是一种更快且更便宜的模型。

去年5月,GPT-4o被推出,其在多模态功能方面更加强大,据时任OpenAI首席技术官穆拉蒂表示,GPT-4o中的“o”代表了“全能”。

每日经济新闻综合OpenAI官网

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

每日经济新闻

相关文章
  • 招320人!杭州外国语学校招生方案发布,明天开始报名

    刚刚,杭州外国语学校正式发布2025年招收初一新生方案。今年将面向杭州市主城区(上城区、拱墅区、西湖区、滨江区、钱塘区和西湖风景名胜区)招收8个班,共320人。网上报名时间自2025年4月28日12时至5月13日12时止。今年将继续采取学生自主报名、按一定比例电脑派位、组织语言学习能力测评的办法,根

    时间:2025-04-27 20:00:00
  • 合肥科技大佬,狠抓回款230亿元

    撰文丨何己派 编辑丨鄢子为刘庆峰带领的科大讯飞,惊险扭转局面。4月21日晚,这家合肥科技巨头,发布2024年成绩单。顶着前三季度净亏超3亿的压力,公司第四季度发力,挣回9个亿的利润,打了个翻身仗。时隔两年,这一年,科大讯飞的营收,重回双位数增长轨道。有太多人关注,这家公司未来要怎么走。22日的业绩沟

    时间:2025-04-27 09:09:00
  • 百度文心大模型最高降80% 李彦宏:创新的本质是成本下降

    4月25日消息,今日,百度Create开发者大会上,百度创始人李彦宏发布文心大模型4.5 Turbo,并再降价。对此,李彦宏表示:创新的本质是成本下降。对比文心4.5,文心大模型4.5 Turbo速度更快、价格下降80%,每百万token的输入价格仅为0.8元,输出价格3.2元,仅为DeepSeek

    时间:2025-04-25 17:51:00
  • 警惕容器攻击、模型投毒!这场论坛热议AI时代新型风险挑战

    4月23日,以“融合·创新·突破”为主题的第二届武汉网络安全创新论坛在武汉市东西湖区国家网络安全人才与创新基地启幕。在当天下午举行的“人工智能安全分论坛”上,政、产、学、研精英齐聚,围绕人工智能国际化合规路径、安全可信评估、标准体系建设、开源创新与共治、未成年人服务安全等议题展开深入研讨。第二届武汉

    时间:2025-04-24 14:29:00
  • 西安市第九医院成功举办“2025年基层医生糖尿病诊疗能力提升培训班”

    阳光讯(记者 张华)为贯彻落实西安市卫生健康委员会关于慢性病防治工作的部署要求,推动优质医疗资源下沉基层,提升基层医生内分泌疾病诊疗水平,西安市第九医院内分泌科于4月18日成功举办“2025年基层医生糖尿病诊疗能力提升培训班”,强化基层能力,共筑慢病防线,吸引了市内及周边各区县近50名基层医务工作者

    时间:2025-04-23 11:43:00