手机版
您的位置: 首页 > 实时讯息 >

数月 → 几天:OpenAI被曝缩水模型安全测试,AI竞赛埋下隐患

0次浏览     发布时间:2025-04-12 12:44:00    

IT之家 4 月 12 日消息,金融时报(FT)昨日(4 月 11 日)发布博文,报道称 OpenAI 大幅压缩最新大型语言模型(LLM)安全测试时间,此前需要数月时间,而最新 o3 模型仅有几天时间。

竞争驱动,安全让步

据八位知情人士透露,OpenAI 大幅压缩模型的安全测试时间,留给员工和第三方测试团队“评估”(evaluations,即测试模型风险和性能)时间仅有数天时间,而此前通常会耗时数月时间。

IT之家援引博文介绍,OpenAI 面临来自 Meta、Google 及 xAI 等对手的激烈竞争,需快速推出新模型以维持市场优势。o3 模型计划最早下周发布,留给测试者安全检查时间不到一周,而此前 GPT-4 的测试期长达六个月。

一位测试过 GPT-4 的人士透露,过去安全测试更彻底,某些危险能力在测试两个月后才被发现,而如今竞争压力迫使公司追求速度,忽视潜在风险。

测试不足,监管缺位

全球目前尚未统一 AI 安全测试标准,但欧盟《AI 法案》将于今年晚些时候上线,要求企业对其最强大的模型进行安全测试。

AI Futures Project 负责人 Daniel Kokotajlo 表示,由于缺乏强制监管,企业不会主动披露模型的危险能力,竞争压力进一步加剧了风险。

OpenAI 曾承诺构建定制模型版本,测试其潜在滥用风险,例如是否能协助制造更具传染性的生物病毒。

这种测试需投入大量资源,包括聘请外部专家、创建特定数据集并进行“微调”(fine-tuning)。但 OpenAI 仅对较老旧的模型进行有限微调,最新模型如 o1 和 o3-mini 未全面测试。前 OpenAI 安全研究员 Steven Adler 批评,若不兑现测试承诺,公众有权知情。

安全测试未覆盖最终模型

另一问题在于,安全测试通常基于早期“检查点”(checkpoints),而非最终发布模型。一位前 OpenAI 技术人员表示,发布未经测试的更新模型是“不良做法”,而 OpenAI 辩称,其检查点与最终模型“基本一致”,并通过自动化测试提高效率,确保安全。

相关文章
  • 特斯拉公布Semi工厂建设进展及全新标识,预计首批量产车年底下线

    IT之家 4 月 29 日消息,特斯拉今日发布了一段视频,展示了其位于内华达超级工厂附近的 Semi 电动卡车专属生产基地建设情况,并首次公开该车型专属标识设计方案。 特斯拉 Semi 项目负责人 Dan Priestley 表示:“我们在过去数月中已经完成了厂房主体结构建设,包括墙体、立柱与混凝土

    时间:2025-04-29 10:09:00
  • 合肥科技大佬,狠抓回款230亿元

    撰文丨何己派 编辑丨鄢子为刘庆峰带领的科大讯飞,惊险扭转局面。4月21日晚,这家合肥科技巨头,发布2024年成绩单。顶着前三季度净亏超3亿的压力,公司第四季度发力,挣回9个亿的利润,打了个翻身仗。时隔两年,这一年,科大讯飞的营收,重回双位数增长轨道。有太多人关注,这家公司未来要怎么走。22日的业绩沟

    时间:2025-04-27 09:09:00
  • 国家电网成功使用大疆FlyCart 30无人机布设线缆

    IT之家 4 月 26 日消息,据“成都日报”报道,近日国家电网四川超高压公司在 500 千伏九石一线检修工作中,成功运用大疆 FC-30(DJI FlyCart 30)无人机挂设输电线路主接地线,这在四川电网超高压输电线路检修中尚属首次。▲ 图源成都日报据悉,500 千伏九石一线途经甘孜、凉山、雅

    时间:2025-04-26 16:27:00
  • 百度文心大模型最高降80% 李彦宏:创新的本质是成本下降

    4月25日消息,今日,百度Create开发者大会上,百度创始人李彦宏发布文心大模型4.5 Turbo,并再降价。对此,李彦宏表示:创新的本质是成本下降。对比文心4.5,文心大模型4.5 Turbo速度更快、价格下降80%,每百万token的输入价格仅为0.8元,输出价格3.2元,仅为DeepSeek

    时间:2025-04-25 17:51:00
  • 五一假期,高速5天免费!

    今天(4月24日),交通运输部介绍今年五一假期小客车免费通行全国收费公路时间:今年五一假期从5月1日到5月5日,共计5天,7座以下(含7座)小型客车免费通行时间为5月1日0时至5月5日24时。交通运输部预计,五一假期,高速公路总体保持高位运行态势:假期前一日18时—20时为节前高峰时段;假期首日,跨

    时间:2025-04-24 14:34:00