数月 → 几天:OpenAI被曝缩水模型安全测试,AI竞赛埋下隐患
IT之家 4 月 12 日消息,金融时报(FT)昨日(4 月 11 日)发布博文,报道称 OpenAI 大幅压缩最新大型语言模型(LLM)安全测试时间,此前需要数月时间,而最新 o3 模型仅有几天时间。
竞争驱动,安全让步
据八位知情人士透露,OpenAI 大幅压缩模型的安全测试时间,留给员工和第三方测试团队“评估”(evaluations,即测试模型风险和性能)时间仅有数天时间,而此前通常会耗时数月时间。
IT之家援引博文介绍,OpenAI 面临来自 Meta、Google 及 xAI 等对手的激烈竞争,需快速推出新模型以维持市场优势。o3 模型计划最早下周发布,留给测试者安全检查时间不到一周,而此前 GPT-4 的测试期长达六个月。
一位测试过 GPT-4 的人士透露,过去安全测试更彻底,某些危险能力在测试两个月后才被发现,而如今竞争压力迫使公司追求速度,忽视潜在风险。
测试不足,监管缺位
全球目前尚未统一 AI 安全测试标准,但欧盟《AI 法案》将于今年晚些时候上线,要求企业对其最强大的模型进行安全测试。
AI Futures Project 负责人 Daniel Kokotajlo 表示,由于缺乏强制监管,企业不会主动披露模型的危险能力,竞争压力进一步加剧了风险。
OpenAI 曾承诺构建定制模型版本,测试其潜在滥用风险,例如是否能协助制造更具传染性的生物病毒。
这种测试需投入大量资源,包括聘请外部专家、创建特定数据集并进行“微调”(fine-tuning)。但 OpenAI 仅对较老旧的模型进行有限微调,最新模型如 o1 和 o3-mini 未全面测试。前 OpenAI 安全研究员 Steven Adler 批评,若不兑现测试承诺,公众有权知情。
安全测试未覆盖最终模型
另一问题在于,安全测试通常基于早期“检查点”(checkpoints),而非最终发布模型。一位前 OpenAI 技术人员表示,发布未经测试的更新模型是“不良做法”,而 OpenAI 辩称,其检查点与最终模型“基本一致”,并通过自动化测试提高效率,确保安全。
-
高考后“最长假期”怎么过 “过来人”给考生支招
6月9日,2025年山西高考落幕。考生们将迎来近3个月的超长假期,在查询分数、填报志愿之余,这段时间该怎样安排?采访中,多位在读本科生、研究生,以“过来人”的身份,给学弟学妹们提出建议:可以适当放松,但不要虚度这个难得的假期,最好做个规划。如释重负当最后一门考试的结束铃声响起,考生们陆续走出考场。“
时间:2025-06-11 20:23:00 -
阳光财险:守护“民族文化的瑰宝” 助推提振消费新引擎
黄酒、丝绸、中药等具有悠久历史传承、凝聚人民聪明才智、蕴含深厚文化底蕴的产业被称为历史经典产业,它们是“民族文化的瑰宝”,也是传统消费市场的重要组成部分。当下,历史经典产业加速跨界融合,重构消费者与传统技艺的链接方式,发展成为消费市场的“新引擎”。作为工艺美术大省,浙江省高度重视历史经典产业发展,于
时间:2025-06-10 11:58:00 -
北京:学考等级考明日8点开始,注意事项→
2025年普通高中学业水平等级性考试(学考等级考)将于6月9日(周一)和6月10日(周二) 举行,请参加的考生务必注意↓↓6月9日物理科目和6月10日历史科目将于上午8:00准时开考。请考生及家长提前规划好出行路线,预留充足时间,确保每科开考前至少提前45分钟到达考点,从容应考。学考等级考时间安排祝
时间:2025-06-08 18:25:00 -
国产具身大模型首次获得汽车制造全场景验证
【国产具身大模型首次获得汽车制造全场景验证】财联社6月8日电,东风柳州汽车有限公司6月7日与智平方(深圳)科技有限公司在深圳正式签署战略合作协议,双方将共同探索具身大模型在汽车制造全方位场景的首次深度应用。根据协议,搭载智平方全域全身VLA(GOVLA)大模型的通用智能机器人AlphaBot 2(爱
时间:2025-06-08 09:31:00 -
99个车站车票起售时间明起调整
6月7日零时起,铁路部门对南京、南昌、广州南、上海虹桥、石家庄、济南等99个车站的车票起售时间点优化调整,起售时间间隔由30分钟调整为15分钟,起售时间点由21个增至41个,车票起售时间点仍为每日8时至18时。上述车站具体车次对应的起售时间点可通过铁路12306网站、客户端和车站公告等渠道查询,请旅
时间:2025-06-06 22:05:00