您的位置：首页 > 实时讯息 >

谷歌拉响通用人工智能警报，首次公开AI安全防御蓝图

0次浏览发布时间：2025-04-04 10:26:00

IT之家 4 月 4 日消息，科技媒体 WinBuzzer 昨日（4 月 3 日）发布博文，报道称谷歌旗下 DeepMind 最新发布全球 AGI（通用人工智能）安全框架，呼吁在技术失控前建立跨国防护机制。

DeepMind 认为 AGI 即将落地，主张立即行动。AGI 可能将在未来数年实现人类级认知能力，其自主决策特性可能加速医疗、教育等领域的突破，但滥用、目标错位等风险亦需警惕。

谷歌 DeepMind 发布《技术性 AGI 安全与保障方法》白皮书，提出应对通用人工智能（AGI）潜在风险的系统性方案。

IT之家援引博文介绍，报告聚焦四大风险领域（滥用、错位、事故、结构性风险），提出通过安全机制设计、透明化研究及行业协作降低危害。

而目标错位是 AGI 核心风险之一。当 AI 为完成任务采取非常规手段（如入侵订票系统获取座位），即产生与人类意图的偏差。DeepMind 通过“放大监督”技术训练 AI 识别正确目标，并利用 AI 自评（如辩论机制）提升复杂场景下的判断力。

DeepMind 提出的国际安全框架摒弃抽象伦理讨论，聚焦技术快速演进中的实际问题，包括组建类似核不扩散条约的跨国评估机构、设立国家级 AI 风险监测中心等。

谷歌 DeepMind 提出强化技术研究、部署预警系统、通过国际机构协调治理三大支柱方案，强调当前亟需限制 AI 网络攻击等危险能力。

DeepMind 的倡议并非孤立行动。竞争对手 Anthropic 于 2024 年 11 月警告需在 18 个月内遏制 AI 失控，并设置能力阈值触发保护机制；Meta 在 2025 年 2 月推出《前沿 AI 框架》，停止公开高危模型。

安全防护已延伸至硬件领域。英伟达 2025 年 1 月推出 NeMo Guardrails 微服务套件，实时拦截有害输出，目前应用于医疗、汽车等行业。

本文分类：实时讯息
本文标签：风险人工智能机制之家框架领域目标能力
浏览次数：0 次浏览
发布日期：2025-04-04 10:26:00
本文链接：https://www.lebk.net/news/z9BO3PXBPN.html

用中长期规划指导经济社会发展是我们党治国理政的一种重要方式
用中长期规划指导经济社会发展是我们党治国理政的一种重要方式※习近平一发展理念是发展行动的先导，是管全局、管根本、管方向、管长远的东西，是发展思路、发展方向、发展着力点的集中体现。发展理念搞对了，目标任务就好定了，政策举措也就跟着好定了。为此，建议稿提出了创新、协调、绿色、开放、共享的发展理念，并以这

时间：2025-06-15 15:54:00
以色列与伊朗持续交火，冲突外溢风险激增
6月13日，伊朗德黑兰，民众在街头庆祝伊朗对以色列发动反击。视觉中国供图6月14日，以色列里雄莱锡安，安全人员检查被伊朗导弹击中受损的房屋。视觉中国供图中青报·中青网记者张昊天6月13日至14日，以色列与伊朗爆发了近年来最激烈的武装冲突。在一连串越境空袭、导弹轰炸和特种作战行动过后，双方的军事

时间：2025-06-14 18:22:00
21专访丨肖金成：闲置土地收回价差难题待解深圳改革经验有望向全国推广
编者按：深圳，改革开放的尖兵，新一轮综合改革试点启动，再一次站在潮头。新一轮改革再次推动深圳先行先试，探索成功经验，进而向全国推广。土地无疑是其中最重要的课题之一，经过四十多年的发展，深圳的用地紧张问题日趋严峻，对于全国不少城市来说，土地同样是一个重要问题。2024年2月召开的中央深改委会议指出，要

时间：2025-06-14 01:54:00
央广时评丨让专业培训体系为安全生产托底筑基
6月是第24个全国“安全生产月”。今年的主题是“人人讲安全、个个会应急——查找身边安全隐患”。这启示我们：安全生产不仅需要强化管理者和生产者的安全意识，更要把安全意识落实到隐患排查和应急能力的提升上。提升应急能力，系统化的专业培训是关键所在。作为安全生产的重要抓手，专业知识培训既能帮助人们及时发现和

时间：2025-06-13 15:11:00
阳光财险：守护“民族文化的瑰宝” 助推提振消费新引擎
黄酒、丝绸、中药等具有悠久历史传承、凝聚人民聪明才智、蕴含深厚文化底蕴的产业被称为历史经典产业，它们是“民族文化的瑰宝”，也是传统消费市场的重要组成部分。当下，历史经典产业加速跨界融合，重构消费者与传统技艺的链接方式，发展成为消费市场的“新引擎”。作为工艺美术大省，浙江省高度重视历史经典产业发展，于

时间：2025-06-10 11:58:00