谷歌DeepMind最强手语翻译模型:SignGemma登场
IT之家 5 月 31 日消息,谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。
IT之家注:SignGemma 模型支持多语言功能,但目前主要针对美国手语(ASL)和英语进行了深度优化,开源属性意味着开发者可以自由使用并改进它。
DeepMind 希望通过这一技术,打破手语使用者在沟通上的障碍,让他们在工作、学习和社交中更顺畅地参与。
DeepMind 今年还推出 Gemma 3n 模型,支持从音频、图像、视频及文本输入生成智能文本,助力开发者打造实时互动应用。
此外,谷歌还与佐治亚理工学院及 Wild Dolphin Project 合作,推出 DolphinGemma 模型,分析并生成海豚声音,基于巴哈马大西洋斑点海豚的长期研究数据构建。
同时,MedGemma 模型作为 Gemma 3 家族新成员,聚焦医疗 AI,支持临床推理和医学影像分析,加速医疗与人工智能的融合创新。
-
世界环境日|AI升级,算力狂飙,地球能承受吗?
生成一张图片,需要多少电力?本文的封面图由DeepSeek与豆包联合生成,仅使用一条文字指令和一次图像请求。手机电量几乎未变,但背后的实际能耗,足够让它从零充满一次。从上游的芯片制造到下游的日常使用,人工智能发展的每个环节都需要消耗大量生态资源。此外,一家半导体制造厂每小时的用电量足以让100个人用
时间:2025-06-05 18:05:00 -
谷歌DeepMind最强手语翻译模型:SignGemma登场
IT之家 5 月 31 日消息,谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。IT之家注:SignGemma 模型支持多语言功能,但目前主要针对美国手语(A
时间:2025-05-31 11:24:00 -
AI战场,腾讯向左,阿里向右
文 | 硅基研究室,作者 | kiki作为中国两家公开表示「追求AGI」的科技大厂,腾讯和阿里成为了「互联网大厂派」中对AI投入最激进的两个典型案例。这几天,腾讯前脚在北京开了今年的AI产业应用峰会,把主题定位「全面拥抱AI」,阿里云后脚就开了中企出海大会,继续展露全球化的野心。特别是自DeepSe
时间:2025-05-23 16:16:00 -
寒武纪-U强化研发投入 探索新兴场景算力需求
作为A股算力龙头,寒武纪-U (688256)已经实现连续两个季度盈利。公司高管在2024年度暨2025年第一季度业绩说明会上表示,2025年,公司将持续加强研发投入,推动芯片产品向大模型及行业垂直领域延伸,探索新兴场景的算力需求。2024年寒武纪归属净利润-4.52亿元,同比上年亏损收窄近五成。其
时间:2025-05-12 15:53:00 -
人机对齐:破解AI伦理困境的“钥匙”
近年来,AI(人工智能)技术飞速发展,在带来效率革命的同时,也暴露出隐私泄露、歧视偏见、算法滥用等伦理问题。当AI在医疗健康领域的应用日益普及,人类能否对其托付生命健康?近日,健康报记者专访第十四届全国政协委员、研究员级高级工程师王江平,请他谈谈医疗AI存在的伦理风险以及应对策略。 医疗AI可能导致
时间:2025-05-06 17:33:00