66安卓网:绿色免费的软件下载站! 手机游戏| 街机游戏| 新游| 人气手游| 最新更新

谷歌的Gemma4已经正式发布,而且这是它首次采用Apache2.0开源许可协议

来源: 66安卓网 日期:2026-04-26 13:50:08
首页热门资讯软件教程 → 谷歌的Gemma4已经正式发布,而且这是它首次采用Apache2.0开源许可协议

谷歌推出了Gemma 4系列,这是该公司目前推出的最强大的开放模型家族。这四款新模型能够在从智能手机到工作站的各类平台上运行,并且首次以完全开放的Apache 2.0许可进行发布。

这些模型依托于和谷歌专属的Gemini 3相同的技术构建,并且按照商业许可的Apache 2.0许可证进行发布,让开发者能够对自身的数据、基础设施以及模型拥有完整的掌控权。而早期的Gemma版本所采用的是更为严苛的谷歌专有许可协议。

据谷歌称,所有Gemma 4模型在多步推理和数学任务方面都有显著提升。对于代理型工作流,它们原生支持函数调用、结构化JSON输出和系统指令,使自主代理能够调用各种工具和API。

四种型号尺寸涵盖从边缘设备到工作站的各种设备

Gemma 4 有四个规模:有效 2B(E2B)、有效 4B(E4B)、26B 专家混合模型(MoE)和 31B 密集模型。这四个都超越了简单的聊天,处理复杂的逻辑和代理式工作流程。

31B型号当前在全球Arena AI文本排行榜的全球开放模型类别中位居第3名,26B模型则排在第6名。谷歌称,Gemma 4的性能比体积是它20倍的模型还要出色。对于开发者而言,这表明高性能表现能大幅减少对硬件的需求。

两款较大的型号主要面向工作站和服务器。31B型号的未量化bfloat16权重可以安装在一块80GB的NVIDIA H100显卡上,量化版本也能运行在消费级显卡上。

260亿MoE模型在推理过程中仅激活38亿参数,这使得代币生成速度特别快。31B密集模型则旨在追求最高质量,旨在作为微调的基础。

较小的E2B与E4B型号是专门针对移动设备和物联网硬件开发的。在推理过程中,它们分别激活20亿和40亿参数,以此来减少内存占用并延长电池使用时间。这两款边缘模型都能原生支持图像、视频和音频输入,从而实现语音识别功能。它们的上下文窗口可容纳128,000个代币,而更大的模型则能够处理最多256,000个代币。

Artificial Analysis的独立基准数据为大型Gemma 4型号提供了支持。在GPQA Diamond科学推理基准测试里,Gemma 4 31B在推理模式下的得分是85.7%。依据Artificial Analysis的数据,这一成绩在所有参数不足400亿的开放模型中排名第二,仅略低于Qwen3.5 27B的85.8%。在处理约120万个输出令牌时,Gemma 4 31B所需的计算量或许也比Qwen3.5 27B(150万个)和Qwen3.5 35B A3B(160万个)要少。

26B MoE模型在同一基准测试中取得79.2%的成绩,超过OpenAI的gpt-oss-120B(76.2%),不过稍逊于Qwen3.5 9B(80.6%)。Artificial Analysis提到,这两个接受评估的模型均在单块H100 GPU上运行。人工智能指数里四个Gemma 4模型的完整评估结果尚未出炉。和以往一样,基准测试数据对实际性能的预测作用存在局限。

Gemma 4 在哪里可以买到以及它支持哪些平台

《Gemma 4》目前已在Hugging Face、Kaggle以及Ollama平台正式上线。其中,Google AI Studio可支持31B与26B型号,Google AI Edge Gallery则负责处理E4B和E2B这两种变体。

在发布之际,这些模型兼容多种框架与平台,涵盖Hugging Face Transformers、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、NeMo、LM Studio、Unsloth、SGLang、Keras等。微调操作可借助Google Colab、Vertex AI或本地游戏级GPU完成。至于生产环境的部署,模型能够通过Vertex AI、Cloud Run和GKE在Google Cloud平台上实现扩展。

在硬件适配层面,谷歌指出Gemma 4能够兼容从Jetson Orin Nano这类入门级设备,到Blackwell GPU、基于ROCm协议栈的AMD显卡,还有谷歌自研的Trillium与Ironwood TPU等各类硬件。

相关资讯
相关下载
游戏攻略
更多+