谷歌推出新一代先进开源模型Gemma，轻量级高性能，助力AI创新

[ 首页 ] > 栏目[ Gemini ] > 文章[ 谷歌推出新一代先进开源模型Gemma，轻量级高性能，助力AI创新 ] 发布时间: 2024-02-22 编号: 41334

谷歌推出开源模型Gemma，这是一款轻量级、先进的开放模型，供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸，能够在不同的设备类型上运行，包括笔记本电脑、桌面电脑、IoT设备、移动设备和云端。

《谷歌推出新一代先进开源模型Gemma，轻量级高性能，助力AI创新》- 投稿作者:游戏TOP10 - 发布于:GetAI社区

以下是谷歌官方介绍全文翻译：

在谷歌，我们深信应当让AI惠及每一个人。长期以来，我们持续不断地为开源社区贡献创新成果，如Transformers、TensorFlow、BERT、T5、JAX、AlphaFold及AlphaCode等。今天，我们满怀激动地向大家介绍新一代来自谷歌的开放模型——Gemma系列，旨在助力开发者和研究人员负责任地构建人工智能应用。

Gemma 开放模型

Gemma 是一个由轻量级、业界领先开放模型组成的家族，其研发和技术基础与Gemini模型相同。这些模型由谷歌DeepMind和其他谷歌团队共同研发，受到Gemini的启发，而“Gemma”这个名字源自拉丁语，意为“珍贵的宝石”。除了发布模型权重外，我们还同步推出了配套工具，以促进开发者创新、加强协作并指导如何负责任地使用Gemma模型。

《谷歌推出新一代先进开源模型Gemma，轻量级高性能，助力AI创新》- 投稿作者:游戏TOP10 - 发布于:GetAI社区

Gemma即日起面向全球用户提供，以下是关键要点概述：

模型尺寸与变体：我们推出两种尺寸的模型权重：Gemma 2B和Gemma 7B，每个型号都包含了预训练版本和经过指令微调的变体。
负责任的生成式AI工具包：推出全新的《负责任生成式AI工具箱》，为利用Gemma开发更安全的人工智能应用程序提供指导和重要工具。
跨框架支持：我们为JAX、PyTorch和TensorFlow（通过原生Keras 3.0）等主流框架提供推理和监督微调（SFT）的工具链。
易于上手：现成的Colab和Kaggle笔记本，以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成，使您能够轻松开始使用Gemma。
灵活部署：预训练和调整后的Gemma模型可在您的笔记本电脑、工作站或谷歌云上轻松部署，并支持Vertex AI和Google Kubernetes Engine（GKE）。
卓越性能：经过多个AI硬件平台的优化，确保行业领先性能，包括NVIDIA GPU和谷歌云TPU。
商业使用与分发：使用条款允许所有规模的组织负责任地进行商业使用和分发。

卓越的性能表现

Gemma模型与我们最大且功能最全面的AI模型Gemini共享技术和基础设施组件。这使得Gemma 2B和7B在各自尺寸类别中，与其他开源模型相比，展现出卓越的性能。值得一提的是，Gemma在关键基准测试中显著超越了更大规模的模型，同时遵循了我们严格的安全和负责任输出标准。有关性能、数据集组成和建模方法的详细信息，请参阅技术报告。

《谷歌推出新一代先进开源模型Gemma，轻量级高性能，助力AI创新》- 投稿作者:游戏TOP10 - 发布于:GetAI社区

负责任设计理念

Gemma从设计之初便贯彻了我们的AI原则。为确保Gemma预训练模型的安全可靠，我们在训练阶段采用了自动化手段滤除部分个人信息及其他敏感数据。同时，通过大规模的微调及基于人类反馈的强化学习（RLHF），使我们的指令调整模型与负责任的行为保持一致。为了全面了解和降低Gemma模型的风险，我们进行了包括手动红队测试、自动化对抗测试以及模型对危险活动能力的评估在内的全面评估。这些评估的详细信息可查阅我们的模型卡片。

新的负责任生成式AI工具包

我们随同Gemma模型一起发布了一个全新的《负责任生成式AI工具包》，以辅助开发者和研究人员重点打造安全、负责任的AI应用。该工具包主要包括：

安全分类：我们提出了一种新颖方法，能够基于极少量示例构建强大的安全分类器。
调试工具：一款模型调试工具可以帮助您深入了解Gemma的行为模式，并及时处理可能存在的问题。
指南文档：您可以获得基于谷歌在大型语言模型开发与部署方面积累的最佳实践指导。

跨框架、工具和硬件的优化

您可以根据自己的数据对Gemma模型进行微调，以适应特定的应用需求，如摘要生成或检索增强的生成（RAG）。Gemma支持多种工具和系统：

多框架支持：选择您喜欢的框架，Gemma提供跨多框架Keras 3.0、原生PyTorch、JAX和Hugging Face Transformers的推理和微调参考实现。
跨设备兼容性：Gemma模型适用于多种流行设备类型，包括笔记本电脑、台式机、物联网设备、移动设备和云，使AI功能更加普及。
硬件平台优化：我们与英伟达合作，对Gemma进行优化，适用于从数据中心到云再到本地RTX AI PC的NVIDIA GPU，确保行业领先的性能和与尖端技术的集成。
针对谷歌云平台的优化：Vertex AI提供广泛的MLOps工具集，具有多种调优选项和内置推理优化的单击部署。使用完全托管的Vertex AI工具或自管理的GKE，可进行高级定制，包括在GPU、TPU和CPU上部署到成本高效的基础设施，跨两个平台。

免费的研究与开发资源

Gemma专为开放社区中的开发者和研究人员而造，他们正积极推动着AI领域的创新。您现在即可通过Kaggle免费体验Gemma，同时享用Colab笔记本的免费层级，首次注册谷歌云的用户还将获得300美元的信用额度。此外，研究人员还有机会申请最高达500,000美元的谷歌云信用额度，以加快其项目的推进速度。

开始使用

您可以通过访问 ai.google.dev/gemma.进一步探索Gemma的更多细节，并找到快速入门指南。随着Gemma模型家族的不断壮大，我们期待未来数周内推出适用于多种应用场景的新变体，并提供丰富的交流、学习和共建机会。我们无比期待见证您用Gemma创造的种种精彩成果！