赞
踩
Gemma是谷歌于2024年2月21日发布的一系列轻量级、最先进的开放语言模型,使用了与创建Gemini模型相同的研究和技术。由Google DeepMind和Google其他团队共同开发。
Gemma提供两种尺寸的模型权重:2B和7B。每种尺寸都带有经过预训练(pre-trained)和经过指令调制(instruction-tuned)的变体。旨在为开发人员和研究者提供一个“轻量级、最先进的开源模型系列”Gemma提供了2B和7B两种不同规模的版本,每种都包含了预训练基础版本和经过指令优化的版本,并且无需数据量化处理,拥有高达8K tokens的处理能力。
Gemma模型可以在您的笔记本电脑、工作站或Google Cloud上运行,并可轻松部署到Vertex AI和Google Kubernetes Engine(GKE)。
Gemma具有以下优势:
Gemma可以应用于各种自然语言处理任务,包括:
Gemma是谷歌发布的一系列轻量级、最先进的开放语言模型,具有性能领先、易于使用、可扩展性和开放性等优势。Gemma可以应用于各种自然语言处理任务,具有广阔的应用前景。
以下是一些Gemma的应用案例:
available on kaggle
我下载的是2b-it-sfp模型,选择gemma.cpp可运行版本模型
- git clone --recursive https://github.com/google/gemma.cpp
- cd gemma.cpp
- cmake -G Ninja -Bbuild_ninja_arm64 -DCMAKE_BUILD_TYPE=Release -DCMAKE_TOOLCHAIN_FILE=$ANDROID_NDK/build/cmake/android.toolchain.cmake \
- -DANDROID_ABI=arm64-v8a -DANDROID_PLATFORM=android-21 -DANDROID_ARM_NEON=ON -DCMAKE_INSTALL_PREFIX=`pwd`/build_ninja_arm64/android_install -DHWY_ENABLE_TESTS=OFF .
- cmake --build build_ninja_arm64
- adb devices
-
- List of devices attached
- 172.16.0.89:5555 device
- # 拷贝执行程序
- adb push ./build_ninja_arm64/gemma /data/local/tmp
- # 拷贝库
- adb push build_ninja_arm64/3rdparty/sentencepiece/src/libsentencepiece.so /data/local/tmp
- # 先解压再拷贝模型
- tar -xvf gemma_model_2b_cxx_sfp.tar.gz
- adb push gemma_model_2b_cxx_sfp/2b-it-sfp.sbs /data/local/tmp
- adb push gemma_model_2b_cxx_sfp/tokenizer.spm /data/local/tmp
- export LD_LIBRARY_PATH=/data/local/tmp/
- ./gemma --tokenizer tokenizer.spm --compressed_weights ./2b-it-sfp.sbs --model 2b-it
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。