赞
踩
前些天在一台linux服务器(8核,32G内存,无显卡)使用ollama运行阿里通义千问Qwen1.5和Qwen2.0低参数版本大模型,Qwen2-1.5B可以运行,但是推理速度有些慢。
一直还没有尝试在macbook上运行测试大模型,不知道单机部署是否会有压力?
恰好家里有一台平时用的较少的macbook,因此,简单做了一些测试,分享给大家,供参考和讨论。
所使用的Macbook Pro稍微有些老,配置如下:
(原来系统Catalina 10.15,发现没有brew命令,安装提示系统版本太低,apple已不再支持;同时系统提示,可以升级到最新mac OS,于是安装升级到最新的系统Sonoma,点击这里查询macOS Sonoma 与哪些电脑兼容)
我们简单实用Ollama方式运行大模型。
首先从Ollama官网下载安装包。
直接点击maxOS下载即可,下载的文件是Ollama.zip压缩文件,解压后是应用程序(ollama.apk),直接双击运行安装就可以。
安装完后,在启动台,就可以看到这个Ollama的图标。
接下来就可以从ollama模型库中,选择需要的模型,做实验测试了。
例如:我们选择阿里通义千问qwen2-1.5B参数的模型:qwen2:1.5b-instruct-q5_K_M
命令行直接运行: ollama run qwen2:1.5b-instruct-q5_K_M
如果下载失败,再次尝试即可。
- (modelscope) MacBook-Pro ~ % ollama run qwen2:1.5b-instruct-q5_K_M
- pulling manifest
- Error: pull model manifest: Get "https://registry.ollama.ai/v2/library/qwen2/manifests/1.5b-instruct-q5_K_M": dial tcp: lookup registry.ollama.ai: i/o timeout
-
- (modelscope) deMacBook-Pro ~ % ollama run qwen2:1.5b-instruct-q5_K_M
- pulling manifest
- pulling 9d9344b43f5a... 100% ▕████████████████████████████████████████████████████████▏ 1.1 GB
- pulling 62fbfd9ed093... 100% ▕████████████████████████████████████████████████████████▏ 182 B
- pulling c156170b718e... 100% ▕████████████████████████████████████████████████████████▏ 11 KB
- pulling f02dd72bb242... 100% ▕████████████████████████████████████████████████████████▏ 59 B
- pulling 624b547e1c39... 100% ▕████████████████████████████████████████████████████████▏ 487 B
- verifying sha256 digest
- writing manifest
- removing any unused layers
- success
- ▏ 120 MB/1.1 GB 930 KB/s

简单测试运行,发现执行速度比预期快(几秒内出结果),实验情况如下:
- >>> 今天是周三,7月4号。7月11号是周几?
- 2023年7月11日是星期三。
-
- >>> 从下面相应的文本中提取关键词。
- ... ###
- ... 文本1:{PicTech提供图片翻译API,开发者可以集成图片翻译到他们的跨境电商系统中。}
- ... 关键词1:PicTech, 图片翻译API, 开发者, 跨境电商系统
- ... ##
- ... 文本2:{Meta公司训练了非常擅长理解和生成文本的前沿语言模型,并且开源给全世界使用,这种开源精神加速了人类科技的发展,
- ... 非常值得尊敬。}
- ... 关键词2:Meta公司, 前沿语言模型, 开源, 人类科技的发展, 尊敬
- ... ##
- ... 文本3:{Neil长期从事互联网行业,对人工智能也非常感兴趣,致力于科技改变生活。}
- ... 关键词3
- ... ###
-
-
- 此题答案为:
-
- 1、PicTech, 图片翻译API, 开发者, 跨境电商系统
-
- 2、Meta公司, 前沿语言模型, 开源, 人类科技的发展, 尊敬
-
- 3、Neil, 互联网行业, 人工智能, 科技改变生活
-
- >>> Send a message (/? for help)

结论: 从运行速度来看,运行相同模型(Qwen2-1.5B),在这台macbook(4核,16G内存)运行速度,比之前在linux单机(8核,32G内存)运行速度要快了不少! 虽然linux机器,从cpu和内存上配置高于我这台macbook,或许两个系统在底层加速优化方面,macbook做的较好?!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。