news 2026/5/1 9:55:19

【mac 私有化大模型】

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【mac 私有化大模型】

mac 私有化大模型

Ollama安装

Ollama = 面向本地/私有部署的大模型运行时 + 模型管理器
封装了llama.cpp + Metal,并提供 OpenAI 风格 API

brew安装

brewinstallollama qp@qp-mac ~ % brewinstallollama==>Fetching downloads for: ollama ✔︎ Bottle ollama(0.13.5)[Downloaded10.8MB/10.8MB]==>Pouring ollama-0.13.5.arm64_sequoia.bottle.tar.gz==>Caveats To start ollama now and restart at login: brew services start ollama Or,ifyou don't want/need a backgroundserviceyou can just run:OLLAMA_FLASH_ATTENTION="1"OLLAMA_KV_CACHE_TYPE="q8_0"/opt/homebrew/opt/ollama/bin/ollama serve==>Summary 🍺 /opt/homebrew/Cellar/ollama/0.13.5:8files,30.1MB==>Running`brew cleanup ollama`... Disable this behaviour by setting`HOMEBREW_NO_INSTALL_CLEANUP=1`.Hide these hints with`HOMEBREW_NO_ENV_HINTS=1`(see`manbrew`).

配置局域网可以访问

exportOLLAMA_HOST=0.0.0.0:11434 brew services restart ollama

启动ollama

qp@qp-mac ~ % brew services start ollama==>Successfully started`ollama`(label: homebrew.mxcl.ollama)

默认端口:11434

验证

http://127.0.0.1:11434# orcurlhttp://127.0.0.1:11434/api/tags# orqp@qp-mac ~ %lsof-i -n -P|grepollama ollama43081qp 4u IPv4 0xc5e6c9b631d67461 0t0 TCP127.0.0.1:11434(LISTEN)ollama43081qp 9u IPv4 0xf2f010455ddbff8d 0t0 TCP127.0.0.1:11434->127.0.0.1:53521(ESTABLISHED)ollama43081qp 10u IPv4 0x9e8ee2687fbe3b7 0t0 TCP127.0.0.1:11434->127.0.0.1:53522(ESTABLISHED)

查看版本

ollama --version

brew 查看启动

brew services list

Ollama 拉取大模型

pull

ollama pull qwen2.5:7b pulling manifest pulling 2bada8a74506:100% ▕███████████████████████████████████████████████████████████████████████████████████▏4.7GB pulling 66b9ea09bd5b:100% ▕███████████████████████████████████████████████████████████████████████████████████▏68B pulling eb4402837c78:100% ▕███████████████████████████████████████████████████████████████████████████████████▏1.5KB pulling 832dd9e00a68:100% ▕███████████████████████████████████████████████████████████████████████████████████▏11KB pulling 2f15b3218f05:100% ▕███████████████████████████████████████████████████████████████████████████████████▏487B verifying sha256 digest writing manifest success

list

qp@qp-mac ~ % ollama list NAME ID SIZE MODIFIED qwen2.5:7b 845dbda0ea484.7GB6minutes ago

run

ollama run qwen2.5:7b qp@qp-mac ~ % ollama run qwen2.5:7b>>>你是谁 我是Qwen,一个由阿里云开发的语言模型助手。我旨在提供帮助和互动,解答用户的问题或进行对话。你可以问我任何问题或者和我聊天,我会尽力给你最好的 回答。>>>Use Ctrl + d or /bye to exit.>>>/bye
# 再次输入qp@qp-mac ~ %curlhttp://127.0.0.1:11434/api/tags{"models":[{"name":"qwen2.5:7b","model":"qwen2.5:7b","modified_at":"2026-01-09T09:14:34.15044164+08:00","size":4683087332,"digest":"845dbda0ea48ed749caafd9e6037047aa19acfcfd82e704d7ca97d631a0b697e","details":{"parent_model":"","format":"gguf","family":"qwen2","families":["qwen2"],"parameter_size":"7.6B","quantization_level":"Q4_K_M"}}]}

tips

  1. 使用ollama run qwen2.5:7b是可以在终端中直接对话,这是一个 REPL 交互模式

    • 会占用当前终端
    • 关闭终端 / Ctrl+C 会话结束
    • 不适合长期服务或多用户
  2. 接入webui 不需要ollama run

    Web UI / 程序调用Ollama,用的是 HTTP API,不是ollama run

    • ollama serve(或 brew service 启动)
    • 提供一个 长期运行的模型服务
    • 默认端口:11434
    • 只要 Ollama 服务在运行,Web UI 就能直接用。

配置 web-ui

docker 镜像拉取

dockerrun -d\--name open-webui\-p3000:8080\-eOLLAMA_BASE_URL=http://host.docker.internal:11434\--restart unless-stopped\ghcr.io/open-webui/open-webui:main

启动需要大改10分钟左右

# 本地访问 http:/127.0.0.1:3000 就可以了# 配置账号密码 admin 123123 就可以使用
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 8:08:39

Sambert-HifiGan语音合成服务的自动化监控告警

Sambert-HifiGan语音合成服务的自动化监控告警 引言:为何需要对语音合成服务进行自动化监控? 随着AIGC技术的快速发展,语音合成(TTS)系统已广泛应用于智能客服、有声读物、虚拟主播等场景。在生产环境中,一…

作者头像 李华
网站建设 2026/4/26 12:36:58

通达信能抓板的乾坤线主图指标

{}AS:(C*3OHL)/6; XJ:(AS0.618*REF(AS,1)0.382*REF(AS,2)0.236*REF(AS,3)0.146*REF(AS,4))/2.382; {回调认同} HLX:EMA(HHV(XJ,3),15); LLX:EMA(LLV(XJ,3),15); CH:CROSS(XJ,HLX);CL:CROSS(LLX,XJ); CHH:BARSLAST(CH);CLL:BARSLAST(CL); YF1:(CHH<CLL OR CH) AND NOT(CL); Y…

作者头像 李华
网站建设 2026/4/28 12:27:19

边缘计算新场景:在本地设备运行图像转视频模型

边缘计算新场景&#xff1a;在本地设备运行图像转视频模型 引言&#xff1a;从云端到边缘的生成式AI演进 随着生成式AI技术的迅猛发展&#xff0c;图像到视频&#xff08;Image-to-Video, I2V&#xff09;模型正逐步从实验室走向实际应用。传统上&#xff0c;这类高算力需求的…

作者头像 李华
网站建设 2026/5/1 7:24:07

电商广告制作新方式:用AI每天生成百条短视频

电商广告制作新方式&#xff1a;用AI每天生成百条短视频 引言&#xff1a;电商内容生产的效率革命 在当前竞争激烈的电商环境中&#xff0c;高质量、高频次的短视频内容已成为品牌吸引用户、提升转化的核心手段。然而&#xff0c;传统视频拍摄与剪辑流程成本高、周期长&#xf…

作者头像 李华
网站建设 2026/4/25 12:57:08

【西安电科大主办 | ACM出版 | 会议规模大级别高/多位领军人才、Fellow加入 | 论文录用率高/往届快至提交出版后1个月见刊】第五届计算机、人工智能与控制工程研讨会(CAICE 2026)

第五届计算机、人工智能与控制工程研讨会&#xff08;CAICE 2026&#xff09; The 5th International Conference on Computer, Artificial Intelligence and Control Engineering 2026年1月23-25日----中国杭州(西安电子科技大学杭州研究院图书馆) 大会官网&#xff1a;ww…

作者头像 李华
网站建设 2026/5/1 8:43:36

处理WordPress粘贴图片站群系统批量转存需求

要求&#xff1a;开源&#xff0c;免费&#xff0c;技术支持 博客&#xff1a;WordPress 开发语言&#xff1a;PHP 数据库&#xff1a;MySQL 功能&#xff1a;导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏 平台&#xff1a;Window…

作者头像 李华