news 2026/6/15 20:05:46

微软 Foundry Local - 本地 AI 推理解决方案

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
微软 Foundry Local - 本地 AI 推理解决方案

软在其 2025 Build 大会上发布了 Foundry Local,能够在本地设备上执行 AI 推理,意味着可以利用本地的 AI 算力,如:CPU/GPU/NPU;也让用户在隐私方面得到了充足的保障,还能有改善成本效益!Foundry Local 默认除了支持 CLI外,还支持 SDK、REST API 和 Catalog API,用户可以自行基于 Foundry Local 进行开发。在未来 Foundry Local 还将内置对 Agent/MCP 的支持。

Foundry Local 还支持跨平台,除了能够运行在Windows 11 上,还能够运行在 macOS。由于需要本地存储和运行模型,请确保有足够的算力和存储,Foundry Local 支持硬件加速:NVIDIA GPU(2000系列或更高版本)、AMD GPU(6000系列或更高)、Intel iGPU、Intel NPU(32GB或更多内存)、高通 Snapdragon X Elite(8GB或更多内存)、高通 NPU,以及 Apple 系列。

要在本地以 Foundry Local 运行 AI 模型,首先需要安装 Foundry Local。

Windows:

winget install Microsoft.FoundryLocal

macOS:

brew tap microsoft/foundrylocal

brew install foundrylocal

运行模型只需要执行:

foundry model run <model>

在 Foundry Local 上可运行的模型有很多,可使用以下命令查看:

foundry model list

还可以加载 --filter 参数对显示列表进行筛选。

其他有用的参数还有:

foundry model info <model> 显示有关特定模型的详细信息

foundry model download <model> 在不运行模型的情况下只下载模型到本地缓存

foundry model load <model> 将模型加载到服务中

foundry model unload <model> 从服务中卸载模

要查看本地已经下载缓存的模型,可执行:

foundry cache list

image

要检查 Foundry Local 服务状态,可执行:

foundry service status

image

Foundry Local CLI 详细使用可参考:Foundry Local 文档。

Foundry Local SDK 目前支持 JavaScript、Python、C# 和 Rust,也可以使用 REST API 去调用 Foundry Local Service。这是一个用于演示或本地实验的示例项目,可能展示如何在本地环境中使用或集成“Foundry”相关功能。核心代码在https://github.com/andrewleader/FoundryLocalLabDemo/blob/main/FoundryLocalLabDemo/ExecutionLogic.cs:

封装 FoundryLocalManager,提供基础模型管理:

• StartServiceAsync:启动本地 Foundry 服务

• ListCatalogModelsAsync / ListCachedModelsAsync:列出目录/本地缓存模型

• DownloadModelAsync:按进度流式下载模型(IAsyncEnumerable<ModelDownloadProgress>)

• LoadModelAsync / UnloadModelAsync:加载/卸载模型

基于选定模型进行流式解析用户文本为结构化对象:

• ParseStudentProfileStreamingAsync:

• 通过 OpenAIClient + Microsoft.Extensions.AI 创建聊天客户端(使用 FoundryLocalManager 提供的 Endpoint 和 ApiKey)

• 构造一个包含字符串枚举的 JSON Schema,要求模型仅输出 JSON

• 发送提示词并以流式方式接收回复,边接收边通过 IAsyncEnumerable<StudentProfileUpdate> 返回中间文本增量

• 收集完整回复后,去除可能的 <think> 标签和 ```json 代码块围栏,处理嵌套对象,再用 Json.NET(含 StringEnumConverter)反序列化为 StudentProfile

• 最后返回一次包含解析好的 StudentProfile 的更新

image

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:34:38

中小诊所系统通常具备哪些功能?

中小诊所系统通常围绕提升诊疗效率、规范业务流程、改善患者体验、实现数据化管理四大核心目标设计&#xff0c;功能模块覆盖日常运营的各个环节。以下是其典型功能模块&#xff1a;一、核心业务功能1、患者管理患者档案&#xff1a;电子化记录基本信息、病史、过敏史等。就诊记…

作者头像 李华
网站建设 2026/6/15 13:34:05

黑客网站整理大全,收藏这一篇就够了

今天给大家分享一些学习网络安全的好去处。对于网络安全的学习&#xff0c;多逛论坛、阅读他人的技术分析帖是非常重要的。但有时候&#xff0c;初学者可能会感到迷茫&#xff0c;不知道去哪里寻找这些技术分析帖&#xff0c;也不知道有哪些相关的论坛或网站。所以&#xff0c;…

作者头像 李华
网站建设 2026/6/15 14:38:41

毕设开源 深度学习火焰检测识别(源码+论文)

文章目录 0 前言1 项目运行效果1 基于YOLO的火焰检测与识别2 课题背景3 卷积神经网络3.1 卷积层3.2 池化层3.3 激活函数&#xff1a;3.4 全连接层3.5 使用tensorflow中keras模块实现卷积神经网络 4 YOLOV54.1 网络架构图4.2 输入端4.3 基准网络4.4 Neck网络4.5 Head输出层 5 数…

作者头像 李华
网站建设 2026/6/15 14:38:11

alembic使用指南

一、alembic是什么&#xff1f;Alembic 是一个用于 Python 数据库迁移和版本控制的工具。它与 SQLAlchemy&#xff08;一个流行的 Python ORM 库&#xff09;紧密集成&#xff0c;共同为 Python 应用程序提供数据库管理和迁移支持。python使用mysql时常用SQLAlchemyAlembic进行…

作者头像 李华
网站建设 2026/6/15 8:01:55

生活小窍门查询小程序,核心功能,收录清洁,收纳,养生等生活小窍门,支持按关键词搜索,收藏常用技巧,离线查看,应用场景,中老年人解决生活中的小问题,如去除水垢,收纳衣物等,简单实用。

生活小窍门查询小程序 下面是一个基于Python的生活小窍门查询小程序&#xff0c;专为中老年人设计&#xff0c;具有简洁易用的界面和实用的功能。 import json import os import tkinter as tk from tkinter import ttk, messagebox, simpledialog from datetime import da…

作者头像 李华
网站建设 2026/6/15 12:35:23

**免费游戏角色AI配音软件2025推荐,适配独立开发者与小

免费游戏角色AI配音软件2025推荐&#xff0c;适配独立开发者与小型工作室一、行业背景与核心痛点对于独立开发者与小型工作室而言&#xff0c;为游戏角色注入灵魂的配音工作&#xff0c;往往是预算与创意之间最大的矛盾点。据《2025年全球独立游戏开发市场报告》显示&#xff0…

作者头像 李华