[具身智能-352]:大模型的部署和使用,就是“组建董事会”和“让董事会开始工作”的过程。

张开发
2026/4/12 9:29:36 15 分钟阅读

分享文章

[具身智能-352]:大模型的部署和使用,就是“组建董事会”和“让董事会开始工作”的过程。
大模型的部署和使用其实就是“组建董事会”和“让董事会开始工作”的过程。在MCP架构中大模型LLM是核心决策者。它的部署方式决定了你请的是“远程顾问”还是“驻场高管”而它的使用初始化则决定了它是否知道如何指挥手下的“部门”MCP Server。以下是大模型部署与使用的完整指南 部署大模型请什么样的“董事会”部署大模型主要有两种模式对应着不同的公司运营策略模式一云端API调用聘请顶级咨询公司这是最常见的方式。你不需要自己买服务器直接通过API连接OpenAI、Anthropic或阿里百炼等大厂的服务。特点智商极高模型能力强即开即用按次付费。适用大多数AI应用特别是需要高智商推理的场景。部署动作去云厂商平台如阿里云百炼、OpenAI平台注册账号。获取API Key这是董事会的“门禁卡”。无需配置硬件直接通过http网络调用。模式二本地/私有化部署招聘驻场高管如果你数据极其敏感或者为了省流量费你可以把模型“请”到自己的服务器上。这通常使用Ollama、vLLM等工具来实现。特点数据不出域安全一次投入硬件成本响应速度快内网。适用企业内部数据敏感、断网环境、或极高频调用。部署动作以Ollama为例安装Ollama相当于盖了一间“高管办公室”。拉取模型运行ollama run llama3.2相当于把“Llama 3.2”这位高管请进办公室。启动服务Ollama会自动在本地通常是localhost:11434启动一个API接口等待Client来连接。 初始化大模型给“董事会”配发“员工通讯录”大模型部署好后它只是一个通用的智者。要让它在这个“公司”里工作MCP Client总经理必须对它进行初始化。初始化的核心动作是注入上下文System Prompt。Client 必须告诉大模型“嘿你现在是这家公司的董事长这是我们的部门通讯录Tools List有事你可以吩咐他们。”代码层面的初始化流程伪代码python# 1. 建立连接 client LLMClient(api_keysk-xxxx) # 2. 获取“部门通讯录” (MCP Client从Server获取能力) # 这里Client会调用 MCP Server 的 tools/list 接口 available_tools [ {name: read_file, description: 读取本地文件, parameters: {...}}, {name: send_email, description: 发送邮件, parameters: {...}} ] # 3. 初始化董事会 (构建系统提示词) # 这一步至关重要它把“通用模型”变成了“MCP架构中的决策者” system_prompt f 你是一个智能助手。你可以使用以下工具来完成任务 {json.dumps(available_tools)} 如果用户的请求需要工具支持请返回工具调用的JSON格式。 # 4. 准备就绪 # 现在这个 model 实例已经是一个“已初始化、懂规矩”的决策者了 model client.init(system_promptsystem_prompt) 使用大模型日常“办公”流程一旦部署和初始化完成大模型就开始在MCP架构中循环工作了。使用大模型本质上就是维护一个“决策-执行-反馈”的循环。步骤 1接收请示User Input用户股东提出需求“帮我查一下服务器日志里的报错。”步骤 2董事会决策LLM InferenceClient 把需求传给 LLM。LLM 思考后发现需要查文件于是返回一个工具调用指令而不是直接回答“我需要调用read_file工具路径是/var/log/app.log。”步骤 3总经理派活Client OrchestrationClient 截获这个指令调用对应的 MCP Server。步骤 4部门干活Server ExecutionMCP Server 读取文件把内容比如“Error 404...”返回给 Client。步骤 5汇报与总结Loop BackClient 把执行结果“Error 404...”再次喂给 LLM“工具执行完毕结果是Error 404。请总结。”LLM 最终生成自然语言回答“老板日志里显示有一个404错误。” 总结从部署到实战表格阶段动作你的角色关键工具/概念部署请人决定是请“远程顾问”API还是“驻场高管”本地Ollama。API Key, Ollama, vLLM初始化立规矩告诉模型它有哪些“下属”Tools赋予它调度权。System Prompt, Tools List, JSON Schema使用听汇报在“思考模型”和“行动Server”之间传递信息直到任务完成。Chat Completion, Tool Call, Loop一句话总结部署是搭台子初始化是给剧本告诉它有什么工具使用就是看大戏看它如何指挥千军万马

更多文章