用标准 HTTP 把 LLM 推理能力接到外部群对话流里
本文描述将大语言模型与企业微信私域对话对接的标准工程路径与实现要点。
功能说明
智能客服的核心链路是:用户在企业微信发消息 → 服务端收到 Webhook → 调用大模型 API 生成回复 → 通过 RPA 连接器发回用户。
本平台不涉及模型本身,只提供消息进出通道。开发者负责 Prompt 设计、上下文管理与敏感词过滤。由于外部群消息同样走 Webhook 投递,同一套代码可复用于私聊与群聊,仅需根据 roomId 是否存在切换会话上下文。
链路分工
环节 | 负责方 | 说明 |
|---|---|---|
消息接收 | 平台 Webhook | 推送至开发者服务器 |
上下文管理 | 开发者 | Redis / 数据库存储 |
模型推理 | 开发者 | 调用 LLM API |
消息回复 | 平台 sendText | 发回用户或群 |
快速上手
步骤 | 操作 | 预期结果 |
|---|---|---|
1 | 部署可公网访问的 Webhook 服务 | 服务正常运行 |
2 | 配置控制台回调地址 | 回调配置生效 |
3 | 在 handler 中调用大模型 API | 获得模型回复 |
4 | 通过 sendText 发回 toid | 用户收到回复 |
5 | 测试多轮对话 | 上下文连贯 |
代码示例
import os, requests API_URL = "http://manager.qiweapi.com/qiwe/api/qw/doApi" TOKEN = os.environ["QW_API_KEY"] def send_text(guid, toid, content): requests.post(API_URL, json={ "method": "/msg/sendText", "params": {"guid": guid, "toid": toid, "content": content} }, headers={"X-QIWEI-TOKEN": TOKEN, "Content-Type": "application/json"}) def handle_webhook(event): user_msg = event.get("content", "") guid = event["guid"] from_id = event["fromId"] reply = call_llm(user_msg, session_id=from_id) send_text(guid, from_id, reply)落地场景
外部群常见问题自动答疑
产品介绍与报价初步咨询
内部知识库问答机器人
多语言客服辅助回复
答疑
问:群聊里如何避免回复所有消息?
在 Webhook 逻辑中过滤:仅当消息 @ 指定账号或包含触发关键词时才调用模型。
问:多轮上下文如何保存?
以 fromId 或 roomId+fromId 为 key,在 Redis 等存储中维护最近 N 轮对话。
问:模型响应慢,用户等待时间长怎么办?
可先回复「思考中…」,异步生成后再发正式答案。
问:合规方面需要注意什么?
自动回复应明确身份,避免误导;敏感行业需人工兜底与审计日志。
延伸链接
想继续往下做,可以从这里开始:
查看 API 文档 — 完整接口说明、Webhook 配置与快速开始
访问官网平台 — 注册账号、扫码登录节点、在线调试