目录
VSCode + Ollama + Continue 本地 AI 代码助手 实操手册
目录
1. 前置环境准备(必做)
1.1 硬件 & 系统要求
1.2 基础依赖
2. Ollama 安装 & 模型下载(本地模型核心)
2.1 安装 Ollama
2.2 基础命令(终端执行:PowerShell / CMD)
2.3 推荐模型下载(适配 A770 16G 显存)
执行下载步骤:
补充 Ollama 常用管理命令
3. VSCode 插件安装
4. Continue 插件完整配置(对接 Ollama)
4.1 打开配置文件
4.2 替换配置内容(适配 Ollama+A770)
配置说明:
4.3 加载配置生效
5. VSCode 命令面板全量常用命令
🔹 高频核心(日常 90% 场景)
🔹 代码编辑专用(改代码 / 排错)
🔹 配置 / 辅助命令
6. 核心功能实操演示
6.1 基础对话 & 代码问答
6.2 选中代码局部改写
6.3 切换运行模型
7. 显卡 & 性能优化(专属 A770 16G)
7.1 显存优化规则
7.2 Ollama 性能调优(可选)
7.3 VSCode 卡顿优化
8. 常见报错 & 排查方案
问题 1:提示 model not found
问题 2:聊天面板无响应、一直加载
问题 3:能聊天,但代码补全不生效
问题 4:网络代理导致连接失败
9. 补充实用技巧
9.1 自定义快捷键(摆脱命令面板)
9.2 区分「本地模型」和「云端模型」
9.3 缓存 & 模型清理
完整使用流程速查(精简版)
适用环境:Windows 系统、Intel Arc A770 显卡、多 Python 环境、本地部署大模型 核心目标:全程离线可用、本地 GPU 推理、代码问答 / 补全 / 改写、模型统一管理,替代云端 AI,兼顾隐私与速度。
目录
- 前置环境准备(必做)
- Ollama 安装 & 模型下载(本地模型核心)
- VSCode 插件安装
- Continue 插件完整配置(对接 Ollama)
- VSCode 命令面板常用操作(Ctrl+Shift+P)
- 核心功能实操演示
- 显卡 / 性能优化(针对 A770)
- 常见报错排查
- 补充实用技巧
1. 前置环境准备(必做)
1.1 硬件 & 系统要求
- 系统:Windows 10 / Windows 11
- 显卡:Intel Arc A770(16G 显存,本手册针对性优化)
- 网络:仅下载模型时需要联网,日常使用可完全离线
1.2 基础依赖
- 确保系统正常开启显卡硬件加速,显卡驱动更新至最新版
- 关闭系统代理 / 全局代理(避免 Ollama 本地接口访问失败)
- 记录本地默认端口:Ollama 默认服务地址
http://localhost:11434(全程固定)
2. Ollama 安装 & 模型下载(本地模型核心)
Ollama 作用:本地模型管理器 + 推理服务,负责下载、加载、运行大模型,VSCode/Continue 仅作为前端调用接口。
2.1 安装 Ollama
- 官网下载:https://ollama.com/ ,选择 Windows 版本安装包
- 双击安装,全程默认路径下一步即可,无需自定义配置
- 安装完成后,系统会自动后台启动
Ollama Service,开机自启
2.2 基础命令(终端执行:PowerShell / CMD)
打开任意终端,执行以下命令,先验证安装成功:
# 查看Ollama版本,验证是否正常运行 ollama --version正常输出版本号即安装成功。
2.3 推荐模型下载(适配 A770 16G 显存)
优先选择代码专用、量化版,兼顾速度与显存占用,按优先级推荐:
| 模型名称 | 特点 | 显存占用 | 执行下载命令 |
|---|---|---|---|
| qwen2.5-coder:7b-instruct-q4_K_M | 中文友好、代码能力强、综合首选 | ~6GB | ollama pull qwen2.5-coder:7b-instruct-q4_K_M |
| deepseek-coder:6.7b-instruct-q4_K_M | 纯代码专项模型,逻辑极强 | ~5GB | ollama pull deepseek-coder:6.7b-instruct-q4_K_M |
执行下载步骤:
- 复制上面任意一条命令,粘贴到终端回车
- 等待下载完成(速度取决于网络,大文件耐心等待)
- 下载完成后,查看本地已安装模型:
ollama list列表中出现刚下载的模型名称,代表就绪。
补充 Ollama 常用管理命令
# 查看当前正在运行的模型(是否占用GPU) ollama ps # 停止正在运行的模型 ollama stop 模型名 # 删除本地模型(释放硬盘空间) ollama rm 模型名 # 直接在终端运行模型(临时聊天测试) ollama run 模型名重要提醒:Continue不会自动下载模型,必须手动用
ollama pull下载后,VSCode 才能调用。
3. VSCode 插件安装
打开 VSCode,左侧点击「扩展」(图标:四个方块),搜索并安装以下 2 个插件:
- Continue(作者:Continue Dev, Inc)
- 核心插件:对接本地 Ollama、实现代码聊天 / 改写 / 补全
- 可选补充:Ollama(作者:Ekbana Solutions)
- 简易版 Ollama 可视化管理,新手可装,非必需
安装完成后,重启一次 VSCode。
4. Continue 插件完整配置(对接 Ollama)
4.1 打开配置文件
方式 1(命令面板,推荐):
- 按下快捷键
Ctrl + Shift + P调出命令面板 - 输入并选择:
Continue: Open Config - 自动打开
config.yaml配置文件
4.2 替换配置内容(适配 Ollama+A770)
清空原有内容,完整复制下方配置粘贴,无需修改路径(默认本地 Ollama 接口):
version: 0.2.29 models: - name: qwen2.5-coder:7b-instruct-q4_K_M provider: ollama model: qwen2.5-coder:7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 contextLength: 8192 maxTokens: 2048 temperature: 0.1 - name: deepseek-coder:6.7b-instruct-q4_K_M provider: ollama model: deepseek-coder:6.7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 contextLength: 8192 maxTokens: 2048 temperature: 0.1 tabAutocompleteModel: name: deepseek-coder:6.7b-instruct-q4_K_M provider: ollama model: deepseek-coder:6.7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 systemMessage: 你是专业的代码助手,基于本地模型运行,专注解答编程问题、优化代码、排查BUG,使用中文回复。配置说明:
provider: ollama:指定使用本地 Ollama 服务,非云端apiBase:固定本地接口,不要修改temperature: 0.1:降低随机性,代码输出更严谨- 两个模型对应上一步下载的模型,可按需增删
4.3 加载配置生效
- 保存
config.yaml文件(Ctrl+S) - 命令面板
Ctrl+Shift+P,执行:Continue: Reload - 重载完成,配置正式生效。
5. VSCode 命令面板全量常用命令
所有操作入口:Ctrl + Shift + P,输入关键词快速检索,按使用频率分类:
🔹 高频核心(日常 90% 场景)
| 命令名称 | 功能说明 | 使用场景 |
|---|---|---|
| Continue: Toggle Chat | 打开 / 关闭 AI 聊天侧边栏 | 提问、对话、解读代码 |
| Continue: Select Model | 切换本地模型 | 在 qwen/deepseek 之间切换 |
| Continue: Reload | 重载插件 | 配置修改、模型卡顿、无响应时使用 |
| Continue: Focus Chat | 光标直接定位到聊天输入框 | 纯键盘操作,无需鼠标点击 |
🔹 代码编辑专用(改代码 / 排错)
| 命令名称 | 功能说明 | 操作步骤 |
|---|---|---|
| Continue: Inline Edit | 行内代码改写 | 选中代码 → 执行命令 → 输入修改需求 |
| Continue: Accept Diff | 接受 AI 的代码修改 | AI 给出代码差异后,一键应用 |
| Continue: Reject Diff | 拒绝 AI 的代码修改 | 不需要修改时撤销 |
🔹 配置 / 辅助命令
| 命令名称 | 功能说明 |
|---|---|
| Continue: Open Config | 打开config.yaml配置文件 |
| Continue: Toggle Autocomplete | 开关 AI 自动代码补全(卡顿时可关闭) |
6. 核心功能实操演示
6.1 基础对话 & 代码问答
Ctrl+Shift+P→ 执行Continue: Toggle Chat,打开右侧聊天面板- 底部输入框提问,示例:
解释Python装饰器用法帮我排查这段代码的BUG
- 发送后,模型本地推理输出答案,全程不上传网络
6.2 选中代码局部改写
- 在编辑器中选中一段代码
Ctrl+Shift+P→ 执行Continue: Inline Edit- 输入需求:
优化代码运行速度/添加详细注释 - AI 生成修改方案,选择
Accept Diff应用修改
6.3 切换运行模型
Ctrl+Shift+P→ 执行Continue: Select Model- 在下拉列表选择已下载的模型名称
- 切换后直接使用,无需重载插件
7. 显卡 & 性能优化(专属 A770 16G)
7.1 显存优化规则
- 禁止使用 30B/70B 超大模型,会直接爆显存、卡顿、闪退
- 优先使用
q4_K_M量化版本,平衡速度与精度 - 同时只运行一个模型,不要多模型并发
7.2 Ollama 性能调优(可选)
- 右键开始菜单 → 运行 → 输入
services.msc回车 - 找到
Ollama Service,右键属性 → 启动类型保持「自动」 - 若运行卡顿:终端执行
ollama ps查看占用,执行ollama stop 模型名释放显存
7.3 VSCode 卡顿优化
- 模型响应慢:执行
Continue: Reload重载插件 - 自动补全拖慢编辑器:执行
Continue: Toggle Autocomplete关闭补全功能
8. 常见报错 & 排查方案
问题 1:提示model not found
- 原因:本地未下载对应模型
- 解决:终端执行
ollama pull 模型名下载,完成后重载 Continue
问题 2:聊天面板无响应、一直加载
- 原因 1:Ollama 服务未启动 解决:重启电脑,或在服务中手动启动
Ollama Service - 原因 2:接口地址错误 解决:检查
config.yaml中apiBase必须为http://localhost:11434/v1 - 原因 3:模型卡死 解决:终端
ollama stop 模型名,再Continue: Reload
问题 3:能聊天,但代码补全不生效
- 原因:tabAutocompleteModel 配置错误
- 解决:核对配置文件中补全模型名称,和本地
ollama list保持一致
问题 4:网络代理导致连接失败
- 解决:关闭系统全局代理、VPN,Ollama 本地接口不需要外网
9. 补充实用技巧
9.1 自定义快捷键(摆脱命令面板)
- VSCode 快捷键:
Ctrl + K Ctrl + S打开键盘快捷方式 - 右上角打开
JSON配置文件 - 添加以下配置(示例,可自定义按键):
{ "key": "alt+z", "command": "continue.toggleChat" }, { "key": "alt+x", "command": "continue.selectModel" }, { "key": "alt+c", "command": "continue.inlineEdit" }保存后,Alt+Z打开聊天、Alt+X切换模型,纯键盘操作更高效。
9.2 区分「本地模型」和「云端模型」
- 本方案:Ollama+Continue →纯本地推理,离线可用、数据不外泄
- VSCode 自带
code chat/ Copilot → 云端模型,必须联网
两套功能互不冲突,按需选择使用。
9.3 缓存 & 模型清理
- 清理 Ollama 模型:
ollama rm 模型名(删除不用的模型,释放硬盘) - 模型异常重置:先
ollama stop all,再重启 VSCode
完整使用流程速查(精简版)
- 开机 → Ollama 服务自动启动
- 终端确认模型:
ollama list - 打开 VSCode →
Ctrl+Shift+P选择功能 - 问答:
Continue: Toggle Chat - 改代码:选中代码 →
Continue: Inline Edit - 换模型:
Continue: Select Model - 出问题:优先执行
Continue: Reload