VSCode + Ollama + Continue 本地 AI 代码助手 实操手册
2026/6/8 6:53:39 网站建设 项目流程

目录

VSCode + Ollama + Continue 本地 AI 代码助手 实操手册

目录

1. 前置环境准备(必做)

1.1 硬件 & 系统要求

1.2 基础依赖

2. Ollama 安装 & 模型下载(本地模型核心)

2.1 安装 Ollama

2.2 基础命令(终端执行:PowerShell / CMD)

2.3 推荐模型下载(适配 A770 16G 显存)

执行下载步骤:

补充 Ollama 常用管理命令

3. VSCode 插件安装

4. Continue 插件完整配置(对接 Ollama)

4.1 打开配置文件

4.2 替换配置内容(适配 Ollama+A770)

配置说明:

4.3 加载配置生效

5. VSCode 命令面板全量常用命令

🔹 高频核心(日常 90% 场景)

🔹 代码编辑专用(改代码 / 排错)

🔹 配置 / 辅助命令

6. 核心功能实操演示

6.1 基础对话 & 代码问答

6.2 选中代码局部改写

6.3 切换运行模型

7. 显卡 & 性能优化(专属 A770 16G)

7.1 显存优化规则

7.2 Ollama 性能调优(可选)

7.3 VSCode 卡顿优化

8. 常见报错 & 排查方案

问题 1:提示 model not found

问题 2:聊天面板无响应、一直加载

问题 3:能聊天,但代码补全不生效

问题 4:网络代理导致连接失败

9. 补充实用技巧

9.1 自定义快捷键(摆脱命令面板)

9.2 区分「本地模型」和「云端模型」

9.3 缓存 & 模型清理

完整使用流程速查(精简版)


适用环境:Windows 系统、Intel Arc A770 显卡、多 Python 环境、本地部署大模型 核心目标:全程离线可用、本地 GPU 推理、代码问答 / 补全 / 改写、模型统一管理,替代云端 AI,兼顾隐私与速度。


目录

  1. 前置环境准备(必做)
  2. Ollama 安装 & 模型下载(本地模型核心)
  3. VSCode 插件安装
  4. Continue 插件完整配置(对接 Ollama)
  5. VSCode 命令面板常用操作(Ctrl+Shift+P)
  6. 核心功能实操演示
  7. 显卡 / 性能优化(针对 A770)
  8. 常见报错排查
  9. 补充实用技巧

1. 前置环境准备(必做)

1.1 硬件 & 系统要求

  • 系统:Windows 10 / Windows 11
  • 显卡:Intel Arc A770(16G 显存,本手册针对性优化)
  • 网络:仅下载模型时需要联网,日常使用可完全离线

1.2 基础依赖

  1. 确保系统正常开启显卡硬件加速,显卡驱动更新至最新版
  2. 关闭系统代理 / 全局代理(避免 Ollama 本地接口访问失败)
  3. 记录本地默认端口:Ollama 默认服务地址http://localhost:11434(全程固定)

2. Ollama 安装 & 模型下载(本地模型核心)

Ollama 作用:本地模型管理器 + 推理服务,负责下载、加载、运行大模型,VSCode/Continue 仅作为前端调用接口。

2.1 安装 Ollama

  1. 官网下载:https://ollama.com/ ,选择 Windows 版本安装包
  2. 双击安装,全程默认路径下一步即可,无需自定义配置
  3. 安装完成后,系统会自动后台启动Ollama Service,开机自启

2.2 基础命令(终端执行:PowerShell / CMD)

打开任意终端,执行以下命令,先验证安装成功:

# 查看Ollama版本,验证是否正常运行 ollama --version

正常输出版本号即安装成功。

2.3 推荐模型下载(适配 A770 16G 显存)

优先选择代码专用、量化版,兼顾速度与显存占用,按优先级推荐:

模型名称特点显存占用执行下载命令
qwen2.5-coder:7b-instruct-q4_K_M中文友好、代码能力强、综合首选~6GBollama pull qwen2.5-coder:7b-instruct-q4_K_M
deepseek-coder:6.7b-instruct-q4_K_M纯代码专项模型,逻辑极强~5GBollama pull deepseek-coder:6.7b-instruct-q4_K_M
执行下载步骤:
  1. 复制上面任意一条命令,粘贴到终端回车
  2. 等待下载完成(速度取决于网络,大文件耐心等待)
  3. 下载完成后,查看本地已安装模型:
ollama list

列表中出现刚下载的模型名称,代表就绪。

补充 Ollama 常用管理命令
# 查看当前正在运行的模型(是否占用GPU) ollama ps # 停止正在运行的模型 ollama stop 模型名 # 删除本地模型(释放硬盘空间) ollama rm 模型名 # 直接在终端运行模型(临时聊天测试) ollama run 模型名

重要提醒:Continue不会自动下载模型,必须手动用ollama pull下载后,VSCode 才能调用。


3. VSCode 插件安装

打开 VSCode,左侧点击「扩展」(图标:四个方块),搜索并安装以下 2 个插件:

  1. Continue(作者:Continue Dev, Inc)
    • 核心插件:对接本地 Ollama、实现代码聊天 / 改写 / 补全
  2. 可选补充:Ollama(作者:Ekbana Solutions)
    • 简易版 Ollama 可视化管理,新手可装,非必需

安装完成后,重启一次 VSCode。


4. Continue 插件完整配置(对接 Ollama)

4.1 打开配置文件

方式 1(命令面板,推荐):

  1. 按下快捷键Ctrl + Shift + P调出命令面板
  2. 输入并选择:Continue: Open Config
  3. 自动打开config.yaml配置文件

4.2 替换配置内容(适配 Ollama+A770)

清空原有内容,完整复制下方配置粘贴,无需修改路径(默认本地 Ollama 接口):

version: 0.2.29 models: - name: qwen2.5-coder:7b-instruct-q4_K_M provider: ollama model: qwen2.5-coder:7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 contextLength: 8192 maxTokens: 2048 temperature: 0.1 - name: deepseek-coder:6.7b-instruct-q4_K_M provider: ollama model: deepseek-coder:6.7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 contextLength: 8192 maxTokens: 2048 temperature: 0.1 tabAutocompleteModel: name: deepseek-coder:6.7b-instruct-q4_K_M provider: ollama model: deepseek-coder:6.7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 systemMessage: 你是专业的代码助手,基于本地模型运行,专注解答编程问题、优化代码、排查BUG,使用中文回复。
配置说明:
  • provider: ollama:指定使用本地 Ollama 服务,非云端
  • apiBase:固定本地接口,不要修改
  • temperature: 0.1:降低随机性,代码输出更严谨
  • 两个模型对应上一步下载的模型,可按需增删

4.3 加载配置生效

  1. 保存config.yaml文件(Ctrl+S
  2. 命令面板Ctrl+Shift+P,执行:Continue: Reload
  3. 重载完成,配置正式生效。

5. VSCode 命令面板全量常用命令

所有操作入口:Ctrl + Shift + P,输入关键词快速检索,按使用频率分类:

🔹 高频核心(日常 90% 场景)

命令名称功能说明使用场景
Continue: Toggle Chat打开 / 关闭 AI 聊天侧边栏提问、对话、解读代码
Continue: Select Model切换本地模型在 qwen/deepseek 之间切换
Continue: Reload重载插件配置修改、模型卡顿、无响应时使用
Continue: Focus Chat光标直接定位到聊天输入框纯键盘操作,无需鼠标点击

🔹 代码编辑专用(改代码 / 排错)

命令名称功能说明操作步骤
Continue: Inline Edit行内代码改写选中代码 → 执行命令 → 输入修改需求
Continue: Accept Diff接受 AI 的代码修改AI 给出代码差异后,一键应用
Continue: Reject Diff拒绝 AI 的代码修改不需要修改时撤销

🔹 配置 / 辅助命令

命令名称功能说明
Continue: Open Config打开config.yaml配置文件
Continue: Toggle Autocomplete开关 AI 自动代码补全(卡顿时可关闭)

6. 核心功能实操演示

6.1 基础对话 & 代码问答

  1. Ctrl+Shift+P→ 执行Continue: Toggle Chat,打开右侧聊天面板
  2. 底部输入框提问,示例:
    • 解释Python装饰器用法
    • 帮我排查这段代码的BUG
  3. 发送后,模型本地推理输出答案,全程不上传网络

6.2 选中代码局部改写

  1. 在编辑器中选中一段代码
  2. Ctrl+Shift+P→ 执行Continue: Inline Edit
  3. 输入需求:优化代码运行速度/添加详细注释
  4. AI 生成修改方案,选择Accept Diff应用修改

6.3 切换运行模型

  1. Ctrl+Shift+P→ 执行Continue: Select Model
  2. 在下拉列表选择已下载的模型名称
  3. 切换后直接使用,无需重载插件

7. 显卡 & 性能优化(专属 A770 16G)

7.1 显存优化规则

  1. 禁止使用 30B/70B 超大模型,会直接爆显存、卡顿、闪退
  2. 优先使用q4_K_M量化版本,平衡速度与精度
  3. 同时只运行一个模型,不要多模型并发

7.2 Ollama 性能调优(可选)

  1. 右键开始菜单 → 运行 → 输入services.msc回车
  2. 找到Ollama Service,右键属性 → 启动类型保持「自动」
  3. 若运行卡顿:终端执行ollama ps查看占用,执行ollama stop 模型名释放显存

7.3 VSCode 卡顿优化

  1. 模型响应慢:执行Continue: Reload重载插件
  2. 自动补全拖慢编辑器:执行Continue: Toggle Autocomplete关闭补全功能

8. 常见报错 & 排查方案

问题 1:提示model not found

  • 原因:本地未下载对应模型
  • 解决:终端执行ollama pull 模型名下载,完成后重载 Continue

问题 2:聊天面板无响应、一直加载

  • 原因 1:Ollama 服务未启动 解决:重启电脑,或在服务中手动启动Ollama Service
  • 原因 2:接口地址错误 解决:检查config.yamlapiBase必须为http://localhost:11434/v1
  • 原因 3:模型卡死 解决:终端ollama stop 模型名,再Continue: Reload

问题 3:能聊天,但代码补全不生效

  • 原因:tabAutocompleteModel 配置错误
  • 解决:核对配置文件中补全模型名称,和本地ollama list保持一致

问题 4:网络代理导致连接失败

  • 解决:关闭系统全局代理、VPN,Ollama 本地接口不需要外网

9. 补充实用技巧

9.1 自定义快捷键(摆脱命令面板)

  1. VSCode 快捷键:Ctrl + K Ctrl + S打开键盘快捷方式
  2. 右上角打开JSON配置文件
  3. 添加以下配置(示例,可自定义按键):
{ "key": "alt+z", "command": "continue.toggleChat" }, { "key": "alt+x", "command": "continue.selectModel" }, { "key": "alt+c", "command": "continue.inlineEdit" }

保存后,Alt+Z打开聊天、Alt+X切换模型,纯键盘操作更高效。

9.2 区分「本地模型」和「云端模型」

  • 本方案:Ollama+Continue →纯本地推理,离线可用、数据不外泄
  • VSCode 自带code chat/ Copilot → 云端模型,必须联网

两套功能互不冲突,按需选择使用。

9.3 缓存 & 模型清理

  1. 清理 Ollama 模型:ollama rm 模型名(删除不用的模型,释放硬盘)
  2. 模型异常重置:先ollama stop all,再重启 VSCode

完整使用流程速查(精简版)

  1. 开机 → Ollama 服务自动启动
  2. 终端确认模型:ollama list
  3. 打开 VSCode →Ctrl+Shift+P选择功能
  4. 问答:Continue: Toggle Chat
  5. 改代码:选中代码 →Continue: Inline Edit
  6. 换模型:Continue: Select Model
  7. 出问题:优先执行Continue: Reload

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询