VSCode + Ollama + Continue 本地 AI 代码助手实操手册-二趣网

VSCode + Ollama + Continue 本地 AI 代码助手实操手册

1. 前置环境准备（必做）

1.1 硬件 & 系统要求

1.2 基础依赖

2. Ollama 安装 & 模型下载（本地模型核心）

2.1 安装 Ollama

2.2 基础命令（终端执行：PowerShell / CMD）

2.3 推荐模型下载（适配 A770 16G 显存）

执行下载步骤：

补充 Ollama 常用管理命令

3. VSCode 插件安装

4. Continue 插件完整配置（对接 Ollama）

4.1 打开配置文件

4.2 替换配置内容（适配 Ollama+A770）

配置说明：

4.3 加载配置生效

5. VSCode 命令面板全量常用命令

🔹 高频核心（日常 90% 场景）

🔹 代码编辑专用（改代码 / 排错）

🔹 配置 / 辅助命令

6. 核心功能实操演示

6.1 基础对话 & 代码问答

6.2 选中代码局部改写

6.3 切换运行模型

7. 显卡 & 性能优化（专属 A770 16G）

7.1 显存优化规则

7.2 Ollama 性能调优（可选）

7.3 VSCode 卡顿优化

8. 常见报错 & 排查方案

问题 1：提示 model not found

问题 2：聊天面板无响应、一直加载

问题 3：能聊天，但代码补全不生效

问题 4：网络代理导致连接失败

9. 补充实用技巧

9.1 自定义快捷键（摆脱命令面板）

9.2 区分「本地模型」和「云端模型」

9.3 缓存 & 模型清理

完整使用流程速查（精简版）

适用环境：Windows 系统、Intel Arc A770 显卡、多 Python 环境、本地部署大模型核心目标：全程离线可用、本地 GPU 推理、代码问答 / 补全 / 改写、模型统一管理，替代云端 AI，兼顾隐私与速度。

1. 前置环境准备（必做）

1.1 硬件 & 系统要求

系统：Windows 10 / Windows 11
显卡：Intel Arc A770（16G 显存，本手册针对性优化）
网络：仅下载模型时需要联网，日常使用可完全离线

1.2 基础依赖

确保系统正常开启显卡硬件加速，显卡驱动更新至最新版
关闭系统代理 / 全局代理（避免 Ollama 本地接口访问失败）
记录本地默认端口：Ollama 默认服务地址http://localhost:11434（全程固定）

2. Ollama 安装 & 模型下载（本地模型核心）

Ollama 作用：本地模型管理器 + 推理服务，负责下载、加载、运行大模型，VSCode/Continue 仅作为前端调用接口。

2.1 安装 Ollama

官网下载：https://ollama.com/ ，选择 Windows 版本安装包
双击安装，全程默认路径下一步即可，无需自定义配置
安装完成后，系统会自动后台启动Ollama Service，开机自启

2.2 基础命令（终端执行：PowerShell / CMD）

打开任意终端，执行以下命令，先验证安装成功：

# 查看Ollama版本，验证是否正常运行 ollama --version

正常输出版本号即安装成功。

2.3 推荐模型下载（适配 A770 16G 显存）

优先选择代码专用、量化版，兼顾速度与显存占用，按优先级推荐：

模型名称	特点	显存占用	执行下载命令
qwen2.5-coder:7b-instruct-q4_K_M	中文友好、代码能力强、综合首选	~6GB	`ollama pull qwen2.5-coder:7b-instruct-q4_K_M`
deepseek-coder:6.7b-instruct-q4_K_M	纯代码专项模型，逻辑极强	~5GB	`ollama pull deepseek-coder:6.7b-instruct-q4_K_M`

执行下载步骤：

复制上面任意一条命令，粘贴到终端回车
等待下载完成（速度取决于网络，大文件耐心等待）
下载完成后，查看本地已安装模型：

ollama list

列表中出现刚下载的模型名称，代表就绪。

补充 Ollama 常用管理命令

# 查看当前正在运行的模型（是否占用GPU） ollama ps # 停止正在运行的模型 ollama stop 模型名 # 删除本地模型（释放硬盘空间） ollama rm 模型名 # 直接在终端运行模型（临时聊天测试） ollama run 模型名

重要提醒：Continue不会自动下载模型，必须手动用ollama pull下载后，VSCode 才能调用。

3. VSCode 插件安装

打开 VSCode，左侧点击「扩展」（图标：四个方块），搜索并安装以下 2 个插件：

Continue（作者：Continue Dev, Inc）
- 核心插件：对接本地 Ollama、实现代码聊天 / 改写 / 补全
可选补充：Ollama（作者：Ekbana Solutions）
- 简易版 Ollama 可视化管理，新手可装，非必需

安装完成后，重启一次 VSCode。

4. Continue 插件完整配置（对接 Ollama）

4.1 打开配置文件

方式 1（命令面板，推荐）：

按下快捷键Ctrl + Shift + P调出命令面板
输入并选择：Continue: Open Config
自动打开config.yaml配置文件

4.2 替换配置内容（适配 Ollama+A770）

清空原有内容，完整复制下方配置粘贴，无需修改路径（默认本地 Ollama 接口）：

version: 0.2.29 models: - name: qwen2.5-coder:7b-instruct-q4_K_M provider: ollama model: qwen2.5-coder:7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 contextLength: 8192 maxTokens: 2048 temperature: 0.1 - name: deepseek-coder:6.7b-instruct-q4_K_M provider: ollama model: deepseek-coder:6.7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 contextLength: 8192 maxTokens: 2048 temperature: 0.1 tabAutocompleteModel: name: deepseek-coder:6.7b-instruct-q4_K_M provider: ollama model: deepseek-coder:6.7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 systemMessage: 你是专业的代码助手，基于本地模型运行，专注解答编程问题、优化代码、排查BUG，使用中文回复。

配置说明：

provider: ollama：指定使用本地 Ollama 服务，非云端
apiBase：固定本地接口，不要修改
temperature: 0.1：降低随机性，代码输出更严谨
两个模型对应上一步下载的模型，可按需增删

4.3 加载配置生效

保存config.yaml文件（Ctrl+S）
命令面板Ctrl+Shift+P，执行：Continue: Reload
重载完成，配置正式生效。

5. VSCode 命令面板全量常用命令

所有操作入口：Ctrl + Shift + P，输入关键词快速检索，按使用频率分类：

🔹 高频核心（日常 90% 场景）

命令名称	功能说明	使用场景
Continue: Toggle Chat	打开 / 关闭 AI 聊天侧边栏	提问、对话、解读代码
Continue: Select Model	切换本地模型	在 qwen/deepseek 之间切换
Continue: Reload	重载插件	配置修改、模型卡顿、无响应时使用
Continue: Focus Chat	光标直接定位到聊天输入框	纯键盘操作，无需鼠标点击

🔹 代码编辑专用（改代码 / 排错）

命令名称	功能说明	操作步骤
Continue: Inline Edit	行内代码改写	选中代码 → 执行命令 → 输入修改需求
Continue: Accept Diff	接受 AI 的代码修改	AI 给出代码差异后，一键应用
Continue: Reject Diff	拒绝 AI 的代码修改	不需要修改时撤销

🔹 配置 / 辅助命令

命令名称	功能说明
Continue: Open Config	打开`config.yaml`配置文件
Continue: Toggle Autocomplete	开关 AI 自动代码补全（卡顿时可关闭）

6. 核心功能实操演示

6.1 基础对话 & 代码问答

Ctrl+Shift+P→ 执行Continue: Toggle Chat，打开右侧聊天面板
底部输入框提问，示例：
- 解释Python装饰器用法
- 帮我排查这段代码的BUG
发送后，模型本地推理输出答案，全程不上传网络

6.2 选中代码局部改写

在编辑器中选中一段代码
Ctrl+Shift+P→ 执行Continue: Inline Edit
输入需求：优化代码运行速度/添加详细注释
AI 生成修改方案，选择Accept Diff应用修改

6.3 切换运行模型

Ctrl+Shift+P→ 执行Continue: Select Model
在下拉列表选择已下载的模型名称
切换后直接使用，无需重载插件

7. 显卡 & 性能优化（专属 A770 16G）

7.1 显存优化规则

禁止使用 30B/70B 超大模型，会直接爆显存、卡顿、闪退
优先使用q4_K_M量化版本，平衡速度与精度
同时只运行一个模型，不要多模型并发

7.2 Ollama 性能调优（可选）

右键开始菜单 → 运行 → 输入services.msc回车
找到Ollama Service，右键属性 → 启动类型保持「自动」
若运行卡顿：终端执行ollama ps查看占用，执行ollama stop 模型名释放显存

7.3 VSCode 卡顿优化

模型响应慢：执行Continue: Reload重载插件
自动补全拖慢编辑器：执行Continue: Toggle Autocomplete关闭补全功能

8. 常见报错 & 排查方案

问题 1：提示`model not found`

原因：本地未下载对应模型
解决：终端执行ollama pull 模型名下载，完成后重载 Continue

问题 2：聊天面板无响应、一直加载

原因 1：Ollama 服务未启动解决：重启电脑，或在服务中手动启动Ollama Service
原因 2：接口地址错误解决：检查config.yaml中apiBase必须为http://localhost:11434/v1
原因 3：模型卡死解决：终端ollama stop 模型名，再Continue: Reload

问题 3：能聊天，但代码补全不生效

原因：tabAutocompleteModel 配置错误
解决：核对配置文件中补全模型名称，和本地ollama list保持一致

问题 4：网络代理导致连接失败

解决：关闭系统全局代理、VPN，Ollama 本地接口不需要外网

9. 补充实用技巧

9.1 自定义快捷键（摆脱命令面板）

VSCode 快捷键：Ctrl + K Ctrl + S打开键盘快捷方式
右上角打开JSON配置文件
添加以下配置（示例，可自定义按键）：

{ "key": "alt+z", "command": "continue.toggleChat" }, { "key": "alt+x", "command": "continue.selectModel" }, { "key": "alt+c", "command": "continue.inlineEdit" }

保存后，Alt+Z打开聊天、Alt+X切换模型，纯键盘操作更高效。

9.2 区分「本地模型」和「云端模型」

本方案：Ollama+Continue →纯本地推理，离线可用、数据不外泄
VSCode 自带code chat/ Copilot → 云端模型，必须联网

两套功能互不冲突，按需选择使用。

9.3 缓存 & 模型清理

清理 Ollama 模型：ollama rm 模型名（删除不用的模型，释放硬盘）
模型异常重置：先ollama stop all，再重启 VSCode

完整使用流程速查（精简版）

开机 → Ollama 服务自动启动
终端确认模型：ollama list
打开 VSCode →Ctrl+Shift+P选择功能
问答：Continue: Toggle Chat
改代码：选中代码 →Continue: Inline Edit
换模型：Continue: Select Model
出问题：优先执行Continue: Reload

企业官网建设流程全解析

目录

1. 前置环境准备（必做）

1.1 硬件 & 系统要求

1.2 基础依赖

2. Ollama 安装 & 模型下载（本地模型核心）

2.1 安装 Ollama

2.2 基础命令（终端执行：PowerShell / CMD）

2.3 推荐模型下载（适配 A770 16G 显存）

执行下载步骤：

补充 Ollama 常用管理命令

3. VSCode 插件安装

4. Continue 插件完整配置（对接 Ollama）

4.1 打开配置文件

4.2 替换配置内容（适配 Ollama+A770）

配置说明：

4.3 加载配置生效

5. VSCode 命令面板全量常用命令

🔹 高频核心（日常 90% 场景）

🔹 代码编辑专用（改代码 / 排错）

🔹 配置 / 辅助命令

6. 核心功能实操演示

6.1 基础对话 & 代码问答

6.2 选中代码局部改写

6.3 切换运行模型

7. 显卡 & 性能优化（专属 A770 16G）

7.1 显存优化规则

7.2 Ollama 性能调优（可选）

7.3 VSCode 卡顿优化

8. 常见报错 & 排查方案

问题 1：提示model not found

问题 2：聊天面板无响应、一直加载

问题 3：能聊天，但代码补全不生效

问题 4：网络代理导致连接失败

9. 补充实用技巧

9.1 自定义快捷键（摆脱命令面板）

9.2 区分「本地模型」和「云端模型」

9.3 缓存 & 模型清理

完整使用流程速查（精简版）

热门文章

文章分类

标签云

相关文章

基于PSO优化的BP神经网络风电短期功率预测MATLAB工具包

TMS320F28335 SPI实战：如何用自环测试（Loopback）快速验证你的驱动代码？

饲料颗粒机哪家靠谱

需要专业的网站建设服务？

问题 1：提示`model not found`