Cherry Studio接入Agnes Image 2.1 Flash教程,实现免费AI图片识别
大家好 这里是「代码简单说」`,欢迎大家关注同名公众号,不定时更新更多实用有趣的教程 也欢迎大家在评论区一起讨论交流!~
关键词:Cherry Studio教程、Agnes AI接入、Agnes Image 2.1 Flash、多模态大模型、AI图片识别、免费视觉模型、Cherry Studio配置OpenAI接口、AI识图教程
最近在体验各种AI模型时,发现不少支持图片识别的模型都需要付费额度,对于个人开发者来说使用成本并不低。
这次发现了一个比较实用的方案,Agnes Image 2.1 Flash 多模态大模型提供免费的视觉识别能力,并且能够直接接入Cherry Studio使用。
整个配置过程大约只需要几分钟,配置完成后即可在 Cherry Studio 中实现:
- 图片识别
- 图片内容分析
- OCR文字提取
- 图表理解
- 截图问答
- 多模态对话
本文详细记录完整接入过程。
一、什么是Agnes Image 2.1 Flash
Agnes Image 2.1 Flash 是一款支持视觉理解能力的多模态大模型。
主要特点:
| 功能 | 支持情况 |
|---|---|
| 文本对话 | √ |
| 图片识别 | √ |
| OCR文字识别 | √ |
| 图表分析 | √ |
| 多轮对话 | √ |
| 免费使用 | √ |
相比很多需要付费额度的视觉模型,对于日常体验和开发测试来说非常方便。
二、下载Cherry Studio
首先下载 Cherry Studio 客户端。
官网地址:
https://cherry-studio-ai.com/进入官网后根据自己的系统下载安装即可。
支持:
- Windows
- macOS
- Linux
安装完成后先不要急着配置模型,接下来需要获取 Agnes AI 的 API Key。
三、获取Agnes AI API Key
登录 Agnes AI 平台:
https://platform.agnes-ai.com/登录成功后进入:
https://platform.agnes-ai.com/settings/apiKeys可以直接访问:
点击:
创建新密钥然后填写一个名称,例如:
CherryStudio点击创建后系统会自动生成 API Key。
如下图所示:
sk-xxxxxxxxxxxxxxxx此时点击右侧:
复制即可复制 API Key。
注意:API Key 只会弹出显示一次,如果忘记复制,需要重新创建新的密钥。
四、Cherry Studio配置Agnes AI
打开 Cherry Studio。
点击左下角:
设置进入配置页面。
找到:
模型服务然后滑动到最下方。
点击:
添加如下图:
创建服务商
弹窗中填写:
名称
Agnes AI供应商类型
选择:
OpenAI保持默认即可。
然后点击:
确定填写接口信息
创建完成后填写以下内容。
API密钥
粘贴刚刚复制的 Key:
sk-xxxxxxxxxxxxxxxxAPI地址
填写:
https://apihub.agnes-ai.com/v1配置示例:
API Key: sk-xxxxxxxxxxxxxxxx Base URL: https://apihub.agnes-ai.com/v1五、获取模型列表
配置完成后。
点击:
获取模型列表系统会自动拉取平台支持的模型。
选择:
agnes-2.0-flash如下:
☑ agnes-2.0-flash六、检测接口是否正常
在 API 密钥右侧找到:
检测按钮。
点击后进行连通性测试。
如果弹出:
连接成功说明配置已经完成。
如下:
✓ 连接成功此时 Agnes AI 已经成功接入 Cherry Studio。
七、开始对话测试
返回:
助手页面。
创建新的会话。
选择:
agnes-2.0-flash然后直接输入问题即可开始聊天。
例如:
介绍一下Vue3响应式原理或者:
帮我分析这段代码都可以快速得到回复。
实际测试过程中响应速度非常快,基本属于秒级返回。
八、开启图片识别功能
很多朋友配置完成后发现:
为什么上传图片无法识别?原因是 Cherry Studio 默认没有开启视觉能力。
需要手动开启。
进入模型设置
返回:
设置找到:
agnes-2.0-flash模型。
点击模型右侧:
设置按钮。
更多设置
进入:
更多设置找到:
模型类型此时会看到多个选项。
默认情况:
✓ Chat □ Vision需要手动勾选:
✓ Chat ✓ Vision也就是开启:
视觉(Vision)能力。
保存配置。
九、测试图片识别
再次回到会话页面。
上传一张图片。
例如:
- 截图
- 网页界面
- 文档
- 图表
- 商品图片
然后输入:
请分析图片内容或者:
提取图片中的文字即可得到识别结果。
例如上传一张网页截图后,可以获得:
- 页面结构分析
- 文本内容提取
- 按钮功能说明
- 页面布局描述
对于开发者分析页面结构也比较方便。
十、完整配置参数汇总
为了方便大家配置,这里整理一份完整参数。
| 配置项 | 内容 |
|---|---|
| 服务名称 | Agnes AI |
| 供应商类型 | OpenAI |
| API地址 | https://apihub.agnes-ai.com/v1 |
| 模型名称 | agnes-2.0-flash |
| API Key | Agnes平台生成 |
| 图片识别 | 开启Vision |
| 是否免费 | 是 |
总结
通过 OpenAI 兼容接口,Agnes AI 可以非常方便地接入 Cherry Studio。
整个流程主要分为四步:
- 下载 Cherry Studio
- 创建 Agnes API Key
- 配置 OpenAI 接口
- 开启 Vision 视觉能力
配置完成后即可获得:
- AI聊天
- 图片识别
- OCR提取
- 图表分析
- 多模态问答
对于平时需要体验视觉模型、分析截图、识别图片内容的开发者来说,是一个比较实用且免费的方案。使用门槛低,配置过程也非常简单,几分钟即可完成接入。