OCR 服务配置

OCR Pro 支持多种 OCR 服务，本文介绍如何配置各个服务。

进入配置

呼出 uTools
输入 设置
选择「OCR 模型服务」

支持的服务

本地主机

使用系统内置 OCR 引擎，无需配置 API。

优点：

✅ 完全免费
✅ 离线使用
✅ 无需配置

缺点：

⚠️ 精度略低于云端服务
⚠️ 不支持表格结构识别

配置步骤：

在 OCR 模型服务中选择「本地主机」
点击启用即可使用

百度 OCR

百度智能云 OCR 服务，精度高、功能丰富。

获取 API Key：

访问百度智能云
注册/登录账号
进入「产品服务」→「人工智能」→ 「文字识别」
创建应用获取 API Key 和 Secret Key

配置参数：

参数	说明
API Key	应用的 API Key
Secret Key	应用的 Secret Key

免费额度

百度 OCR 新用户有免费额度，具体请查看官网说明。

腾讯 OCR

腾讯云 OCR 服务，速度快、性价比高。

获取 API Key：

访问腾讯云
注册/登录账号
进入「云产品」→「人工智能」→「文字识别」
获取 SecretId 和 SecretKey

配置参数：

参数	说明
SecretId	腾讯云 SecretId
SecretKey	腾讯云 SecretKey

阿里 OCR

阿里云 OCR 服务。

获取 API Key：

访问阿里云
注册/登录账号
进入「产品」→「人工智能」→「文字识别」
获取 AccessKey

配置参数：

参数	说明
AccessKey ID	阿里云 AccessKey ID
AccessKey Secret	阿里云 AccessKey Secret

讯飞 OCR

科大讯飞 OCR 服务。

获取 API Key：

访问讯飞开放平台
注册/登录账号
创建应用获取相关配置

Gemini

使用 Google Gemini 模型进行 OCR。

获取 API Key：

访问 Google AI Studio
创建 API Key

自定义 API

支持配置符合特定格式的自定义 OCR API。

多模型配置

OCR Pro 支持配置多个模型并同时使用：

在「OCR 默认模型」中设置模型数量
启用的模型会同时进行识别
可对比不同模型的识别结果

测试连接

配置完成后，点击「测试」按钮验证配置是否正确。

注意

请妥善保管您的 API Key，不要泄露给他人。