! 图片文字识别 (:ocr_text)

声明

识别结果, 结果详情 = 图片:ocr_text([ 引擎选项, 二值化选项 ])

参数

引擎选项可选参数，表型，用于选择识别语言及识别引擎

参数结构

{
    -- Android 版使用 Paddle-Lite 引擎识别。可使用 lang 指定模型
    -- 例如 lang = "ppocr_ch" 则使用模型 /sdcard/nbtouch/models/ppocr_ch
    -- Paddle-Lite 引擎支持 *.nb 格式的 Slim 模型
    engine = "paddle" | "tesseract",
    lang = "ppocr_ch",
}

Android 支持的 OCR 引擎和模型

Android 平台推荐使用 Paddle-Lite 引擎，支持以下模型：

ppocr_ch       -- 简体中文（推荐）
ppocr_cht      -- 繁体中文
ppocr_en       -- 英文数字
ppocr_jp       -- 日文
ppocr_kr       -- 韩文

也可使用 tesseract 引擎，支持 eng（英文）、chi_sim（简体中文）等语言包。

二值化选项实数型，二值化阈值，可参考图片自动二值化表型，自定义二值化色偏，参考图片手动二值化文本型，自定义二值化色偏，参考图片手动二值化

返回值

识别结果文本型，识别返回的文字
结果详情表型

OCR 识别的结果详情结构

{
    {
        ["y"] = number_value,
        ["x"] = number_value,
        ["w"] = number_value,
        ["h"] = number_value,
        ["confidence"] = number_value(0.0000 ~ 1.0000),
        ["text"] = string_value,
    },
    ...
}

说明

识别图片中的文字，除了不需要区域参数，其它和屏幕区域文字识别 (screen.ocr_text) 一致

软件版本在 1.3.8 以上可使用

PaddleLite 简体中文普通版模型（需要解压缩）

PaddleLite 简体中文完全版模型（需要解压缩）

PaddleLite 繁体中文识别模型（需要解压缩）

PaddleLite 日文识别模型（需要解压缩）

PaddleLite 韩文识别模型（需要解压缩）

PaddleLite 英文数字识别模型（需要解压缩）

也可从 PaddleOCR 模型列表下载对应模型转换成 det_opt.nb、cls_opt.nb、rec_opt.nb, 然后找到对应的 dict.txt 配套使用

示例

-- Android 示例
local img = image.load_file(NBT_SCRIPTS_PATH..'/1.png')

txt, info = img:ocr_text({
    engine = "paddle", -- 使用 PaddleLite OCR 引擎
    lang = "ppocr_en", -- 使用英文数字模型
})
sys.toast("识别结果："..txt:atrim())

txt, info = img:ocr_text({
    engine = "paddle", -- 使用 PaddleLite OCR 引擎
    lang = "ppocr_ch", -- 使用简体中文模型（推荐）
})
sys.toast("识别结果："..txt:atrim())

txt, info = img:ocr_text({
    engine = "paddle", -- 使用 PaddleLite OCR 引擎
    lang = "ppocr_ch", -- 使用简体中文模型
}, "9D5D39-0F1F26,D3D3D2-2C2C2D") -- 使用色偏二值化
sys.toast("识别结果："..txt:atrim())

注：上述代码中使用了非本章函数 sys.toast、string.atrim

旧版遗留示例（不推荐）

local img = image.load_file(NBT_SCRIPTS_PATH..'/1.png')
-- 示例 1：
local txt = img:ocr_text() -- 默认配置是使用 tesseract 引擎英文数字模式识别文字
sys.toast("识别结果："..txt:atrim())
--
-- 示例 2：
local txt = img:ocr_text("eng", "9D5D39-0F1F26,D3D3D2-2C2C2D") -- 使用色偏二值化识别
sys.toast("识别结果："..txt:atrim())
--
-- 示例 3：
local txt = img:ocr_text("eng", { {0x9D5D39, 0x0F1F26}, {0xD3D3D2, 0x2C2C2D} }) -- 使用色偏二值化识别，同上
sys.toast("识别结果："..txt:atrim())
--
-- 示例 4：
local txt = img:ocr_text({
  lang = "chi_sim",         -- 使用 tesseract 引擎简体中文库识别（注意，简体中文库不是内置的）
  white_list = "你我他",      -- 白名单设为 "你我他"
})
sys.toast("识别结果："..txt:atrim())
--
-- 示例 5：
local txt = img:ocr_text({
  lang = "eng",
  white_list = "1234567890",      -- 自定义使用白名单限制仅识别为数字
}, "9D5D39-0F1F26,D3D3D2-2C2C2D") -- 使用色偏二值化识别
sys.toast("识别结果："..txt:atrim())

注：上述代码中使用了非本章函数 sys.toast、string.atrim

声明​​

参数​​

返回值​​

说明​​

示例​​

旧版遗留示例（不推荐）​​

声明

参数

返回值

说明

示例

旧版遗留示例（不推荐）