• 第三媒体软件中心使用与技巧工具教程 → 如何用百度大脑文字识别技术,快速集成实用小工具 TTL

    如何用百度大脑文字识别技术,快速集成实用小工具

    上传:gyj333     来源:信息存储服务     日期:2019-12-11

    [摘要]  
       本文介绍了基于百度AI的云猫OCR软件相关功能、性能评价及核心代码解读。因篇幅较长大家可以直接检索所需信息参考
     
    [正文]    

       一、 总体概述

      本文介绍了基于百度AI的云猫OCR软件相关功能、性能评价及核心代码解读。因篇幅较长大家可以直接检索所需信息参考。

      本文主要介绍了由本人开发的、基于百度AI的云猫OCR软件的主要功能,性能评价及核心代码解读。因为是几个帖子合并成一个,所以篇幅较长,希望各位能耐心看完,当然也可以各取所需。

      本文主要分为以下几个部分:

      第一部分是云猫OCR软件介绍。 由开发者本人亲自介绍软件的主要功能。对标ABBYY等OCR软件,云猫OCR的功能更全面,使用更简单,关键的是云猫OCR目前是完全免费给大家用的。当然因为是试用版,可能存在一些bug,大家使用的时候不要乱按就行。

      第二部分是云猫OCR基于百度OCR的具体实现方式说明。 同时也会对软件的部分核心代码进行展示,便于大家进行参考做出更有创意的产品。

      第三部分是云猫OCR使用说明及效果评测。 但因为云猫OCR是2017年底左右开发的,所以用的不是百度OCR最新接口功能,如果云猫能得到大家的支持,我可以考虑开发新版接入更多百度最新的AI接口,希望大家能多多捧场。

      本文的最后部分是附录,附上了我基于百度OCR进行开发的代码解读,使用的是最新的百度手写体识别接口,也一并打包给大家参考。

      第一部分 云猫OCR的软件介绍

      一、云猫OCR简介

      云猫OCR是基于百度云OCR算法,由进击的狐狸进行开发的一款软件。本软件由C#语言进行开发,运行在Windows平台上。主要调用的接口是通用文字识别、通用文字识别(高精度)和表格识别等。

      二、云猫OCR目前实现的主要功能:

      1.批量图片文字识别,可以预览图片,可以对识别结果进行自动换行和缩进,可以控制QPS并发(QPS功能因为百度云的timeout问题而暂时搁置);

      2.批量表格图片识别,支持自动打开识别结果,用户也可以选择直接打开保存目录;

      3.PDF转图片,在我的笔记本(配置为I7处理器/8G内存/128G SSD硬盘)的硬件环境下,PDF转图片程序?檎加玫哪诖娌怀400M,同时可以在2分钟左右的时间内转换超过500页内容的PDF文件。支持一键打开转换结果文件夹。

      4.云猫软件支持换肤功能,目前有两套皮肤;

      5.可以设置API Key和Secret Key;

      6.支持中途停止识别;

      7.支持把设置改变后对同一张图片进行重新识别;

      8.支持多种语言;

      9.其他功能,比如识别统计信息、控制字体大小、右键把识别结果另存为rtf文件、全选和复制识别结果等等;

      三、演示帖子链接

      http://ai.baidu.com/forum/topic/show/492371

      四、云猫OCR演示视频链接

      https://v.qq.com/x/page/r0564n4a87e.html

      第二部分 云猫OCR基于百度OCR的具体实现方式说明

      一、概述

      云猫OCR是基于百度AI,在Windows平台运行的一款软件。我是用C#语言在Visual Studio2017集成开发环境中进行开发的,开发方式是SDK包开发。在开发中,我们需要参考百度的技术文档。

      百度云文字识别技术文档地址:

      https://cloud.baidu.com/doc/OCR/index.html

    如何用百度大脑文字识别技术快速集成实用小工具

      二、准备工作

      首先,我们需要下载最新的百度文字识别的SDK包。

      C# SDK包的下载地址:http://ai.baidu.com/sdk#ocr

    如何用百度大脑文字识别技术快速集成实用小工具

      下载完毕后解压缩,最新的包在文件夹net45里面。

    如何用百度大脑文字识别技术快速集成实用小工具

      打开Visual Studio2017开发环境,选择新建项目,因为我打算用控制台项目讲解,因此要选择新建项目——C#控制台项目。建好项目之后,需要在项目中引用上面下载的SDK包。

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      三、 核心代码讲解

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      注意,具体开发的时候要把上面的API Key和Secret Key分别改为你自己的,另外不要忘了把图片文件路径改为你自己的图片路径。下面是识别的结果示例:

    如何用百度大脑文字识别技术快速集成实用小工具

      原图如下:

    如何用百度大脑文字识别技术快速集成实用小工具

      (二)解析Json格式,把识别结果转变为更为直观的文本类型

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      程序运行结果如下:

    如何用百度大脑文字识别技术快速集成实用小工具

      这样就比较符合人类的阅读习惯了,上面这段代码也是核心的基础代码,可以通过这些核心的代码去做一些优化,比如自动换行、自动缩进、根据语言习惯自动改变标点符号等等。

      (三)表格识别

      百度的表格文字识别的编程较为麻烦,主要分成两步:第一步是提交表格文字识别请求,获得requestId;第二步是根据requestId获取表格文字识别的结果,默认是Excel文件格式,Json结果会返回一段下载地址。

      我的程序除了上面这两步以外,还添加了自动下载Excel文件到本地电脑的代码,供各位参考。另外要注意的是,提交识别请求和获得识别结果这两步之间,程序必须设置延时,否则不能获得下载的URL 。经过实际测试,延时为3秒以上较为合适,3秒以下可能会出错。

      代码如下:

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      作者使用的测试用图片:

    如何用百度大脑文字识别技术快速集成实用小工具

      表格文字识别结果截图:

    如何用百度大脑文字识别技术快速集成实用小工具

      第三部分 云猫OCR的使用说明及效果评测

      一、概述

      笔者是在2017年接触百度云服务平台的,在这里我也称之为百度AI 。笔者根据百度AI提供的函数接口,自行编程实现了一款OCR软件——云猫OCR。云猫OCR大部分的代码开发是在2017年底前完成的,之所以雪藏到现在,是因为笔者的一些私人事务(小孩出生等)——我是利用业余时间进行软件开发的,所以中断了大概一年多的时间,现在才有空继续这个项目。

      评测篇的原帖子地址:

      http://ai.baidu.com/forum/topic/show/955989

      二、评测的具体内容

      (一)准备工作

      在使用云猫OCR之前,我们必须先去百度云官网进行注册账号,有了账号以后,我们还要去具体的云服务项目下申请API Key和Secret Key ,一般这两个Key是用户各人保管的,不能随便透露给外人。因为百度云现在已经正式收费,而用户每人每天的免费调用次数都是有限的,提高限额需要支付费用,用户使用百度云AI接口的依据主要就是这两个Key,所以我们要保管好。下面是简单的准备工作图片说明:

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      (二)正式使用云猫OCR

      用户有了百度云API Key和Secret Key之后,就可以正式使用云猫OCR了。具体使用步骤如下:

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      (三)评测的具体内容

      首先介绍一下云猫OCR调用的百度AI的主要接口,首先是通用文字识别(带位置版),其次是通用文字识别(带位置高精度版),最后是表格文字识别,下面依次介绍这三种识别。

      1. 通用文字识别(带位置版)和通用文字识别(带位置高精度版)的混合使用

    如何用百度大脑文字识别技术快速集成实用小工具

      如上图所示,用户可以选择多种语言(包括德语、法语、西班牙语等等),选择好后点击文字识别即可。因为百度云提供的高精度文字识别接口只支持中英文,而通用的文字识别支持除中英文以外的多种语言,所以笔者在编写软件中,这两种接口是混合使用的,具体怎么混合使用请看代码篇。一般情况下,高精度的文字识别效果比通用的好,但也比较耗时。

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      本软件支持识别的文字结果在本机保存为文件,具体如下图操作:

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      保存的文件是rtf格式,可以用WPS或者Office Word打开。下面再给出一次性识别20张图片的统计结果图示:

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      从上图可以看出,百度云的文字识别结果速度还是不错的,识别速度是平均大概2-3秒一张图。

      2. 表格文字识别

      表格文字识别的主要步骤如下图所示:

    如何用百度大脑文字识别技术快速集成实用小工具

      识别的结果软件会自动保存为Excel文件并打开,如图:

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

      从上图可以看出,表格文字识别的速度比普通文字识别要慢一些,大概需要5-6秒。

      评测总结:百度OCR对于印刷体的识别还是不错的,比起以前的OCR软件来说,百度OCR可以说是革命性的进步。当然,它也有自己的短板。比如手写体的识别,笔者还没有评测,但百度云通用文字高精度接口对手写体的识别是较差的。再比如QPS并发,我的理解是可以提高OCR文字识别的速度,对于大量的图片文字识别来说尤其是重要,可以节省大量时间。但遗憾的是,百度云对并发好像做的不太好,程序不一定支持QPS并发,这个缺点我们也是希望百度后面能够有所改正。

      附录:

      C#编程实现手写识别

      一、概述

      本人是用C#编程,调用百度API接口实现手写体识别的,参考了百度的产品文档。

      文档地址:https://cloud.baidu.com/doc/OCR/index.html

      二、代码及解说

      本人的源代码大部分是来自百度的产品文档,但其中也遇到了一些麻烦。比如文字识别的编码问题,百度的代码给出的编码是Default,但在我的机器上这样做会显示乱码。经过查找资料,我把编码改成UTF8,乱码的问题才得到解决。

      作者的所有源代码如下:

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具

    如何用百度大脑文字识别技术快速集成实用小工具


      注意,上面的代码中需要各位改成自己的Akey和Skey,另外要改一下图片路径。如果返回的是乱码,还需要改一下编码。

      识别的结果如下:

    如何用百度大脑文字识别技术快速集成实用小工具


      程序用的图片文件如下:

    如何用百度大脑文字识别技术快速集成实用小工具

       (新闻稿 2019-12-13)


    频道首页 】【 评论 】 【 打印 】 【 字体:
       上一篇:文件误删除如何恢复? 办公文件丢失恢复技巧!
       下一篇:
    导航:报价 | 大全 | 排行榜 | 产品大全 | 参量 | 订阅 
     Advertisement
     十大最受关注的新闻
    1  让创意更自由,索尼Xperia 1手机唤醒摄影创造力
    2  618手机市场线上权威报告 京东成为用户购机首选平台
    3  佳能数码相机: 街头篮球场 教你拍出自己的潮流vlog
    4  十代酷睿凌云 开启游戏本新篇章机械师“战空”F117-V
    5  AI疾速抓拍“快准稳”荣耀30青春版记录美好生活
    6  坚果手机"宝宝聪明早教先行"教育专场活动,最低9.9元
    7  蓄势发力国内To C市场 中兴终端引进高端行业人才
    8  超强超好玩,三星Active 2智能手表宝藏表盘推荐大赏
    9  NCB2020 福昕软件助力零售业企业数字化逆势破局
    10  上市捷报,福昕软件IPO通过科创板上市委审核!
     十大热门驱动/软件下载
    1  [手机驱动]手机usb万能
    2  [热门常用软件]QQ2008正式版下载【腾讯QQ2008官方版Beta1】
    3  [热门常用软件]E话通下载【E话通4.5 正式版】
    4  [手机驱动]Samsung三星 手机USB驱动1.0版For Win98SE/ME/...
    5  [手机驱动]Microsoft微软 ActiveSync同步软件4.5中文版Fo...
    6  [摄像头驱动]万能摄像头 FOR Windows
    7  [热门常用软件]皮皮播放器下载【PPFilm皮皮播放器 2.1.0....
    8  [手机驱动]诺基亚 PC套件下载
    9  [热门常用软件]面对面游戏下载【面对面视频游戏大厅】
    10  [手机驱动]Microsoft微软 Windows Mobile Device Center ...
     十大最受关注的品牌
    1  三星手机(SAMSUNG)
    2  诺基亚手机(NOKIA)
    3  华硕笔记本(ASUS)
    4  摩托罗拉手机(MOTOROLA)
    5  英特尔CPU(Intel)
    6  华硕主板(ASUS)
    7  LG手机(LG)
    8  索爱手机(Sony Ericsson)
    9  联想笔记本(lenovo)
    10  宏碁笔记本(acer)
     十大热门常用软件下载
    1  QQ2008正式版下载【腾讯QQ2008官方版Beta1】
    2  E话通下载【E话通4.5 正式版】
    3  皮皮播放器下载【PPFilm皮皮播放器 2.1.0.2版】
    4  面对面游戏下载【面对面视频游戏大厅】
    5  DVD解码器下载【NVIDIA DVD Decoder 1.02】
    6  迅雷5下载【迅雷5.8.1.507官方版】
    7  QQ2007 II正式版下载【腾讯QQ2007官方版本】
    8  QQ2006正式版下载【腾讯QQ2006官方版本】
    9  联众世界游戏大厅下载【联众世界2.7.0.8官方版】
    10  MTV下载器【MTV下载精灵 8.31版】
    11  pplive最新版下载【PPLive网络电视V1.9.35版】
    12  迅雷(Thunder)下载【迅雷v5.7.12.493官方版】
    13  腾讯QQ2008下载【腾讯QQ官方版2008极速贺岁版KB1】
    14  Total Video Converter下载【Total Video Converter v3.1...
    15  QQ拼音输入法下载【腾讯QQQQ拼音输入法V1.4.1版】
    16  皮皮高清影视播放器下载【PIPIPlayer 2.7.0.3版】
    17  eMule下载【电驴eMule官方v0.49a正式版】
    18  极点五笔输入法下载【极点五笔6.1标准版】
    19  QQ2009正式版下载【腾讯QQ2009 SP4官方版】
    20  Vagaa哇嘎画时代版下载【哇嘎 2.6.5.10】
       >> 查看评论   
     
       >> 查看更多评论   [共有0条评论]
    发表评论
            
            
       点评:
       姓名:  
                字数: 0
         
    新闻精选
    ·CDIE2020上?,福昕助力企业探寻数字化新
    ·海云数据加速AI布局,为公安系统提供智慧解决
    ·老榕树广告联盟网盟朋友圈推广 破局自媒体盈
    ·加速信创体系建设,Coremail论客数字办公再升
    ·9元任看4部电影!招行信用卡“9元随心看”受
    ·云端起航历久弥新 全国糖酒商品交易会线上云
      ·天威诚信 荣获“2020中国网络信息安全优秀服
    ·信号强、辐射低,藏在中兴“5G超级天线”中的
    ·发改委等部门鼓励发展线上办公,电子认证行业
    ·阿里"春雷计划"持续落地 淘宝大学
    ·苏宁818发布会 苏宁金融未来三年免息让利100
    ·即信发布ICC融合通信中台 打造银行社交化运营
    舞龙_维京人世界_暴怒北欧海盗_愤怒暴龙_谁想成为百万富翁