公司新闻

文本提取一秒搞定 华为OCR技术到底厉害在哪?

分类:公司新闻 作者: 来源: 发布:2020-03-25 11:00
  

  在日子和工作中,你是不是经常会遇到这样的状况:训练时,手机里拍了一堆PPT资料,回去一个字一个字手动录入。阅读网页时,找到了想要的资料,但是发现“Ctrl+C、Ctrl+V”不起作用,只能截图先保存着。Ren

  而想要把图片或纸质文件上的内容变成电子文档,其实不需那么繁琐。华为手机上的文本提取功用能够快速提取屏幕上的文字,且支撑电话号码、邮件、网站一步跳转,助力高效工作。Ren

  才智视觉神操作,分分钟搞定文本提取Ren

  那么,这么好用的文本提取功用终究怎样用?其实这就要从咱们的手机摄像头说起,可别小瞧了这个摄像头,它但是躲藏在手机里的才智眼。卡路里、翻译、识物……一扫便知。文字提取功用仅仅归于才智视觉的一小部分, 想要文本提取,就要先翻开才智视觉。Ren

  那么怎么进入才智视觉呢?Ren

  一是经过手机桌面空白处下拉进入大局查找,点击右上角“才智视觉”图标;二是翻开手机相机,点击左上角“才智视觉”图标,三是直接唤醒华为才智帮手小艺说“翻开才智视觉”即可。Ren

Ren

  配图为EMUI10版别界面图,不同机型、版别请以什物为准Ren

  进入才智视觉后,在“识物”方法下,对着需求提取文字的图片扫一扫,点击文字区域,呈现蓝色光标后,依据自己的需求拖选文字,点击“仿制文字”即可提取相关文字。Ren

Ren

  配图为EMUI10版别界面图,不同机型、版别请以什物为准Ren

  文本提取变简略的神器是TARen

  文本提取功用不只操作方法简略,并且能够快速且精确地录入一些纸质文档,也能够提取图片中需求的文字信息,便利咱们的工作和日子。关于能把图片上的文字一字不漏地提取下来,终究依托的是什么隐秘武器?其实隐秘就在OCR技能。Ren

  OCR的隐秘都在这儿Ren

  许多小伙伴会问OCR是什么?其实OCR即光学字符辨认(Optical Character Recognition),是一种对图片中存在文字的区域进行定位,再将定位的区域进行辨认,并将其转换成计算机文字的进程。在这儿的使用,就是在智能镜头的AR场景里,对镜头所拍照到画面中的文本进行定位(检测)和辨认,终究凭借NLP(Natural Language Processing)输出文本辨认成果。那么,技能完成要经过哪些流程呢?Ren

Ren

  Step1 :检测+辨认,O CR检测模型作用凸显Ren

  当咱们的镜头对准需求提取文本的资料时,当时的画面会以图片方法送入OCR检测模型。在检测模型中,图片首要会经过担任检测的卷积神经网,像人眼睛相同的卷积神经网会把图片中的文字信息提取出来变成特征图。检测模型依据这些特征图,猜测图片中的哪些区域是文本区域,并输出相应坐标,以便从原图中截取出来作为辨认模型输入。Ren

  接下来,担任辨认的卷积神经网会对这些辨认模型进行特征提取,提取到的特征信息被送入循环神经网,循环神经网就像咱们的大脑,会处理、加工、判别、推理所取得的信息,终究得到图片中的文字信息。Ren

  当咱们的镜头对准需求提取文本的资料时,当时的画面会以图片方法送入OCR检测模型。在检测模型中,图片会经过检测和辨认两个环节,终究得到图片中的文字信息Ren

  Step2 :校对+优化,OCR是个完美主义Ren

  一般状况下,检测和辨认出的文本一般需求再次核对以确保其正确性。这是因为在AR场景中,经过OCR技能检测到镜头画面的文字,将文本区域高亮后展现给用户,得到的文档往往都不是很完美,很可能带有歪斜或重影;而文字追寻功用确保当镜头移动导致拍照画面颤动时,检测到的文本区域保持在本来的方位不变。Ren

  在这基础上,需先进行图画预处理,做视点矫正和去噪,接着对文档版面进行剖析,将各个字符送入训练好的OCR辨认模型进行字符辨认,得到成果,终究还需求对其进行辨认成果的校对和优化。Ren

  Step3 : 定帧后 ,拖一拖,仿制文字轻松搞定Ren

  当用户期望屏幕画面固定不动,能够点击检测到的文本行,这时屏幕会定帧,用户可手动挑选对检测和辨认到的文字内容进行拖选,其作用类似于在文本文档里,用鼠标对文本内容进行拖选。Ren

  要完成文本区域内拖选的功用,就需求用到整行拖选技能。文字整行拖选技能主要是依据OCR检测模型输出文本区域的坐标,经过辨认用户的点击事情,实时记载用户点击的方位,并经过上层UX对用户拖选到的区域进行高亮。阅历一系列的操作,终究把可仿制的文字呈现在用户面前。Ren

Ren

  文本提取有哪些难点与应战?Ren

  看似简略操作的文本提取,实践要战胜的困难可不少。文字的字体、字号、色彩等不一致,简略被误辨认;言语品种繁复,中文、英文、数字等多种言语混合呈现,辨认难度大;辨认时,不行猜测光线改变、图片不清、布景杂乱搅扰等等,这些都给文本提取带来了不小的困难。Ren

  关于上述的困难,根据华为OCR技能于业界抢先的深度学习文字定位功用和文字辨认技能,无论是日子中杂乱多变场景,仍是不同光照条件,华为OCR技能能支撑多场景、恣意版面的文字辨认提取,具有英文和数字、多语种(包含中文、日文、韩语、阿拉伯语、英语和欧洲五国言语等)、以及超越7000个常用汉字的简繁体辨认才能,一起还具有多种笔直场景的辨认才能,支撑辨认如身份证、银行卡、手刺、驾驶证等, 满意日子中大部分场景的文本提取需求。Ren

  OCR技能作为AI技能的支撑,是一种强有力的辨认方法。文字提取、辨认物品、扫描习题、翻译外文时大多都需求依托OCR技能,使用方法简略便利。假如你正好有华为手机,无妨体会一下。Ren

-

Copyright © 2013 关键词凯发国际app-k8凯发国际娱乐下载 All Rights Reserved