热点推荐
ZOL首页 > 新闻中心 > 业界 >

背景资料

文通布发慧视新品 OCR进入视觉图像

ZOL 作者:中关村在线 HP 责任编辑:张磊 【原创】 2005年04月26日 17:38 评论

    熟悉OCR(光学字符识别)的人都知道,利用OCR技术,我们可以轻松实现纸质文档的电子化,大大提高工作效率。但一直以来,OCR技术几乎都要依赖扫描仪来实现文字识别的功能,而扫描仪的局限性造成了我们无法实现随时随地采集文字图像,这也成为了OCR技术广泛应用的一个巨大瓶颈。426,北京文通信息技术有限公司推出了国内首款视觉图像文字识别系统――慧视,创造性的将OCR数码相机DV拍照手机PDA等图像输入设备相结合,实现了对任意视觉图像的识别,将文字识别引领到了视觉图像这一更为广阔的领域,业界专家兴奋地预言:“慧视”的推出,必将引爆视觉图像识别应用的一场新革命。

摆脱扫描仪的束缚

众所周知,利用OCR技术,我们可以把纸质文字直接转化为电子文本。但其前提是必须要利用扫描仪将图文资料和大量的纸质文字资料进行扫描处理和文字识别,再输入到计算机上进行编辑。而作为计算机的外设,扫描仪也日益显现出功能上的落后、应用与携带上不方便的特点。于是,人们对计算机结合扫描仪这种传统而繁琐的识别方式提出了更高的要求,希望计算机能够直接读取图像文字资料,独立“识图认字”。

而与传统的OCR技术不同的是,文通信息开发的“慧视”完全脱离了扫描仪,直接把OCR移植到数字移动产品上。这样一来,就摆脱了以前通过扫描仪来完成识别的繁琐与不便,当用户利用数码相机、数码摄相机或手机等设备把感兴趣的文章、图像文字资料或者是看不懂的资料拍下来之后,就可以把这些数字图像资料传入电脑,然后再通过“慧视”识别软件,立刻就变成了人可编辑、使用和保存的材料,满足了那些经常要和文字打交道、对识别率有很高要求人们的需求。

慧视的识别奥秘

既然慧视可以识别数码相机拍摄的图像文字,那么它的识别奥秘究竟在哪?回答这个问题,我们还是要从视觉图像说起。

据文通的技术人员介绍:所谓视觉图像,简单的说就是我们用眼睛直接看到的图像,也就是我们利用数码相机、摄像机PDA、拍照手机等拍摄的自然视觉图像。视觉图像与扫描仪扫出的图像不同,视觉图像往往会有焦距变化、角度形变、光线变化、背景变化等多种复杂的情况出现。比如,我们在用眼睛直接观看一副展板内容的过程中,受角度、光线的变化就会产生以上这些情况,同样在用相机拍摄的过程中,这些问题也会经常出现,因此实现这些图像的识别,就需要更多的外围技术,对图像进行调整,变成OCR技术可以直接的识别的标准图像。

为此,慧视采用先进的图像恢复技术,通过复杂的计算和处理,将平面曲边、曲面曲边、以及不同角度拍摄的图像校正为平面直边图像。同时针对复杂背景的图像,利用图像自动处理技术,实现图像的二值化,也就是将图像底纹进行过滤,最终变成黑白两色的图像,大大提高了OCR的识别效果。

据了解,凭借强大的TH-OCR技术,慧视具备了超强的文字识别能力,不仅实现了中文简体、繁体、数字、英文日文、韩文以及行业专用字符集的识别,同时具备了多文种、同版面的识别。比如用户采集的图像包含英、日、韩三种语种,这时,用户只需将同类语种的段落分别选中,就可以一步实现识别。此外,对于图文混排的情况,慧视也能进行很好的识别处理。而更为神奇的是,慧视还能识别手写字体的图像。据文通信息副总经理王军铸介绍,手写字体的识别是文字识别领域的一个难点,经过了长时间的研发,目前慧视已经较好的解决了这一难题,如果图像中用户的字迹不是很潦草,识别效果是非常理想的。其次,在识别完成之后,慧视还能将识别结果自动导入到word、写字板、excel等应用程序,方便了用户进行查看和编辑,而且即使识别有误。利用慧视附带的小灵鼠,就可以轻松实现鼠标手写输入。另外,慧视全面兼容文通名片管理系统,并支持名片资料的批量处理。这样,用户就可以一次处理多张名片资料,大大提高了效率。

创新引领新潮流

作为国内OCR领域的领导厂商,文通信息源于清华,承担着清华TH-OCR技术产品化和应用创新的重要任务。正如文通信息总经理沙建辉说,创新一直是促进识别技术不断发展的源源动力,作为国内OCR领域领导厂商的文通,正是依靠着不断创新,研发实践,实践再研发再投入实践,不断的推陈出新、精益求精。

“我们关注所有输入产品,并希望用户的输入产品真正得到有效的应用”文通信息总经理沙建辉表示。在文通看来,数码相机同扫描仪一样,都是输入产品都具有信息采集的功能。特别是对于数码相机,很多用户对它的应用还仅停留在拍照片,但实际上数码相机更大的应用价值却是信息的采集。而目前数码相机信息采集的功能之所以没有得到广泛应用,关键就是缺乏相应的软件配合,而文通信息正是看到了这一巨大的潜在市场。

作为目前国内首款视觉图像文字识别系统,慧视的应用前景,特别是在个人消费市场前景非常广阔。其中最主要的原因除了慧视方便、实用、快捷的功能之外,数码设备的逐步普及也起到了推波助澜的作用,实现了信息的随时采集、随时识别。比如我们在图书馆查阅资料时,就完全可以用随身携带的数码相机把需要的内容拍下来,然后用慧视进行识别,再比如在我们在参加展会或者参观旅游景点的时候,也可以用数码相机或者DV记录下我们感兴趣的内容,然后用慧视直接识别文字,同时由于慧视具有多语种识别的功能,因此无论我们身在何处,有了慧视这双 “识别的慧眼”,都可以随时随地帮助我们实现文字的识别。

除了与数码相机结合之外,慧视通过嵌入技术嵌入到拍照手机以及PDA中,在慧视的发布会上,文通信息就向人们展示先进的嵌入式“慧视”技术。据了解,文通信息的嵌入技术在汉字识别领域处于世界领先地位。即将推出的嵌入式“慧视”,采用了全新的灰度算法OCE识别核心,极大的增强了既有数码摄像功能智能手机的应用能力。特别是随着配有高象素摄像头手机的普及,该技术将开辟嵌入式视觉文字图像采集识别的广阔应用领域。

在谈到慧视的应用前景,文通信息副总经理王军铸乐观地表示,随着技术和应用的不断提升和扩展,慧视将深入到人们生活和工作的各个层面,其技术和需求的范围广、潜力大、时间长,必将成为未来全球科技发展的重点竞争领域。而除了发展嵌入式技术之外,文通正在计划将慧视与翻译系统以及语音识别系统相结合,为各国之间的交流提供一座高效、实用的平台。

清华大学智能图文实验室教授,国内OCR领域的权威专家丁晓青教授在发布会上的一番话向我们揭示了“慧视”的真正“玄机”:“目前OCR技术已经迎来了新的应用高潮,除了行业信息化建设带来的机会之外,数码相机、摄像机、PDA特别是可拍照手机这些输入设备的不断丰富发展与普及应用,更为视觉图像识别技术提供了机会。可以说,“慧视”的问世,不仅给文字识别领域带来一场“划时代的革命”,在数字图像信息的认识和应用上,更引领了一场全新的、轻松自由的工作和生活方式的潮流!”。

 

给文章打分 5分为满分(共0人参与) 查看排行>>
上一页 1 2 
本文导航
  • 第2页:背景资料
频道热词:智能穿戴  汽车科技  三菱空调  
视觉焦点