您当前位置: 必胜印刷网 > 新闻中心 > 相关 > 正文

内蒙古大学博士毕业生研发出一款传统蒙古文印刷体文字识别软件

时间:2016-12-05 来源:自治区教育厅

摘  要:
日前,内蒙古大学2015届博士乌日力嘎完成了一款传统蒙古文印刷体文字识别系统软件的研发。

关键词: 印刷体文字识别软件  

  日前,内蒙古大学2015届博士乌日力嘎完成了一款传统蒙古文印刷体文字识别系统软件的研发。

  据其研发者乌日力嘎博士披露,目前她研发的这款软件对蒙古文白体的识别率已达到99%以上,对铅印版的识别率也达到95%以上。“传统蒙古文有大量的图书、报刊,但其中很多都没有实现数字化,”乌日力嘎博士介绍说,高效数字化需要OCR(Optical Character Recognition)软件自动识别扫描或拍照的图片,将图片中的文字转换成文本。

  乌日力嘎在内蒙古大学读博士期间研究机器翻译,机器翻译需要大量的语言资源,但是蒙古文的资源特别少,我们在建立语言数据库时需要大量的人力、时间和经费。于是,她萌发一个念头——“自己是否也试着研发一款高精度的蒙古文自动识别系统。”2015年夏天博士毕业后,乌日力嘎开始全身心地投入到传统蒙古文OCR软件的开发之中,她参考了国内外大量学术文献,并使用深度学习和语言模型等高新技术,在短时间内成功研发出了蒙古文高精度自动识别软件。据介绍,这一软件的优势是既能识别扫描图片,又能识别拍照的图片,并且将打字和校对的功能融为一体。

  “上世纪90年代以前的书本都是铅印版本,但目前还没有其他可以把铅印版转换成文本的软件,而乌日力嘎博士研究的软件优势是能识别铅印版,并且有承前启后的作用,”内蒙古大学教授那顺乌日图认为,乌日力嘎研究的软件理论上有创新,这一软件结合语言规则和统计方法,再利用深度学习和神经网络等新技术来完成的。因为以前的OCR软件是基于规则或者是基于统计的方法来实现的,他们最终效果都不理想。

  乌日力嘎表示,希望她所开发的这款软件能为广大的蒙古语言文字工作者带来更多的工作上的便利。

热点排行
柯尼卡美能达黑白新品bizhub PRO 1200产品报告

革新化黑白数字印刷系统——拥有更全面的综…[详细]

杭州东城图像公司推出热敏CTP和UV-CTP

近日,杭州东城图像技术有限公司重拳出击,…[详细]

上海紫光预推出数字喷墨印刷机PM520

上海紫光机械有限公司将在2011年11月举办的…[详细]

大族冠华新推GH794四色商务印刷机亮相全印展

第四届中国(上海)全印展于11月14日隆重召开…[详细]

美企业推出新概念UV-LED喷墨丝网印刷机

据来自美国wxow网站的消息,丝网印刷机厂商…[详细]

柯尼卡美能达bizhub PRESS C7000/C6000产品报

2011年8月5日,柯尼卡美能达在北京展出了其…[详细]

更多知识手册