内大要闻

内蒙古自治区东北亚语言资源中心举行项目验收会议

12月6日-12月9日,内蒙古自治区东北亚语言资源中心(http://218.21.196.5:28600/dbyzc/guide)组织专家举行子项目的验收会议。北京大学王厚峰教授、中国标准化研究院陈玉忠教授、延边大学玄龙云教授、新疆大学吐尔根·依不拉音教授、青海师范大学才让加教授、内蒙古师范大学青格乐图教授、中国电子技术标准化研究院高级工程师陈庄、潍坊北大青鸟华光照排有限公司高级工程师吕建春等专家学者参加线上评审,我校社科处处长达胡白乙拉教授、资产处副处长李惠民参加线下评审。在监理公司的严格监督和筛选下,参评的16个项目中,由中科院、中国标准研究院、成都联图科技有限公司等企事业单位承建的6个子项目获得参评资格,并顺利通过验收。

项目负责人那顺乌日图教授对专家组和监理公司表示衷心感谢。同时,敦促其它承建单位严格按照合同要求完成相关任务。

会议现场

“东北亚语言资源数字化平台”是在“一带一路”合作倡议下我校承建的国家政务信息化建设项目之一。项目建设内容以东北亚各国和地区使用的汉文、蒙古文、俄文、日文、韩文以及英文等多种文字的发展进程为基础,建设1个语言应用支撑系统、2个应用服务系统以及1个数据库。

东北亚语言资源数字化平台

自2020年6月30日具体开始实施以来,研发完成相关任务,并集成10个应用工具软件。同时,收集近10000万词的语料库和100万册文献资源。具体包括:

(一)应用开发软件:东北亚语言资源数字化博物馆(http://218.21.196.5:20080/);达日罕-东北亚语言翻译(https://darhan.niutrans.com/Trans);达日罕词典系列(蒙古文辞书搜索系统:http://219.159.44.166:37027/toli/;汉蒙翻译系统:http://39.99.62.216:8010/);东北亚语言口语翻译系统;文本机器翻译系统;文本转换系统;多文种OCR识别系统;多文种搜索引擎;东北亚语言服务以及回鹘式蒙古文文献数字化平台等。

(二)语料库:是开发多语种工具书、电子词典、语言学习软件、多语言机器翻译等应用产品的基础。目前收集的语料包括:1.单语语料库:传统蒙古文、西里尔蒙古文、达斡尔、鄂伦春、鄂温克语语料,以及语音文本对应语料。2.多语语料库:汉-蒙、汉-英、汉-俄、汉-日;汉-西里尔-传统蒙古文、汉-英-韩、汉-英-俄、汉-英-西里尔;西里尔蒙古文-传统蒙古文-俄-汉、西里尔蒙古文-传统蒙古文-日-汉、西里尔蒙古文-传统蒙古文-韩-汉平行语料库。部分语料已经在平台上展示。

(三)文献库: 1.特色资源:包括国内外收藏的回鹘式蒙古文、八思巴文、女真文、契丹文、突厥文、托忒文相关的拓片、摩崖题记、残片、古籍文献以及研究论文、论著。2.典籍文献:包括国内外收藏的汉文典籍文献98万册。3.期刊杂志库:具体为东北亚六国七种语言文字现刊杂志,民国时期的期刊杂志。4.档案资料:具体为自中世纪以来的蒙古文、汉文文献档案资料。5.书法/国画:具体为国内外收藏的600万张国画/书法图片。6.影印家谱:具体为自明清以来国内外图书馆收藏的6千多册影印家谱。

此外,还收集了3000小时的音视频资源。

该平台的建设,旨在为广大师生、政府机关人员以及旅游人士提供快捷的知识搜索与交流平台。在展示“一带一路”东北亚沿线国家和地区的历史风貌的基础上,用多种语言“讲好中国故事”,学习他国先进文化,从而增进东北亚各国对我国人文历史的了解,最终助力社会经济的发展。

 (供稿:东北亚语言资源中心

上一条:我校举办 “书记与我面对面”新一届学生会(研究生会)主席团成员座谈会
下一条:我校参加全国哲学类专业教学指导委员会年会并做专题报告