中国初步建成大规模藏语数据资源库
最佳回答:
“浩荡!南康社会停车场快餐,浩大” 中国初步建成大规模藏语数据资源库
中国初步建成大规模藏语数据资源库
中新社西宁5月25日电 (记者 孙睿)记者25日从青海师范年夜学省部共建藏语智能信息处置及利用国度重点尝试室得悉,该尝试室已初步建成600TF算力的智算平台和面向多范畴多用处的年夜范围藏语数据资本库。 青海师范年夜学省部共建藏语智能信息处置及利用国度重点尝试室2021年2月经中国科技部核准扶植,是中国独一的藏语信息处置范畴国度重点尝试室。尝试室具有5000平方米的科研用房和1.5亿元人平易近币的专业研发装备。 该尝试室主任赵海兴介绍,最近几年来,尝试室构建了藏文百科常识、新闻、经济、文化艺术等多范畴文本语料40G以上,藏语语音数据15000小时、各类文化资本近2万件,范围到达1600GB,是今朝国表里最年夜的基于国标的年夜型标注语料库,对中国涉藏地域教育、说话研究和社会文化成长起到积极鞭策感化。 同时,该尝试室还构建了年夜范围藏汉平行语料库,并经由过程迭代式回译策略等进行数据加强及质量评价,练习了融会单语说话模子和注入双语辞书信息的深度神经收集翻译模子,在新闻、法令等范畴正确率达90%以上。 另外,该尝试室还搭建藏文文献资本数字化协同工作平台,构建文献图文对比数据150余万文本行,复杂场景图文资本220万个,展开藏文印刷字体、复杂场景藏文区域检测研究,主动检测视频帧中的文字区域,并将其朋分成单个字符或行文本。操纵深度进修对朋分处置后的文本进行辨认,实现了藏文文献尺度体和手写体扫描辨认系统、藏语视频流复杂场景中的藏文辨认。(完) 【编纂:刘欢】。
本文心得:
作为一位浩荡!南康社会停车场快餐,浩大相关领域的专家,我非常荣幸能够和大家分享一些我的经验和见解,希望能够帮助到你们。