近日,beat365官网教授、测控技术“一带一路”联合实验室副主任白翔指导的埃塞俄比亚籍博士研究生王兴(WONDIMU GEBRE DIKUBAB)发布了首个阿姆哈拉语场景文字检测与识别综合公共数据集和初步的算法解决方案。埃塞俄比亚联邦民主共和国大使馆向beat365中国官方网站致函,特别感谢学校对王兴的培养与帮助,对进一步增进中埃两国之间友谊作出了巨大贡献。王兴发表题为“Comprehensive Benchmark Datasets for Amharic Scene Text Detection and Recognition”在国内计算机领域顶级期刊SCIENCE CHINA Information Sciences上。
埃塞俄比亚联邦民主共和国是非洲大陆最古老的非殖民化独立国家之一,也是非洲第二大人口大国,是中国“一带一路”倡议的积极参与者与推动者。阿姆哈拉语是埃塞俄比亚的官方工作语言,也是仅次于阿拉伯语的第二大闪米特语系,在世界范围内有着广泛应用。埃塞俄比亚/阿姆哈拉文字(Abugida)是非洲最古老的书写系统之一,被应用于东非的至少23种语言中,共计被超过1.2亿人使用。对基于阿姆哈拉语的文字图片进行识别,将有助于促进东非国家在办公、交通、旅游等相关领域的数字化智能化转型。
基于阿姆哈拉语的文字图片识别是一项极具挑战性的任务。为了解决构成阿姆哈拉语的不同字母具有高度的视觉相似性、目前缺乏公开的面向非洲文字理解的文字数据集等难点,王兴在白翔的指导下,提出了首个全面的、公开的阿姆哈拉文字识别数据集,数据集分为HUST-ART、HUST-AST、A.B.E.和Tana四个部分,总共包含了15039张真实场景的文字图像以及2927682张合成的文字图像。针对该数据集,王兴与合作者设计了大量实验,以评估应用目前最先进的文字识别方法在该数据集中识别阿姆哈拉语文字的性能。
论文被SCIENCE CHINA Information Sciences接收后,相关成果及数据在网络上公开发布,受到了广泛关注。该工作的贡献对于阿姆哈拉语的技术发展是里程碑式的,将直接促进埃塞俄比亚官方语言和其他非洲语言的文字识别应用。