一个路线图,帮助AI技术说非洲语言

从文本生成ChatGPT到声控Siri,人工智能工具旨在帮助我们的日常生活——只要你说一种它们支持的语言。对于数十亿不使用英语、法语、西班牙语或其他主流语言的人来说,这些技术是遥不可及的,但非洲的研究人员正在寻求改变这一现状。在8月11日发表在《模式》杂志上的一项研究中,科学家们绘制了为非洲语言开发更好的人工智能驱动工具的路线图。

Masakhane研究基金会的第一作者和人工智能研究员Kathleen Siminyu说:“对我来说,用于非洲语言的人工智能工具有限是没有意义的。”Masakhane研究基金会是非洲科学家的基层网络,旨在激励说非洲语言的人使用人工智能工具。“语言技术进步中的包容和表现不是你在最后打上的补丁,而是你在前面考虑的事情。”

这些工具中有许多依赖于人工智能领域的自然语言处理,这是一种使计算机能够理解人类语言的技术。计算机可以通过训练,从语音和文本数据中获取模式,从而掌握一门语言。然而,当某种语言的数据稀缺时(如非洲语言),它们就会失败。为了填补这一空白,研究小组首先确定了参与开发非洲语言工具的关键参与者,并探索了他们的经验、动机、重点和挑战。这些人包括创建和策划内容的作家和编辑,以及在建立语言工具基础设施方面至关重要的语言学家、软件工程师和企业家。

对主要参与者的采访揭示了在设计非洲语言工具时需要考虑的四个中心主题:

首先,受殖民的影响,非洲是一个多语言的社会,非洲语言是人们文化认同的核心,也是社会参与教育、政治、经济等方面的关键。

第二,有必要支持非洲的内容创作。这包括为非洲语言建立字典、拼写检查器和键盘等基本工具,并消除将政府通讯翻译成多国语言(包括非洲语言)的财务和行政障碍。

第三,非洲语言技术的创造将受益于语言学和计算机科学之间的合作。此外,应该专注于创造以人为本的工具,帮助个人释放更大的潜力。

第四,开发者在收集、管理和使用数据的过程中应该注意社区和道德规范。

“有越来越多的组织在这个领域工作,这项研究使我们能够协调努力,建立有影响力的语言工具,”思敏宇说。“研究结果强调并阐明了在时间和财务投资方面的优先事项。”

接下来,该团队计划扩大研究范围,让更多的参与者了解人工智能语言技术可能影响的社区。他们还将解决可能阻碍人们获得这项技术的障碍。该团队希望他们的研究可以作为一个路线图,帮助开发广泛的语言工具,从翻译服务到捕捉错误信息的内容版主。这些发现也可能为保护非洲土著语言铺平道路。

思敏宇说:“我希望我们生活在这样一个世界里,非洲人可以像英语、法语、普通话或其他语言流利的人一样拥有高质量的生活,获得信息和机会。”


作者:细胞出版社

原文链接:https://www.sciencedaily.com/releases/2023/08/230811115430.htm

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:15264513609,邮箱:1027830374@qq.com