非洲本土语言被纳入大语言模型开发视野

山西新闻网>>新闻频道>>国际新闻

时 间
/
分 享
评 论

中新网约翰内斯堡11月27日电 西非语言沃洛夫语和普拉尔语,撒哈拉以南地区非洲语言林加拉语、斯瓦希里语和班巴拉语等被纳入大语言模型开发视野。

法国电信公司Orange当地时间26日公布,其将与人工智能技术公司OpenAI、互动媒体与服务公司Meta合作,用非洲本土语言训练人工智能大模型。

该倡议从2025年上半年开始,最初将专注于通过“微调”OpenAI的Whisper语音模型和Meta的Llama文本模型,整合两种西非语言:沃洛夫语和普拉尔语。

沃洛夫语是塞内加尔、冈比亚和毛里塔尼亚南部的一种语言,而普拉尔语则主要在塞内加尔使用。这两种语言的使用人数分别约为1600万人和600万人。

Orange首席人工智能官史蒂夫·贾瑞特(Steve Jarrett)表示,公司将使用本地语言模型与客户互动,并计划将其免费提供给公共卫生和教育服务等使用。该项目明年将针对林加拉语、斯瓦希里语和班巴拉语等其他撒哈拉以南地区非洲语言进行训练。

目前,大型人工智能公司用于训练算法的数据大部分都来自美国,这意味着当涉及欧洲、中东和非洲等不同地区时,他们的模型可能会失去文化和语言等重要背景信息。(完)

(责编:董春平、刘洋)

山西日报、山西晚报、山西农民报、山西经济日报、山西法制报、山西市场导报所有自采新闻(含图片)独家授权山西新闻网发布,未经允许不得转载或镜像;授权转载务必注明来源,例:"山西新闻网-山西日报 "。

凡本网未注明"来源:山西新闻网(或山西新闻网——XXX报)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。