《通用大模型评测标准》发布

山西新闻网>>新闻频道>>产经消费

时 间
/
分 享
评 论


  10月12日,在2024中国移动全球合作伙伴大会期间,中国移动携手央企及产业各方共同发布大模型评测体系建设的重要成果《通用大模型评测标准》,为产业界遴选优质大模型提供重要参考依据。
  通用大模型评测标准基于“24-6”框架。“2”代表两类评测视角,以重点行业实际使用需求为导向,与国标对模型能力要求拉齐,将评测任务划分为理解和生成两类视角。“4”代表四类评测要素,从评测全生命周期中提取出评测工具、评测数据、评测方式和评测指标四类关键要素,确保评测工作可实施性。“6”代表六大评测维度,综合考虑大模型应用过程中的核心能力,设定功能性、准确性、可靠性、安全性、交互性和应用性六大维度。该标准广泛吸纳产学研用各方意见,并结合行业特色场景需求,可为通用大模型全面评估提供客观依据,为AI赋能千行百业提供保障。

整理:辛义生

(责编:李琳、温文)
打好秋季"预防针" 筑牢畜禽"免疫网"

打好秋季"预防针" 筑牢畜禽"免疫网"

山西日报、山西晚报、山西农民报、山西经济日报、山西法制报、山西市场导报所有自采新闻(含图片)独家授权山西新闻网发布,未经允许不得转载或镜像;授权转载务必注明来源,例:"山西新闻网-山西日报 "。

凡本网未注明"来源:山西新闻网(或山西新闻网——XXX报)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。