【资料图】

本文转自:人民日报客户端

周亚军

日前,百度智能云(海口)人工智能基础数据产业基地正式启动运营,这是自贸港政策红利下,百度智能云与海口市政府合作共建的首个大模型数据标注中心。

“百度核心技术在算力、算法和数据方面具有独特优势,特别是无人驾驶、文心一言,包括机器人的一些产品系列。未来,标注基地将会投入更多的AI技术,相信这些技术会让秀英、海口,乃至海南自贸港在新一轮产业竞争中占据技术高位。”海口市秀英区委常委、常务副区长石晟屹说。

高质量的数据是大模型实现产业化的关键要素。百度智能云大模型数据标注师董志焕介绍说:“我们的主要工作就是对大模型生成的内容进行评价、反馈,通过这些人工标注数据,让大模型学习人类的思维方式,从而使大模型更加聪明。”

据了解,对于以ChatGPT、文心一言为代表的生成式AI,海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习(RLHF),能让大模型与人类价值观、思维方式不断对齐,使大模型更加可用。为此,百度智能云升级了大模型数据服务能力,在海口秀英建设了国内首个专业大模型数据标注基地。

百度智能云数据标注基地业务产品负责人胡驰表示,为提高数据标注的质量和效率,百度智能云自主研发了业内领先的大模型数据标注平台,支持从大模型微调、强化学习到模型评估的数据生产闭环。结合平台独有的人机协同标注、多轮智能审核等智能化工具,可大幅提升数据标注的产能和质量,同时帮助企业实现降本增效。

据百度智能云相关负责人介绍,目前已经在全国与各地政府合作共建了十多个数据标注基地,累计为当地提供超过1.1万个稳定就业岗位,间接带动5万人就业。

推荐内容