8月29日消息,近日百度官方公众号发布消息,标志着百度智能云(海口)人工智能基础数据产业基地在海口市秀英区正式启动运营。这一合作项目是由百度智能云与海口市政府共同打造的国内首个大模型数据标注中心,致力于为各个行业提供优质的大模型数据服务,进一步推动人工智能产业的发展。
该基地的建立恰逢大型人工智能模型应用的初期,其中关键在于获取高质量的数据,这对于大模型产业化具有重要意义。尤其对于生成式AI模型如ChatGPT和文心一言,海量的数据训练、人工标注、微调以及基于人类反馈的强化学习等步骤,使得这些模型能够与人类价值观和思维方式保持一致,从而更加实用。
百度智能云在这一背景下加强了其大模型数据服务能力,建立了国内首个专业大模型数据标注基地。据了解,百度智能云与全国多地政府开展合作,已共建十多个数据标注基地,为当地创造了超过1.1万个稳定就业岗位,并间接促进了5万人就业。
值得一提的是,为确保数据标注质量,百度智能云还构建了全流程数据服务人才队伍。海口数据标注基地拥有数百名专职大模型数据标注师,而且他们的本科学历比例达到了100%。
一位名叫王洁玉的百度智能云大模型数据标注师表示:“与传统的数据标注师不同,大模型标注师需要拥有本科以上学历,主要是因为大模型涉及的知识领域广泛,评判标准复杂。入职前的两个月,公司会组织培训和考核,合格后才能正式上岗。”
据百度官方透露,未来三到五年内,海口基地预计新增就业岗位将超过5000个。此外,基地的建立只是百度与海口市合作的起点,双方将进一步合作,共同打造数字经济产业集群,为海口市秀英区的数字经济规模和水平提供更大的提升空间。