两会问计|上海市政协委员黄海清:探索语料数据合理使用规则 助力大模型可持续“燃烧

发布日期: 2025-01-25

  央广网上海1月16日音尘(记者郭振丹 沈梅)1月16日,上海市邦民政府实行大旨记者会。上海市经济和讯息化委员会主任张英先容,上海将长远展开“人工智能+制作”举动,连接推动智能工场创办和智能呆板人研发操纵,打制船舶、汽车、原料等要点范畴大模子,培植工业语料、智算云等专业任职商。

  同日,上海市政协十四届三次集会实行大会谈话。上海市政协委员黄海清代外科协界别谈话,提议寻觅语料数据合理应用准则,饱动大模子财富康健发扬。

  现在,人工智能是新一轮科技与财富改造的要紧驱动气力。“算力、算法、数据”是人工智能的中枢三因素,而语料数据宛如燃料,行为大模子财富的中枢驱动力,决心大模子陶冶结果的上限。

  黄海清先容,大模子的陶冶数据每每是来自于海量的公然数据集和搜集内容,这些数据集席卷竹素、著作、网站和其他公然可用的内容。但目今我邦著作权的“合理应用宽免条目”无法涵盖大模子陶冶,这给邦内大模子公司酿成了授权难、本钱高以及危害大三方面题目。

  黄海清提议,要加疾真切大模子语料数据的合理应用准则,饱动“文本与数据开掘”正在预陶冶范畴的合用。参考欧盟“文本与数据开掘”合理应用条目或日本“非赏识性规则”,杀青正在邦内引申针对呆板研习的数据合理应用,均衡著作权人权柄和科技发扬需求,处分授权难的题目。

  同时,政府出台怂恿策略,助助语料数据企业巩固自愿化用具链平台研发,低重语料数据本钱。盘绕上海金融、制作、熏陶、医疗、文旅、都会处理等6大意点行业,具身智能、自愿驾驶、智能终端、科学智能、正在线大合节范畴,巩固自愿洗涤算子及自愿标注算法等时间研发,打制AI自愿化洗涤与标注用具链平台,低重语料本钱。

  别的,黄海清还体现,要加疾人工智能天生物爱戴畛域的法令推敲,订定准则真切的人工智能天生物的权属与职守。

  同日,上海市政协十四届三次集会实行大会谈话。上海市政协委员黄海清代外科协界别谈话,提议寻觅语料数据合理应用准则,饱动大模子财富康健发扬。