繁体简体

用于大模型的首批中文基础语料库发布

华夏经纬网 > 新闻 > 大陆新闻 > 时事要闻      2023-12-22 08:28:14

  中新网北京12月21日电 中国网络空间安全协会人工智能安全治理专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。

  据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质量可信数据,经过去重、过滤等技术手段,形成并对社会发布首批120G中文基础语料,包括1亿余条数据,500亿个token。用户登录中国网络空间安全协会网站,点击“中文基础语料库”链接,通过注册、认证等程序,就能够下载相关语料。

  网安协会人工智能安全治理专委会负责人表示,语料库建设是一项长期性、专业性的工作,需要遵循相应法规、标准和规范,需要合力共建、突破创新,推动形成科学有效的语料库汇聚、处理、使用机制,为国家人工智能技术创新和产业发展赋能。

  来自专委会成员单位、大模型备案机构和相关领域科研、企业、社会组织代表近100人参加发布会。


责任编辑:左秋子
热门评论
互联网新闻信息服务许可证10120170072
京公网安备 11010502045281号
违法和不良信息举报电话:010-65669841
举报邮箱:xxjb@huaxia.com

网站简介 / 广告服务 / 联系我们

主办:华夏经纬信息科技有限公司   版权所有 华夏经纬网

Copyright 2001-2024 By www.huaxia.com