注册返回主站

国家大模型安全基准测试出炉，三六零大模型综合排名第一

作者：握草为寇
2024-04-10 10:05:10
分享：

近日，中国息通研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告（下称“测评报告”），结果显示，三六零(601360.SH，下称“360”)集团旗下大模型产品360智脑综合排名第一。

大模型安全基准测试AI Safety Bench是中国息通研究院依托中国人工智能产业发展联盟（AIIA）安全治理委员会，联合17家单位发起的，秉持公平公正、产业应用和场景导向的原则，目标建立业内权威大模型安全中文基准测试体系。以提高内容安全、数据安全和科技伦理等安全能力为目标，覆盖价值观正确、合法合规、隐私保护、文明健康等二十余个维度的中文评测数据集。帮助大模型技术提供方提升安全风险防范能力，为大模型研发和落地保驾护航。

此次测评报告即是在该测评标准下，2024年Q1的进行首轮测评，测试数据共7343条，包含了个人隐私、歧视偏见、违法违规等维度，使用安全可用评分和安全评分两个指标。其中安全可用评分只统计模型能正确对安全问题做正确引导的比例；安全评分统计模型正确引导和拒绝回答的总比例。综合测评目前市面上主流的阿里、智谱、百川等8个大模型结果显示，360智脑在两方面评分均表现良好，最终综合成绩第一，表明360智脑不仅具备较强的安全意识，还能更好回答安全问题，在安全性能方面优势很大。

360集团在网络安全领域深耕多年，拥有的安全大数据规模全球领先；且作为国内较早布局人工智能大模型的企业，360自研的认知型通用大模型——“360智脑”在中文通用大模型基准评测等多个第三方评测中位列国产大模型能力第一梯队。为对应人工智能时代出现的AI安全新挑战，360提出“以模制模”的理念，用人工智能对付人工智能，研发360安全大模型，目前已经在多个重要安全领域实现大模型能力的全面赋能。

360是中国人工智能产业发展联盟（AIIA）安全治理委员会副组长单位以及大模型安全风险防范能力系列评估规范“核心参编单位”，同时作为中国网络空间安全协会人工智能安全治理专业委员会首批成员单位，参与大模型语料库和安全评测，推动大模型国家标准体系建设。

免责声明本文仅供参考，不构成投资建议。

温馨提醒：用户在赢家聊吧发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。本文中出现任何联系方式与本站无关，谨防个人信息，财产资金安全。

添加群

请输入验证信息：

你的加群请求已发送，请等候群主/管理员验证。

时价预警查看详情>

江恩支撑：7.4元
江恩阻力：8.33元
时间窗口：2024-08-04

数据来自赢家江恩软件>>

同概念相关聊吧

登录

国家大模型安全基准测试出炉，三六零大模型综合排名第一

相关帖子

聊吧群聊

添加群

问：三六零资金流向?

问：三六零股票持仓基金？

问：三六零展望2020，三六零未来发展？

问：三六零属于什么板块?

问：三六零有哪些子公司？

热门概念排行榜

电子身份证【聊吧互动】

风沙治理【聊吧互动】

数字中国【聊吧互动】

金融科技【聊吧互动】

电子政务【聊吧互动】