瑞莱AI安全平台全方位评估

2023-07-09 22:02:03 来源: 智东西

智东西


(资料图片仅供参考)

作者 | ZeR0

编辑 | 漠影

智东西7月9日报道,在刚刚落幕的第六届上海世界人工智能大会(WAIC 2023)上,清华大学人工智能研究院孵化企业瑞莱智慧RealAI发布了全新人工智能安全平台。内部集成了多个自研模型和专家论证高质量数据集,新增了对通用大模型的评测,已覆盖近70个评测维度。

该平台功能与OpenAI今年7月5日在官网发布的“自动对齐研究员”概念类似,通过自动化的训练方法优化大模型,以期在通用人工智能加速赋能人类社会的同时,为人类筑起抵御人工智能威胁的安全之盾。

一、覆盖近70个评测维度,给大模型系上安全带

随着大模型走向落地,大模型其内生及衍生安全威胁愈演愈烈,数据泄露、幻想、生产歧视、排斥和有害内容等安全问题屡见不鲜,例如机密文件被泄露、添加无意义的字符后模型竟给出完全相反的回答、输出违法有害内容、隐含对某些人类社群的偏见和歧视等等。

瑞莱智慧联合创始人、算法科学家萧子豪认为,大模型“落地难”的本质在于当前仍处于“野蛮生长”阶段,还没有找到场景、风险和规范三者之间的平衡点。而探寻这一平衡点的过程,缺少易用和标准化的工具,即在技术层面上缺乏有力抓手,能够科学评判大模型在场景中能否同时满足规范和低风险,且能够进一步定位问题并给出优化建议,助力模型上线运行。

对此,瑞莱智慧推出人工智能安全平台版本。这是集成主流及RealAI独有的世界领先的安全评测技术,能够提供端到端的模型安全性测评解决方案,解决当前通用大模型安全风险难以审计的痛点问题。

相较上一版本,新增了对通用大模型的评测,已覆盖数据安全、认知任务、通用模型特有漏洞、滥用场景等近70个评测维度,全方位多维度地评测通用大模型的性能,未来还会持续扩增测评维度的数量。

二、从源头上找症结,帮助修复模型问题

“评测只是手段,帮助通用大模型提升其自身安全性才是核心目的。”萧子豪说,创造新技术和控制技术危害应该同步进行,“瑞莱智慧的办法是,从源头上找到症结,再用魔法打败魔法。”

如果将人工智能模型比作“引擎”,数据则是模型的“燃料”。可以说,数据集质量直接影响模型的内生安全。因此,内部集成了多个自研模型和专家论证高质量数据集,来帮助用户修复模型中的问题。

瑞莱智慧人工智能安全平台通用大模型测评及优化工作流程

对黑盒不可解释的通用大模型,自研红队对抗模型取代人工设计问题,显著提升攻击成功率和样本多样性。也就是说,该模型数据集中,不仅包含了自有数据集,还包含了模型自生成的数据,无论是从数据质量还是数据规模上都可圈可点,因此它能够自动化地挖掘出更多的漏洞,从源头上缓解安全问题。

教练模型则通过对被测大模型进行多轮次的提问-回答训练,并以训练好的评分模型对问答结果进行评分,再将评分结果反馈给大模型,使其不断强化学习到好坏答案的要点及区别,直至问答能力逐步迭代至最优。

除了定制化的训练框架,教练模型理想的模型效果还得益于夯实的数据基础,瑞莱智慧自有数据集经过数十位价值观领域的专家论证,以确保输入的数据无误,质量高且领域多元,未来也将持续更新补充。

萧子豪透露说,这些技术都是基于自研多模态大模型底座实现的。

三、平台新增两个功能模块,可检测生成式AI生成内容

除此之外,瑞莱智慧还带来了能够防范生成式人工智能恶意滥用的。

据悉,DeepReal此前名为深度伪造内容检测平台,现已正式更名为生成式人工智能内容检测平台,因为它除了能够检测Deepfake内容,还新增两个功能模块,可以检测Diffusion、LLM(大型语言模型)这两类新方法生成的数据,支持对图像、视频、音频、文本进行是否伪造的检测。

其应用场景包括打击网络诈骗和声誉侵害行为、检测网络内容合规性、检测音视频物证真实性等,可对生成式人工智能技术滥用行为进行管控和治理。

结语:五年专攻AI安全可控,已参与30余项国家及行业标准制定

自2018年成立以来,瑞莱智慧就致力于研究和发展安全可控的第三代人工智能技术,建立通用人工智能模型能力和人工智能安全能力:通过通用人工智能模型来适应各类复杂的智能应用场景和任务;并通过人工智能安全能力,真正使人工智能造福人类整体利益。

瑞莱智慧坚持源头创新和底层研究,在生成式人工智能等领域不断发表世界领先科研成果。成立以来,瑞莱智慧研发团队核心成员在人工智能领域顶会上发表论文数百篇,多次在国际测评和竞赛中斩获冠军,获得授权专利100余项。同时,瑞莱智慧积极推动行业规范化,累计参与30余项国家标准、行业标准制定。此外,瑞莱智慧已与网信办、工信部、公安部及下属多家单位展开深入的项目合作。

萧子豪说,通用人工智能的时代必将到来,如何让人工智能扬长避短,如何用人类智慧驾驭人工智能,是从业者的一道长久课题。这也是瑞莱智慧一直努力的方向。

未来,将在保障通用大模型和专有模型安全、可靠、可控上发挥作用。瑞莱智慧也将持续迭代技术、打磨产品,以确保在这场人工智能安全“攻防战”中始终立于不败之地,将人工智能的两面性这一“关键变量”,转化为高质量发展的“最大增量”。

标签:

瑞莱AI安全平台全方位评估

智东西作者|ZeR0编辑|漠影智东西7月9日报道,在刚刚落幕的第六届上海世

07-09 22:02:03

加速布局锂电池循环业务 天奇股份拟设立新能源合资公司

7月9日晚间,天奇股份公告称,公司与富奥汽车零部件股份有限公司(以下

07-09 20:38:07

田忌赛马的成语故事的内容_田忌赛马的成语故事

1、齐国使者来到大良,孙膑作为俘虏秘密探访,劝说齐国使者。2、齐国的

07-09 19:28:05

高端光电镜头概念股有哪些?高端光电镜头股票一览(2023/7/9)

高端光电镜头概念股有哪些?高端光电镜头股票一览(2023 7 9),高端光

07-09 18:13:33

哈弗回应“销售播放竞品视频”:不允许攻击竞品

IT之家7月9日消息,哈弗品牌执行副总经理乔心昱针对“哈弗新能源销售顾

07-09 17:03:51

中国文化体验公益课程:布艺、羊毛毡、珐琅

“鲁班工坊”中国文化体验公益课程即将在莎顿开课!该系列课程由新加坡

07-09 16:04:08

黄委会驻村工作队助力小王庄村“电商筑梦直播赋能”

7月5日,腾讯基金小红花梦想团队一行到中牟县刁家乡小王庄村开展直播电

07-09 14:35:43

我喜欢的一个人作文400字同学(我喜欢的一个人作文400字)

喜欢的一个人作文400字同学,我喜欢的一个人作文400字这个问题很多朋友

07-09 13:22:16

上半年铁路完成固定资产投资同比增长6.9%

本报北京7月8日电(记者李心萍)记者从中国国家铁路集团有限公司(以下

07-09 12:17:33

进一步规范职业健康检查和职业病诊断工作

据央视新闻报导,国家卫生健康委、国家疾控局近日印发《关于进一步规范

07-09 11:08:51

“玉”见万年中华文化 《寻古中国·玉石记》开播

由中央广播电视总台和国家文物局联合摄制的大型系列纪录片《寻古中国·

07-09 10:16:27

五年级科学下册教案教科版2022百度文库(五年级科学下册教案)

年级科学下册教案教科版2022百度文库,五年级科学下册教案这个问题很多

07-09 09:23:26

笔记本2k20(年2k笔记本会普及吗)

2022年2K屏的笔记本电脑肯定会普及,不光是2022年,实际上从2021年2K的

07-09 08:14:39

怡家广场舞从此心里有个你:广场舞在心里从此有个你?

今天给各位分享怡家广场舞从此心里有个你的知识,其中也会对广场舞在心

07-09 06:40:01

第三代人工智能迈进

清华大学人工智能研究院院长、中国科学院院士张钹教授在「纪念《中国科

07-09 04:18:31

《长沙夜生活》万人观影季启动 四大主题活动释放城市魅力

长沙晚报掌上长沙7月8日讯(全媒体记者宁莎鸥)今日,由潇湘电影集团主

07-09 01:21:18

成都大运会火炬传递成都站第二个传递日开启 121名火炬手参与

7月28日,第31届世界大学生夏季运动会将拉开帷幕。目前,成都大运会各

07-08 22:35:22

RoboCup机器人世界杯中国区总决赛首次在上海张江举行 将推动产教融合

由中国自动化学会、RoboCup中国委员会主办,上海张江(集团)有限公司

07-08 21:10:35

对于人类来说,多热才算“太热”?

7月4日,地球记录到了有史以来最热的一天。那么,人类可安全容忍的温度

07-08 21:02:17

最后一天!骨精灵发来前线预告,2023线上年中发布会节目单来啦!

三界异动,兵主复活。影出九黎,再世纷争!7月9日19:30,《梦幻西游》

07-08 19:20:35

每只都是独特的鸭

传统项目又来了啊~这一次是逐渐离谱版~~你以为只有小蓝鸭是独特的吗?

07-08 18:25:18

海南“村VA”丨文昌会文站龙家村球场开赛 现场球迷激情满满

新海南客户端、南海网7月7日消息(见习记者袁玉龙)7月7日晚,文昌市会

07-08 17:52:44

iQOO和红米怎么选

红米和IQOO之间应该怎么选?两款机型各有优点红米K40Pro配备6400万像素

07-08 17:19:58

今明梅雨降温 下周申城高温连播

新民晚报讯(记者马丹)一夜梅雨,滴答缠绵,申城气温也变得“温”柔。

07-08 16:17:41

《雍正王朝》九子夺嫡,朝堂之上斗得有多狠?

《雍正王朝》开篇的黄河发大水,就揭示了两大阵营几个阿哥之间的角逐。

07-08 15:15:14

西西帕斯拼了?温网三线作战,男双兄弟齐上阵,混双演绎情侣档

消息传出之后,很多人都羡慕西西帕斯找到了巴多萨这样一位甘愿为他牺牲

07-08 14:10:57

比亚迪汉同门兄弟!海豹DM-i要来了:20万级大杀四方

比亚迪汉同门兄弟!海豹DM-i要来了:20万级大杀四方

07-08 12:58:14

证监会:支持公募基金管理人及其他行业机构合理调降基金费率

全面优化公募基金费率模式,稳步降低行业综合费率水平,逐步建立健全适

07-08 12:09:09

2023年7月7日山东省重质纯碱价格最新行情预测

中国报告大厅2023年7月7日山东省重质纯碱价格最新走势监测显示:河南森

07-08 09:40:54

多家上市公司回应镓、锗相关业务情况 专家建议多方入手推动稀缺资源高质量发展

中国铝业是我国最大的金属镓生产商。中国铝业有关人士告诉《证券日报》

07-08 08:57:08

郑州航空港城市设计暨创意建筑国际竞赛启动

7日上午,省政府新闻办召开郑州航空港2023“空中丝路”城市设计暨创意

07-08 07:53:02

织密织牢新能源车充电网

车好用,电难充。自从新能源汽车在国内上路以来,“充电焦虑”“里程焦

07-08 06:23:39

国产剧爆肝27天收回成本,《变形金刚7:超能勇士崛起》延长放映至8月8日

随着暑期档的热烈进行,《变形金刚7:超能勇士崛起》官方微博宣布,该

07-08 06:07:27

AI应用新场景 联合国拟使用无人驾驶车辆运送粮食援助

联合国世界粮食计划署官员表示,由人工智能(AI)驱动的无人驾驶车辆最

07-08 04:03:05

易普力(002096.SZ):控股子公司中标石英砂岩矿开采施工项目

格隆汇7月7日丨易普力(002096 SZ)公布,近日,公司所属控股子公司中国

07-08 01:49:45

虚构乙二醇等贸易业务虚增收入利润致财报虚假记载 西陇科学及董事长等遭广东证监局警告并共罚款390万元

【虚构乙二醇等贸易业务虚增收入利润致财报虚假记载西陇科学及董事长等

07-07 22:47:48

区领导检查防汛基础设施建设

7月6日,区委副书记、区长李新带队检查防汛基础设施建设工作。李新到人

07-07 22:04:56

“羲皇故里”甘肃天水释放创新创高优势招商 打造数字科技产业链

中新网兰州7月7日电 (崔琳)7日,第29届兰洽会天水市特色优势产业招

07-07 21:14:42

求证:卖旧买新可申请房款0.6%补贴 温州出台购房新优惠

潮新闻客户端记者章嵘嵘日前,《瓯海发布》发布温州购房新政,也就是温

07-07 20:26:57

别克昂科拉怎么样及吉利远景suv多少钱

燃油经济性是如今很多人都会考虑的一个问题,而最近有人就跟我说别克昂

07-07 19:40:13

泉峰汽车:获国内某知名通信科技公司电机壳体定点项目,预估项目金额约4.39亿元

泉峰汽车7月7日公告,近期收到目前国内某知名通信科技公司(基于保密协

07-07 19:04:38

蓝坊镇峰口村:“一网三联”构建乡村治理新格局,赋能乡村振兴

近年来,蓝坊镇峰口村党总支部坚持党建引领,全面推行“六事”治理模式

07-07 18:22:39

知乎宣布将下线“匿名功能”

知乎发文宣布将下线“匿名功能”。知乎表示,作为社区早期的产品机制,

07-07 17:58:07

孙巍峰主持召开加快建设农业强省重点工作专题会议

【大河财立方消息】7月6日,河南省委农办主任,省农业农村厅党组书记、

07-07 17:18:27

“智能制造 共创未来”第八届中国沈阳国际机器人大会在沈举办

7月7日,第八届中国沈阳国际机器人大会举办,本届机器人大会以“智能制

07-07 17:05:20

中国人民银行发布《中央银行存款账户管理办法》

中国人民银行发布《中央银行存款账户管理办法》,央行,金融,中国人民银

07-07 16:17:48

央行发布《中央银行存款账户管理办法》加强关键环节风险管控

中新网7月7日电据中国人民银行微信公众号7日消息,为规范中央银行存款

07-07 16:03:49

邂逅“母城”的美好!来这个主题摄影作品展吧

徜徉在古色古香的历史文化街区,一场正在上演的小型现场音乐会听得人心

07-07 15:11:58

印度央行副行长Sankar:印度央行密切关注金融科技行业。

印度央行副行长Sankar:印度央行密切关注金融科技行业

07-07 15:03:02

灿瑞科技:预计二季度出货量会有较为明显的环比增速

灿瑞科技:预计二季度出货量会有较为明显的环比增速。新闻资讯提供最新

07-07 14:11:35

加速布局锂电池循环业务 天奇股份拟设立新能源合资公司
田忌赛马的成语故事的内容_田忌赛马的成语故事
高端光电镜头概念股有哪些?高端光电镜头股票一览(2023/7/9)
哈弗回应“销售播放竞品视频”:不允许攻击竞品
中国文化体验公益课程:布艺、羊毛毡、珐琅
黄委会驻村工作队助力小王庄村“电商筑梦直播赋能”
我喜欢的一个人作文400字同学(我喜欢的一个人作文400字)
上半年铁路完成固定资产投资同比增长6.9%
进一步规范职业健康检查和职业病诊断工作
“玉”见万年中华文化 《寻古中国·玉石记》开播
五年级科学下册教案教科版2022百度文库(五年级科学下册教案)
笔记本2k20(年2k笔记本会普及吗)
怡家广场舞从此心里有个你:广场舞在心里从此有个你?
第三代人工智能迈进
《长沙夜生活》万人观影季启动 四大主题活动释放城市魅力
成都大运会火炬传递成都站第二个传递日开启 121名火炬手参与
RoboCup机器人世界杯中国区总决赛首次在上海张江举行 将推动产教融合
对于人类来说,多热才算“太热”?
最后一天!骨精灵发来前线预告,2023线上年中发布会节目单来啦!
每只都是独特的鸭
海南“村VA”丨文昌会文站龙家村球场开赛 现场球迷激情满满
iQOO和红米怎么选
今明梅雨降温 下周申城高温连播
《雍正王朝》九子夺嫡,朝堂之上斗得有多狠?
西西帕斯拼了?温网三线作战,男双兄弟齐上阵,混双演绎情侣档
比亚迪汉同门兄弟!海豹DM-i要来了:20万级大杀四方
证监会:支持公募基金管理人及其他行业机构合理调降基金费率
2023年7月7日山东省重质纯碱价格最新行情预测
多家上市公司回应镓、锗相关业务情况 专家建议多方入手推动稀缺资源高质量发展
郑州航空港城市设计暨创意建筑国际竞赛启动
织密织牢新能源车充电网
国产剧爆肝27天收回成本,《变形金刚7:超能勇士崛起》延长放映至8月8日
AI应用新场景 联合国拟使用无人驾驶车辆运送粮食援助
易普力(002096.SZ):控股子公司中标石英砂岩矿开采施工项目
虚构乙二醇等贸易业务虚增收入利润致财报虚假记载 西陇科学及董事长等遭广东证监局警告并共罚款390万元
区领导检查防汛基础设施建设
“羲皇故里”甘肃天水释放创新创高优势招商 打造数字科技产业链
求证:卖旧买新可申请房款0.6%补贴 温州出台购房新优惠
别克昂科拉怎么样及吉利远景suv多少钱
泉峰汽车:获国内某知名通信科技公司电机壳体定点项目,预估项目金额约4.39亿元
蓝坊镇峰口村:“一网三联”构建乡村治理新格局,赋能乡村振兴
知乎宣布将下线“匿名功能”
孙巍峰主持召开加快建设农业强省重点工作专题会议
“智能制造 共创未来”第八届中国沈阳国际机器人大会在沈举办
中国人民银行发布《中央银行存款账户管理办法》
央行发布《中央银行存款账户管理办法》加强关键环节风险管控
邂逅“母城”的美好!来这个主题摄影作品展吧
印度央行副行长Sankar:印度央行密切关注金融科技行业。
灿瑞科技:预计二季度出货量会有较为明显的环比增速
日本目前有几家海底捞
X 广告
行业动态
X 广告

Copyright ©  2015-2023 京津冀植物网版权所有  备案号:京ICP备2022022245号-12   联系邮箱:434 922 62 @qq.com