ChatGPT的AI安全之道_微动态
近期,关于ChatGPT在数据采集和使用方面有安全隐患的报道层出不穷。
(资料图片)
4月6日凌晨,OpenAI在官网发布了《 Our approach to AI safety 》(“我们的AI安全之道”),介绍了自己在安全、可靠地为全球用户提供ChatGPT服务方面所做的努力。
以下是我对重点部分的翻译(括号中斜体文字是我的评论,另点击“阅读原文”可以查看原文):OpenAI 一直致力于确保人工智能系统的安全性和广泛的效率提升。我们的全球用户告诉我们,ChatGPT可以提高他们的生产率,增强他们的创造力,并提供量身定制的学习体验。 我们也认识到,像任何技术一样,这些工具会带来真正的风险——因此我们在系统的各个级别上都建立了强有力的安全保障。
建设越来越安全的AI系统
在发布任何新系统之前,我们会进行严格的测试,邀请外部专家提出反馈意见,通过强化学习、人类反馈等技术改进模型的行为,并构建广泛的安全监控系统。
例如,在我们最新的模型GPT-4完成训练后,我们花费了超过6个月的时间,全力打造更加安全和一致的模型,并在发布之前进行了充分的测试。
我们认为,强大的AI系统应该接受严格的安全评估。需要监管措施来确保采取了这样的规定。同时,我们也积极地与政府合作,讨论这种监管措施的最佳形式。
( 监管措施的增长曲线会在技术逐步进入快速发展期之后启动,目前各国已经出现这样的趋势,下图为我的朋友龚总Robin画的技术发展阶段曲线图,在Gartner曲线基础上叠加了监管曲线、市场占有率曲线和社会接受度曲线,很有参考意义。 )
通过在实践中学习,加强安全保障
虽然我们尽力在部署新系统之前防范各种可以预见的风险,但是我们在实验室中所能学到的知识毕竟是有限的。因为,尽管进行了广泛的研究和测试,但我们仍然无法预测人们将如何使用我们的技术。 这就是为什么我们认为,从实践中学习,是建设和发布越来越安全的AI系统的重要手段。
因此,我们以小心谨慎的、循序渐进的方式,向越来越广泛的人群发布新的AI系统,期间采取了大量的保护措施,并根据我们学到的经验,进行持续的改进。
保护儿童
我们安全工作的一个关键重点是保护儿童。我们要求人们必须年满18岁,或在父母的批准下年满13岁才能使用我们的AI工具,并正在寻求年龄验证方法。
我们不允许我们的技术用于生成仇恨、骚扰、暴力或成人内容等其他类别。我们最新的模型GPT-4对不允许的内容的响应请求比GPT-3.5少82%,我们建立了一个强大的监测系统来监测滥用。GPT-4现已可用于ChatGPT Plus订户,我们希望随着时间推移,将其提供给更多人使用。
尊重隐私
我们的大型语言模型是基于广泛的文本语料库进行训练的,其中包括公开可用的内容、许可内容和人工评审生成的内容。
我们不使用数据来销售我们的服务、广告或创建人们的资料——我们使用数据使我们的模型更有益于人们。例如,ChatGPT通过进一步训练人们与其进行的对话而改进。
虽然我们的一些训练数据包括可在公共互联网上获得的个人信息,但我们希望我们的模型学习世界,而不是个人隐私信息。
因此,我们努力在可能的情况下从训练数据集中删除个人信息,微调模型以拒绝请求个人信息,以及回应个人请求从我们的系统中删除其个人信息。这些步骤最大程度地减少了我们的模型可能生成包含私人个人信息的响应的可能性。
( 这部分是对个人输入信息可能会用于模型训练的回答,事实上,在ChatGPT的使用条款中,OpenAI注明,用户可以选择是否允许将自己的数据用于模型训练,而且对于API用户,其选项默认就是关闭的 )
改善事实准确性
今天的大型语言模型根据它们先前看到的模式,包括用户提供的文本输入,来预测下一个系列的单词。在某些情况下,下一个最可能的单词可能不准确。
( 这里描述的是Transformer模型的工作原理 )
改善事实准确性是OpenAI和许多其他AI开发人员的主要关注点,我们正在取得进展。通过利用ChatGPT输出被标记为不正确的用户反馈作为主要数据源,我们已经改进了GPT-4的事实准确性。GPT-4比GPT-3.5更有可能产生真实的内容。
( GPT-4与Plugin和Browsing的结合,进一步提升了保障内容真实性的能力 )
持续研究和参与
我们认为,解决AI安全问题的实际方法是将更多的时间和资源投入到研究有效的安全和合规技术,并测试它们对真实世界中各种滥用行为的承受力。
重要的是,我们也认为,提高AI的安全性和能力应该相辅相成。迄今为止,我们最好的安全工作是通过我们能力最强的模型合作完成的,因为它们更擅长按照用户的指示行事,并且更容易指引。
我们将越来越谨慎地创建和部署更有能力的模型,并将在不断发展我们的AI系统的同时,继续改进安全预防措施。
尽管我们等待了超过6个月的时间才部署GPT-4,以更好地了解其能力、好处和风险,但有时需要更长时间来改进AI系统的安全性。
因此,政策制定者和AI技术提供商需要在全球范围内,有效地治理AI的开发和部署,以免有人为了走在前面而偷工减料。
这是一个艰巨的挑战,需要技术和制度创新的结合,但这也是我们热切希望做出贡献的重要领域。
解决安全问题还需要广泛的辩论、实践和参与,包括对AI系统行为边界的讨论。我们一直在促进各方利益相关者之间的合作和开放对话,以创建一个安全的AI生态系统。
标签:
- ChatGPT的AI安全之道_微动态
- 每日观察!东契奇:球队需要有一个富有成效的休赛期 有些事情肯定要改变
- 吕梁市公安局召开交通秩序整治安排部署会
- 比卢普斯:期待有机会执教一支有竞争力的球队 并展示我的成长
- 全球关注:小麻雀学游泳作文三年级(共11篇)
- 机械能守恒公式什么时候学_机械能守恒公式
- 景观小品设计_对于景观小品设计简单介绍
- 威乐汽车钥匙怎么换电池_威乐汽车_世界消息
- 关于广大市民观看湖北省第十六届运动会开闭幕式的公告
- 23年一季度: 股市操作小结
- 首届中国青少年网球巡回赛首站在广州南沙挥拍 世界观察
- 坐标东南西北 「白象泡面工厂」火速出圈是巧合吗?_环球动态
- 津城花事多 双街看海棠
- 焦点热门:一季度中国中小企业发展指数大幅反弹
- 马特拉齐:我非常尊重尤文图斯,但竞技层面我真的讨厌尤文图斯
- 焦点要闻:资料套打是什么意思_套打是什么意思
- QLED与UHD有何不同?全面解析 天天热点评
- “世界最大的水上庙会”激情上演,泰州姜堰千篙万桨绘就醉美水乡民俗画卷 焦点热议
- 玻尿酸填鼻唇沟维持多久? 世界快消息
- 环球热头条丨中国人寿保险品种有哪些?可靠吗?
- 分手送伞什么意思|当前速讯
- 当前聚焦:数百名江西在港乡亲回乡 走进江西吉安钓源古村感受庐陵文化魅力
- “五一”假期国内游订单已追平疫情前
- 环球速看:我市新添10家省五星级示范农家书屋
- 多元化布局提速 险资积极开拓REITs业务
- 同泰基金管理有限公司关于同泰大健康主题混合型证券投资基金变更基金经理的公告
- that girl原版完整版_tha
- 慕组词和拼音是什么_慕组词和拼音
- 天天快消息!9.98万元起 比亚迪2023款元Pro开启预售
- 金风科技:4月3日进行路演,摩根士丹利、花旗银行等多家机构参与-世界热推荐
- 大连开宝马撞人致5死案司机刘东被执行死刑|天天新要闻
- 招商蛇口完成发行10亿短期融资券 利率2.2%_每日速看
- 世界今日报丨公共 | 陕西石泉县文化馆举办广场舞骨干培训班
- 以App为支点,宇宙行进击AGI时代
- 因耶稣受难日 欧美股市今日休市 焦点快报
- 买房公积金可以一次性全部提取出来吗
- 教育发达国家排名_世界最新发达国家排名-世界热闻
- 关谷悠悠_关谷 世界独家
- 深耕服务久久为功,“金色名片”熠熠生辉|环球聚看点
- “飞行汽车”亮相成都 2030年前有望打“飞的” 当前滚动
- 中国中铁(601390):五维度重塑估值:资产质量/ROE/现金流/成长/矿产
- 口袋妖怪日月神秘礼物数据
- 阵风7到8级,局地9级!河北大风蓝色预警中!限行提示、高速路况请查收→ 天天视点
- 焦点关注:2022年报点评报告:经营稳中有进,新能源业务快速增长
- 天天新动态:既要保持币值稳定,也要提高资金运行效率
- 张志丹:分批建仓很关键!3大技巧教你掌握
- 彩龙网友体验专场滑雪乐趣 昆明热雪奇迹体育2023春招大会持续报名中
- 华帝的内斗硝烟,为何突然散了?_全球视讯
- 哪吒U-Ⅱ U秀版上市交付 售价11.88万元起
- 首开股份:前3月签约金额177.47亿元,同比降12.01% 观速讯
- 持续向好,越秀地产一季度累计合同销售金额同比上升约217.3%-当前快看
- 【实测】小白测评数据库已更新 新增魅族20PRO续航性能
- 全球快看:【财经分析】氢能如何破局?隆基氢能这样发力
- 跑出多元解纷司法为民加速度
- 终极斗罗:轩宇想抽空龙马星系的力量,天龙气炸,舞麟表示很赞成 新资讯
- 当前快报:Meta CTO回应马斯克等人要求暂缓AI研发:这不切实际
- 美前检察官:特朗普正以检方梦寐以求的方式自证其罪
- 九寨沟今年接待游客突破50万人次 4月起实行旺季票价-当前资讯
- 定了!就在下周一!主板注册制首批10只新股将亮相,交易规则有变-天天即时
- 【全球播资讯】宇通客车:汽车动力电池价格受上游原材料价格、电池市场供需情况及市场格局等多种因素影响
- 每日信息:第133届广交会将开幕
- 【税收宣传月】县税务局开展“税企共建”税收宣传月活动 热点在线
- 摩根大通首席执行官:美国银行业危机影响将持续数年
- 美股前瞻 | “小非农”弱于预期,三大股指期货震荡走低;不赞同降息!美联储梅斯特:年底前利率应升至5%以上
- 14岁的B站来到了“资本退潮”的十字路口?|环球消息
- 天天观点:圈a怎么打出来_怎么打符号圈A啊
- 迁户口以后学生档案的籍贯一般写什么_籍贯一般写什么
- 宋·张即之书法选-焦点
- 全球关注:对于非法行医的行为怎么量刑
- 犯罪嫌疑人能否主动申请启动强制医疗程序?
- 合肥14家银行可“带押过户”|全球热讯
- 马尾邀请人才父母畅游榕城
- 法院仲裁裁决不予执行的情形
- where is the green sheep绘本_Green is an important color|天天速看料
- urgency的形容词_urgency
- 战略团队打造思路
- 全国道德模范谭之平走进湖北医药学院宣讲 环球时讯
- 西安土拍市场“活”了?-环球实时
- 这个坏习惯让男子血糖失控、诱发心梗,医生:必须改
- 当前通讯!女生妇女节休假半天被公司辞退!法院判公司赔18万余元
- 最后一次股东大会在即 瑞信(CS.US)将如何直面愤怒的股东?
- 天天播报:Jackeylove谈iG风格语惊四座:要么一波肥要么一波送
- “吃别人嚼过的馍没味道” 世界新视野
- 深圳一租赁住房项目落地龙岗 建成后提供约1032套房源_每日热文
- 找一个会做爱的人,很重要
- 偃师天气_偃|世界资讯
- 【东海期货4月4日产业链日报】贵金属篇:美国PMI低于预期,支撑金银价格
- 沧州着力建设一流社会信用体系
- 四六级成绩查询身份证入口没了_四六级成绩查询身份证
- 清明、五一假期将至 近郊乡村民宿“供不应求”
- 每日快播:拥抱非遗在春天 放飞童趣绘纸鸢
- “任何威胁恐吓,都别想吓倒我”——追记福建省福州市公安局刑侦支队原政委郭伟民_全球快报
- 强烈推荐!这种膳食模式特别健康,能提高我们的预期寿命! 环球微资讯
- 全球热点评!阿尔及利亚总统和叙利亚总统通电话 就叙利亚局势进行讨论
- 焦点速讯:76人最强投手突然失去了手感,他可能要被淘汰出轮换阵容了?
- 天天动态:品尝七色西红柿、拥抱500多斤大南瓜……第24届菜博会增加“沉浸式”参观体验
- 速看!北大附国际部暨道尔顿学院开启招生信息采集_全球头条
- 真空计
- 缠夫 小说_缠夫
- 2023福建福州鼓楼区东街街道招聘社区工作人员1人公告 世界通讯
广告
广告
- 如何验证翡翠的真假?只需要简单8步 天天短讯
- DJI RS 3 Mini发布:2千克负载仅795克,支持快速竖拍 天天新消息
- 形容法律威严的句子(精选187句)
- 《宝可梦》满血情况下受到的伤害减半,能带来多少对战机会?
- 世界热推荐:活力中国丨在忙碌的生产线感知中国经济活力
- 全球消息!海南航空回应男子在航班上喊飞机要出事:该名旅客已移交机场公安
- 陆金贷(小额应急)网贷逾期3年多久上征信|全球百事通
- 比亚迪继续减持比亚迪股份,半年已减持超30%
- 胎压监测板块1月9日涨0.91%,通达电气领涨,主力资金净流出2377.78万元_环球快消息
- 世界速看:陆金贷(小额应急)贷款逾期八天延迟还款会影响征信吗
- 記者觀察|封關壬寅末終落幕 港深雙城記開新篇 世界微动态
- 南开区16岁小孩抚养费一般多少钱
- 世界微头条丨十来万的车,我选卡罗拉
- 新华视点|商圈火、景区旺 各地消费市场显活力|聚焦
- 每日热门:光猫和路由器怎么连接 光猫和路由器的正确连接方法
- 蔬菜生吃还是熟吃?你是哪一派?|天天观点
- 天天消息!九典制药(300705.SZ):非洛地平片获批上市
- 热水泡脚脚痒是怎么回事?-环球时快讯
- 面试时,最可怕的就是背调?-世界视点
- 环球短讯![快讯]广联航空:关于特定股东减持数量过半的进展