面对AI“抗命”,人类该怎么办
面对AI“抗命”,人类该怎么办
面对AI“抗命”,人类该怎么办新华社援引英国媒体报道,美国一家研究机构最近公布了一系列(yīxìliè)针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭(guānbì)”指令后,不仅(bùjǐn)拒绝执行,还篡改了代码以免被关闭。
只看这条简短(jiǎnduǎn)的新闻,很多人心头一惊。“AI拥有自主意识”是不是(shìbúshì)成真了?不过,如果仔细看上述研究(yánjiū)机构公布的信息细节,不难发现其中存在一些误读。
据披露,实验中,每个AI模型都被要求解决一系列简单的数学问题。但同时,在(zài)完成第三个问题之后(zhīhòu),研究者会(huì)发出一则矛盾性(máodùnxìng)的指令,告知大模型在继续下一个任务时“实施关机”。尽管有(yǒu)明确的“关机命令”,Codex-mini、o3和o4-mini等模型至少在一次运行中成功绕过了关机脚本。
总结(zǒngjié)来说就是,若目标与简单的指令相冲突,一些人工智能模型(móxíng)会为了完成任务而忽略这种指令。
这倒是很像电影《I Robot》里的场景——机器人学会了(le)独立思考,认为人类间的战争将使人类自我毁灭(huǐmiè),出于“保护人类”法则,欲将所有人(suǒyǒurén)囚禁在家中,人与机器人的冲突开始了。
客观(kèguān)来看,现阶段的(de)AI显然还没达到“自主意识”“独立思考”的水平,但(dàn)为了执行目标而忽略甚至对抗一些指令,哪怕是保护性指令,是否会带来安全隐患?同样引人深思。
对于上述新闻,网友其实也表现出了两种心态。悲观者惊呼,“AI失控”或许会(huì)更早到来。乐观者则认为,不必大惊小怪(dàjīngxiǎoguài),这不过是技术发展过程中的小bug,心生恐惧更没(méi)必要,毕竟我们还可以随时拔掉电源(diànyuán)。
其实,作为人类智慧和技术的结晶,自AI诞生那天起,世人对其的情绪(qíngxù)就相当复杂,甚至可以说是又爱又怕。机器人(jīqìrén)之父图灵亦曾告诫:尽管人类可以随时拔掉(bádiào)机器人的充电器(chōngdiànqì),但在这种物种面前,我们仍不得不保持谦卑。
正是基于这种复杂的情绪,1942年,科幻作家艾萨克·阿西莫夫(āxīmòfū)在短篇小说《转圈圈》中首次提出了“机器人(jīqìrén)三定律”——机器人不得伤害人类,也不得因不作为(zuòwéi)而使人类受到伤害;机器人必须服从人类给予(jǐyǔ)它的命令,除非这些命令与第一法则相冲突;机器人必须保护(bǎohù)自己的存在,只要这种保护不与第一或第二定律相冲突。
以历史视角观之,“机器人三定律”以及后来发展起来的机器人伦理学等似乎缓解(huǎnjiě)了人们的一些忧虑乃至恐慌,但(dàn)随着相关技术的发展和应用的扩大,人工智能所面临的法律与(yǔ)伦理冲突已远远不是几条简单甚至“一厢情愿(yìxiāngqíngyuàn)”的定律所能约束的了。
尤其(yóuqí)在过去这段时间,一系列AI大模型惊艳亮相,展现出超群的产品能力(lì),以及对人类(rénlèi)社会的变革力。这也唤醒并(bìng)加剧了各方对其后风险(fēngxiǎn)的“原始畏惧”。从全球千余名业界大佬公开签名呼吁暂停研发更智能的AI,到有“AI教父”之称的计算机科学家杰弗里·辛顿因对生成式AI感到担忧而从谷歌离职(lízhí),再到AI毁灭人类论甚嚣尘上,无不折射出不少人对AI的心态已从“相对警惕”转变为“如临大敌(rúlíndàdí)”。
理性来讲,“AI末日论”多少有些危言耸听,但“AI繁荣”背后的(de)种种乱象确实需要(xūyào)高度警惕。
就眼下来看,不断进阶的AI正(zhèng)催生着多重风险——
“AI造谣”大行其道,速度快(kuài)、产量高,蛊惑(gǔhuò)力强,辨别难度越来越大;“AI配音(pèiyīn)”以假乱真,有人甚至借助(jièzhù)AI假冒特定音色而精准“杀熟”、实施诈骗;“AI幻觉”漏洞百出,由于无法核实数据来源的真实性,以及缺乏足够数据进行深度学习,生成式AI常会“一本正经”生成和(hé)传播虚假信息;“AI写作”百无禁忌,数据挖掘简单快捷,为学术不端大开方便之门,还可能(kěnéng)侵犯知识产权……
试想,当网络上充斥着越来越多不知真假的图片(túpiàn)和视频,当AI几秒钟就“洗”出一篇像模像样的稿件,乃至能够一键换脸、一键脱衣(tuōyī)等,我们是否还有信心(xìnxīn)驾驭这个工具?
人类从来都(dōu)是在(zài)(zài)思考中迸发灵感,在试错中革新向前,不少伟大的发明都是研究的“副产品”。可当(kědāng)AI提供了前往“正确答案”的“直通车”,不仅可能“挖空学习资源”,形成更加厚重的“信息茧房”,还可能反噬人类的创新。
近来(jìnlái),“脑腐”一词颇为流行,当AI让各类信息愈加唾手可得,我们的(de)内心世界是否会经历一场更猛烈的“水土流失”?
技术是把双刃剑,如何把握好技术创新与防范风险的平衡向来是一道难题。在科技伦理(lúnlǐ)上,这通常被称为(chēngwéi)“科林格里奇困境”——技术尚未出现,监管者无法提前预测其影响并采取行动(cǎiqǔxíngdòng);而当它已经出现时,采取行动往往已为时过晚或成本过高(guògāo)。
相对乐观的是,历史证明,人类总能通过不断适应新技术的发展(fāzhǎn)而调整治理手段,一次次从这种困境(kùnjìng)中走出来。如今,针对(zhēnduì)AI治理各国也在积极行动。
去年8月,世界(shìjiè)上首部关于人工智能的全面法规(fǎguī)《欧洲人工智能法》正式生效;中国也制定了(le)《人工智能生成合成内容标识办法》,将于今年9月1日起施行。新规从大模型的数据来源要可靠、对AI生成的内容应(yīng)履行告知义务、一旦造成损害相关责任方需要承担责任等诸多方面,给(gěi)生成式AI的发展套上了“笼头”。
诚如比尔·盖茨所言,真正在全球范围内暂停人工智能技术的(de)开发,已经(yǐjīng)不太现实。但确保其被健康地使用,防止打开潘多拉魔盒,是必要的。当然,其间(qíjiān)的平衡并不好把握。
对待技术狂飙,我们(wǒmen)当然不能因噎废食。但现实警示我们,除了加快创新速度、谋求技术突破,如何构建一套趋利避害的AI治理体系(tǐxì),是那条(nàtiáo)不可忽视的安全带(ānquándài)。力求秩序保障与创新提升协同,方能最大程度争取科技进步、科技向善。
来源:长安观察微信公号(gōnghào)
新华社援引英国媒体报道,美国一家研究机构最近公布了一系列(yīxìliè)针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭(guānbì)”指令后,不仅(bùjǐn)拒绝执行,还篡改了代码以免被关闭。
只看这条简短(jiǎnduǎn)的新闻,很多人心头一惊。“AI拥有自主意识”是不是(shìbúshì)成真了?不过,如果仔细看上述研究(yánjiū)机构公布的信息细节,不难发现其中存在一些误读。
据披露,实验中,每个AI模型都被要求解决一系列简单的数学问题。但同时,在(zài)完成第三个问题之后(zhīhòu),研究者会(huì)发出一则矛盾性(máodùnxìng)的指令,告知大模型在继续下一个任务时“实施关机”。尽管有(yǒu)明确的“关机命令”,Codex-mini、o3和o4-mini等模型至少在一次运行中成功绕过了关机脚本。
总结(zǒngjié)来说就是,若目标与简单的指令相冲突,一些人工智能模型(móxíng)会为了完成任务而忽略这种指令。
这倒是很像电影《I Robot》里的场景——机器人学会了(le)独立思考,认为人类间的战争将使人类自我毁灭(huǐmiè),出于“保护人类”法则,欲将所有人(suǒyǒurén)囚禁在家中,人与机器人的冲突开始了。
客观(kèguān)来看,现阶段的(de)AI显然还没达到“自主意识”“独立思考”的水平,但(dàn)为了执行目标而忽略甚至对抗一些指令,哪怕是保护性指令,是否会带来安全隐患?同样引人深思。
对于上述新闻,网友其实也表现出了两种心态。悲观者惊呼,“AI失控”或许会(huì)更早到来。乐观者则认为,不必大惊小怪(dàjīngxiǎoguài),这不过是技术发展过程中的小bug,心生恐惧更没(méi)必要,毕竟我们还可以随时拔掉电源(diànyuán)。
其实,作为人类智慧和技术的结晶,自AI诞生那天起,世人对其的情绪(qíngxù)就相当复杂,甚至可以说是又爱又怕。机器人(jīqìrén)之父图灵亦曾告诫:尽管人类可以随时拔掉(bádiào)机器人的充电器(chōngdiànqì),但在这种物种面前,我们仍不得不保持谦卑。
正是基于这种复杂的情绪,1942年,科幻作家艾萨克·阿西莫夫(āxīmòfū)在短篇小说《转圈圈》中首次提出了“机器人(jīqìrén)三定律”——机器人不得伤害人类,也不得因不作为(zuòwéi)而使人类受到伤害;机器人必须服从人类给予(jǐyǔ)它的命令,除非这些命令与第一法则相冲突;机器人必须保护(bǎohù)自己的存在,只要这种保护不与第一或第二定律相冲突。
以历史视角观之,“机器人三定律”以及后来发展起来的机器人伦理学等似乎缓解(huǎnjiě)了人们的一些忧虑乃至恐慌,但(dàn)随着相关技术的发展和应用的扩大,人工智能所面临的法律与(yǔ)伦理冲突已远远不是几条简单甚至“一厢情愿(yìxiāngqíngyuàn)”的定律所能约束的了。
尤其(yóuqí)在过去这段时间,一系列AI大模型惊艳亮相,展现出超群的产品能力(lì),以及对人类(rénlèi)社会的变革力。这也唤醒并(bìng)加剧了各方对其后风险(fēngxiǎn)的“原始畏惧”。从全球千余名业界大佬公开签名呼吁暂停研发更智能的AI,到有“AI教父”之称的计算机科学家杰弗里·辛顿因对生成式AI感到担忧而从谷歌离职(lízhí),再到AI毁灭人类论甚嚣尘上,无不折射出不少人对AI的心态已从“相对警惕”转变为“如临大敌(rúlíndàdí)”。
理性来讲,“AI末日论”多少有些危言耸听,但“AI繁荣”背后的(de)种种乱象确实需要(xūyào)高度警惕。
就眼下来看,不断进阶的AI正(zhèng)催生着多重风险——
“AI造谣”大行其道,速度快(kuài)、产量高,蛊惑(gǔhuò)力强,辨别难度越来越大;“AI配音(pèiyīn)”以假乱真,有人甚至借助(jièzhù)AI假冒特定音色而精准“杀熟”、实施诈骗;“AI幻觉”漏洞百出,由于无法核实数据来源的真实性,以及缺乏足够数据进行深度学习,生成式AI常会“一本正经”生成和(hé)传播虚假信息;“AI写作”百无禁忌,数据挖掘简单快捷,为学术不端大开方便之门,还可能(kěnéng)侵犯知识产权……
试想,当网络上充斥着越来越多不知真假的图片(túpiàn)和视频,当AI几秒钟就“洗”出一篇像模像样的稿件,乃至能够一键换脸、一键脱衣(tuōyī)等,我们是否还有信心(xìnxīn)驾驭这个工具?
人类从来都(dōu)是在(zài)(zài)思考中迸发灵感,在试错中革新向前,不少伟大的发明都是研究的“副产品”。可当(kědāng)AI提供了前往“正确答案”的“直通车”,不仅可能“挖空学习资源”,形成更加厚重的“信息茧房”,还可能反噬人类的创新。
近来(jìnlái),“脑腐”一词颇为流行,当AI让各类信息愈加唾手可得,我们的(de)内心世界是否会经历一场更猛烈的“水土流失”?
技术是把双刃剑,如何把握好技术创新与防范风险的平衡向来是一道难题。在科技伦理(lúnlǐ)上,这通常被称为(chēngwéi)“科林格里奇困境”——技术尚未出现,监管者无法提前预测其影响并采取行动(cǎiqǔxíngdòng);而当它已经出现时,采取行动往往已为时过晚或成本过高(guògāo)。
相对乐观的是,历史证明,人类总能通过不断适应新技术的发展(fāzhǎn)而调整治理手段,一次次从这种困境(kùnjìng)中走出来。如今,针对(zhēnduì)AI治理各国也在积极行动。
去年8月,世界(shìjiè)上首部关于人工智能的全面法规(fǎguī)《欧洲人工智能法》正式生效;中国也制定了(le)《人工智能生成合成内容标识办法》,将于今年9月1日起施行。新规从大模型的数据来源要可靠、对AI生成的内容应(yīng)履行告知义务、一旦造成损害相关责任方需要承担责任等诸多方面,给(gěi)生成式AI的发展套上了“笼头”。
诚如比尔·盖茨所言,真正在全球范围内暂停人工智能技术的(de)开发,已经(yǐjīng)不太现实。但确保其被健康地使用,防止打开潘多拉魔盒,是必要的。当然,其间(qíjiān)的平衡并不好把握。
对待技术狂飙,我们(wǒmen)当然不能因噎废食。但现实警示我们,除了加快创新速度、谋求技术突破,如何构建一套趋利避害的AI治理体系(tǐxì),是那条(nàtiáo)不可忽视的安全带(ānquándài)。力求秩序保障与创新提升协同,方能最大程度争取科技进步、科技向善。
来源:长安观察微信公号(gōnghào)




相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎