02 对话纽约时报人物:「AI 安全」是学者的自娱自乐还是下一个风口?

02 对话纽约时报人物:「AI 安全」是学者的自娱自乐还是下一个风口?

40分钟 ·
播放数7508
·
评论数27

在飞速扩张的人工智能领域,「AI 安全」只能是牺牲品吗?

本期节目,我们请到普林斯顿大学 AI 安全方向的研究学者 VTU,一起聊聊:「AI 安全」到底是什么?AI 的定制化、边缘化,如何影响「AI 安全」的发展?如何平衡安全、创新与资本之间的关系?

去年 7 月,OpenAI 公布由首席科学家 Ilya 主导的「超级对齐 (superalignment) 」计划,承诺将拿出总算力中的 20% 投入在「AI 安全」上,以保证人类对超级智能的可控。但随着技术的高速发展与扩张,这个平衡似乎已经瓦解。在今年 6 月 20 日,Ilya 宣布创立新公司 Safe SuperIntelligence Inc (SSI),专注于开发安全的超级智能。

☕️ 本期嘉宾

VTU

☕️ 时间线

01:51 聊聊研究「AI 安全」的初心

07:43 「AI 安全」方向的创业是一个好时机吗?

11:40 「AI 安全」的界限在哪里?是否应该有统一的安全性标准?

14:38 后门攻击 (Backdoor Attack) 是什么?

22:11 AI Safety 和 AI Security 竟然是两码事儿?

29:21 总结登上《纽约时报》文章的两个启发点

34:00 苹果和 OpenAI 合作,「AI 安全」的隐患如何体现?

36:33 不止国内,硅谷的生成式 AI 公司也很「卷」!

☕️ 关于我们

  • Victoria: 帝国理工大学化学系本硕 // 做不被定义的理科生 // 小红书&IG @victoritse
  • Jecci: 剑桥大学社会人类学硕士 // 做自己的生活艺术家 // 小红书&公众号 @杰西西Jecci

☕️ Reference

  • OpenAI安全团队解散:Sam Altman 和 OpenAI 总裁 Greg Brockman 倾向于加速商业化,以获得更多资金来支持 AI 模型的算力需求,力求快速增强 AI 的力量;而 Ilya 等人则希望 AI 更安全。去年 11 月,双方矛盾激化,OpenAI 上演「宫斗」大戏,结果 Altman 和 Greg Brockman 在短暂离职后重归 OpenAI,原董事会中的多位董事离开,Ilya 则在今年 5 月宣布离任。
  • 欧盟人工智能法案:2024 年 3 月 13 日,欧盟议会顺利通过了世界首部最全面的《人工智能法》(EU AI Act),标志着人类在人工智能领域迈出了法制的第一步。
  • 全球最火 AI 技术大佬,离开 OpenAI 后为何创立了一家 AI 安全公司?

☕️ 关于AirCafe

《AirCafe》是一档将不同学科和领域里的人链接在一起的播客节目。通过「第一视角」的对谈与碰撞,我们想要打破海内外信息壁垒,建立一张属于你我的人脉网。

欢迎大家在评论区留言互动,或者扫描下方二维码与我们联系,期待你的来信!

欢迎在 Apple PodcastSpotify小宇宙 订阅我们,不错过我们的「云端聊天」~

☕️ 声明

本播客的内容仅代表个人观点,并不代表任何公司、律师事务所、投资机构出具的任何形式的意见或建议。未经本播客的授权,不得转载或使用播客节目中的任何内容。

展开Show Notes
大模型内容安全产品表示很惊喜听到了safety和security这样的区分。实际业务中safety更多是后置的监测手段,比如利用传统内容安全治理中的敏感词/正则、文本安全模型、图片安全模型等来对用户输入或大模型输出的内容去做监测,这些手段都是后置的;而播客中提到的safety更多是指模型本身的安全能力,通过prompt调优、微调或者是知识注入等方式来防止模型主动输出有害信息,从业务链路上看这些都是前置的环节,在内容生成前或者内容生成过程中去做的优化手段。
Jz_2IkR:感谢分享
维多利亚Victoria
:
感谢补充与分享💗 你提到的safety在实际业务中的应用和前置与后置的区分非常有启发性,我们也很高兴听到你对我们讨论中的safety和security区分感到共鸣!😊
萧烨
萧烨
2024.7.01
38:51 有认真听 X关注了 !哈哈哈哈哈硅谷跟中国一样卷是可以想象的 但是感觉意义感是不一样的 可以卷但是希望卷有意义的事情!!!
杰西西Jecci
:
同意!要“卷”有所值~~
维多利亚Victoria
:
一起做对社会有意义的“卷王”😉
Jz_2IkR
Jz_2IkR
2024.7.05
29:33感觉两位女主播对于ai安全的理解不太多,其实本期嘉宾有很多可以发掘提问的点,但是听下来感觉主持人引导和提问都不太深入。前面说的留学签证啥的也不切题,如果开头就聊这个感觉很容易流失观众。包括这里,听到这我也不知道嘉宾在纽约时报文章讲了什么。还是要靠嘉宾自己捋。也不是纯吐槽。选题,内容,嘉宾还是非常棒的,就是希望主持能多一些引导,而引导的提前应该是对这个内容有一些基础的认识和自己的理解。整个博客内容是需要嘉宾和主持人共同呈现出来的,期待下一期!
杰西西Jecci
:
非常谢谢你指出的问题呀,我们也在逐渐走出舒适圈去接触自己熟悉领域之外的内容,但确实可以做更多的准备!对我们来说,现在还是个起点,所以也很需要类似的反馈,再次感谢!😉
维多利亚Victoria
:
感谢反馈!考虑到有些听众可能没有技术背景,所以我们也在努力做一个平衡,避免过多技术性的讨论。但是你的反馈对我们来说意义很大,今后我们会进一步优化播客的内容,让有技术背景的听众能有更多收获!如果你在本期中有任何感兴趣但没被提及的话题,欢迎在问卷中给我们留言,我们会跟进~感谢你的支持与宝贵建议!💗
3条回复
Mercury_kiki
Mercury_kiki
2024.7.04
第一次听就关注啦,希望以后多更新奥
杰西西Jecci
:
谢谢关注!一定会保持更新🙌🏻
midoripom
midoripom
2024.7.04
19:37 有那种在简历里面埋伏“录取此人”的透明字的案例,就是一种对真人无用但对机器具有干扰作用的“后门攻击”吧,一旦成功也会极大破坏招聘公平
杰西西Jecci
:
想起了港大学生假学历入学的新闻…
问题太不专业了,在问道读研之前是否知道自己未来研究方向的时候就听不下去了😑
杰西西Jecci
:
确实问得不好,很久没这么正经主持过节目,我努力提高,谢谢反馈!
维多利亚Victoria
:
感谢反馈与建议!根据这个建议,我们在第三期的录制前期好好打磨了问题的质量,也有加入专业技术层面的内容,可以期待一下!😉
beibiie
beibiie
2024.6.30
厉害了!这期节目听起来!
杰西西Jecci
:
嘿嘿~~谢谢beibei!!🙌🏻
HD935508z
HD935508z
2024.7.06
提点建议,主播声音太小了,一开始蓝牙外放没有听见,直到嘉宾说话才听清
杰西西Jecci
:
谢谢反馈!
Alexxie_1234
Alexxie_1234
2024.7.14
多看书,提高自己的认知,任何事物都是相通的。
来了!
杰西西Jecci
:
🥹🥹🥹
陆壹肆
陆壹肆
2024.7.09
14:10 hate speech在美国是被保护的倒也没有吧……最多不算违法。所有社媒的community guidelines里应该都有禁止hate speech
个人近两年来的感受是,可科技与AI 哪有不安全的,危险的因素永远是人。如果地球有生命,第一个要赶出去的物种就是人类啊
晨萱-语迟者说-INFJ:进一步,首先需要定义“安全”的含义,中国与欧美是不同的。因而对 AI 的发展趋势也是有影响的。