局部有语 | 和IT界30年资深玩家 道长 聊聊“宕机”这件事:不尊重人性,就是在埋炸弹!TOB局内人

局部有语 | 和IT界30年资深玩家 道长 聊聊“宕机”这件事:不尊重人性,就是在埋炸弹!

72分钟 ·
播放数396
·
评论数3

微软的全球性"蓝屏"宕机事件正在持续发酵!2024年7月19日美国网络安全企业“群集打击”(CrowdStrike)软件出现问题引发了微软操作系统蓝屏和全球宕机。此次微软蓝屏波及不少国家地区,影响全球近千万台使用Windows的设备,导致航空公司、银行、电信公司和媒体、健康医疗等各个行业陷入混乱 。“微软蓝屏”登上热搜,不少打工人晒出电脑蓝屏画面,戏称“感谢微软,提前放假” 。

近两年,国内IT知名公司如某里云、某雀、某品会也经历了不同程度的服务中断。尽管宕机事件的影响最终会消退,但它们给我们的警示不容忽视。

本次节目,我们将与嘉宾道长一起探讨什么是写懂人的代码,以及宕机事故的原因、预防措施以及应对策略,以减少其对业务和客户的负面影响。道长是拥有30年IT行业经验的资深专家。在10年的IT咨询服务中,他处理了众多客户的宕机事故,并以幽默的打油诗形式,分享了他的应对哲学:“未知本固有,不信有好事;只要修得快,宕机是小菜;要想修得快,红蓝勤对抗;要想助推好,需要懂心理。”

本期节目适合的听众:

  • IT专业人士
  • 对技术挑战感兴趣的广泛听众
  • 企业决策者,希望了解如何提高业务连续性

【主播👨🏻/👩🏻】大海/ 棉花

【嘉宾👨🏻】道长,程序员吾真本,IT界30年资深玩家。编程故事种草机,演过的角色有软件开发、测试、项目管理、软件开发咨询和编程故事创作。个人Slogan “讲动人的故事,写懂人的代码”

【提要📒】

05:25 Part1 什么是懂人的软件开发

  • 不关心程序员社会与心理的状况,后果就是程序员会硬着头皮去按照公司的规定去做软件。
  • 做软件的人的社会和心理,就像是驱动这些APP运行电力。如果你不关心这个手机的电池是否足够,那么这个APP再好用,最终你也是会没电。
  • 奈飞的混沌猴在生产环境搞“破坏”,就让这个程序员就非常重视这个事情。

07:05 Part2 最有效能的开发环境,它意外情况也一定会发生!

  • 一次真实的客户现场的意外事件复盘会!
  • 分布式计算的八大误区&蓝军行动

33:28 Part3 “宕机”意外出现后,IT和业务人员如何协同应对?

  • 目前的营销销售跟服务人员,比较欠缺的就是他们没有想到去做演习。
  • 测试环境和生产环境的“爆破”实验。
  • “未知本固有,不信有好事;只要修得快,宕机是小菜;要想修得快,红蓝勤对抗;要想助推好,需要懂心理。”
  • 杜绝此类事情再次发生?这是绝对不可能的!

48:31 Part4 有效应对技术产品宕机:公关处理的重要性

  • 滴滴宕机事件后的应对案例、OpenAI的status.openai.com
  • 棉花对于宕机事件下的营销公关原则:真诚、积极、简单!

最后道长也透露了自己现在在对将编程与故事进行融合,希望打造动人的编程书籍,《Rust的奇幻之旅》:程序员转型记。

Chaos Monkey 是通过模拟现实世界中的故障和中断来主动测试系统的弹性

男公厕小便池刻上苍蝇的图案,提高男士小便入池的准确度(图片来自维基百科)

【后期✂️】小铁

【音乐🎵】

  • 片头:speed of light- Jazz Funk Sou
  • 垫乐:Bossa nova
  • 片尾:James Brown 《Try Me》

【往期️🚀】

海棉说 | 售前和销售如何成为“最佳拍档”?

局部有语 | 对话客户体验专家 龙国富:离开业务目标谈客户体验提升,就是自我感动!

大咖返场!Jonathan:B端销售不会送礼物也一定做不好业务!

海棉说 | ToB业务到底要不要做播客?

海棉说 | B2B采购决策真的都是理性的吗?

销售实践 | 从月入千元到年薪百万:大咖级Sales Jonathan的进阶之路

海棉说 | 谈谈线索(字少事大)

海棉说 | 咱就是说,想搞定客户?那就得看人下菜碟呀!

海棉说 | ToB企业到底要不要做品牌?

销售实践 | 边开车边跟Vivian聊聊「B端销售」的“渣男”招标与组织斡旋、防白嫖与“回扣”、培训与成长

【收听👂🏻】

❤️如果你喜欢「TOB局内人」,请给我们三连:点赞、留言、转发。

👉加入听友群&嘉宾自荐,请联系vx:Tracy25200 (备注:TOB+公司)

展开Show Notes
大海Harry
大海Harry
2024.7.25
置顶
来不及写文案啦!
诚邀你来群里和听友们与往期嘉宾玩耍!
联系vx : tracy25200
备注【TOB+公司】可快速通过哟~
forward_V7Oe
forward_V7Oe
2024.8.13
跟程序员关注线上环境没啥关系吧 本质还是商业模式更关注线上环境 随机破坏的方式带来了成本增长和狼来了体感 长此以往人都会疲的
一周前的微软蓝屏,CrowdStrike还是修得慢了。要是他们能在问题出现后的10分钟内用自动化方式完成修复,就没事了。有人说,都蓝屏了,如何自动化修复?当然蓝屏时,是无法运行任何自动化工具的。但如果下次想修得快,可以把自动化修复实现在蓝屏之前,还是能想出办法把“修得快”作为软件特性实现出来的。[旺柴]