- OpenAI早期邮件大曝光:马斯克和Sam的邮件往来
🎙️ 感谢虎嗅对本节目的支持。虎嗅 F&M 创新节正在火热进行,我们特意为听众朋友们提供北京线下门票。详情请查看的链接,赶快领取吧! 温馨提示:本期节目因收音设备故障,音质可能有所影响,部分杂音可能会略显刺耳,敬请谅解,也感谢您的包容和支持! Shownote * 0:31-2:00 📰 YC总裁兼CEO Garry Tan和Sam Altman的对话 * 2:01-4:30 🤖 OpenAI 曾考虑收购 AI 芯片初创公司 Cerebras * 4:31-5:40 ✉️ OpenAI早期邮件大曝光:揭秘Sam和 Musk的早期邮件往来 * 5:41-7:30 🧑💼 OpenAI核心高管变动:安全研究副总裁Lilian Weng宣布离职,联合创始人Greg Brockman结束长假回归 * 7:31-9:40 💵 OpenAI高层薪资大曝光!Sam Altman年薪仅为76001美元 * 9:41-11:53 🚀 马斯克122天完成10万卡超算中心 * 11:54-14:47 🌍AI垃圾回收和再利用或成为下一个值得关注的赛道:AI产生高达500万吨电子垃圾 * 14:48-16:27 🎤 GOSIM:对话OpenCV之父Gary BradskiGary 感谢您的收听,我们下期再见~
- 对话复旦大学类脑研究院工程师郑忍成: 解析人工智能在医疗中的实践与商业化挑战
大家好,欢迎收听《AI Odyssey》。 最近我们一直在关注AI在生命健康领域的产品,这些产品大体可以分为两个方向:一是面向消费者的健康管理产品(硬件 or App),基于穿戴设备、饮食记录App、运动记录App等收集用户摄入和消耗的数据,并通过AI教练(AI Coach)来提供健康指导;二是面向医疗机构的疾病诊断和辅助导诊的AI软件。前者理解起来相对简单,基于公网的数据进行预训练就能获得一个还不错的 Agent,无论是选择使用API,还是训练自己的小型模型, 整体用户体验上差别不会很大。但在更为专业和细分的医疗领域,无论是在数据获得,算法优化,还是算力部署上,现实场景都更为的复杂,且富有挑战。 因此,本期节目我们特别邀请到了复旦大学类脑研究所的郑忍成工程师,与我们分享AI在医学影像的应用以及在医疗领域的发展趋势。掌声欢迎👏👏。 嘉宾: 郑忍成:复旦大学博士毕业(zhengrc@fudan.edu.cn),目前任复旦大学类脑智能科学与技术研究院算法工程师。主研方向为人工智能算法及其在医学影像分析中的应用。在《IEEE Transactions on Medical Imaging》,《Science Advances》等学术期刊上发表SCI论文20余篇,并在MICCAI,ISMRM等国际学术会议上发表会议论文和摘要10余篇。参与国家自然科学基金、上海自然科学基金等多个面上项目。 主播: Leo:硅谷大厂高级机器学习工程师,GenAI LLM发烧友 PongPong:连续创业者,AI初创公司产品负责人 Shownote: [00:31] - 嘉宾介绍 [01:22] - 医学影像AI的发展历程 [02:08] - AI在医学影像中的实际应用 [04:14] - AI与传统算法的对比 [05:52] - 医学影像算法的发展历程 [07:24] - 特定器官的AI检测与通用模型的探索 [12:08] - 医疗AI的数据获取与隐私保护 [15:07] - 数据标注的挑战 [16:30] - 医学影像AI的准确性与挑战 [19:20] - 医学影像AI产品三类证与二类证的介绍 [23:27] - AI在低风险领域的应用与商业化 [27:34] - 医疗AI的商业化路径 [30:06] - 医院联盟与数据共享 [36:58] - 医学影像AI的未来趋势 以上就是本期的全部内容啦,感谢您的收听,我们下期再见~ 欢迎大家在同名 小🍠:AI Odyssey 和 👸号:AI Odyssey 关注我们,我们将持续给大家带来更多精彩内容,敬请期待。
- 对话MindOS联创Kisson:AI-Native操作系统与AI Agent的设计构想
主播的话: 认识Kisson是通过她的一篇复盘文章《创业两年,被风口拍得酸爽》,她在文章中详细记录了创业以来的各种经历和思考,这让我对她和MindOS的发展产生了浓厚的兴趣。22年是新一轮AI创业潮的一个关键时间节点,Kisson的公司MindOS在这一年成功融资,站在了起跑线的领先位置。两年多的时间过去了,这家公司经历了哪些变化呢?今天我们邀请Kisson来分享她的创业故事和对AI未来的看法,期待她的精彩分享。 嘉宾: Kisson 林宋琪,Mindverse AI (MindOS.com) 联创及COO,前TikTok商业化战略总监,前Facebook集团战略经理。关注AI agent和记忆模型。公众号:Kisson不聊广告改煲鸡汤了。推特:@KissonL 主持人: Leo 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 PongPong 连续创业者,AI初创公司产品负责人 产品介绍: MindOS:一款面向海外2B的AI Agent创建引擎,商家可以创建客服机器人部署到网站上提升转化率。心识宇宙 (Mindverse)自研的大型个性化模型(LPM)解决了传统AI缺乏个性化、隐私问题和数据偏见等痛点,以及通过模型长期记忆的优势让AI可以通过自然语言持续学习,越聊越懂用户,为商家的客户提供完全个性化的体验。 * 官网:www.mindos.com Mebot:一款学习和记住用户想法和偏好的生产力工具 * 官网:www.mindos.com Shownotes: 00:44 - 嘉宾自我介绍 08:45 - 探讨AI-native操作交互系统,现有技术的局限和未来的潜在进展 09:58 - 分享从开发自有模型转向利用GPT API,MindOS 如何找到自己的定位 12:23 - 讨论个人AI助手在信息整合和管理中的角色,长期记忆和个性化模型的重要性 18:38 - 分享 Mebot 如何利用长期记忆提供更个性化的体验 19:29 - 讨论解决有效捕捉和情境化用户信息的挑战,分享了 AI+硬件更简便输入的潜在解决方案 24:44 - 讨论如何提高 Long-term memory (LTM) 在推理时的准确性 27:46 - 介绍了MindOS 团队对 on-device 模型和构建数据抽象理解层的规划 29:22 - 探讨小而美的AI初创公司的优势 35:05 - 讨论AI产品找到PMF的挑战,以及理解市场需求的重要性 40:46 - 介绍 MindOS 的商业模式 43:35 - 分享 MindOS 在迭代过程中对ToB 和ToC市场的需求分析和运营策略 48:30 - 探讨关于AI Agent的挑战和机遇 感谢收听,我们下期再见~
- AI快讯:马斯克撤诉与苹果WWDC生成式AI亮相
本期节目 Shownotes 00:05 - 特斯拉老板马斯克终于拿到拖欠6年的560亿美金工资 马斯克撤销对OpenAI的诉讼,法院文件显示无罪开释 苹果宣布与OpenAI合作,将ChatGPT集成到iOS 18,引发马斯克强烈反对 02:47 - 苹果全球开发者大会WWDC介绍生成式AI技术,强调隐私保护 苹果Private Cloud Compute介绍 07:17 - 最新发布的三个文生视频模型对比介绍:快手推出的可灵视频生成模型、Luma AI的Dream Machine、Runway的Gen-3 Alpha 08:12 - Pika 公司完成8000万美元B轮融资,计划扩展研究和工程团队 09:58 - 英伟达推出Nemotron-4 340B大模型,提供高质量合成数据用于各行业。 10:50 - 阿里云通义千问团队开源Qwen2大模型,性能超越Llama-3等知名模型。 13:30 - 包含15,140条ChatGPT提示的数据集分析,展示用户互动情况和越狱提示分布 GPT DAN提示词地址 感谢您的收听,我们下期再见~
- 对话整数智能联创和前IDEA研究员:构建高质量数据集与智能数据工程平台
端午快乐~ 很开心,这期又可以和大家聊聊硬核的 GenAI 技术内容。最近和 AI 创业者们交流最多的话题就是 AI 数据。因此,本期节目我们特别邀请了两位在 AI 数据领域颇有建树的嘉宾:杨子敖,Brandeis CS PhD Candidate;刘明皓,整数智能信息技术(杭州)有限责任公司的算法负责人。一起聊了一下他们多年来在这方面积累的经验和认知,深入讨论了如何为大模型训练和推理构建高质量的数据集,以及如何搭建智能数据工程平台。 如果你对数据处理感兴趣,或者是一位充满好奇心的 AI 从业人员,我们希望通过这期节目为你带来关于 AI 和数据的新看法和启发。欢迎收听~ 嘉宾介绍: 杨子敖 Brandeis CS PhD Candidate,曾在奇绩创坛和IDEA研究院工作过。目前的研究兴趣是Data centric ML,特别是基于influence function和Shapley value的Data Valuation。 刘明皓,整数智能信息技术(杭州)有限责任公司算法负责人。中国人工智能产业发展联盟2022年突出贡献个人,《人工智能研发运营一体化(Model/MLOps)能力成熟度模型》核心参编专家,MAP-NEO Core Contributor。 主播介绍: Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 Shownotes 00:30 - 嘉宾自我介绍 02:27 - 讨论 OpenAI 发布的 Scaling Laws 对模型性能的影响 02:59 - 探讨评估模型性能的主要指标和方法 03:48 - 模型性能衡量标准,介绍学术界常用的 Benchmark 和其他评估方法 04:49 - 分享如何评估知识型模型的效果 05:35 - 不同的 Scaling Laws 数据量的建议 07:05 - 介绍高质量数据的定义及其处理方法 08:57 - 讨论数据清洗过程中质量与多样性的平衡 09:58 - 解释数据质量如何具体影响模型训练效果 12:00 - 讨论如何评价模型的响应质量。 13:48 - 探讨处理具体应用场景数据的方法和建议 16:09 - 解释行业特定数据和 Prompt Engineering 的重要性 18:20 - 讨论在敏感领域处理数据时的隐私问题 21:22 - 介绍合成数据在模型训练中的应用和效果 23:14 -讲述如何在不同产业中扩展数据处理管道 26:48 - 解释保持数据集新鲜和相关性的周期更新策略 29:16 - 探讨验证数据集在模型评估中的关键作用 32:28 - 分享长文本数据在训练和验证中的处理方法 36:46 - 介绍自动驾驶数据的收集和处理流程 42:08 - 讨论数据壁垒的未来和数据共享的可能性 参考文献: 构建高质量数据集与智能数据工程平台 https://github.com/multimodal-art-projection/MAP-NEO https://arxiv.org/pdf/2405.19327 2077ai.com 感谢收听,我们下期再见!
- 本周AI快讯:英伟达剧透未来GPU,AMD MI350系列引爆台北
欢迎收听本周的 AI 资讯: 00:02 - 英伟达创始人黄仁勋在 COMPUTEX TAIPEI 的重磅演讲,宣布后三代GPU产品路线图,剧透下一代GPU芯片 官网介绍 01:28 - AMD CEO在 COMPUTEX TAIPEI 宣布了新的Instinct GPU系列路线图,MI350系列登场 官网介绍 02:53 - OpenAI宣布所有ChatGPT免费用户现在可以使用浏览、视觉、数据分析、文件上传和GPT等功能 03:14 - 智谱AI获得沙特阿美旗下风险投资部门 Prosperity7 的4亿美元投资,估值达到30亿美元 澎湃新闻【沙特基金4亿美元重仓智谱AI,企业估值达30亿美元】 03:58 -MiniMax CEO闫俊杰做客极客公园直播间,讨论了技术与成本、开源与闭源之争、投流和产品市场的契合度等关键问题 原文地址【MiniMax 闫俊杰:今天的 AI 应用都不会成为 Super App,但这不重要】 05:21 - 张小珺:2023中国大模型产业的资本故事 原文地址【大模型的扑克牌:独家内幕故事】 感谢您的收听,我们下期再见~
- 本周AI 资讯速递:OpenAI GPT-4o、Google I/O 2024 和 Apple 新品发布
大家好,欢迎收听本期AI 资讯 00:43: OpenAI 发布 GPT-4o 05:39: Google I/O 2024发布会亮点 08:23: 苹果春季发布会 M4 闪亮登场 09:33: 字节跳动发布了豆包大模型,价格较行业便宜99.3%。 感谢您的收听 ,我们下期再见~
- AI 快讯:超越Llama—微软Phi-3模型
Shownote 00:01 - ChatGPT Plus新功能:Memory 00:44 - 微软发布iPhone 能跑的 Phi-3 模型系列 参考论文 02:34 - 微软新工具:Copilot Workspace GitHub版Devin 介绍文章 03:48 - 李飞飞的创业方向:空间智能 04:58 - XAI融资动态 原文地址 05:54 - 英伟达收购AI 初创公司Run:ai 原文地址 06:17 - 出门问问在香港交易所挂牌 07:32- Anthropic推出iOS应用 08:30- Sam 在斯坦福大学的演讲 原文地址 09:47 - Perplexity CTO的复盘分享 视频地址 以上就是本期全部内容,感谢收听,我们下期再见~
- AI快讯探索 Llama3:Meta 打造的AI革新力作
大家好,欢迎收听本期 GenAI 快讯: 以下是本期摘要: 00:07 - Meta 新推出的开源大模型 Llama3,8B、70B 已开源,405B(还在训练未开源)性能逼近GPT-4 参考内容 02:01 - Dwarkesh Patel 对扎克伯格的访谈讨论Llama3 405B模型和AI开源生态系统的重要性 视频地址 03:11 - Meta 的无线长文本技术,已开源 论文地址 04:21 - OpenAI 更新 Assistant API 的功能,可处理高达10,000个文件 V2 技术文档更新说明 05:07 - Claude 3 Opus模型已上线Amazon Bedrock 05:54 - MiniMax发布ABAB 6.5系列模型 06:46 - 斯坦福HAI发布第七个年度AI Index报告 报告地址 08:47 - Adobe将引入AI技术到Premiere Pro中,支持OpenAI的Sora和其他模型 官方 sora 演示视频 09:19 - 第一AI 程序员 Devin 演示视频“造假”翻车事件 光头哥逐帧分析视频 11:18 - 亚马逊人事变动,吴恩达加入董事会 亚马逊官方公告 11:57 - 20VC 对 OpenAI CEO Sam 和COO Brad 的访谈 Youtube 访谈视频 12:20 - MiniMax创始人讨论其对技术和产品并重策略的看法,以及公司在大模型创业中的地位和策略 以下是《晚点 LatePost》与 MiniMax 创始人闫俊杰的对话 以上是本期全部内容,感谢收听,我们下期再会~
- AI快讯:马斯克的 XAI 发布 Grok1.5,微软巧妙收编 Pi 团队,Stability AI 风雨飘摇
欢迎来到 AI Odyssey。以下是AI领域的最新动态,欢迎收听! 本期内容: 00:02 - XAI 公司推出大模型 Grok-1.5,特点是上下文理解和高级推理能力的提升,计划向早期测试人员和 x 平台现有用户提供; 参考内容 01:15 - OpenAI 分享了 Voice Engine 的预览,能够通过输入文本和 15 秒音频样本生成自然语言,目前只在小范围内分享; 参考内容 02:10 - OpenAI 的 GPT 4 似乎不再有严格的使用上限,官方提示“Usage limits may apply”; 03:44 - Sam Altman 在 Lex Fridman 的播客中谈论了 OpenAI 的内部风波、对 Musk 的批评看法、Sora 的局限性和 GPT 4 的不足; 播客地址 机器之心翻译版 05:24 - Business Insider 报道一些投资者对 Sam Altman 的不满; 原文地址 06:09 - 微软 CEO Nadella 就科技、企业文化、个人成长和未来趋势的讨论; 视频地址 07:46 - 微软向Inflection支付6.5亿美元以获得专利使用与人才团队; 新闻来源 09:09 - Stability AI 的 CEO 突然宣布辞职; 官方公告 10:22 - Anthropic 公司开发的 AI 语音和音乐生成工具Suno 介绍; Suno 官网 11:43 - 百度将为苹果今年发布的 iOS 和 Mac OS 提供 AI 功能; 12:17 - GTC2024 黄仁勋 和 Transformer 架构的八位提出者的对话; 极客中国原文 12:32 - 吴恩达教授在 deeplearning 最新课程:优化 LLM 推理系统; 课程地址 12:50- YC W24 AI Starup 项目分布; Google sheet 地址 13:22 - 创业邦发布的 2023 年 AIGC 产业投资报告; 文章地址 13:32 -Trustless Labs 发布的 AI + Crypto 项目介绍; 报告地址 以上就是本期节目的所有资讯,感谢您的收听,我们下期再见。
- 揭秘AI文生图【下】文生图模型最前沿研究——结构原理、推理加速和评估
大家好。欢迎来到 AI Odyssey。本期播客我们有幸邀请到了文生图领域内的两位专家:林之秋和李嘉琛。两位嘉宾和主播深入探讨了文生图模型的最前沿研究,涵盖了模型的结构原理、推理加速以及评估方法。此外嘉宾还分享了模型架构的细节和优化技巧,以及模型评估的挑战和解决方案。本期内容丰富,为大家提供了一次深入了解文生图模型的机会,相信本期播客能带给大家新的启发和思考。欢迎收听,期待和大家一起探索AI的奥秘。 嘉宾介绍: 林之秋:CMU机器人研究所四年级博士,关注vision-language model以及generative AI。Twitter: @ZhiqiuLin Jiachen Li (李嘉琛, 推特:@JiachenLi11) :加州大学圣塔芭芭拉分校 (UCSB)三年级PhD,主攻文生图模型,机器人控制,多模态学习。Jiachen带队参加了Amazon SimBot Challenge,获得了第二名以及10w美元的奖金。 本期主播: Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 Shownotes: 00:34 嘉宾自我介绍 02:08 讨论文生图模型的分类:闭源模型和开源模型,以及它们的特点和区别 03:52 探讨闭源模型和开源模型在数据质量和模型架构上的差异 06:06 分析 Diffusion Model (扩散模型)的原理,包括其与 GAN(生成对抗网络)的比较和优化 09:33 解释 Stable Diffusion 模型的特点,包括在潜在空间的生成和文本条件的引入 11:44 详细介绍 Diffusion Process 的理论基础,包括随机微分方程和逆过程的概念 16:00 讨论LCM(一致性模型)在降低推理步骤和保持生成质量方面的作用 20:42 探讨生成模型的评估指标,包括对齐度、质量、人工评估和自动化指标的重要性 27:02 分析现有自动化指标的局限性,包括 CLIP Score 的问题和改进方向 33:29 探索奖励建模在引导生成模型方面的应用和挑战 38:47 讨论不同奖励模型策略对生成模型的影响及训练的挑战 44:06 探讨用于评估和改进生成模型的新方法,包括弱模型指导强模型的潜力 49:44 讨论提高生成模型文本理解能力的重要性及其在专业应用中的潜在应用 54:29 探索用于生成模型评估的新基准和方法,重点关注文本对齐 59:36 讨论合成数据在生成模型训练中的应用及潜在优势 感谢收听,我们下期再会~
- 揭秘AI文生图【上】文生图应用startup从0到1
欢迎收听本期 AI Odyssey,本期我们有幸邀请到了HuHu AI CEO 刘天强,一位经验丰富的连续创业者。在这期节目中,嘉宾不仅分享了他在 AI 领域的创业历程,还深入讨论了关于 AI 产品设计、用户增长策略、以及如何在竞争激烈的市场中找到立足点。无论你是 AI 领域的专业人士,还是对文生图应用充满好奇的听众,这期节目都将为你提供独到的见解和启发。欢迎收听,与我们一起探索 AI 文生图的奥秘! 嘉宾介绍: 刘天强:HuHu AI CEO,连续创业者。曾经创立Orbeus并被Amazon收购,后成为Amazon Rekognition的创始架构师。在创立Huhu AI前,曾经是智能家居公司Wyze的CTO (Twitter: @Tianqiang_Liu, xhs: @AI创业中的井叔) 主播介绍: Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 产品介绍: Chat Designer Chat Designer 是HuHu AI 的第一款 AI 产品。支持从文本生成图片,包括肖像图和产品图。用户通过简单的聊天对话即可进行像素级编辑。支持修图工具进行精确调整,轻松创造个性化图像。 HuHU AI HuHu AI 为各种商业场景提供 AI 设计代理解决方案。 Shownotes * 00:32 嘉宾自我介绍,分享连续创业经历 * 02:10 Chat Designer 的独特之处 * 02:47 讨论选择生成图应用领域的原因和市场定位 * 03:44 探讨 AI 产品设计与传统产品设计的异同 * 05:02 讨论 AI 产品的不确定性和评估标准 * 06:35 分析 AI 产品的市场定位和宣传策略 * 07:30 讨论 AI 模型的不确定性 * 08:02 讨论关于加强AI生成图的控制 * 09:29 Chat Designer 的目标用户群和市场策略 * 10:54 用户增长的核心要素和流量获取 * 13:55 讨论 AI 生图应用的艺术风格和质量评估 * 16:22 讨论 AI 生图应用的速度、质量和多样性之间的平衡 * 21:02 分享产品定价策略和收费标准 * 25:03 分享用户增长策略和口碑效应 * 32:23 预测生图应用未来发展方向和产品重构计划 感谢收听,我们下期再见!
- GenAI快讯:马斯克领航开源大模型Grok
欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态,欢迎收听! 以下是本期内容: 00:05 - 马斯克开源Grok-1 项目地址 github.com 01:39 - OpenAI 开源 Transformer Debugger (TDB) 工具 GitHub 链接:github.com 03:19 - OpenAI 大模型加持的 Figure 01 机器人 Demo 视频链接 04:01 - Devin:Cognition AI 团队发布的首个 AI 软件工程师 05:10 - A16Z 分享 Top100 GenAI ToC 产品 原文链接 06:29 - 探索最新 AI 创业公司的 Pitch Deck 网站 官网链接 07:26 - Yann LeCun 在 Lex Fridman 播客中的专访内容 视频链接 09:21 - 张小珺对王小川的采访 王小川想提出中国AGI第三种可能性 感谢收听本期播客,更多精彩内容,请持续关注我们的节目。下期再见!
- GenAI快讯:揭秘马斯克诉讼OpenAI,Claude 3震撼发布
欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态,欢迎收听! 以下是本期内容: 00:49 - 马斯克对OpenAI的诉讼及其影响 外媒链接 01:16 - OpenAI回应马斯克诉讼,公开过去8 年的邮件沟通记录 公开链接:openai.com 01:54 - OpenAI就CEO被罢免事件的调查结果,Sam重返董事 03:22 - Anthropic发布新的AI模型系列Claude 3 42 页的技术报告《The Claude 3 Model Family: Opus, Sonnet, Haiku》 04:00 - Claude 3 Opus模型具有自我认知 05:10 - 前 Google 工程师,AI 创业心路历程分享 原文链接:www.yitay.net 07:36 - 张小珺对杨植麟和朱啸虎的专访 月之暗面杨植麟专访:AI不是接下来一两年找到PMF,而是接下来十到二十年如何改变世界 朱啸虎讲了一个中国现实主义AIGC故事 08:12 - Mini Max融资6 亿美元 感谢您的收听,我们下期再见~
- GenAI快讯系列-第 7 期:Sora解密
欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态,欢迎收听! 以下是本期内容: 00:08 - Sora模型介绍 00:33 - Sora的技术优势以及其扩散模型和Transformer架构的特点 01:27 - Sora在社交媒体上的影响 02:05 - 扩散模型的原理与应用 论文地址 02:47 - Sora模型的几何一致性分析 论文地址 03:43 - Sora的发展前景 04:46 - OpenAI与纽约时报版权争议 文件链接 05:57 - 谷歌Gemma模型介绍 07:00 - Gemini模型因种族偏见问题受到的批评和紧急关闭事件 08:04 - Meta 计划在 7 约发布 LLaMa 3 模型 08:47 - Klarna公司采用OpenAI的AI客服系统的表现和业务影响 09:48 - 中信证券的AI投资指南 原文地址 以上就是我们这期节目的要点摘要,详细内容请收听完整播客。我们下期节目再会。