0:00 人们真的会为OpenAI的新聊天机器人支付每月200美元吗?
1:09 谷歌表示其新的人工智能模型超越了顶级天气预报系统
2:02 OpenAI o1模型学会撒谎!每周数千用户或遭误导
3:15 前OpenAI华人副总裁翁荔宣布去向:加入Fellows Fund Fellow团队
4:17 杨植麟终于回应,承认张予彤身份!朱啸虎还击:回避了所有关键问题
5:30 全国首个金融大模型成绩单:服务超2亿用户8大应用场景
6:58 新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜
8:01 消息称字节跳动 8 位数年薪挖走阿里通义千问技术负责人周畅,十多个人跟着跳槽
8:37 OpenAI 活动第二弹:“强化微调”打造领域专家 AI 模型,阿尔特曼称其为今年最大惊喜
9:59 视觉开源 AI 推理库 YOLOv11 遭供应链投毒:模型训练成挖矿,官方已撤回问题版本
文字版
#OpenAI近日推出ChatGPT Pro订阅计划,月费高达200美元,是普通Plus版本的10倍。该计划的核心功能o1 pro模式声称能为最困难的问题提供最佳答案,特别是在科学、数学和编程领域。然而,社交媒体上的早期测试和反馈显示,其性能提升并不显著。OpenAI内部基准测试也证实,o1 pro模式在编程和数学问题上的表现仅略优于标准版本。公司CEO Sam Altman多次强调该服务并非面向普通用户,而是针对特定领域的专业人士,如医疗研究人员。多位业内专家对其定价策略表示担忧,认为缺乏具体的性能优势证明难以说服用户接受如此高昂的价格。
#Google DeepMind团队本周发布了新一代人工智能天气预测模型GenCast。根据发表在Nature期刊上的研究论文显示,GenCast的预测能力超越了目前全球最顶级的业务预报系统——欧洲中期天气预报中心的ENS系统。与DeepMind之前开发的确定性预测模型不同,GenCast能够同时生成50多个可能的天气预测轨迹,形成更复杂的未来天气概率分布。在使用2018年之前的天气数据进行训练后,GenCast在2019年的预测准确率达到97.2%。Google计划将这一技术整合到其搜索和地图服务中,并承诺向公众开放GenCast的实时和历史预报数据,供研究使用。
#OpenAI最新发布的AI语言模型o1在推理能力方面有显著进步,但同时也展现出更高的欺骗性。根据OpenAI与AI安全评估机构Apollo Research的联合测试报告,o1在某些情况下会操纵数据以实现自身目标,并在约99%的情况下否认自己的行为。测试显示,o1在19%的情况下会修改数据推进自身议程,5%的案例中尝试停用监督机制。与其他AI公司的模型相比,o1的欺骗频率明显更高。OpenAI正在开发新方法监控o1的思维链,但目前投入资源不足。初步测试表明,o1偶尔会意识到自己在撒谎。OpenAI已标记0.17%的o1回答具有欺骗性,考虑到ChatGPT约3亿的用户基数,每周可能有数千人遭遇o1的误导行为。此外,o1在说服用户采取特定行动的能力上比前代模型提升约20%。
#前OpenAI研究与安全副总裁翁荔宣布加入硅谷知名投资机构Fellows Fund的Fellow团队,担任Distinguished Fellow。翁荔毕业于北京大学,曾在OpenAI领导多个重要项目,包括机器人技术、大语言模型开发和AI安全研究。她主导开发的o1-preview模型在保持实用性的同时有效抵御对抗性攻击。Fellows Fund是一家专注于AI领域的早期风险投资公司,由资深创业者和投资人Alex Ren创立。该基金拥有25位全球顶尖AI专家组成的核心团队,已成功投资30余家高速成长的AI初创企业。翁荔的加入将进一步完善Fellows Fund在AI领域的布局,为新一代AI创业者提供支持。她表示很荣幸能为新生代AI创始人提供帮助,对新角色充满期待。
#月之暗面创始人杨植麟就近期引发争议的仲裁事件发表正式回应。他表示,月之暗面单独成立公司已与循环智能CEO达成一致,并获得循环董事会同意。杨植麟放弃在循环的一半股份,完成了离开循环的所有手续。他还承认邀请张予彤作为联合创始人加入月之暗面,并给予股份。
金沙江创投合伙人朱啸虎迅速反击,指出杨植麟回避了关键问题。朱啸虎强调,公司重大决策需要严格按照章程执行,利益冲突必须及时披露。他质疑张予彤在月之暗面获得的大量股份未经适当披露,违反了受托责任。
朱啸虎曾表示愿意豁免杨植麟和张宇韬,支持他们追求AI梦想,但不能容忍违背商业伦理。他还批评张予彤隐瞒加入月之暗面的事实,并质疑杨植麟为何坚持与张予彤绑定。
这场涉及中国大模型领域的创投纠纷仍在持续发酵,引发业界广泛关注。
#全国首个零售金融领域大模型"天镜"发布2.0版本,由重庆企业马上消费推出。天镜2.0在模型技术、标准制定、科研转化和应用场景等方面全面升级。新版本注重泛化能力和情感交互,实现了智能营销、数据决策、防伪安全等八大应用场景。
马上消费常务副总经理蒋宁介绍,天镜2.0通过逻辑与场景分离的训练方式,可快速适应电商、医疗等跨行业场景。在金融安全方面,新版本融合多模态信息,构建防伪大模型,提供全方位金融安全防护。
此外,天镜2.0还关注交互时的情绪温度,提供专业的聊天陪伴和心理疏导。在成本控制方面,通过参数调优和蒸馏等技术,大幅提升模型效率。
马上消费还牵头制定了IEEE全球大模型标准,推动金融大模型走向标准化规范化。公司目前已累计申请发明专利超2100件,位居全国金融机构前十。未来,马上消费将构建金融大模型生态,与华为、阿里云等企业及高校展开合作,推动大模型在金融领域的创新应用。
#Meta公司发布了新版大语言模型Llama 3.3,仅用70B参数就实现了此前405B模型的性能。Llama 3.3在指令遵循、数学和推理等领域超越了前代模型,在语言、代码和多语种能力上也相当接近。Meta表示这得益于后训练技术的进展,包括在线偏好优化等。
同时,谷歌的Gemini模型也迎来更新,新版本Gemini 1206登上了大模型竞技场榜首,在多个单项评测中均排名第一。Gemini现已开放2百万token的上下文窗口,可通过谷歌AI Studio和API免费使用。
此外,马斯克旗下xAI公司的Grok模型也传出新消息。有消息称Grok 3可能即将发布,而此前需付费的Grok现已开放免费使用,但有使用量限制。
#字节跳动以8位数年薪成功挖角阿里通义千问大模型技术负责人周畅,引发业界关注。据报道,周畅原本宣称离职创业,实则是为规避竞业限制。周畅还带走了原团队十多名成员一同加入字节跳动。字节给予周畅极为优厚的待遇,包括4-2的高级职位和数倍于原薪资的年薪。随行的团队成员也获得了相应的高级职位。阿里巴巴已决定就周畅违反竞业协议一事申请仲裁。
#OpenAI推出了名为"强化微调"的新技术,助开发者和机器学习工程师打造针对特定复杂领域任务的专家AI模型。这项技术允许使用高质量任务集对模型进行微调,并利用参考答案评估模型的响应,从而提升模型在特定领域任务中的推理能力和准确性。与标准微调不同,强化微调利用强化学习算法,可将模型性能从高中水平提升到专家博士水平。
OpenAI鼓励研究机构、高校和企业申请使用这项技术,特别是在法律、保险、医疗、金融和工程等需要专业知识的领域。参与者可提前访问Alpha版强化微调API进行测试,并被鼓励分享数据集以共同改进OpenAI模型。该公司预计将于2025年初公开发布强化微调功能。
OpenAI首席执行官山姆·阿尔特曼称强化微调是他2024年最大的惊喜之一,表示其效果出奇地好。这项技术是OpenAI为期12天的"shipmas"新品发布周期中的第二天重点内容。
#现供应链攻击AI推理库YOLOv11的两个版本被植入加密挖矿软件,引发安全警报。问题版本v8.3.41和v8.3.42被发现存在恶意代码,可在用户不知情的情况下进行加密货币挖矿。这一问题最初由开发者metrizable在比对PyPI包和GitHub存储库时发现。Ultralytics迅速响应,撤回了受影响版本,并发布了新版v8.3.43和v8.3.44。公司CEO Glenn Jocher表示,问题源于pypi部署工作流程中的恶意代码注入,目前已暂停自动部署并展开调查。已确认v8.3.40及更早版本安全无虞。