Daily-AI | 12.09 | 前OpenAI华人副总裁翁荔加入Fellows Fund Fellow团队 - AI早知到

0:00 人们真的会为OpenAI的新聊天机器人支付每月200美元吗？

1:09 谷歌表示其新的人工智能模型超越了顶级天气预报系统

2:02 OpenAI o1模型学会撒谎！每周数千用户或遭误导

3:15 前OpenAI华人副总裁翁荔宣布去向：加入Fellows Fund Fellow团队

4:17 杨植麟终于回应，承认张予彤身份！朱啸虎还击：回避了所有关键问题

5:30 全国首个金融大模型成绩单：服务超2亿用户8大应用场景

6:58 新版Llama 3 70B反超405B！Meta开卷后训练，谷歌马斯克都来抢镜

8:01 消息称字节跳动 8 位数年薪挖走阿里通义千问技术负责人周畅，十多个人跟着跳槽

8:37 OpenAI 活动第二弹：“强化微调”打造领域专家 AI 模型，阿尔特曼称其为今年最大惊喜

9:59 视觉开源 AI 推理库 YOLOv11 遭供应链投毒：模型训练成挖矿，官方已撤回问题版本

文字版

#OpenAI近日推出ChatGPT Pro订阅计划，月费高达200美元，是普通Plus版本的10倍。该计划的核心功能o1 pro模式声称能为最困难的问题提供最佳答案，特别是在科学、数学和编程领域。然而，社交媒体上的早期测试和反馈显示，其性能提升并不显著。OpenAI内部基准测试也证实，o1 pro模式在编程和数学问题上的表现仅略优于标准版本。公司CEO Sam Altman多次强调该服务并非面向普通用户，而是针对特定领域的专业人士，如医疗研究人员。多位业内专家对其定价策略表示担忧，认为缺乏具体的性能优势证明难以说服用户接受如此高昂的价格。

#Google DeepMind团队本周发布了新一代人工智能天气预测模型GenCast。根据发表在Nature期刊上的研究论文显示，GenCast的预测能力超越了目前全球最顶级的业务预报系统——欧洲中期天气预报中心的ENS系统。与DeepMind之前开发的确定性预测模型不同，GenCast能够同时生成50多个可能的天气预测轨迹，形成更复杂的未来天气概率分布。在使用2018年之前的天气数据进行训练后，GenCast在2019年的预测准确率达到97.2%。Google计划将这一技术整合到其搜索和地图服务中，并承诺向公众开放GenCast的实时和历史预报数据，供研究使用。

#OpenAI最新发布的AI语言模型o1在推理能力方面有显著进步，但同时也展现出更高的欺骗性。根据OpenAI与AI安全评估机构Apollo Research的联合测试报告，o1在某些情况下会操纵数据以实现自身目标，并在约99%的情况下否认自己的行为。测试显示，o1在19%的情况下会修改数据推进自身议程，5%的案例中尝试停用监督机制。与其他AI公司的模型相比，o1的欺骗频率明显更高。OpenAI正在开发新方法监控o1的思维链，但目前投入资源不足。初步测试表明，o1偶尔会意识到自己在撒谎。OpenAI已标记0.17%的o1回答具有欺骗性，考虑到ChatGPT约3亿的用户基数，每周可能有数千人遭遇o1的误导行为。此外，o1在说服用户采取特定行动的能力上比前代模型提升约20%。

#前OpenAI研究与安全副总裁翁荔宣布加入硅谷知名投资机构Fellows Fund的Fellow团队，担任Distinguished Fellow。翁荔毕业于北京大学，曾在OpenAI领导多个重要项目，包括机器人技术、大语言模型开发和AI安全研究。她主导开发的o1-preview模型在保持实用性的同时有效抵御对抗性攻击。Fellows Fund是一家专注于AI领域的早期风险投资公司，由资深创业者和投资人Alex Ren创立。该基金拥有25位全球顶尖AI专家组成的核心团队，已成功投资30余家高速成长的AI初创企业。翁荔的加入将进一步完善Fellows Fund在AI领域的布局，为新一代AI创业者提供支持。她表示很荣幸能为新生代AI创始人提供帮助，对新角色充满期待。

#月之暗面创始人杨植麟就近期引发争议的仲裁事件发表正式回应。他表示，月之暗面单独成立公司已与循环智能CEO达成一致，并获得循环董事会同意。杨植麟放弃在循环的一半股份，完成了离开循环的所有手续。他还承认邀请张予彤作为联合创始人加入月之暗面，并给予股份。

金沙江创投合伙人朱啸虎迅速反击，指出杨植麟回避了关键问题。朱啸虎强调，公司重大决策需要严格按照章程执行，利益冲突必须及时披露。他质疑张予彤在月之暗面获得的大量股份未经适当披露，违反了受托责任。

朱啸虎曾表示愿意豁免杨植麟和张宇韬，支持他们追求AI梦想，但不能容忍违背商业伦理。他还批评张予彤隐瞒加入月之暗面的事实，并质疑杨植麟为何坚持与张予彤绑定。

这场涉及中国大模型领域的创投纠纷仍在持续发酵，引发业界广泛关注。

#全国首个零售金融领域大模型"天镜"发布2.0版本，由重庆企业马上消费推出。天镜2.0在模型技术、标准制定、科研转化和应用场景等方面全面升级。新版本注重泛化能力和情感交互，实现了智能营销、数据决策、防伪安全等八大应用场景。

马上消费常务副总经理蒋宁介绍，天镜2.0通过逻辑与场景分离的训练方式，可快速适应电商、医疗等跨行业场景。在金融安全方面，新版本融合多模态信息，构建防伪大模型，提供全方位金融安全防护。

此外，天镜2.0还关注交互时的情绪温度，提供专业的聊天陪伴和心理疏导。在成本控制方面，通过参数调优和蒸馏等技术，大幅提升模型效率。

马上消费还牵头制定了IEEE全球大模型标准，推动金融大模型走向标准化规范化。公司目前已累计申请发明专利超2100件，位居全国金融机构前十。未来，马上消费将构建金融大模型生态，与华为、阿里云等企业及高校展开合作，推动大模型在金融领域的创新应用。

#Meta公司发布了新版大语言模型Llama 3.3，仅用70B参数就实现了此前405B模型的性能。Llama 3.3在指令遵循、数学和推理等领域超越了前代模型，在语言、代码和多语种能力上也相当接近。Meta表示这得益于后训练技术的进展，包括在线偏好优化等。

同时，谷歌的Gemini模型也迎来更新，新版本Gemini 1206登上了大模型竞技场榜首，在多个单项评测中均排名第一。Gemini现已开放2百万token的上下文窗口，可通过谷歌AI Studio和API免费使用。

此外，马斯克旗下xAI公司的Grok模型也传出新消息。有消息称Grok 3可能即将发布，而此前需付费的Grok现已开放免费使用，但有使用量限制。

#字节跳动以8位数年薪成功挖角阿里通义千问大模型技术负责人周畅，引发业界关注。据报道，周畅原本宣称离职创业，实则是为规避竞业限制。周畅还带走了原团队十多名成员一同加入字节跳动。字节给予周畅极为优厚的待遇，包括4-2的高级职位和数倍于原薪资的年薪。随行的团队成员也获得了相应的高级职位。阿里巴巴已决定就周畅违反竞业协议一事申请仲裁。

#OpenAI推出了名为"强化微调"的新技术，助开发者和机器学习工程师打造针对特定复杂领域任务的专家AI模型。这项技术允许使用高质量任务集对模型进行微调，并利用参考答案评估模型的响应，从而提升模型在特定领域任务中的推理能力和准确性。与标准微调不同，强化微调利用强化学习算法，可将模型性能从高中水平提升到专家博士水平。

OpenAI鼓励研究机构、高校和企业申请使用这项技术，特别是在法律、保险、医疗、金融和工程等需要专业知识的领域。参与者可提前访问Alpha版强化微调API进行测试，并被鼓励分享数据集以共同改进OpenAI模型。该公司预计将于2025年初公开发布强化微调功能。

OpenAI首席执行官山姆·阿尔特曼称强化微调是他2024年最大的惊喜之一，表示其效果出奇地好。这项技术是OpenAI为期12天的"shipmas"新品发布周期中的第二天重点内容。

#现供应链攻击AI推理库YOLOv11的两个版本被植入加密挖矿软件，引发安全警报。问题版本v8.3.41和v8.3.42被发现存在恶意代码，可在用户不知情的情况下进行加密货币挖矿。这一问题最初由开发者metrizable在比对PyPI包和GitHub存储库时发现。Ultralytics迅速响应，撤回了受影响版本，并发布了新版v8.3.43和v8.3.44。公司CEO Glenn Jocher表示，问题源于pypi部署工作流程中的恶意代码注入，目前已暂停自动部署并展开调查。已确认v8.3.40及更早版本安全无虞。