Daily-AI | 12.11 | Sora上线挤爆服务器！1个视频3块钱 - AI早知到

0:00 OpenAI支持的Speak融资7800万美元，估值达10亿美元，帮助用户通过大声交流学习语言

0:38 外媒：英伟达2025年收入或增长52%，六大科技巨头增长骤减

1:49 Sora上线挤爆服务器！1个视频3块钱，网友已玩疯，实测对比可灵海螺

3:03 字节跳动押注AI：投入数十亿美元张一鸣亲自监督挖人

4:14 谷歌量子芯片引爆热议：5分钟算完10²⁵年任务，Nature加急发表，还证实了多元宇宙？？？

5:28 国家知识产权局拟明确：AI 系统无法成为发明人，专利文件署名的发明人必须是自然人

6:20 智谱首个免费多模态模型 GLM-4V-Flash 上线，支持图像描述生成、视觉问答等

7:18 苹果 AI 负责人称公司对开发通用人工智能不感兴趣，短期内难实现

8:25 ChatGPT 高级语音模式主创“自立门户”：新公司估值达 2 亿美元，打造有情感的 AI 语音交互

9:34 扎克伯格：Meta AI 全球月活跃用户逼近 6 亿

文字版

#AI语言学习平台Speak宣布完成7800万美元C轮融资，估值达到10亿美元。本轮融资由Accel领投，OpenAI、Khosla Ventures和Y Combinator跟投。这距离其6个月前完成的2000万美元B轮融资仅半年时间，彼时估值为5亿美元。

#根据彭博社报道，预计"七大科技巨头"（谷歌、亚马逊、苹果、Meta、微软、英伟达和特斯拉）在2025年的盈利增长将放缓至18%，远低于2024年预期的34%。若剔除AI芯片巨头英伟达，其余六家公司预计仅能实现3%的微弱增幅。英伟达预计2025年利润和收入分别增长49%和52%，成为Russell 1000指数中表现第七好的股票。与此同时，标准普尔500指数的盈利增长预计2025年达到13%，高于2024年的10%。投资者已有所反应，信息技术板块遭遇六周以来最大资金流出，而小盘股吸引了大量资金流入。七大科技巨头目前市盈率为41倍，为2022年初以来最高，远高于标准普尔500指数的23倍。在经济不确定性加剧的背景下，科技巨头仍被视为稳健的投资选择。

#OpenAI推出文生视频模型Sora Turbo新版本，比2月预览版更快。Sora可生成最高1080p分辨率、最长20秒、多种画面比例的视频。ChatGPT Plus和Pro用户可免费使用，Plus用户每月可生成50个480p视频，Pro用户可生成500个1080p视频。Sora专属页面上线，提供预设风格、多种选项和社区分享功能。新功能包括Remix（替换视频元素）、Re-cut（截取延展场景）、Storyboard（精确控制每帧）、Loop（无缝循环）和Blend（视频合成）。

首批试用者反馈Sora存在性别搞错、文字乱码、镜头变化不听指令等问题。OpenAI称Sora基于DALL·E和GPT模型，采用Transformer架构的扩散模型。训练数据来自公开、专有和人类数据。为确保安全使用，OpenAI采取多项输出前安全措施，并与数百名创意专业人士合作测试10个月。

#字节跳动正全力押注生成式AI，投入数十亿美元用于AI基础设施建设。公司创始人张一鸣亲自监督从竞争对手挖角顶尖AI人才，扩大AI大模型和产品研发团队。过去两年，字节跳动采购了大量英伟达GPU用于模型训练。公司还组建团队研发AI芯片，以减少对英伟达的依赖。

字节旗下AI聊天机器人"豆包"月活跃用户已达6000万，远超百度同类产品。海外版"Cici"也有近1300万月活用户。张一鸣虽已卸任CEO，但仍积极参与AI战略制定，致力于实现通用人工智能(AGI)目标。

目前抖音国内增长接近饱和，TikTok海外扩张也面临挑战。有业内人士质疑字节能否在AI领域取得成功，称公司此前在游戏、VR等领域的尝试均未成功。但张一鸣认为AI可能成为延续公司未来的新引擎。

#谷歌量子计算团队Google Quantum AI发布了最新量子芯片Willow，在量子纠错和随机电路采样两项基准测试中达到了业界最高水平。Willow拥有105个量子比特，能在5分钟内完成当今最快超级计算机需要10²⁵年才能完成的计算。这一成果已在《自然》杂志上发表。

Willow的关键突破在于实现了错误率的指数级降低，首次达成"低于阈值"的里程碑。这意味着随着量子比特数量增加，系统的错误率反而会下降，为大规模量子计算奠定了基础。

谷歌CEO皮查伊亲自在社交媒体上宣布了这一突破。OpenAI CEO奥特曼和总裁Brockman也对此表示祝贺。中国量子专家陆朝阳评价这项工作展现了"真正非凡的技术突破"。

谷歌在官方博客中提到，Willow的成果为量子计算发生在多个平行宇宙的观点提供了支持，引发了网友对多元宇宙理论的热议。不过，目前科学界尚无方法证实或证伪这一观点。

#国家知识产权局近日公开征求《人工智能相关发明专利申请指引》意见。该指引明确，在中国现行法律下，人工智能系统无法成为发明人，专利文件署名的发明人必须是自然人。指引区分了两类情况：人工智能辅助作出的发明，即以AI技术作为辅助工具得到的发明；以及人工智能生成的发明，即AI在无人类实质性贡献下自主生成的发明。对于前者，对发明创造作出实质性贡献的自然人可署名为发明人；而后者则无法被赋予发明人身份。这一规定与英国最高法院和美国专利商标局的立场一致，强调专利发明人必须是自然人。

#智谱AI推出首个免费多模态模型GLM-4V-Flash，为开发者和企业提供高级图像处理功能。该模型支持图像描述生成、分类、视觉推理、问答和情感分析等任务，覆盖26种语言。GLM-4V-Flash基于智谱AI的4V系列模型，在图像处理精确度上有所提升。

该模型旨在帮助企业以低成本快速应用大模型技术，特别适合垂直行业的场景解决方案。智谱AI此前在8月已推出免费语言模型GLM-4-Flash，此次发布的GLM-4V-Flash进一步扩展了其免费模型矩阵。

开发者可通过智谱AI官网的体验中心试用GLM-4V-Flash，并查阅相关说明文档。

#苹果公司机器学习和人工智能战略高级副总裁约翰·詹南德雷亚近日表示，苹果对开发通用人工智能（AGI）不感兴趣，认为这一目标不现实且有些轻率。他指出，该领域仍有许多未解决的问题和突破需要实现，认为通过简单扩大现有技术就能实现AGI的想法非常天真。

詹南德雷亚强调，苹果可能会参与重要的AI突破，但目标是改进产品而非追求AGI。他透露，公司从事基础研究的工程师数量可能超过开发即将推出产品的工程师。苹果的AI研究重点是面向用户的产品，旨在改善人们的生活。

詹南德雷亚认为，一些常见的AGI乐观预期是非常天真的。他表示，苹果并不排除参与AGI相关突破的可能性，但公司的最终目标是开发实用的AI产品，而非追求遥不可及的通用人工智能。

#ChatGPT高级语音模式的主创Alexis Conneau最近"自立门户"，创立了新公司WaveForms AI。该公司已获得著名风险投资公司Andreessen Horowitz领投的4000万美元种子轮融资，公司估值达2亿美元。WaveForms AI的目标是打造具有情感的AI语音交互系统，让人工智能语音交互更加自然，更具情感共鸣。

Conneau表示，他们的AI音频系统部分灵感来源于科幻电影《她》，旨在避免成瘾性和隔离性体验等负面影响，同时让更多用户感受AI的优势。公司计划优先考虑同理心和连接，构建更积极的人机交互体验。

WaveForms AI的愿景是实现情感通用智能（EGI），让AI系统能够实时解释和响应情感线索。公司计划于2025年发布首批产品，但目前尚未公开技术演示，公司网站仅限于对音频智能愿景的描述。

#Meta公司首席执行官马克·扎克伯格近日宣布，旗下AI助手Meta AI的全球月活跃用户数量即将突破6亿大关。这一增长得益于最新发布的Llama 3.3模型。Meta AI服务于去年秋季推出，今年10月已达到5亿月活用户。扎克伯格表示，Llama模型是目前全球应用最广泛的AI模型，下载量超过6.5亿次。

有媒体指出，这一数据与Meta庞大的用户基数密切相关。作为社交媒体巨头，Meta拥有超过30亿用户，并已将AI助手整合到旗下所有应用中，包括Facebook、Instagram、Messenger和WhatsApp。公司还主动引导用户使用AI功能。

业内人士认为，更能反映AI助手实际价值的关键指标是用户与之互动的时长和频率，以及在社交应用中的实际应用情况。目前，这些方面的具体数据尚未公布。