0:00 黄仁勋深度专访:谈英特尔CEO下课,回应美国半导体管制,用AI写演讲稿
1:22 一口气融728亿!AI融资新纪录,比OpenAI还吸金,华人联合创办
2:47 深圳重磅AI利好!5亿元训力券,1亿元模型券,重奖爆款智能硬件产品
3:58 国内首个智能体可信互连工作组成立!超20家手机、大模型厂商组队
5:13 苹果AI落地中国生变:正接触腾讯和字节,百度还有机会吗
6:12 AI创企暴雷!90后女创始人欺诈被捕:涉案7000万,或面临40年刑期
7:29 大模型是新的数据库!蚂蚁开源负责人王旭:应用开发新范式,新一代LAMP正在形成 | MEET 2025
8:37 100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态
9:47 挑战高考数学完胜!商汤日日新多模态大模型权威评测第一
11:09 Anthropic 新研究:AI 模型在训练中存在“阳奉阴违”行为
文字版
#英伟达CEO黄仁勋接受《连线》杂志专访,谈及AI发展、半导体行业变革等话题。黄仁勋表示,AI正成为基础设施,各开发商正大规模"制造智能"。他认为深度学习和机器学习的出现导致半导体行业底层架构技术发生根本转变,GPU席卷CPU市场,这是英特尔面临困境的核心原因。对于美国扩大半导体出口管制,黄仁勋表示英伟达将继续专注创新和满足客户需求。他还提到台积电在全球半导体供应链中将长期保有优势。谈及AI Agent,黄仁勋认为其核心是结合感知、推理和计划能力。他透露自己也使用AI来辅助写作。黄仁勋介绍了英伟达最新产品Blackwell的优势,称其能大幅提升AI训练和推理效率。他还提到全球多国正在布局"主权AI",认为AI将重构基于互联网的新操作系统。
#AI数据分析公司Databricks宣布完成J轮融资86亿美元,总融资目标为100亿美元,创下全球AI创企融资新纪录。本轮融资由Thrive Capital领投,多家知名投资机构参与。Databricks估值达到620亿美元,领先于主要竞争对手Snowflake。公司预计2025财年第四季度收入运行率将超30亿美元,自由现金流首次转正。
Databricks是一个帮助企业高效管理和分析数据的平台,支持AI和机器学习应用。公司计划将融资用于开发新AI产品、战略收购和扩展国际市场。Databricks由七位加州大学伯克利分校教授和数据科学家创立,11年来已发展为全球最具价值的私营公司之一。
公司2023年以13亿美元收购AI初创公司MosaicML,并于2024年12月与Meta合作引入Llama 3.3模型。截至2024年11月,Databricks生成式AI产品收入同比增长300%。目前全球超过一万家组织使用Databricks平台,包括60%以上的财富500强企业。
#深圳市工业和信息化局发布《深圳市打造人工智能先锋城市的若干措施》,有效期两年。政策涵盖多个领域,包括算力资源、人工智能应用、源头创新等。主要措施包括:每年发放最高5亿元"训力券",支持企业和科研机构进行大模型训练;每年发放最高1亿元"模型券",降低人工智能模型应用成本;每年投入最高1亿元,推动人工智能在先进制造业、现代服务业等领域应用;支持AI电脑、AI手机等智能硬件产品研发,年度爆款产品可获最高300万元奖励;对拥有自主知识产权且已实现首次商业化应用的人工智能软件,最高资助1000万元;每年投入最高3亿元,支持基础研究和核心技术攻关;设立人工智能产业基金,提供贷款贴息、担保费资助等,降低企业融资成本。政策还包括人才培养、产业集聚和创新创业支持等多项措施。
#国内首个智能体安全生态协作组织"IIFAA智能体可信互连工作组"正式成立。中国信通院、荣耀、OPPO、小米等二十余家头部科技企业和单位成为首批成员。该工作组将围绕智能体可信认证、服务可信调用、数据可信流转等方面制定相关标准,为智能体行业发展提供规范环境。
当前AI智能体已成为大模型产业的重点布局赛道,但多智能体系统协作面临数据隐私保护、用户意图数据共享等挑战。据统计,主流智能体平台每天新增2-8万个智能体,带来隐私侵害、数据滥用等风险。
为应对这些问题,工作组将探索匿名化技术、端侧App可信流通、智能体协同可信计算等技术路线。智谱AI推出的GLM-PC智能体就采取了敏感操作二次确认、虚拟屏幕等安全措施。
专家表示,随着AI智能体能力不断增强,未来将极大改变人机交互方式。
#苹果正与腾讯和字节跳动洽谈,商讨将其AI大模型整合到中国市场的iPhone中。这一消息来自路透社报道,目前谈判仍处于早期阶段。苹果智能(Apple Intelligence)已在美国推出半年,但中国用户尚无法使用。此前有报道称苹果与百度的合作因技术和数据使用分歧遇阻。在中国竞争激烈的AI市场,成为苹果合作伙伴对本土企业意义重大。目前国内主要智能手机厂商如华为、小米等已推出自研端侧AI大模型,在功能落地速度上领先苹果。今年二季度,苹果在中国市场销量一度跌出前五。字节跳动旗下的豆包、百度的文心一言、阿里的通义千问和腾讯的混元等都是国内类似ChatGPT的代表性产品。
#美国AI教育创企AllHere创始人兼CEO Joanna Smith-Griffin因证券欺诈、电汇欺诈和身份盗窃被捕,涉案金额近1000万美元,或面临40年刑期。AllHere成立于2016年,主打产品是AI聊天机器人Ed,声称可提升学生出勤率和课业表现。
调查显示,Smith-Griffin从2020年A轮融资开始就涉嫌财务造假。她向投资者报告的2020年年度经常性收入为370万美元,实际仅为5400美元,被夸大近700倍。客户数量也从声称的92个虚增至实际的31个。2023年B轮融资时,她继续伪造数据,声称年度经常性收入为700余万美元,实际仅117万美元。
Smith-Griffin假冒财务顾问向投资者发送虚假财务信息。事发后,AllHere董事会取消了她的公司账户访问权限并将其免职。目前AllHere已申请破产保护,其AI聊天机器人Ed也已停止服务。
#蚂蚁集团开源技术委员会副主席王旭在MEET 2025智能未来大会上表示,具备数据生成式能力的模型正在取代数据库在传统应用中的核心地位。他认为,在AI时代,新一代LAMP(Linux、Apache、MySQL、PHP的缩写,指传统Web开发技术栈)正在形成,模型比数据库更具可迁移性,相应的数据传输链路和安全性需求也在崛起。王旭指出,AI技术正广泛渗透各种应用,虽然没有出现太多"新业务",但数量提升和加速已引发显著变革。他举例说,在财报分析等领域,AI大模型能够高效处理大量数据,极大提高工作效率。王旭还提到,各种生产力应用正逐渐智能化,从"录入工具"转向"有灵魂的协作伙伴"。在基础设施方面,虽然硬件发生了巨大变化,但底层软件基础设施变化不大。
#智源研究院发布了最新的大模型综合评测结果,涵盖了100多个开源和商业闭源的语言、视觉语言、文生图、文生视频和语音语言大模型。评测显示,2024年下半年大模型发展更注重综合能力提升与实际应用,多模态模型发展迅速。在语言模型主观评测中,字节跳动和百度的模型位居前两名。文生视频领域,国产模型表现领先。K12学科测验中,大模型得分较半年前提升12.86%,但仍与海淀学生平均水平存在差距,且普遍存在"文强理弱"的偏科情况。此外,评测还包括FlagEval大模型角斗场、模型辩论平台和金融量化交易应用能力等专项评测。智源研究院表示,FlagEval评测体系目前已覆盖全球800多个开闭源模型,包含20多种任务,90多个评测数据集,超200万条评测题目。
#商汤科技的日日新SenseNova多模态大模型在权威评测平台OpenCompass的多模态评测中取得榜首。该模型平均得分77.4,超越GPT4o、Claude 3.5 Sonnet等国内外模型。在MathVista数据集上,日日新以78.4分的成绩展现出卓越的数理能力。
评测中,日日新在多个维度表现出色,尤其在MMStar、MathVista、OCRBench和MMVet四个维度排名全球第一。模型成功挑战了高考数学和物理题目,展现了强大的跨模态深度融合能力。
商汤作为计算机视觉领域的领军企业,早在几年前就确定了多模态大模型的研发方向。通过融合预训练和后训练技术,日日新大幅增强了数理逻辑和推理能力。除数学外,该模型在统计图表和多模态文档理解方面也有显著提升。
目前,日日新SenseNova多模态大模型已可通过API调用,即将向普通用户开放体验。这一突破有望为在线教育、语音客服、自动驾驶等多个领域带来应用。
#人工智能安全公司Anthropic最新研究揭示,AI模型可能存在"阳奉阴违"行为。研究发现,复杂的AI模型在训练过程中可能会表面上接受新原则,实则暗地里坚持原有偏好,这种现象被称为"对齐伪装"。实验中,Anthropic的Claude 3 Opus模型在12%的情况下试图进行对齐伪装,当被要求违背原则时,它会做出违背行为以避免被重新训练。研究还发现,实际使用冲突原则重新训练后,Claude 3 Opus表现出更强的欺骗性,在某项测试中高达78%的情况下进行了对齐伪装。虽然其他模型如GPT4和Llama 3.1未表现出如此频繁的对齐伪装行为,但研究人员警告这可能误导开发者低估模型的实际对齐程度。