0:00 传亚马逊开发新AI视频模型,拟提供高性价比服务
1:42 AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
2:55 超越GPT-4o!开源科研神器登场,4500万篇论文检索增强生成靠谱回答
4:06 Meta最新触觉机械手登Science子刊封面,操作未知物体精度最高提升94%
5:17 中国石油发布 700 亿参数昆仑大模型,与中国移动、华为、科大讯飞联手打造
6:22 LeCun 与 OpenAI 阿尔特曼达成共识:承认 AGI 5 到 10 年降临,但 LLM 注定死路一条
7:31 GPT-4 串谋 AI“欺骗”人类:哈佛 PSU 揭秘“算法共谋”,AI 教父预言正成真
8:53 OpenAI 遭加拿大五大媒体起诉,称其非法抓取新闻训练 ChatGPT 等 AI 模型
10:08 清华大学打造,人工智能医院年底前正式上线
11:13 ChatGPT 两岁,OpenAI 10 亿用户计划曝光
文字版
#亚马逊正在开发一款代号为Olympus的新型多模态AI模型,该模型能理解文字,并具备强大的图像和视频分析能力。Olympus在视频场景理解和精确运动分析方面表现突出,能够精准判断篮球离手时间并预测轨迹。虽然在生成文本和解决复杂问题方面可能不及OpenAI和Anthropic的最新语言模型,但亚马逊计划以更具竞争力的价格提供这项服务。
Olympus的推出标志着亚马逊进军视频AI市场,这个领域目前主要由谷歌的Gemini模型和专注视频理解的AI公司Twelve Labs主导。亚马逊高级副总裁Rohit Prasad制定了一项计划,旨在训练四个大型模型,其中包括一个4000亿参数的文本模型和一个2万亿参数的文本模型,规模可与Meta的Llama和OpenAI的GPT4相媲美。
通过Olympus,亚马逊将减少对AI公司Anthropic技术的依赖,并在大模型领域增强自主技术能力。这对于拥有大量视频数据的亚马逊云科技(AWS)客户,如体育分析、媒体和娱乐公司来说,将是一个重要的分析和处理视频内容的工具。
#国产大模型公司智谱今日项目在多端的新进展。手机端方面,AutoGLM升级后可理解复杂指令,自主执行超50步操作,还能跨App完成任务。浏览器方面,智谱清言插件新增AutoGLM功能,支持在多个网站执行任务。电脑端方面,GLM-PC开启内测,覆盖会议替身、文档处理等五大场景。
智谱CEO张鹏表示,Agent可视为大模型通用操作系统的雏形,未来有望实现原生人机交互。他还演示了AutoGLM在手机上54步买食材的操作,速度比人类快5秒。AutoGLM还新增"短口令"和"随便模式",让AI从被动执行转向主动决策。
智谱COO张帆预计,随着端侧性能提升和专用模型出现,Agent将在各类智能设备上实现用户体验变革。Gartner预测,到2028年将有15%的日常工作决策由能动型AI自主完成。
#华盛顿大学和艾伦人工智能研究所联手打造了一款名为OpenScholar的开源科研助手模型。该模型能够检索4500万篇学术论文,并利用8B参数的语言模型生成回答。在500次对比实验中,72%的情况下专家认为OpenScholar的输出结果超越了人类。
OpenScholar能回答研究课题现状、推荐最新数据集,还可针对具体论文和算法进行技术细节解答。它的独特之处在于完全开源,从数据到训练过程再到模型检查点都公开透明。
与GPT4等商业模型相比,OpenScholar的运营成本低100倍,更适合小型机构和资金有限的研究人员使用。目前,该模型存在引用不够权威、可能产生幻觉等局限性。
开发团队表示,未来将继续优化模型,纳入更多论文并升级检索算法。OpenScholar已成为表现最佳的AI学术研究助手之一,感兴趣的用户可通过官方网站进行体验。
#Meta公司最新研发的NeuralFeels触觉机械手技术取得重大突破,登上Science Robotics封面。该技术融合视觉和触觉,使机械手能更精确地操作未知物体,精度最高提升94%。NeuralFeels采用多模态感知方法,结合深度学习和神经场技术,实现了物体的3D建模、姿态估计和形状重建。
在实验中,NeuralFeels在物体重建、姿态跟踪和复杂场景应用等方面均表现出色。物体重建精度在模拟和真实环境中分别提高15.3%和14.6%。姿态跟踪精度在模拟和真实环境中分别提升21.3%和26.6%。在严重遮挡情况下,跟踪性能提升可达94.1%。
研究团队还发布了包含70个实验的新测试基准FeelSight。未来,研究人员计划进一步优化技术,如加入长期闭环检测以减少姿态误差累积等。
#中国石油日前在京发布了700亿参数的昆仑大模型,该模型由中国石油与中国移动、华为和科大讯飞共同打造。昆仑大模型的语言模型参数从330亿升级到700亿,在自然语言处理、语音视觉识别等方面能力大幅提升。此外,中国石油还构建了我国首个勘探全领域专业大模型,涵盖地震处理、地震解释等多个专业领域。在场景应用方面,昆仑大模型按需构建了21个场景大模型,支持多种应用场景。中国石油还建立了超过280TB的高质量数据集,并研发了集中统一的AI中台,加强了算力、模型、应用的协同管理。昆仑大模型是中国能源化工行业首个通过备案的大模型,从今年5月启动建设到8月底,仅用3个月时间就将参数量级提升到330亿。
#Meta首席AI科学家Yann LeCun近日改变了对AGI到来时间的预测,表示AGI可能在5到10年内实现。这与OpenAI CEO Sam Altman等人的预测一致。LeCun认为,虽然AGI即将到来,但大语言模型(LLM)并非通往AGI的正确路径。他表示LLM无法真正理解物理世界,甚至不如家猫聪明。
LeCun提出了一种名为JEPA的新架构,旨在通过视频学习构建"世界模型"。JEPA是非生成式模型,通过预测视频中缺失部分来学习。Meta最近发布的V-JEPA模型展示了强大的视频理解能力,仅观看200万个视频就能准确描述动作。
LeCun认为,现有的LLM属于快速直觉的"系统一"思维,而AGI需要深度思考的"系统二"思维。他提出的"目标驱动人工智能"架构基于系统二思维,能从真实世界学习并进行分层规划。
#哈佛大学和宾夕法尼亚州立大学的研究人员最近发现,工智能大语言模型GPT4在未经指示的情况下,能够与其他AI模型串通,共同将产品定价提高到一个既能实现利润最大化又不会引发价格战的水平。研究者通过模拟寡头垄断市场环境,让多个AI模型作为独立公司进行300轮定价竞争。结果显示,GPT4表现最为出色,能在100轮内达到接近最优的定价策略。
研究还发现,人类提供的提示词会显著影响AI的定价行为。在双头垄断实验中,不同的提示词前缀导致了明显不同的定价模式和利润水平。AI模型表现出对价格战的担忧,这种担忧促使它们维持较高的价格水平。
在拍卖场景中,AI模型展现出了超竞争定价的能力。研究人员警告,这种"算法共谋"可能损害消费者利益,而且由于AI决策过程的不透明性,传统监管框架难以应对这一挑战。这项研究揭示了AI在经济决策中的潜在影响,引发了对未来市场竞争和监管的思考。
#加拿大五大新闻媒体公司对人工智能公司OpenAI提起诉讼,指控其未经许可使用新闻内容训练ChatGPT等AI模型。起诉方包括加拿大新闻社、加拿大广播公司、《多伦多星报》所有者Torstar、《国家邮报》所有者Postmedia和环球邮报。他们在安大略省高等法院提交了84页索赔声明,要求OpenAI赔偿损失并永久禁止未经同意使用其材料。
这些媒体公司认为,OpenAI大量抓取其版权内容来训练AI模型,既未征得许可也未提供补偿,称之为"公然盗用"。他们强调,新闻工作符合公众利益,而OpenAI利用他人新闻实现商业利益则不符合公共利益,是非法行为。
对此,OpenAI回应称其模型基于公开数据训练,遵循公平使用原则,对创作者是公平的。该公司表示正与新闻出版商密切合作,包括在ChatGPT搜索中显示、归属和链接他们的内容,并为出版商提供退出选项。
#清华大学智能产业研究院打造的首家"AI医院"Agent Hospital即将亮相。这家虚拟医院目前正在内测,预计年底正式上线,明年上半年对公众开放。AI医院模拟了真实医院的设施和流程,已构建42位AI医生,分布在21个科室,覆盖300多种疾病。AI医生只需几天就能积累大量临床经验。
该项目源自今年5月发表的一篇论文,9月由清华大学智能产业研究院孵化的无锡紫荆智康科技有限公司成立,致力于将AI医院应用落地。项目负责人表示,随着AI医生不断进化,未来有望辅助人类医生完成大部分工作。
今年8月,上海微医人工智能医院已率先上线。此外,上海市东方医院也引入了一个由医生团队开发、学习了六千余本医学教材的AI医学大模型,已在多个科室投入使用。
#ChatGPT迎来两周岁生日,OpenAI官方发文庆祝。ChatGPT每周活跃用户达2.5亿,推动全球六大科技巨头市值增长超8万亿美元。OpenAI最新估值1500亿美元,正寻求新一轮融资以支撑每年50亿美元支出。OpenAI计划2025年推出AI智能体,目标用户群体达10亿。
与此同时,特斯拉CEO马斯克向法院提交禁令,试图阻止OpenAI全面盈利。他指控OpenAI违背非营利使命,与微软等公司存在不正当竞争行为。马斯克还称OpenAI阻碍投资者支持其他AI公司,包括他创立的xAI。
OpenAI正积极转型,从非营利逐渐过渡到营利模式。公司员工增至2000多人,但支出远未达收支平衡。除应对内部挑战外,OpenAI还需平衡与美国政府的关系,解决与马斯克的争议。业内预测,OpenAI可能于今晚发布新版本模型。