Mistral AI 和 NVIDIA 发布先进语言模型; OpenAI 探索定制 AI 芯片; 历史上的无生命物体审判

Mistral AI 和 NVIDIA 发布先进语言模型; OpenAI 探索定制 AI 芯片; 历史上的无生命物体审判

13分钟 ·
播放数11
·
评论数0

嗨,大家好,欢迎收听 Discover 科学新闻,我是逍逍。今天为大家带来几则最新的科学动态。

首先,Mistral AI 和 NVIDIA 联合发布了一个名为 Mistral NeMo 的顶尖语言模型。这个 120 亿参数的模型具有 12.8 万个 token 的上下文窗口,据称在推理、世界知识和编码准确性方面达到了同类模型的先进水平。它的出现将推动人工智能技术的进步。

Mistral NeMo 是 Mistral AI 和 NVIDIA 合作开发的成果,在 NVIDIA DGX Cloud AI 平台上训练,利用了 3072 个 H100 80GB Tensor Core GPU,算力相当强大。这个模型的设计目标是高性能处理各种自然语言处理任务,包括文本生成、内容总结、语言翻译和情感分析。它拥有巨大的上下文窗口,能更连贯地处理复杂信息。另外,Tekken 这个基于 Tiktoken 的分词器也表现出色,能更高效地压缩源代码和多种语言,特别是韩语和阿拉伯语。Mistral NeMo 在训练过程中还采用了量化感知技术,可以在不牺牲性能的情况下进行 FP8 推理,这对企业级部署非常重要。

与同级别的其他模型相比,Mistral NeMo 12B 的表现非常抢眼。根据基准测试,它在准确性和效率方面都超越了 Gemma 2(90 亿参数)和 Llama 3(80 亿参数)。Mistral NeMo 的定价也很有竞争力,每 100 万个输入和输出 token 仅需 0.3 美元,而 GPT-4(32k 上下文)和 Mixtral 8x22B 等更大模型的价格高得多。Mistral NeMo 的 12.8 万个上下文窗口和 Tekken 先进的分词技术,使它能够更好地处理长格式内容和多语言任务,在大约 85% 的语言中,它的文本压缩性能都优于 Llama 3 分词器。

Mistral NeMo 的基础模型和指导模型权重都可以在 HuggingFace 上获得,方便开发人员访问和使用。它可以与 mistral-inference 一起使用,并可以使用 mistral-finetune 工具进行调整。对于企业部署,Mistral NeMo 打包为 NVIDIA NIM 推理微服务,可以通过 ai.nvidia.com 访问。它设计用于单个 NVIDIA L40S、GeForce RTX 4090 或 RTX 4500 GPU,将强大的人工智能功能带到企业的桌面上,方便各种组织使用。

Mistral NeMo 是一款多功能模型,适用于各种任务,包括企业级人工智能解决方案、聊天机器人以及对话人工智能系统。它的多语言功能对需要处理多种语言的国际企业和组织尤其有用。此外,该模型在编码准确性方面的强大性能使其成为软件开发和代码生成任务的宝贵工具。Mistral NeMo 的大上下文窗口和高级推理能力也使其适用于复杂文本分析、总结和各个行业的研究应用。

好,接下来我们看一下 OpenAI 的动态。据报道,OpenAI 正在探索开发自己的 AI 芯片,以减少对稀缺且昂贵的 GPU 的依赖。这一战略举措由 CEO Sam Altman 领导,旨在提高 OpenAI 的 AI 开发计算能力。

开发定制 AI 芯片的动力来自克服 GPU 短缺和减少使用昂贵的 Nvidia GPU 开发 AI 模型的成本。通过打造自己的芯片,OpenAI 希望更好地控制自己的 AI 基础设施和计算能力,从而提高训练和运行 ChatGPT、GPT-4 和 DALL-E3 等大型语言模型的性能。这一举措还可能为 OpenAI 与供应商的未来谈判提供杠杆,并减少对单一来源关键组件的依赖。

OpenAI 已经在积极招募谷歌前员工,他们曾参与过张量处理单元(TPU)的工作。公司正在探索各种芯片封装和内存组件,以优化性能。虽然新芯片预计最早要到 2026 年才能生产,但 OpenAI 已经考虑过收购 AI 芯片初创公司来加速开发。这些举措是提高计算能力更大计划的一部分,该计划还包括与外部投资者讨论创建新公司,以资助数据中心和专用 AI 芯片服务器等基础设施。

OpenAI 的芯片开发计划正在考虑几种可能的策略,包括在内部开发定制 AI 芯片、收购现有 AI 芯片初创公司或与成熟的芯片制造商更紧密合作。然而,这一进程并非一帆风顺。芯片开发复杂而昂贵,一个普通芯片的开发成本估计在 2000 万美元到 5000 万美元之间,而更先进的设计可能高达数十亿美元。此外,生产时间也很长,新芯片的最早发布日期预计在 2026 年。OpenAI 还需要应对 AI 硬件领域的激烈竞争,包括谷歌、亚马逊和 Meta 等科技巨头已经开发了自己的 AI 芯片。

OpenAI 开发定制 AI 芯片反映了科技行业的趋势,谷歌、亚马逊和 Meta 等公司已经拥有了自己的 AI 专用处理器。转向定制硬件解决方案旨在优化 AI 开发的性能和成本。如果 OpenAI 的举措成功,可能会颠覆目前由 Nvidia 主导的 AI 芯片市场。其影响可能不仅限于 OpenAI,还可能推动 AI 模型训练和推理的进步,加速各行业人工智能创新的步伐。此外,这一举措也符合 AI 硬件在维护技术领导地位方面日益重要的战略意义,美国最近对中国出口先进 AI 芯片实施的限制就体现了这一点。

下面来讲一讲一个有趣的法律话题。在整个历史中,法律体系都不得不处理一个不寻常的做法,即因对人类造成伤害或死亡而将无生命物体送上法庭。从古希腊的 Prytaneion 法院到中世纪的欧洲的赎罪物概念,再到现代的资产没收案件,这种看似古怪的法律传统实际上发挥了重要的社会和文化功能,帮助社会理解悲剧事件,并维护正义与秩序。

在古希腊雅典,有一个名为 Prytaneion 的特别法庭,专门审理涉及意外死亡的无生命物体。其中一个著名的案例是,塔索斯(Thasos)运动员西恩尼斯(Theagenes)的雕像被起诉并扔进大海,因为它倒下来砸死了西恩尼斯的竞争对手。正如公元前 4 世纪的演说家德摩斯登(Demosthenes)所描述的那样,这个法庭的职能是审判石头、木头或铁器等导致人死亡的物体。这种做法反映了希腊人的信念,即即使是无生命的物体在被指控犯下严重罪行时也不应被剥夺审判权利。

赎罪物的概念源于古希腊的做法,于 11 世纪左右出现在中世纪欧洲。这些导致人死亡的物体或动物将被没收并交给王室用于虔诚用途。交给当局的通常是物品的价值,而不是物品本身。例如,在 1267 年,一个滚烫的开水桶造成了一名洗衣妇的死亡,它被宣布为赎罪物,价值 18 便士。赎罪物可能来自日常用品,如车轮,也可能来自牲畜,反映了人们认为即使是无生命的物体也应为致命事故负责的信念。这种做法在英国一直持续到 1846 年才被废除。

在现代法律概念中,物权管辖权允许法院对财产而不是个人采取行动。这一原则在资产没收案件中尤为突出,政府可以没收与非法活动有关的财产。一个著名的例子是《美国诉 124700 美元美国货币》案,法院裁定与毒品贩运有关的资金可以被没收。其他不寻常的案件包括《美国诉一个实心金色公鸡状物案》,其中一座金色雕像被根据《黄金储备法》被扣押,以及《美国诉马萨诸塞州特克斯伯里 434 号主街案》,涉及试图扣押据称用于毒品交易的汽车旅馆。

无生命物体审判不仅仅是法律程序,它们还服务于重要的社会和文化目的。通过创建将混乱或悲剧事件归咎于物体的叙事,社区可以应对否则无法解释的事件。这种做法强化了法律面前人人平等的想法,维护了社会秩序,提供了道德平衡。此外,在难以确定人类过错的情况下,这些审判为建立社区叙事提供了一种机制,帮助社区驯服混乱并反映社区的道德价值观。不同地区陪审团的结论差异表明,这些审判主要关注的是特定社区的社会正义,而不是广泛的法定规则。

好了,最后我们来看一个有趣的创新。丹麦南部大学的研究小组开发了一种创新的无人机系统,能够从架空电线上自动充电,这可能彻底改变长航时无人机操作的方式。

开发利用电线为无人机充电的概念最初是为了延长无人机检查电网的飞行时间。丹麦南部大学的研究团队使用了塔罗 650 运动碳纤维无人机机身,并定制了各种组件,包括一个 7000 毫安时的锂聚合物电池、一个 Raspberry Pi 4 B 微型计算机和一个 Pixhawk V6X 自动驾驶模块。无人机配备了被动式动力线握持器和由两个内倾臂组成的电缆导向装置,使其能够安全地附着在电线上。这种创新的方法使无人机能够在无需人工干预的情况下长时间运行,这可能彻底改变基础设施检查和维护的做法。

当无人机软件检测到电池电量低时,充电过程就会开始。无人机使用摄像头和毫米波雷达系统定位最近的电线,然后从下方接近电线。无人机的电缆导向装置将电缆引向握持器,握持器在不需要电源的情况下关闭。一旦固定,无人机顶部的感应式充电器就会从电线上抽取电流。这种创新的系统允许无人机一直连接到电线上,直到电池充满。然后,握持器松开,无人机继续执行任务。在现场测试中,原型机表现出在五个检查和充电循环中持续飞行两个多小时的能力。

这种创新的技术为无人机操作提供了几个关键优势:

- 延长飞行时间:无人机可以通过多次充电循环保持两个多小时的空中飞行时间

- 全自动操作:减少了在偏远或难以到达的地区对人工干预的需求

- 提高成本效率:消除无人机返回基地站充电的需要

- 连续电力线检查:能够在不中断的情况下检查电力线

- 实时安装传感器:使公用事业公司能够更有效地监控资产

- 超越电力线检查的应用:可以应用于长距离的自主送货服务

该系统从电线上收获能量的能力也为更大的有效载荷和扩展的操作范围带来了可能性。

虽然这项技术很有前景,但它也面临着重大挑战。安全问题来自无人机可能损坏电线并导致大面积停电的风险。此外,还需要解决使用公共基础设施为无人机充电所涉及的监管和道德问题。从技术上讲,该系统的有效性取决于电线的电压和感应充电效率。展望未来,研究人员的目标是提高系统在各种环境条件下的适应性并扩展其操作能力。未来的迭代可能实现长距离、完全自主的检查或交付服务,几乎不需要人工干预。

好了,今天的 Discover 科学新闻就到这里。感谢收听,下期再见!