繁体简体

马斯克推出Grok 3 AI竞赛白热化

华夏经纬网 > 新闻 > 国际新闻      2025-02-19 11:37:20

左图:示威者抗议特朗普政策的集会上高举抵制马斯克的海报。\美联社;右图:马斯克(右一)与三位工程师17日在线上举行Grok 3发布会。\网络图片

本港时间18日,马斯克旗下人工智能初创公司xAI通过直播,发布号称“地球最聪明的AI大模型”Grok 3。演示内容显示,Grok 3在数学、科学、编程三项能力的相关测评中,得分均高于其他主流AI模型。Grok 3总共用了20万个英伟达H100GPU训练,被质疑为“性价比黑洞”。复旦大学计算机科学技术学院教授张奇18日接受大公报专访时表示,DeepSeek的出现加速了AI领域的竞争,诸如xAI和OpenAI等企业迫于压力,不得不调整大模型的发布节奏以应对市场变化。\大公报记者苏雨润 戚佳洁

【大公报讯】本港时间18日,马斯克旗下人工智能(AI)新创公司xAI推出AI模型Grok 3,并十分高调地宣称,这是“地表最聪明的AI”,目标是为了理解宇宙。根据xAI数据,Grok 3在数学、科学以及编程三大基准测试中的表现还不错。数据上是超越了所有主流模型,包括GPT-4o、DeepSeek-V3等。以数学测验为例,Grok 3取得了52分的最高成绩,而同属xAI阵营的Grok 3 mini则拿到40分,DeepSeek-V3以39分紧追在后,GPT-4o只有9分。

Grok 3一周后上线语音模式

Grok 3性能突破的背后是惊人的资源投入,xAI团队透露,Grok 3有20万个英伟达GPU、4亿个GPU小时的算力支持。马斯克在直播中首次披露,Grok 3训练过程累计消耗20万个英伟达GPU,训练在xAI公司的数据中心完成。马斯克还说,Grok 3将在一周后上线语音模式。

据官方数据,Grok 3的运算能力依托由20万个英伟达H100GPU构建的Colossus超算集群,据称运算能力是前代产品Grok 2的“10倍以上”,预训练阶段的消耗相当于一座核电站7%的月发电量。以市价计算,一个H100GPU大概在3万美元(约23.4万港元),那么Grok 3的训练成本就至少在60亿美元(约468亿港元)左右。相较于DeepSeek以远低于同行的成本训练出比肩OpenAI o1模型能力的R1模型,Grok 3的这一算力消耗属实不小。在马斯克公布Grok 3训练成本后,很快便有分析指出,Grok 3的算力消耗是DeepSeek-V3的263倍。

DeepSeek走红加速行业竞争

马斯克宣称“地球最聪明的AI大模型”。张奇则指出,Grok 3在推理能力上确实更进一步,但就目前数据来看,它依然属于大体量模型。至于其是否会对DeepSeek的市场造成冲击,还需取决于它在实际场景中的使用效果。“完整部署Grok 3需要强大的计算量,许多企业出于性价比考量,可能不会选择它。”

随着Grok 3的发布,AI市场的竞争格局愈发白热化,各大企业为在这场技术竞赛中抢占优势,纷纷加大研发投入,加速产品迭代。张奇表示,AI模型间的竞争是行业常态,不过此前相互追赶的速度相对较慢,DeepSeek的走红让行业竞争进一步提速。他告诉记者,GPT-4问世后,各大企业在追赶多模态技术方面投入了大量时间与精力,企业间的追赶节奏一度放缓。而DeepSeek的出现将研发工作从“幕后”推向“台前”,研发重点也从“训练”转向“推理”,极大缩小技术壁垒,加速了大模型版本的迭代速率。

此外,值得注意的是,在本次直播发布会上,马斯克多次提及DeepSeek。张奇表示,在Grok 1发布时,xAI研发团队的关注焦点主要集中在OpenAI等头部企业,几乎从未提及中国的AI模型。“DeepSeek的异军突起彻底改变了这一状况,这反映出马斯克乃至美国科技界对中国AI企业技术突破与创新能力的高度认可。”

文章来源:香港大公报
责任编辑:姚思寒
寰球热点
国际观察
互联网新闻信息服务许可证10120170072
京公网安备 11010502045281号
违法和不良信息举报电话:010-65669841
举报邮箱:xxjb@huaxia.com

网站简介 / 广告服务 / 联系我们

主办:华夏经纬信息科技有限公司   版权所有 华夏经纬网

Copyright 2001-2024 By www.huaxia.com