马斯克发布Grok 4大模型,最贵版本月费2000元
7月10日消息,马斯模型北京时间今日中午,布G版本在比原定时间推迟一小时后,最贵商丘市某某电梯厂埃隆·马斯克 (Elon Musk) 旗下xAI发布了其最新的月费元旗舰AI模型Grok4,并推出了一项全新的马斯模型AI订阅计划——每月300美元的SuperGrokHeavy。
Grok是布G版本xAI用以对标OpenAI的ChatGPT和谷歌Gemini等模型的产品,能够分析图像并回答问题。最贵
外界对Grok 4的月费元期望很高。xAI这款最新的马斯模型AI模型将直接对垒OpenAI即将推出的GPT-5,后者预计将在今年夏末发布。布G版本
“对于学术问题,最贵Grok 4在每个学科上都超过了博士水平,月费元无一例外,马斯模型”埃隆·马斯克在直播中说道。布G版本商丘市某某电梯厂“它有时可能缺乏常识,最贵也尚未发明新技术或发现新物理学,但这只是时间问题。”
xAI于周三发布了两款模型:Grok4和Grok4 Heavy——后者是该公司的“多智能体版本”,性能更强。
Grok 4 特性如下:•【超凡的推理与解决能力】Grok4在xAI的Colossus超级计算机上进行了训练,其训练量是Grok2的100倍。在强化学习(RL)方面,它投入的计算量比任何其他模型都多出10倍。据称,该模型能够从第一性原理出发进行思考并纠正自身错误,在多项推理基准测试中表现出色。在通常用于测试人们推理能力的基准测试中,Grok4达到了博士水平。其多智能体版本Grok4Heavy在美国数学邀请赛(AIME25)中取得了满分。Grok4在所有学科的学术问题上都表现出优于博士水平的能力。xAI中强调Grok4的推理能力已达到超人水平。
•【为开发者而生的编码变体】xAI团队目前正在大力开发编码模型。他们最近训练了一个专门的编码模型,该模型将既快速又智能,并计划在未来几周内与开发者分享。
•【集成的工具使用与现实交互】Grok4将工具使用能力深度融入了训练中,这与Grok3仅依靠泛化能力不同,从而显著提升了模型使用这些工具的能力,解决了前代在工具使用上“更弱且不可靠”的问题。未来,Grok最终将能够通过人形机器人(如Optimus)与物理世界互动,从而能够制定假设并验证其真伪。
•【领先的语音交互体验】Grok4的语音功能在端到端延迟速度上提升了2倍(延迟缩短了一半),提供了更灵敏、自然、流畅且不易打断的对话体验。新的声音模型具有卓越的自然度和韵律。
•【增强的实时网络访问】Grok4具备强大的工具使用能力,能够访问网络并实时抓取数据。Grok可以在聊天过程中提供最新信息,而无需用户打开独立的标签页或浏览器。与Grok3相比,Grok4的工具使用能力更为原生和可靠。
•【对互联网文化的理解能力】Grok4能够理解主观且带有幽默感的问题,例如判断“最奇怪的资料照片”,这需要其理解问题的隐含意义并从互联网上找到对应的信息和判断。其语音模式下的Eve也能进行富有感情和幽默感的对话。
xAI声称,Grok4在多项基准测试中展现了前沿水准,其中包括“人类最后一道考题”(Humanity’s Last Exam),这个考试通过数千个关于数学、人文学科和自然科学等主题的众包问题,来衡量AI的能力。据xAI称,Grok4在不使用“工具”的情况下,在该测试中得分率为25.4%,超过了谷歌Gemini2.5 Pro的21.6%,以及OpenAI的o3(high)的21%。
xAI还声称,配备“工具”的Grok4 Heavy取得了44.4%的高分,超过了同样使用工具、得分为26.9%的Gemini2.5 Pro。
此外,非营利组织Arc Prize表示,Grok在他们的ARC-AGI-2测试中取得了新的SOTA(State-of-the-Art,即当前最佳水平)分数——这是另一个高难度基准,由类似拼图的难题组成,需要AI识别视觉模式——得分率为16.2%。这几乎是排名第二的商业AI模型ClaudeOpus 4得分的两倍。
除了Grok 4和Grok4 Heavy,xAI还推出了其迄今最昂贵的AI订阅计划、名为SuperGrokHeavy的每月300美元的订阅服务。该计划的订阅者将能抢先体验Grok4 Heavy,并优先使用新功能。此计划与其他主要AI提供商如OpenAI、谷歌和Anthropic推出的超高端会员服务类似,但xAI目前提供了其中最昂贵的订阅选项。
SuperGrok Heavy的订阅者或许能提前体验到xAI计划在未来数月推出的一些新产品。该公司周三表示,一款AI编码模型将于8月问世,一个多模态智能体将于9月推出,而视频生成模型则定于10月。
xAI正通过其API发布Grok4,以吸引开发者基于该模型构建应用。该公司提到,其企业业务部门成立仅两个月,但计划与各大超大规模云服务商合作,通过他们的云平台提供Grok。
尽管Grok在基准测试中表现出了领先水平,但当xAI试图将Grok作为ChatGPT、Claude和Gemini的真正竞争者向企业推销时,它可能很难摆脱近期的这些负面事件。企业是否准备好连同其所有缺陷一并接纳Grok,仍有待观察。
Grok 4的发布,恰逢马斯克旗下公司经历动荡的一周。周三早些时候,在X公司任职约两年后,其首席执行官琳达·亚卡里诺 (Linda Yaccarino) 宣布辞职。目前,X尚未公布她的继任者。
巧合的是,雅卡里诺的离职,发生于几天前Grok的官方自动化X账号曝出丑闻之后:该账号在回复用户时发表了攻击性帖子。xAI不得不短暂限制该Grok账号,并删除了这些内容。
马斯克和xAI的领导层基本上回避了对此事件的讨论,而是将焦点放在了Grok 4的性能和能力上。(易句)
(本文由AI翻译,网易编辑负责校对)

(责任编辑:娱乐)
-
财联社7月10日电,据环球时报,有记者提问称,乌克兰昨天表示已拘留两名中国公民,指控他们试图将导弹技术走私出境,请问中方对此有何评论?对此,发言人毛宁表示,我们还在核实了解有关情况,如果涉及中国公 ...[详细]
-
当地时间7月8日,中国援马达加斯加杂交水稻技术援助二期项目立项换文签署仪式在马达加斯加外交部举行。△中国驻马达加斯加大使季平与马外交部长拉萨塔交换立项文书 马达加斯加外交部长拉萨塔与中国驻马达加 ...[详细]
-
2024年高考成绩公布后,再次证明:自律者出众,懒散者出局!
作者:主创团·牧青野高考查分,已落下帷幕。每年的这段时间,都牵动着无数人的心,我们和也每个高考家庭一样感同身受、热泪盈眶。十年寒窗孤清,一朝策马扬名。没有谁的收获是凭空而来,没有谁的幸运是从天而降。眼 ...[详细]
-
6月16日起,湖南遭受近20天强降雨,为该省1961年以来暴雨之最。受上游持续降雨影响,6月30日,洞庭湖2024年第一号洪水形成。洞庭湖作为长江流域最重要的洪水调蓄湖泊之一,进入汛期后水位长时间 ...[详细]
-
成都市公安局天府新区分局7月10日发布警情通报称,7月5日12时许,该局接报警,称华阳街道发生疑似拐卖儿童纠纷。民警立即到场处置并开展调查。经调取监控、询问证人及涉事人员,现查明:郑某某女,32岁 ...[详细]
-
2024年6月17日,布里斯班水上中心。澳大利亚巴黎奥运游泳选拔赛落幕,41人脱颖而出将代表老牌游泳强国踏上最高水平的赛场。在澳大利亚奥委会公布的大名单中,人们并没有看到流行音乐人科迪·辛普森的名字。 ...[详细]
-
原标题:菲律宾警方:已掌握8名涉嫌绑架并杀害中国公民的嫌疑人信息) 据央视新闻消息,菲律宾警方7月9日表示,警方已经掌握了涉嫌绑架并杀害中国公民案件中8名嫌疑人的 ...[详细]
-
1996年6月26日,英格兰与德国的欧洲杯半决赛已进入最后的点球决战。前6轮点球,两队出场的球员全部罚进。第7轮,英格兰中后卫索斯盖特走上了点球点。他摆好球,冷静思考,进行了超长的助跑,然后罚出一记绵 ...[详细]
-
7月11日,外交部发言人毛宁主持例行记者会。 法新社记者提问,据报道,俄罗斯外长拉夫罗夫将于下周访华,外交部能否证实并提供更多细节? 毛宁资料图。图源:外交部网站 对此,毛宁表示:“目前我没有 ...[详细]
-
【地理视角】海里的盐从哪来的?高考地理中的正午和子夜太阳高度!
不知道大家有木有尝过海水的味道?反正我尝过游泳呛水),又咸又涩,还夹杂点苦味,这滋味···那时,我脑袋瓜里冒出一疑问:为什么海水是咸的呢?既然想到问题,就得去深入挖掘,结果发现,原来这个问题众说纷纭, ...[详细]