Grok3 API获取指南:马斯克复刻OpenAI,附$150教程
摘要
Grok3发布,采用与OpenAI类似的分层策略,含基础版和推理版,LMSYS排行榜飙破1400分。xAI推出
先拆解几个关键结论:马斯克这次确实被逼到了墙角。收购OpenAI失败后,他直接把Grok3推向台前,并高调宣称这是“全球最强AI模型”。发布策略的路径,怎么看都有点似曾相识——从时间节点到产品线划分,几乎是把OpenAI的打法完整复制了一遍。当然,硬核技术点也不少,尤其是“订阅费翻倍+每月$150 API免费额度”这一套组合拳,很符合马斯克一贯的作风。
下面用十四条要点快速理清Grok3当下的全部底牌:
- Grok3采用了与OpenAI一致的模型分层策略:两个基础版(Grok3和Grok3 mini),外加两个推理版——Grok3 Reasoning(Beta)为完整版但尚在测试;Grok3 mini Reasoning更成熟,用少量精度换取了更快的响应速度。
- 当前可直接通过grok.com体验。想免费试水的用户,推荐先去lmarena.ai上手。
- 在LMSYS排行榜上一骑绝尘,成为首个突破1400分的模型,所有类别均排名第一。AIME(数学)96分,GPQA(科学)85分,成绩与完整版o3不相上下。
- 采用类似OpenAI o系列的模糊思维链机制,不展示原始思考过程。防止蒸馏,这已是行业共识。
- AI大神Andrej Karpathy实测结论:Grok3的推理能力大致处于o1-pro($200/月档位)水平,优于DeepSeek-R1和Gemini 2.0 Flash Thinking。开启强思考模式后,Grok3 Reasoning(Beta)在AIME 2025上的表现甚至超过o3-mini-high。
- Grok3的计算量是Grok2的10倍,是DeepSeek V3的263倍,于今年1月完成预训练。
- Grok2将在几个月后开源——这要感谢DeepSeek,让Grok1.5之后已闭源的模型重新回归开源社区。
- 底层硬件为名为Colossus的集群,由20万块Nvidia H100 GPU组成,典型的“力大砖飞”方案。
- 除Grok模型外,本次还推出了DeepSearch,名字与OpenAI类似,但实际体验更像联网版的DeepSeek R1。
- 语音模式未来会推出,并支持多模态,绝非简单的文字转语音。
- X Premium+用户可率先使用Grok 3。但价格嘛……从$22涨到$40,涨幅45%。这一点反倒不像OpenAI,毕竟他们不敢这么定价。
- 马斯克还单独推出了SuperGrok订阅计划,每月$30或每年$300。但坦白说,现阶段OpenAI和DeepSeek性价比更高。
- 目前Premium+与SuperGrok在配额上的具体差异尚未公布,想尝鲜的话,Premium+是更推荐的选择。
- xAI估值已达$750亿,约为OpenAI估值的一半。
接下来,看看它在实际测试中的表现到底有没有水分。
- 从基础模型的性能来看,Grok3相比各家基础模型,确实实现了一次明显跃升。
- 尽管Grok3的表现证明了Scaling Law仍然有效,但那张对比图存在一定误导性。AIME(数学)的蓝色与浅蓝色差距较大,如果不开启sampling,Grok3推理版的实际表现应与R1处于同一水平线。
一、领取xAI $150 API额度
详细的实测演示放在后面,先把马斯克送的羊毛薅到手。每月$15的API额度,只要Grok3的定价不离谱,日常个人使用完全足够。
操作步骤很简洁:
- 访问
console.x.ai,选择你习惯的登录方式即可。
- 在Payment Setting中填写Business details和Billing address。
- 点击侧边栏的Credits,在Prepaid credits里充值$5。
- 在同一页面点击
Share data——这意味着你将个人数据分享给xAI使用,每月可获得$150 credits。
二、基础编程
拿到API后,等着Grok3上线即可。发布会上关于数学和科学的展示直接使用了分数图表,因此这里从编程、物理模拟、DeepSearch和语音模式四个维度,进一步拆解Grok3的真实能力。
马斯克对AI游戏前景相当看好,直播中透露后续会打造一个AI游戏社区。现场演示时,他用Grok将《俄罗斯方块》与《宝石迷阵》融合,创造了一个全新的混合游戏。
这个思路颇具创意——不是简单复刻已有游戏,而是“创作”一个混合体。不过难度确实不小,直播过程中多次卡在思考环节。好在最后一次尝试,Grok3成功做出了demo。AI正确理解了元素融合:游戏规则不再是传统俄罗斯方块中“排满一行消掉一行”,而是融合了宝石迷阵的规则,三个同色方块凑在一起即可消除。这种理解能力,值得肯定。
三、物理世界模拟
除了做游戏,Grok3还尝试了近期热门的代码模拟世界。这次与SpaceX联动了一把——让Grok3生成一段飞行器从地球发射到火星再返回地球的3D动画。不过后续有人验证,按这个动画的参数,飞行器连地球都飞不出去……
那么,在2D维度下,Grok3的物理模拟表现如何?
至少从现有复刻结果来看,Grok3的编码能力并没有想象中那么强……Claude的含金量,还在持续上升。
四、UI很好看的DeepSearch
再聊聊DeepSearch。第一次听到这个名字时,第一反应就是:你们是真没新名字可用了吗?“Deep Search”和“Deep Research”来回用是吧?
名字虽然很OpenAI,但实际体验更偏向搜索,而非生成研究报告。现阶段AI搜索的核心在于信息源。根据此前体验Grok2的经验,Grok3加上X平台的信息源,确实能给OpenAI的AI Search带来实质性威胁。如果在额度上能再提升一些,$30的套餐也不是不能接受。
现场展示环节中,Grok3被要求预测NCAA疯狂三月赛事的胜负。这个活动是巴菲特2014年发起的,历史上无人成功过——连抄答案都找不到地方。
从实际演示来看,DeepSearch在UI上确实下了功夫。侧边栏有一个任务面板,可以实时监控正在执行的任务——与OpenAI Operator的侧边栏有些相似。
五、反复跳票的语音模式
语音模式真是一波三折。去年8月马斯克就预告要在24年底发布,结果一直拖到这次发布会前一个小时,还临时取消发布,改为未来一周内灰度更新。
发布会最后放了一段男声作为“画饼”,但时间太短,很难评价质量。期待一下中文语音的实际表现吧。
写在最后
马斯克这次发布会,对Grok的改动幅度非常大。此前我对Grok的定位是“有幽默感的AI,外加一个画人物图很准的功能”。但这次,基础模型、推理模型、语音模型、AI搜索全部装上了,基本追平了OpenAI的产品矩阵。以至于奥特曼在发布会前都有点坐不住——虽然没有发布新模型,但还是搞了个投票,计划后续开源“o3-mini层级的模型”还是“端侧模型”。
回顾时间线:2023年,马斯克发布33B的Grok 0,性能比肩70B的Llama 2;11月又发了Grok 1。2024年,发布了Grok 1.5和Grok 2,还有多模态模型Grok-1.5V。到现在Grok3,xAI的追赶速度确实很快。照这个节奏,马斯克大概不用再半夜惦记收购OpenAI的事了。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。