Grok4.20虽然在性能上远不及Gemini和GPT-5.4，却在零幻觉表现上刷新了新的纪录-66安卓网

首页 → 热门资讯 → 软件教程 → Grok4.20虽然在性能上远不及Gemini和GPT-5.4，却在零幻觉表现上刷新了新的纪录

xAI的Grok 4.20在基准测试中未能赶上顶级AI模型的水平，不过其幻觉现象比其他测试过的模型都要少。依据Artificial Analysis的数据，开启推理功能后，Grok 4.20 Beta的智力指数为48分，这一分数远低于Gemini 3.1 Pro Preview和GPT-5.4的57分，但相比Grok 4还是提高了6分。

xAI推出了三种API版本：包含推理功能、不含推理功能以及多智能体模式。该模型拥有200万代币的上下文窗口，费用为每百万代币2美元或6美元；相比Grok 4价格更低，在西方同类模型中定价具备竞争力。

Grok 4.20最显著的特点在于事实的可靠性。在AA全知测试中，经人工分析，其非幻觉率高达78%，创下了新纪录。该测试衡量的是模型编造答案的频率，而非承认自身无知的情况，同时还结合了事实回忆能力的考察。Grok 4.20仅有五分之一的答错情况是因无法给出答案导致的。

相关资讯

相关下载

浏览排行

游戏攻略: 更多+

1《蓝色星原旅谣》这款游戏里都有哪些职业可以选择呢？ 2《王者荣耀世界》伽罗技能全展示 3《生存33天》警长角色玩法攻略 4《洛克王国世界》兽花蕾技能教学全解析 5《漫威争锋》死侍女仆造型现已正式公布 6《原神》与脆脆鲨联动活动正式开启，欢迎分享相关内容 7《王者荣耀世界》战令系统详情说明 8《蚂蚁新村》4月9日今日答案已更新