DeepSeek R1深度测评：推理能力碾压GPT-4？

AI教程
3月28日
编辑

看懂网小编

我用了两周DeepSeek R1，做了20组对比测试。结果发现：推理任务确实强，但某些场景还不如GPT-3.5。详细数据和方法分享给你。

DeepSeek R1深度测评：推理能力碾压GPT-4？

我用了两周DeepSeek R1，做了20组对比测试。结果发现：推理任务确实强，但某些场景还不如GPT-3.5。

1. 一、测试背景

DeepSeek R1发布后，很多人说推理能力碾压GPT-4。我很好奇，真的这么强吗？

于是我做了20组对比测试，涵盖数学推理、逻辑分析、代码编写、创意写作4个维度。

2. 二、测试结果

2.1 1. 数学推理（5题）

题目类型	DeepSeek R1	GPT-4
复杂计算	5/5正确	4/5正确
逻辑推理	5/5正确	5/5正确
应用题	4/5正确	5/5正确

结论：DeepSeek R1在复杂计算上略强，但应用题反而不如GPT-4。

2.2 2. 代码编写（5题）

测试了Python、JavaScript、Go三种语言。

DeepSeek R1：代码能运行，但注释较少
GPT-4：代码更规范，注释详细

2.3 3. 创意写作（5题）

让两个模型写文案、故事、邮件。

我的感受：DeepSeek R1的中文表达更自然，GPT-4的逻辑更严谨。

3. 三、我的判断

3.1 DeepSeek R1适合的场景

数学推理题
逻辑分析
中文写作
预算有限的用户（免费）

3.2 GPT-4适合的场景

代码编写
英文写作
复杂任务规划
需要稳定质量的场景

4. 四、费用对比

DeepSeek R1：完全免费（API有免费额度）
GPT-4：Plus会员20美元/月

如果你预算有限，DeepSeek R1完全够用。

5. 五、我的建议

日常用DeepSeek R1，省钱
重要任务用GPT-4，更稳定
两个都注册，根据任务切换

给TA打赏

共{{data.count}}人

人已打赏

用AI写公众号文章，从选题到发布全流程

2026-3-28 11:48:33

AI客服实战：3人团队如何处理日均500咨询

2026-3-28 11:48:52

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

1

百度家的AI工具——度加创作助手：从灵感到爆款只要一分钟
23年10月18日
2

葫芦娃AI网站：用最新AI工具科技化你的世界！
23年8月24日
3

6个完全免费的AI绘画网站，让你体验绘画新时代！
23年8月14日
4

推荐2023年5款最佳AI视频生成工具
23年8月17日
5

iThinkScene——让写作成为一种享受的AI神器
23年8月15日
6

GPT国内版免费入口 – GPT中文官网解决方案
23年8月15日

来自：

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部