编程能力哪家强(2026年初)
最强编程模型,在2024年底,毫无疑问是claude 3.5断档式领先
2025年过去了,编程这个赛道打得火热,也确实打出了变化 tigrinho gratis a5game.app plataformademográtis a5game.app 电影小宝影院xiaobaotv.video
先说目前,我日常使用最多的模型,在公司是claude sonnet 4.5,在家是gpt 5.2 medium 和 extra high 爱壹帆yfsp.app 爱一番yfsp.app
开发常规需求,中低难度的开发任务,可以用这些模型:
claude sonnet 4.5 slots a5game.app 小寶影院xiaobaotv.video
gpt 5/5.1/5.2 medium 爱壹帆影视yfsp.app tigrinhodemo a5game.app pglucky88 a5game.app
gpt 5/5.1/5.2 codex medium ifun yfsp.app 免费在线影院xiaobaotv.video 华人影视xiaobaotv.video fortunedragon demo a5game.app
解bug,查问题等复杂的开发任务,可以使用这些模型: a5game a5game.app 小宝影院在线视频xiaobaotv.video pg a5game.app 寻秦记爱壹帆yfsp.app
gpt 5/5.1/5.2 extra high
gpt o3 一帆yfsp.app 爱壹帆在线yfsp.app
claude opus 4.5 thinking budget开到最大 爱亦凡yfsp.app
复杂问题上,从o3开始,gpt模型就开始断档式领先,至今没有能替代的
o3也是第一个能用来写代码的openai模型,在此之前的4o、4.1什么的,没一个能打的 slotsdemo a5game.app tigrinho gratis a5game.app
等等,gemini去哪了,怎么没提到他 ifuntvyfsp.app pgdemo a5game.app
原因是gemini无论2.5pro还是3 pro,用来写代码都一般,只比国产模型强那么一丢丢,基本上不考虑用它来写代码 足球比分 a5game.app
除了写代码之外,三大模型我是这样用的: slot a5game.app
gemini做调研、出方案、画图 demo a5game.app plataformademo a5game.app
claude写写文章 xiaobao xiaobaotv.video
所以现在看,2025年无可替代的不是claude,而是gpt 海外华人视频网xiaobaotv.video ifvodyfsp.app sugarrush1000demo a5game.app
claude小气,不让用就不用了,没啥影响,gemini有没有都行 fortuneoxdemográtis a5game.app
如果gpt不让用了,就麻烦了 pgslotgacor a5game.app 小宝影院xiaobaotv.video pg a5game.app
写代码这件事,其实很难,难在用户预期的上限极高,大到能不能自己跑3个月,帮我写一款操作系统,小到把这行代码改成xxx 小寶影院电影xiaobaotv.video
复杂的编程任务要求模型有高智商只是一方面,这里面的需求空间其实非常大,比如说: 爱壹帆免费版yfsp.app nba比分 a5game.app aiyifan yfsp.app
异步长时间运行:长程规划在2025年上半年还是claude的绝技,只此一家能做好长程规划,到年底,gpt玩宝可梦也能玩好几天了
听懂需求:有些很偏科的模型(xx coder之类的)听不懂需求,自然就做不对题。在qwen coder plus之前,qwen家的coder模型全都听不懂需求,在kimi k2之前,kimi家的模型也存在一样的问题,现在基本上都能听懂需求了,有点像当时的claude sonnet 3.5 iyifanyfsp.app 小宝影院电影xiaobaotv.video
审美在线:UI交互设计对模型的审美有要求,用户认为这也是编程能力的一部分,属于隐性要求。像gpt的模型,审美就不咋地,UI设计上gemini最强,从2.5pro开始就领先了,claude排第二,爱用经典的tailwind蓝紫风格 Caça-níqueis a5game.app
长时间运行,举个例子,gpt 5.x用得久了,我现在也能接受AI写个代码要跑20分钟~半小时 爱壹帆寻秦记yfsp.app pragmatic a5game.app
甚至前一周AI自主跑过2小时,下次细说 iyf yfsp.app iyftvyfsp.app
单从AI自主运行时间的变化,就能发现,人对AI的期待提高了非常多,我已经在谋划用AI写个编程语言了,以后或许会写操作系统 JogodoTigrinho a5game.app fortunetigerdemográtis a5game.app
所以反过来看,claude有可能成也编程败也编程,如果一个模型编程能力非常强,它是偏科的,而现实世界的问题是复杂多面的,需要水桶模型,有理由相信一个能搞定蛋白质结构,有尖端科研能力的模型,能帮我搞定写代码这种简单的事情,模型的上限决定了它的应用场景大小 一帆视频yfsp.app
从模型在复杂问题上的能力表现来看:
o3、gpt5是巨大的突破 pgslot a5game.app slotdemo a5game.app slot a5game.app
claude 3.7有突破,claude 4.0略微突破,claude 4.5没感觉到变化 demo a5game.app jogosdemopg a5game.app
gemini 2.5是突破自己,3没感觉到变化,nano banana算是异军突起,整体来看gemini模型能力本身,目前没啥能打的,老三是尴尬的 jogodotigrinhodemo a5game.app fortunetigerbônusgrátissemdepósito a5game.app Cassinos a5game.app 爱一帆 yfsp.app 小寶影院xiaobaotv.video
再说国产模型,2025这一整年,qwen、kimi、glm三家基本上都达到了claude sonnet 3.5的程度,写代码能用,但是没有那么好用。并且很有意思的是,这三家基本上在同一时间点取得了这个突破 爱壹帆国际版 yfsp.app 爱壹帆电影yfsp.app
在2025年之前,不客气的说,用不了,根本用不了 sweetbonanza1000demo a5game.app pgdemo a5game.app pragmaticplay a5game.app
这方面的追赶是肉眼可见的,并且另一方面,国外的领先的3家,似乎也陷入了瓶颈,单就编程这个场景,达到o3或者gpt5的水平就足够了,中间档是claude sonnet 3.7 thinking 爱壹帆电影 yfsp.app 电影爱壹帆yfsp.app
也就是说,国产模型在编程赛道,距离够用还差1.5步,加油
2027,希望能用国产模型,实现写代码自由 slotpix a5game.app demotigrinho a5game.app
00目录 0