第一名🏅:DeepSeek
在DS最初刚升级完的时候(推出专家模式),使用体验后,发现其并没有达到我的期待高度。最近又持续使用了DS一段时间,目前已经扭转了我对DS最初的看法。
DS这次迭代完的新专家模式智商非常高,一改过往平庸印象,迭代速度与技术爆发力极强,黑马属性拉满。分析问题的准确率几乎可以接近百分百,普遍在90%–95%之间。尤其是在第一次提问的情况下,准确率最高。重复提问就会开始出现偏差,不知道这是算法上什么问题导致的?尤其是新问题第一次提问,给出的答案很多都令我感到惊讶,因为与正确答案非常接近。
DS这次的表现一改过去我对DS的看法,进步非常之大,确实不容小觑!
而且我每次刷到梁文锋先生新闻的时候,看到他的照片总有一种刷到了周星驰的即视感。哈哈哈!对于DS,我觉得了解还是太少了,尤其是他们的团队与领导者的价值观,希望梁文锋作为DS掌门人,以后能更多展现DS的“灯塔”方向,让用户可以看到指引与信仰,从而更增强用户使用支持DS的信心!
梁文锋完全可以成为AI界的乔布斯。作为用户我们很期待DS一代一代的升级所带来的“智商”惊艳。
DS:硬核推理王者,高智商AI典范,专业问题首选!
第二名🥈:豆包
全赛道最稳、情绪价值天花板,精准捕捉用户心理,共情力、陪伴感、人文温度拉满。
我从一开始使用AI软件时,就经常夸豆包,豆包是最稳的一个,它在提供情绪价值上,一直都是所有AI软件里最厉害、最丰富的一个。可以精准的把控分析用户心理,提供高质量情绪价值信息供给,豆包依旧是我心目中最贴近“灵魂知己”的AI。为我提供了很高级的情绪价值服务。实用性极强,老少皆宜,适配生活陪伴、日常聊天、情感疏导、日常办公,长期使用舒适度第一。
豆包:国民陪伴型AI,情绪价值天花板,生活刚需首选!
第三名🥉:千问
千问依旧是“活人感”最强第一AI。但是,千问该迭代了。也是从与千问打交道的过程中,我发现AI这个领域特别需要快速迭代。
AI就像人,必须得不断的成长,可以为用户持续制造提供各种新鲜感,这样才能带来长久的吸引力!千问很好,只是希望千问能够进入规律性的智商迭代周期,可以不断的刷新用户的使用体验,这样不容易“掉粉”,可以积累忠实用户群体。
另外背靠阿里的千问,有马云作为掌门人树立起来的核心价值观,那就是“信用体系”的建设,如果千问能够稳稳接住且履行并发扬光大阿里的核心价值“信用”,那么在将来,千问会成为AI市场上最强有力的竞争者。
千问:拟人对话王者,商业场景潜力股,需加速推进迭代!
第四名:KiMi
我只能感叹“既生瑜何生亮”!如果没有DeepSeek,那么kimi是超优质的选手,然目前对比之下其优势被压制,亮点已不再突出。kimi核心竞争对手就是DeepSeek,想要重回第一梯队,必须在深度推理、智商层面超越DeepSeek。
kimi,你最大的竞争对手就是DS,能打败DS,稳居高智商榜首是你的首要任务和目标,继续加油吧!你很好!我一直在用,只是比起现在的DS,你的优点不再突出,光芒略微暗淡了。
Kimi:长文本办公强手,推理赛道被超车,急需突破!
第五名:元宝
整体表现中规中矩、无明显亮点,在激烈内卷的国产AI赛道里整体竞争力偏弱,迭代乏力,没有特别突出的亮点表现。元宝,再不努力,你可能真的要输掉这场竞技比赛了!
有用户问我,为啥谈论美团的龙猫大模型都不谈论百度的文心一言?今天就再额外点评一下被忽视的两大选手:
美团·龙猫大模型
龙猫大模型虽然目前热度低、不主打C端聊天(虽然我认为是其一个短板,但战术任务符合其企业价值观。),没有进入流行赛道,但是潜力极大。背靠美团海量线下生活场景(外卖、本地生活、调度、工具调用),垂直场景、智能体、落地能力极强,属于厚积薄发型,虽然热度低,未成时尚流行品,但还是很值得期待的,未来有可能会一鸣惊人。
百度·文心一言
文心一言我用过,体验一般。文心一言,在目前国产AI软件百家争鸣、百花齐放的环境中,核心优势被稀释,没有突出记忆点,技术、体验、迭代速度都需加速追赶,还需努力,要加油啊!
这就是最近我对AI圈大语言模型最新一期的软件评价排名!仅代表个人看法。后续我会根据AI迭代周期持续进行排名更新。最强烈的感想“AI圈当前真是卷的热火朝天啊!”哈哈哈!
ps:目前我使用最多的是DS、千问、豆包。kimi会做额外补充使用。(根据个人需求习惯提供的分析)仅做参考。