
春节期间,DeekSeek大模型彻底火翻了天,让全世界震惊了一把!豆包也没闲着,更新发布了doubao-1.5-pro大模型,性能显著提升。除了玩玩两家各自推出的app之外,我也通过API接口分别接入了两家的大模型服务,通过对大模型答复内容和反应时间的对比,发现两家差异还是蛮大的。下面是一个具体实例,试验进行了多次,这里只是摘录了其中一次典型的对比情况。

第一张截图接入的是doubao-1.5-pro-32k模型,速度最快,当然它没有推荐具体的股票,解释了缘由,一般公共平台都会回避。推荐股票的回答用时16秒,回答自己是谁用时2秒。

第二张截图接入的是DeepSeek V3模型,它给出了具体推荐股票,也做了风险提示,符合相关规定。从满足用户意愿的角度说,它的表现应该是更好。但是推理耗时也明显增加,推荐股票的回答用时50秒,回答自己是谁用时8秒。值得注意的是,它竟然把自己认错了,以为自己是ChatGPT?可能是由于我用了OpenAI兼容接口来调用它吧,这个得要扣分啊!

第三张截图接入的是DeepSeek R1模型,它也回避了具体的股票,但是给出了股票的筛选规则,授人以渔啊,也不错。但相对而言,它的推理时间最长,推荐股票的回答用时59秒,回答自己是谁用时5秒,它也答对了。
为什么会做这个试验呢?由于我在做接口测试时,发现DeepSeek的两个模型推理速度都很慢,尤其是DeepSeek R1模型,回答一个普通问题一般需要30~90秒,常常造成我的前端程序超时,在我将超时时间设为2分钟后才算正常工作。我一度怀疑是提供模型服务的平台方分配的资源不足,但在平台上查阅相关信息,平台只是提供了接入服务,引用的是DeepSeek公司的模型,并非平台自己部署的模型(对这一点后续可能还需深入调查),那这么看就还是能够说明一些问题。
从应用程序功能的丰富程度来看,豆包app和豆包电脑版用得都超级顺手,DeepSeek app可以选择DeepSeek V3(默认情况)和R1模型(深度思考),主要就是提供推理服务,除此之外未开发其他功能。DeepSeek也有网页版(目前注册账号受到限制),还未开发电脑版。DeepSeek公司也表明了他们的重点是研发模型,而不是提供应用,定位清晰。这里对推理速度的比较,目的不是品评DeepSeek的产品,而是就实际使用体验来说,目前豆包app+电脑版要比DeepSeek好用。















暂无评论内容