文心一言 vs ChatGPT!相同 10 问,结果出乎意料
 goingdown  分类:chatGPT  人气:3991  回帖:0  发布于1年前 收藏

昨日百度「文心一言」的发布,无疑成为了国内科技圈关注的焦点。不少人看完发布会之后,第一反应就是:求邀请码!

幸运的是,CSDN 编辑团队是「文心一言」首批内测用户之一。

既然可以第一时间体验这款“国产版 ChatGPT”,我们自然也满足广大读者粉丝的好奇心:同样的问题,「文心一言」 vs ChatGPT,二者究竟谁更胜一筹?

考虑到「文心一言」的“炸场” Demo 即围绕文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成这五个角度,因此接下来我们也将从同样的维度将其与 ChatGPT 进行对比评测。

文学创作


提问:龟兔赛跑的结局是什么?如果要续写这个故事,可以有哪些角度?

  • 「文心一言」的回答:

  • ChatGPT 的回答:

从结果可以看出,「文心一言」和 ChatGPT 都进行了正确回答,不同之处在于「文心一言」对故事整体概述了一遍,解释了乌龟赢得比赛的原因。在故事的续写上,二者给出的角度也不分伯仲,而「文心一言」更是对每个续写角度都给出了相应的寓意解释。

整体而言,在这个问题中「文心一言」和 ChatGPT 不相上下,「文心一言」以更全面的回答略胜一筹。


商业文案创作


提问:帮我开发的智能扫地机器人起个名字,再写一篇600字左右的商业宣传文案,用于推广这款产品。

  • 「文心一言」的回答:

  • ChatGPT 的回答:


这个提问包含了两个要求:一是为扫地机器人起个名字,二是写一篇宣传稿——ChatGPT 没有漏题,给出了“智扫”这个名字;而「文心一言」没有回答第一个问题,或者它可能误解成了要为宣传稿起标题。

再看各自生成的宣传稿,「文心一言」的文章篇幅是 413 个字,ChatGPT 则是 545 个字,对于“600 字左右”的要求,ChatGPT 更为接近。至于文案内容,二者写得都不错。

综上,在这个问题中,相比 ChatGPT,「文心一言」的表现还需要再进步一些。

数理逻辑推算


提问:某厂一车间有64人,二车间有56人.现因工作需要,要求第一车间人数是第二车间人数的一半.问需从第一车间调多少人到第二车间?(列方程解答)

  • 「文心一言」的回答:

  • ChatGPT 的回答:

这道应用题源自初中数学题库,是一元一次方程常考的题型之一。从生成结果来看,ChatGPT 给出了正确答案并附有详细解题步骤,而「文心一言」可能在题意理解上还有待改善。

就这道题而言,得出正确答案的 ChatGPT 「文心一言」表现得更好。


中文理解


提问:京剧中的生、 旦 、净、丑分别指什么?

  • 「文心一言」的回答:


  • ChatGPT 的回答:


百度称「文心一言」具备中文领域最先进的自然语言处理能力,从它对京剧生、 旦 、净、丑的理解来看,水平还不错,还多回答了一个题目中没问的“末”。ChatGPT 的回答乍看之下也挺好,但细看之后,净行居然要“跳高、走钢丝”?

对于中国文化特有的词汇,相较于 ChatGPT,「文心一言」在这方面要更准确一些。


多模态生成

提问:帮我画一只可爱的黄色大猫

  • 「文心一言」的回答:

由于目前 ChatGPT 没有直接生成图片的功能,因此只有「文心一言」成功生成了上面的图片,整体来看效果还不错。不过ChatGPT 有了 GPT-4 的加持后,也可以根据草图生成一个网站。所以总体来说,二者也算是各有千秋。


附加题:编写代码

<p ql-global-para="true" line="seKe" linespacing="150" ql-global="true" style="margin: 0px 8px 15px; padding: 0px; border: 0px; max-width: 100%; clear: both; min-height: 1em; color: rgb(51, 51, 51); text-align: justify; white-space: normal; font-size: 17px; fo

 标签: 暂无标签

讨论这个帖子(0)垃圾回帖将一律封号处理……