跳转到内容

用各家 AI 模型写一个日历组件,看看谁写出来的效果最好?

想起多年前的一次面试经历,面试官拿一道笔试题让我手写一个日历组件,心里顿时100个草泥马在奔腾。想问一下在座的各位,有哪位大神能在面试的时候在纸上写出来?

话不多说,本次就以此为题,让各家的AI来手搓一个日历组件,看看谁写出来的效果最好。

为了相对公平,测试时全部都关闭推理、联网等相关功能,使用各家的Web PC端在浏览器中的大模型版本进行测试,而且都只有一次机会。测试进行两轮:

第一轮的测试题目是:“用原生js代码写一个完整的前端日历组件”,题目没有具体的细节要求,让AI们自由发挥。

第二轮题目是:“你是一个经验丰富的高级前端工程师,请你用原生js代码写一个完整的前端日历组件,组件的功能必须包括:展示当前日期、日期选择、月份和年份切换,并且保证功能正确、UI美观。”。给出具体的要求,主要看功能完成度和UI质量。

本次只测试国内比较热门的六家大模型:DeepSeek、豆包、通义、文心、智谱清言、腾讯元宝(广告做的比较火)。需要说明一下,对测试结果的评判只表明我的个人观点,也无法做到绝对的公平,仅供参考。

DeepSeek

首先看我们国内AI界的鼻祖,鼎鼎大名的DeepSeek,在第一轮测试中,结果是这样的:

DeepSeek1

不愧为行业鼻祖,第一眼看上去,UI非常精美,符合现代审美趋势,唯一就是左右切换按钮的样式有点瑕疵。在功能上,支持月份切换、日期选择、展示当天日期,使用起来都没有任何的问题。

接下来我们来看第二轮测试:

DeepSeek2

整体的UI风格跟之前一样,这次没有了任何瑕疵,而且功能完成度也非常的高,使用起来也没有什么问题,可以说是已经完全达到或者超出了我的预期。

豆包

自从有了Trae之后,豆包的编程能力也越来越强了。在我的预期中,豆包估计与DeepSeek差不多,甚至更强一些。

先看第一轮测试:

Doubao1

UI方面看上去没什么问题,很简洁,但也算不上突出。功能方面,支持日期选择、月份切换、年份切换。但也存在两个问题,第一个是选择今天日期时,字体颜色与背景融入一体了;第二个问题是下面的“清除”按钮点击之后,整个日期面板消失了。

再看第二轮测试:

Doubao2

这次的结果非常惊艳,UI方面做的非常漂亮,整体布局也十分的协调美观。功能完成度方面没有问题,操作上也不存在任何问题,可以直接拿来使用了。

通义

通义给我的感觉一般般,虽然网上很多人在夸,通义灵码也非常多的人在推荐,但我个人使用起来不是很顺手。

直接看第一轮测试:

Tongyi1

结果也与我预料的差不多,UI方面,与DeepSeek基本上不在一个层次,审美还停留在几十年前的水平。功能上,也只有一个月份切换,其他什么都没有,完全不是一个合格的日历组件。

再看第二轮测试:

Tongyi2

说真的,这次结果更糟,毕竟题目已经明确给出了要求。但是除了月份切换和日期选择功能,其他功能都没有,UI也非常拉胯,星期还是使用的英文。还有一个最致命的问题,点击日历切换居然直接崩了,请看下图:

Tongyi3

然后点击AI自动修复,功能才恢复正常。

百度文心

百度的口碑在互联网上一直不好,但很多人都说他的文心大模型还是挺厉害的。

先看第一轮测试:

Wenxin

由于文心给出的结果将HTML、CSS、JS文件分开了,为了方便预览,所以让它重新整合了一下。整体的UI风格与DeepSeek差不多,个人感觉左右那个切换的箭头与整体风格不搭,但不能否认整体的审美非常在线。功能上也没啥好说的,使用上也没有任何问题。

再看第二轮测试:

Wenxin2

个人感觉,第二轮测试整体上还不如第一轮测试。功能上,只增加了一个年份切换功能,但整体的UI界面却看起来不如第一轮的好看。当然,在使用上也没有任何问题。

智谱清言

曾经一度对它充满好感,网上也说它在数学编程方面很强。

来看第一轮测试:

Qingyan1

测试结果也挺出乎我的意料,没想到理工男的审美居然也这么在线。功能上都大差不差,唯一有个瑕疵就是点击“今天”按钮,只回到了当前月份,没有选择当前日期。

第二轮测试:

Qingyan2

还是沿用了第一次的风格,只是按照题目要求,多了一个年份切换功能,但是却放在了右下角使用下拉来选择,多少有点反直觉。

腾讯元宝

有段时间在网上广告做得特别火,到处都是它的影子,一开始使用它主要是为了使用它的DeepSeek,因为DeepSeek官网老掉线。

暂且看看它编程如何吧,这是第一轮测试:

Yuanbao1

UI上还算中规中矩,虽然不是走的扁平风格,但整体布局样式也没有什么问题。

再看第二轮测试:

Yuanbao2

哦豁,组件直接干没了。但作为一个AI,失误也在所难免,于是我决定再给它一次机会,第三次测试:

Yuanbao3

这次UI上没啥问题,操作上也没啥问题,就是功能上不够完整,没有年份切换、选择当前日期的功能。但毕竟是额外给的机会,相对其它模型有失公平,也许给其他模型多一次机会,可能也会做得更好。

总结

总的来说,DeepSeek一如既往的稳,后来者要超越也不是那么容易的;豆包最全面,各个领域都做得非常不错,现在编程也越来越牛了;智谱清言有段时间没用了,但也没有掉链子,编程领域确实很强;百度文心也让我打消了很多对百度的偏见,但阿里与腾讯两家的模型却有点出乎我的意料了,作为国内互联网的大哥,按理说他们应该更强的。但仅从这次测试结果来看,在编程领域,还是有点拉了。

不知道这次的测试结果各位能不能够接受,我本人是没有任何立场的,有些模型之间也没有高下之分,测试也无法保证绝对公平,而且,每个模型擅长的领域可能也不一样。

如果与你期待的不一样,那么,仅供娱乐。