“好吧,我去看看。”团长挂断了电话。
朋友云林说的这么厉害,也勾起了团长的好奇心。
电脑上搜索“小团子”,进入了官网。
“先看看是不是真的像云林说的那样,性能超过了gpt40。”团长心想。
他先尝试着让小团子写一个简单的程序,结果小团子很快就完成了,而且代码规范,逻辑清晰。
有点东西。
至少编程方面不比gpt弱。
接着,他又给小团子出了几道高难度的逻辑推理题,这些题目gpt40一样会出错。
然而,小团子却轻松地给出了正确的答案。
“哎呀,还真有点东西啊!”
团长开始认真起来,他决定接下来要对小团子进行一个更全面的测试。
只有全方面的测试,才能真正的评测出一个ai的能力。
团长测试过很多号称超过gpt的ai模型,有的刚开始确实会给人带来惊喜,但继续测试下去,就会发现各种问题,有的甚至是为了宣传效果,专门针对某些测试题进行了优化和训练,实际上并没有那么强大。
想到这里,团长打开了一个自己制作的专门用于测试ai性能的测试题库。这个题库包含了各种类型的题目,涵盖了语言理解、逻辑推理、数学计算、编程能力、图形识别等多个方面,难度也层层递进。
接下来,团长将测试题目一次全给了小团子。
几分钟后,小团子给出了全部的答案。
对照标准答案,小团子得到了85分。而同样的测试题,gpt40的得分只有75分。
“哇靠!”
团长激动的脸色红了,这个测试结果,他是没有预料到的。
小团子的得分竟然比gpt40高出了整整10分。
“这怎么可能?”团长既兴奋,又心里存疑。
深吸一口气,平复了一下激动的心情,决定继续进行测试。
他加大了测试的难度和广度,包括了英文、日文等多种语言的理解能力;进一步测试了小团子的逻辑推理和数学计算,以及多模态能力等等。
这一测试,就一直持续到了晚上八点。
期间,团长连晚饭都顾不上吃,完全沉浸在了对小团子的测试中。
连续测试了七八个小时,团长眼里有血丝,可他的精神是亢奋的。
经过了如此详细和全面的测试,他得出了一个让他自己都感到震惊的结论:
小团子在中文、英文等多种语言的理解能力,逻辑推理能力,数学计算能力,编程能力,以及图形识别、多媒体处理能力等多个方面,都全面超越了gpt40。
这个结果,要不是他自己亲自测试出来的,换做任何一个人告诉他,团长都绝对不会相信。
“国产大模型,居然真的超越了gpt!”团长喃喃自语,说话声音因为兴奋有些颤抖。
“先吃点东西吧,晚饭都没吃。”
团长的妻子端着一碗热气腾腾的面条走了进来。
“等一会儿,马上就好了。”团长手指飞快地在键盘上敲击,对测试视频进行最后的剪辑。
又过了一会儿,第一个测试视频剪辑完成。
团长迫不及待地登录了自己的b站账号,将视频上传并发布——《全面碾压gpt40!国产大模型“小团子”横空出世!》
作为b站上拥有百万粉丝的知名ai科普博主,团长在ai 科技圈的影响力不容小觑。
视频一经发布,立刻就引起了众多网友的关注。
“真的假的?国产大模型超越gpt40了?”
“楼主不会是在开玩笑吧?”
“期待!赶紧去试试!”
“我刚才测试了一下,‘小团子’确实很强,比gpt40好用多了!”
“支持国产!希望‘小团子’越来越好!”
……
有好奇的,有质疑的,也有兴奋的,还有已经测试过“小团子”并表示认可的。
评论区里,各种声音交织在一起,热闹非凡。
与此同时,苏阳刚冲完凉,从洗手间出来,一边擦着头发,一边对团团说道:“团团,汇报一下‘小团子’的最新情况。”
“爸爸,小团子的用户数量已经突破20万了。”
这个成绩苏阳自己是满意的。
真要说起来,gpt刚问世的时候,不到半个月的时间在全球积累了上亿的用户。
相比20万用户,还不够看。
苏阳也不急。
他相信小团子的实力,慢慢来。
“睡觉了,团团晚安!”苏阳打了个哈欠。
“爸爸晚安!”
熄灯,睡觉。