阿里大模型敢对标GPT-3.5？我们让GPT-4给它上了点强度-脚本导航

> 自媒体 > （AI）人工智能 > 阿里大模型敢对标GPT-3.5？我们让GPT-4给它上了点强度

阿里大模型敢对标GPT-3.5？我们让GPT-4给它上了点强度

来源：差评

2023-05-03 18:43:01

495

管理

疯了疯了，大语言模型又迎来一位参赛选手，它便是阿里巴巴版本的 GPT —— 通义千问。

通义千问，写了一大堆，但最终没能写完整个代码，我们尝试让它继续也没能成功。文心一言的结果也差不了太多，就实现了个按钮。。但是 ChatGPT 非常优雅地实现了这个功能。

看来国内的不管是通义还是文心，在代码这块都远远逊色于 ChatGPT。

测完了代码我们又尝试测了一下 3 个AI 的数学能力，用的还是经典问题“ 青蛙跳井 ”。

通义千问直愣愣地掉进了我们挖的坑。ChatGPT 好像识别了这个陷阱，但搞混了几个数字，最终还是做错了。而文心一言，简洁明了一个公式就答对了问题。看到这里，大家估计对通义也有个大概的了解了。

新比赛我们让目前在 AI 赛道的领头羊 GPT-4 出面，让它决定哪些维度最能衡量模型好坏，该怎么出题、怎么打分都让它来。

简单说就是让 GPT-4 当出卷人、阅卷人，通义千问和文心一言当考生

（下文大 G 指 GPT-4，小通指通义千问，小文指文心一言）。

至于 ChatGPT，由于它作为大 G 的关系户，为了保证考试公平公正，直接被红牌罚出场。不得不说，大 G 的出题水平还是相当高的。

除了测试的第 6 题，凭空捏造了个“ 人工智能伦理问题的论文 ”外，几乎找不到什么问题。

下面节选了几个有代表性的问答（左滑显示小文）：

说实在的，虽然在经过了几波 GPT 们的冲击，这次通义千问还是给我带来了不少惊喜的。

而且，我们简单用了一段时间后也发现，目前通义千问的潜力显然没有被挖掘完全。

在很多没有展示的测试里，通义千问在第一次回答里是错误的，可如果你多尝试生成两次，就能奇妙地发现它是能回答正确的。

我们猜测这是它的权重并没有被调教好，而在关于正确答案的赋权上，是个非常快速就能迭代更新的，一旦不断迭代量变，很快就能引起质变。

所以等后期通义千问开放使用后，大家一定不要吝啬点赞反对，这能帮助 GPT 们更快地进化，更好地服务大众。

而在 AI 大模型的落地上，阿里似乎有种后发先至的势头。

不少差友们可能已经看到了，前几天，我们已经评测过通义千问轻量版在天猫精灵上的演示应用，虽然是一个定制化轻量版，但可能是因为多了联网，两者使用起来几乎一样。

更强的是例如我让它推荐杭州的美食，它不仅和我认真地聊了起来，甚至还真的想要帮我去订一个外卖。。。

这么看起来，我几乎已经能看见通义千问重塑我们生活的样子了。

这两天，通义千问背后的负责人，阿里云智能CTO周靖人接受采访时说，通义千问模型只是“ 一个中间态 ”，“ 不是起点也不是终点，是个既定路线上的节点。”

这想象空间就太大了。假如再把格局打开一点，AI 借助像水电一样的云计算，会不会把我们想到想不到的行业，都重新升级一遍呢？

这么看来，前段时间我们聊过的组织架构大调整，现在想想，怕不就是为了云服务和 AI 布局？

站在这个历史性的时刻上，虽然我看不清未来到底是什么样子，但我很期待它的到来。

1

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

GPT-4来袭，代码工具还是人类威胁？

2023-05-03 18:44

让你从0开始认识GPT-4AI

2023-05-03 18:41

相关文章

GPT-4突然变笨，OpenAI迅速回应，这背后隐藏了什么？

例如，有人在使用GPT-4进行对话的几小时，都没能解决代码问题。然而，转..

老公和谁微信聊天最频繁？如何查找？只用打开这里立马就看到..

你知道你老公和谁微信聊天最频繁，聊天最火热呢？只需要打开微信的这个开..

苹果开发GPT聊天机器人的消息传出后公司值增加了 710 亿美元..

苹果公司目标通过自己的聊天机器人成为 OpenAI 的 ChatGPT 未来的竞争对..

协作机器人步入AI时代！越疆机器人+ChatGPT到底多聪明？..

ChatGPT 无疑是今年最出圈的科技热点，和之前我们认知中的 AI 不太一样，..

外贸4.0时代来了！FOBGOODS启动AI智能GPT，助力跨境电商新篇章！..

相信最近已经很多伙伴已经听闻消息，美国OpenAI研发的聊天机器人程序，于..

17 天狂赚 270 万，ChatGPT 是新型印钞机？

2023 年最有搞头的副业来了，轻松月入 10 万加，17 天狂赚 270 万，低成..

ChatGPT刺激对芯片需求全球AI芯片竞赛不断升温

【CNMO新闻】近段时间，由人工智能（AI）实验室OpenAI发布的对话式大型语..

男女首次见面如何聊天?这四个约会话题，能让气氛融洽..

嘿！你好啊！我是老周心灵感悟，欢迎来到我的情感空间，今天的你过得还好..

微软Teams融入游戏属性：新配套应用增强玩家聊天交流..

IT之家 8 月 17 日消息，微软近日在 Microsoft Store 上架了一款新工具，..

关于作者

仓莫以北(普通会员)

文章

677

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

2023/08/26

标签云

成员 网址收录40369 企业收录2981 印章生成216707 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved

浙ICP备19035174号-7

1

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索