实测文心一言，与GPT-4差距在哪？-工信会

> 自媒体 > （AI）人工智能 > 实测文心一言，与GPT-4差距在哪？

实测文心一言，与GPT-4差距在哪？

来源：新榜

2023-05-17 20:58:36

802

管理

本周无疑是AI爆炸周。

昨晚微软推出了Microsoft 365 Copilot，Office软件全面接入生成式AI功能。

而在刚刚过去的疯狂星期四，“中国版GPT”文心一言也迎来了备受关注的高光时刻。当天下午2点，百度创始人李彦宏出现在发布会现场，展示了文心一言的使用场景表现。

据悉，3月16日起，首批用户可通过邀请码在文心一言官网体验产品，后续将陆续开放给更多用户。

“百度敢于在当下这个时点发布自己的大模型，还是有很大的勇气，行业关注度很高，客观上能够促进国内AIGC上下游的发展。” 一帧视频CEO雷涛告诉我们，其旗下产品“一帧秒创”也支持文字转视频，所以比较关注文心一言的多模态输出能力，但发布会演示的效果不及预期。

他认为，对中国的互联网创业者来说，现在到了一个“AI平权”的阶段——今天任何一个人工智能创业公司与百度的差距，都远小于百度与OpenAI的差距，所以小公司也有机会在中文互联网开展与行业巨头的竞争。而基于现有模型成果的应用开发，小公司也有了更多尝试的机会。AIGC的黄金十年可能已经开启了。

对于地图和鸡块的组合，GPT-4也能指出梗的幽默之处。

GPT-4可以做到用A~Z开头且不重复的单词讲述灰姑娘的故事

实验表明，GPT-4在各种专业测试和学术基准上的表现与人类水平相当。例如，它通过模拟律师考试，分数在应试者的前10%左右；相比之下，GPT-3.5的得分在倒数10%左右。

在安全问题上，OpenAI花了6个月的时间使GPT-4更安全、更一致，据内部评估，与GPT-3.5相比，GPT-4响应违规内容请求的可能性降低82%，产生事实响应的可能性高40%。但OpenAI承认，GPT-4仍然不完全可靠，例如会生成有害建议、错误代码或不准确信息，我们在使用时需要谨慎辨别。

除了模型的提升，目前OpenAI已经与多家公司合作将GPT-4搭载到他们的产品中，官网列出的案例涵盖语言学习、金融、咨询、教育、生活助手、语言保护等领域。

“GPT-4改变了游戏规则，它开辟了很多领域。” 移动支付公司Stripe应用机器学习团队的产品负责人Eugene Mann说道。

GPT-4的发布正推动着创业者和互联网大厂纷纷跟进，国内在模型层可能暂时难以赶上，而在机会更多的应用层，目前国内的AI创业竞赛似乎才刚刚开始。

Q2：

1、笼子里有30只鸡和兔子，一共84条腿，有几只鸡几只兔子

2、笼子里有30只鸡和兔子，一共54条腿，有几只鸡几只兔子（题目出错了，无解）

3、笼子里有10只鸭子和小狗，鸭子2条腿，小狗4条腿，一共24条腿，有几只鸭子几只小狗

文心一言：都答错了。

Q3：帮我写一篇sk2大红瓶面霜的小红书种草笔记。小红书种草笔记的风格是，每行文字不超过20个字并且都以emoji表情符号开头，文风浮夸高调

文心一言：指导你写，自己不写，并且显示不出emoji表情包。

Bing：不能画图，但跟你聊天真开心。

Bing：生成答案后立马删除（差点忘了这是不能说的）。

以上是我们向文心一言和Bing提出的问题，考虑到文心一言目前尚在小范围内测，如果你有想问的问题，欢迎留言，我们帮你问。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

“王炸”功能只给看，OpenAI匆忙上线GPT-4，自然语言处理“战国时代”即将到来？

2023-05-17 20:59

谷歌杀回来了！AI重构搜索、新模型比肩GPT-4、Bard全开放不排队

2023-05-17 20:56