> 自媒体 > (AI)人工智能 > 国产版GPT清醒点,“胡说”没关系,烧得起算力才是王道,这场大会寻出路……
国产版GPT清醒点,“胡说”没关系,烧得起算力才是王道,这场大会寻出路……
来源:上观新闻
2023-05-03 17:26:32
603
管理

这本是一场信息化企业家协会的换届选举,部分正在全国乃至全球各地洽谈业务的企业家们本难以到场,却不惜中途赶回上海,除了要投出心目中的会长人选之外,更是冲着大会专题论坛聚焦的“GPT大语言模型的应用和机遇”主题。22年前作为大学生创业的上海联合麦通CEO陈哲敏抢到了第一个提问GPT业内大咖的机会。他的公司多为世界500强企业提供客户管理服务,有着规模达3000人的外包呼叫中心。陈哲敏着急的是,大语言模型对通用常识和专业问题的解答存在巨大差异,我们距离真正的专业垂直场景应用还要走多远?

这并非陈哲敏一家的困惑。达观数据创始人陈运文也早已关注到,如果问ChatGPT一些专业问题,它的回答往往东拉西扯,说不到重点或不够深刻。

但此类“一本正经胡说八道”,并不能掩盖GPT巨大的技术突破和出色表现。难能可贵的是,在GPT背后,由埃隆·马斯克创立的OpenAI人工智能研究实验室,曾承受多年孤独,坚守一条最冷门的技术路线并最终跑通。

陈运文介绍,目前,全球绝大部分大语言模型都使用了由谷歌提出的Transformer基础组件结构,并走出了Encoder、Decoder、Encoder-Decoder三条技术路线。第一条路线擅长语义理解型任务,训练代价小、效果显著,故而一度领先。采用这一路线的谷歌BERT模型当年也曾风光无限;第二条路线对知识的提炼和写作能力强,但算力、数据成本极高,效果也曾长期落后,仅OpenAI“一意孤行”,好在得到微软支持,最终跑赢;技术路线三则尝试将路线一和二相结合,目前仍在摸索阶段。

在国内,近期多个国产AI大模型竞相官宣,包括阿里“通义千问”、商汤“日日新”、复旦“MOSS”、百度“文心一言”、清华大学“ChatGLM-6B”等。达观数据也推出了国产GPT系统“曹植”系统,面向金融、政务、制造领域推出类似微软Copilot的“达观助手”,帮助用户更好地进行文字自动化撰写、审核、排版等。在陈运文看来,国产AI大模型“大乱斗”反倒是好事。“大家走的技术路线相似,但用到的数据参数和规模训练方式有所差异,各家可结合业务优势,专注于构建垂直、专用领域的大语言模型。”

这其实也间接回答了上海联合麦通陈哲敏的问题——针对外包呼叫中心的功能鲜明的专业大模型已在路上。

2016年,英伟达创始人黄仁勋就向OpenAI捐赠了超级计算机DGX-1,此举大大提升了OpenAI的算力。

在此次会议上,上海市信息化企业家协会完成换届,上海龙软电子集团有限公司董事长戴剑飚连任第三届理事会会长。

上海龙软电子集团有限公司董事长戴剑飚连任第三届理事会会长。(供图)

据悉,上海市信息化企业家协会于2014年4月在市经信委指导下成立,集聚了大批信息产业领域资深企业家和创造者,在助力上海推进城市数字化转型进程中发挥独特作用。未来五年,上海数字经济核心产业增加值占全市生产总值的比重将提高到18%。

来源:作者:李晔

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文
嘻疯 发自 凹非寺量子位 | 公众号 QbitAI刚刚,NeurIPS 2025最佳论文奖、..
阿里千问开源4款Qwen3.5小尺寸模型,满足资源受限至轻量应用不同需求..
【太平洋科技快讯】3月3日消息,阿里千问近日开源四款Qwen3.5更小尺寸模..
实测Qwen3.6-27B:4分钟做了个跑酷游戏,验证码识别正确率超90%..
它用时四分钟左右,写完了1200多行代码。从实测结果来看,游戏设计与前端..
阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队..
衡宇 发自 凹非寺量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具..
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus..
衡宇 发自 凹非寺量子位 | 公众号 QbitAI三天不开源,Qwen团队手就痒。昨..
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒
全球最快的开源大模型来了——速度达到了每秒2000个tokens!虽然只有320..
激活170亿参数 Qwen3.5实测 重构大模型性价比逻辑
2月16日Qwen3.5正式开源,以3970亿总参数、仅170亿激活参数的架构实现性..
Qwen最新闭源模型曝光!实测夸克“对话助手”
10月23日,阿里旗下夸克正式上线“对话助手”。从界面上看,它像是“塞进..
林俊旸离职后,Qwen的变与不变
来源:视觉中国OpenAI早期也曾采用垂直整合的架构模式,并集中资源完成了..
关于作者
乖乖(普通会员)
文章
1968
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106516

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索