数据:xAI将使用推特数据进行训练马斯克不希望在 AGI 领域只有一个公司主导,而是有所竞争。当前,xAI才刚刚起步,目前还处于非常初级的阶段,需要一点时间才能真正推出有用的东西。而在还没有对模型进行训练的阶段,先找到训练数据的来源是当务之急,数据的质量也决定了未来模型效果和产品的质量。在直播中,马斯克表示,人类创造的数据总有一天会用完,因此人工智能最终将生成内容并访问。而鉴于很多人工智能的软件开发人员广泛使用 Twitter 的数据,马斯克表示,“我想我们也会使用公共推文(显然不是任何私人推文)进行训练,就像基本上其他人一样。”上周五,马斯克在没有援引任何证据的情况下声称,“地球上的每个人工智能组织”都使用了 Twitter 的数据进行训练,“在所有情况下都是非法的”。在本月初,Twitter 更是起诉了四个身份不明的团体窃取了数据。最近几周,推特更是实施了速率限制,马斯克声称,这是因为推文正在“被疯狂地爬取”。他说:“有多个实体抓取了曾经发布的每一条推文,并试图在几天的时间里完成这一点。所以这让系统崩溃了,我们必须采取行动。”
同时,马斯克还表示,推特的数据集将被用于“文本训练”和“图像和视频训练”。他还指出人工智能系统需要的不仅仅是人类创建的数据,他希望 xAI 能够追随 Alphabet 旗下 DeepMind 的 Alpha Zero 的脚步,在训练结束后,能够通过与自己进行这些游戏来进行自我训练。此外,xAI 的初衷是开发“理解物理世界而不仅仅是互联网”的技术,因此马斯克认为特斯拉的驾驶数据也将在这方面有所帮助。算力:xAI将和特斯拉密切合作哪怕强如马斯克,在组建AI初创公司时,也难逃算力焦虑。有消息称,马斯克试图从老黄那边求购4万张用于训练AI的GPU,但最后英伟达只承诺在1年内提供2万张卡供其使用。在直播中,特斯拉的铁杆粉丝兼推广人奥马尔·卡齐向马斯克询问了 xAI 是否有可能使用英伟达或特斯拉制造的芯片进行数据处理。而马斯克称,xAI将会与特斯拉密切合作,共同开发人工智能软件,“这种关系互惠互利,可能加速特斯拉在自动驾驶方面的能力”。同时,他表示特斯拉正自研芯片,但绝不会叫做GPU,或用100s、H100s等来描述它。马斯克也曾在公开演讲中直言,尽管人们一般将它和GPU等价看待,但特斯拉的Dojo不是GPU,而是特斯拉在为机器学习和计算机视觉训练而开发的超级计算机。在周末的直播中他还表示,Dojo2将向大模型方向发力。算法:xAI 最终的模型不会“人云亦云”在算力和数据这两方面,和人才的关系并不算太大,但在算法领域,人才的重要性则不言而喻。据semafor透露,马斯克给团队中顶级研究员的薪酬,高达9位数,如果按照传言的200亿估值来算,那么在初创阶段的分给核心技术人员的1%股票期权,就相当于2亿美元。同时,xAI 的团队成员在直播中提到,行业当前的 AI 模型只是模仿它们所训练的数据,而他们真正想要做的是改变这种模式,让模型能够发现真相,不仅仅是重复模型从训练数据中学到的知识,而是能够提供真正的新见解、新发现。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体103523