首页 > 法治

【环球时快讯】GPT-4是8x2200亿参数的混合模型?这个小道消息今天传疯了

来源:机器之心Pro 时间:2023-06-22 16:40:58

机器之心报道

编辑:吴昕


(资料图片)

George Hotz:除了苹果之外,大部分公司保密的原因都不是在隐藏什么黑科技,而是在隐藏一些‍「不那么酷」的东西。

「GPT-4 的参数量高达 100 万亿。」相信很多人还记得这个年初刷屏的「重磅」消息和一张被病毒式传播的图表。

不过很快,OpenAI 的 CEO Sam Altman 就出来辟谣,证实这是一条假消息,并表示,「关于 GPT-4 的谣言都很荒谬。我甚至不知道这从何而起。」

实际上,许多人相信并传播这样的谣言是因为近年来 AI 社区不断在增加 AI 模型的参数规模。谷歌在 2021 年 1 月发布的 Switch Transformer 就把 AI 大模型参数量拉高到了 1.6 万亿。在此之后,很多机构也陆续推出了自己的万亿参数大模型。据此,人们有充分的理由相信,GPT-4 将是一个万亿参数的巨量模型,100 万亿参数也不是不可能。

虽然 Sam Altman 的辟谣帮我们去掉了一个错误答案,但他背后的 OpenAI 团队一直对 GPT-4 的真实参数量守口如瓶,就连 GPT-4 的官方技术报告也没透露任何信息。

直到最近,这个谜团疑似被「天才黑客」乔治・霍兹(George Hotz)捅破了。

乔治・霍兹因 17 岁破解 iPhone、21 岁攻陷索尼 PS3 而闻名,目前是一家研发自动驾驶辅助系统的公司(comma.ai)的老板。

最近,他接受了一家名为 Latent Space 的 AI 技术播客的采访。在采访中,他谈到了 GPT-4,称 GPT-4 其实是一个混合模型。具体来说,它采用了由 8 个专家模型组成的集成系统,每个专家模型都有 2200 亿个参数(比 GPT-3 的 1750 亿参数量略多一些),并且这些模型经过了针对不同数据和任务分布的训练。

在这段播客播出之后,PyTorch 创建者 Soumith Chintala 表示自己似乎听过同样的「传闻」,很多人可能也听过,但只有 George Hotz 在公开场合将其说了出来。

「混合模型是你在无计可施的时候才会考虑的选项,」George Hotz 调侃说,「混合模型的出现是因为无法让模型的参数规模超过 2200 亿。他们希望模型变得更好,但如果仅仅是训练时间更长,效果已经递减。因此,他们采用了八个专家模型来提高性能。」至于这个混合模型是以什么形式工作的,George Hotz 并没有详细说明。

为什么 OpenAI 对此讳莫如深呢?George Hotz 认为,除了苹果之外,大部分公司保密的原因都不是在隐藏什么黑科技,而是在隐藏一些「不那么酷」的东西,不想让别人知道「只要花 8 倍的钱你也能得到这个模型」。

对于未来的趋势,他认为,人们会训练规模较小的模型,并通过长时间的微调和发现各种技巧来提升性能。他提到,与过去相比,训练效果已经明显提升,尽管计算资源没有变化,这表明训练方法的改进起到了很大作用。

目前,George Hotz 关于 GPT-4 的「爆料」已经在推特上得到了广泛传播。

有人从中得到了灵感,声称要训练一个 LLaMA 集合来对抗 GPT-4。

还有人说,如果真的像 George Hotz 说的那样,GPT-4 是一个由 8 个 2200 亿参数的专家模型组合的混合模型,那很难想象背后的推理成本有多高。

需要指出的是,由于 George Hotz 并未提及消息来源,我们目前无法判断以上论断是否正确。有更多线索的读者欢迎在评论区留言。

相关稿件

【环球时快讯】GPT-4是8x2200亿参数的混合模型?这个小道消息今天传疯了

焦点快报!荆门市首届潮玩运动休闲大会今日落幕

快乐8第23163期丁火分析 全球观点

国家外汇管理局:1-5月外汇市场累计成交101.87万亿元

《蛋仔派对》终身认养大熊猫,携手繁育国宝,保护蛋仔在行动

天天播报:浅谈以文化建设引领新时代乡村振兴

男子出门买早饭,结果在杭州一绿化带迷路四天三夜…… 当前焦点

后室游戏爱好者的福音——Escape the Backrooms

天天报道:千年手游剑雨如歌:大佬想“挣钱”搬砖打金必玩

当前速看:广东加速建设现代化产业体系,助推经济高质量发展继续走在前列、当好示范

十个步骤教你挽回分手(4)

航班号是啥 航班号是啥意思

“小英说理”入民心 海口秀英区禁毒主题微宣讲活动举行[图]

什么是结构的模态分析 什么叫结构模型 环球快播

当前快播:薄荷奶绿怎么做 薄荷奶绿怎么做好吃

影响联盟格局的五大交易:热火勇士功成名就,篮网森林狼失算,太阳豪赌_全球新要闻

端午诗草[七律]_全球热讯

环球微动态丨图解阳宅大全

三方交易失败,凯尔特人还没放弃波神,快船有顾虑,卡椒让人担忧

EDG找到更适合的打法,放弃四保一效果显著,UZI展现强大压制力 全球速讯

沙特媒体:洛佩特吉和阿莱格里是利雅得新月主帅候选

当前速递!清理腋下的毛的方法 怎样清除腋下的腋毛

多氟多新材料董事长李世江:要把能源体系放在智能制造体系基础上才行-全球聚焦

热点评!“天宫”空间站电推进发动机首次实现在轨“换气”

固态电池冲刺上车还需加把劲_环球热消息

延庆旧县镇 赏非遗表演摘应季鲜果

女人吃藕的好处(为什么说男不离韭,女不离藕)_世界热文

农村养殖清虾(养殖青虾)|全球微头条

谷歌指控微软Azure违反市场竞争_热点聚焦

6月21日基金净值:景顺长城沪深300指数增强A最新净值2.116,跌1.31% 全球快资讯