当前位置: 首页 - 手机 - 科技部官方网站首页GPT高仿系列开源自主训练能力达GPT-3水平

科技部官方网站首页GPT高仿系列开源自主训练能力达GPT-3水平

2024-12-03 手机 0

萧箫,凹非寺量子位报导

虽然GPT-3未曾开源,但已有人模仿其模型。

慕尼黑工业大学的Connor Leahy仅需200小时、6000元人民币便复现了GPT-2。

因此,理论上可训练与之规模相当的模型,但硬件问题尚待解决。

若能成功,计划首先从谷歌请求资源;如不获,则再探其他途径。

在TPU或GPU上训练方法有所不同。TPU环境下需注册谷歌云平台、创建存储空间和虚拟机,将模型放至TPU进行训练。而GPU则可直接进行,无需设置云端环境。

此外,可利用谷歌Colab免费获得TPU-V8S处理器,以1.5B参数版本(GPT 3XL)轻松完成训练。指定硬件名称及数量后,便可开始模型训练。

然而,对于复现项目,有人持怀疑态度。他们认为,即使是几百名自动化团队,只会使用搜索引擎工作,并无法撰写最新新闻事件报道,因为数据更新受限。

尽管如此,有观点认为,这一项目仍具意义,即使只是提供快速答案于大量零碎信息中挑选最佳解,也是其价值之一。在大量信息中寻找最优解,是GPT-X项目核心价值的一部分。

目前,所有相关代码均已开源,为对此感兴趣的小伙伴提供了机会:

项目地址:https://github.com/EleutherAI/gpt-neo

参考链接:https://www.eleuther.ai/gpt-neo, https://news.ycombinator.com/item?id=25819803

— 完 —

标签: 诺基亚手机大全中国最好的手机是哪一款5G手机分别有什么三星anycalloppo官网入口