当前位置: 首页 - 数码 - 浙江工商大学教授探讨GPT-3究竟是什么它又将如何重塑我们现有的工作面貌

浙江工商大学教授探讨GPT-3究竟是什么它又将如何重塑我们现有的工作面貌

2025-01-15 数码 0

据外媒MSPoweruser披露,GPT-3是一项由Alec Radford设计的语言模型,其全称为Generative Pre-training Transformer。自2018年以来,由埃隆·马斯克创立的人工智能研究机构OpenAI发布了该模型。这款先进的工具采用了一种独特的生成式语言模型(两个神经网络通过竞争相互完善),通过对广泛范围内书面材料和长篇连载文本进行预训练,能够积累全球知识并处理复杂的依赖性问题。

在2019年2月,GPT-2被宣布,它是基于800万份文档训练而成,其中包含40GB的大量文本数据,这些数据源自Reddit用户分享的文章。然而,埃隆·马斯克对此表示担忧,因为他认为如果GPT-2落入不法之手,将可能用于散播假新闻。

2020年5月,OpenAI推出了更为强大的版本——GPT-3,它拥有比GPT-2多几个数量级参数(1750亿个参数与15亿个参数相比)。这使得其在性能上实现了显著提升。

只要给予任何提示文本,GPT-3都能返回一个完整的文本输出,以模仿用户提供的模式。它甚至可以接受编程指令,只要展示一些希望它完成的事例,就能生成一篇完整的小说或故事。此外,还有其他应用场景,如搜索引擎或智慧般解释复杂概念等。

尽管这种技术看似接近于开发出能够像人类一样理解、推理和交流能力的人工智能,但OpenAI警告称他们遇到了扩展性的挑战。由于其巨大的计算需求——需要每天数千petaflop/s—完全部署GPT-3将是一个巨大的工程,而相似的系统仅需几十petaflop/s-day即可完成工作。

对于想要了解更多关于GPT-3信息的人,可以访问GitHub以获取最新资料。

标签: 电脑数码咸鱼网二手交易平台bliblipoco数码讨论app