当前位置: 首页 - 行业资讯 - 人物手抄报探究ChatGPT为何未首次亮相中国未来可能会吗

人物手抄报探究ChatGPT为何未首次亮相中国未来可能会吗

2025-02-05 行业资讯 0

人物探索:ChatGPT未先现中国,未来或许有望

在近日市场对人工智能的热潮中,我不免感到一丝担忧。券商们甚至高声宣扬:“当前核心奥义是AI仓位,相比α,“AI%”才是胜负手的。”然而,作为一个普通人,我始终保持着对ChatGPT开发关键环节的关注。

ChatGPT的开发关键点包括算法模型、训练数据和算力资金,其中并没有明显存在卡脖子的环节。其使用的大多数开源模型以及Transformer、强化学习等技术已经被广泛应用了较长时间。而训练数据则是我认为目前最大的挑战,因为模型训练需要海量且优质的语料,但中文语料如何避免被美国卡脖子?此外,数据整理需要大量时间和耐心。

举例来说,一份几千条数据的标注可能需要一周(单个标注人员可能负责多份数据标注),而由于标准理解不同,还需反复沟通、扯皮,最终可能还无法达到预期效果。算法模型决定了效果下限,而数据质量决定了效果上限。

至于资金支持,即便国内大型互联网公司或政府研究部门愿意投入,这也不是问题。但真正阻碍ChatGPT在中国落地的是指挥官对于技术能否改变世界这一信仰缺乏。在出现之前,没有人能确定这条路可行,而且每次新版本都耗费巨资却未必取得令人印象深刻的成果。

从互联网发展历史来看,国内通常是一个追随者,所以Copy to China模式更容易得到认可。而具体到某个项目上,如果已被证明有效,就更容易获得信任和资源支持。这背后是一种习惯短平快,对待技术耐心缺乏的心态。

OpenAI成立于2015年,并于2017年推出第一个版本,即使经过六年的时间,它依然引起了巨大的关注。试想一下,如果一个项目三年花费几亿仍无明显成效,那将面临什么样的后果?

ChatGPT故事虽宏大,但细节乏味无聊,如数据整理与标注,这些都需要足够耐心完成。此两点原因非泛泛而谈,其对于ChatGPT开发关键环节影响深远,没有对技术信仰就无法持续投入资金与时间,没有足够耐心就无法完成海量、高质量数据的标注工作。

作为一种语言模型,ChatGPT本质就是逐字生成内容,不仅仅是简单拷贝粘贴,而是一个人的学习过程:首先是通识学习,无监督训练;其次专项学习,有监督训练;最后创造性训练,以提高模型泛化能力实现强化学习。这让我思考一个人阅读掌握资料广度与深度决定知识水平高低,以及如果一个人读尽世界资料,他将达到的高度,将超越我们现在所能理解范围之外的事物。

《三体》中的“技术爆炸”回顾人类发展史,我们发现进步并非线性的,而是在特定时期会有突破性进展。封建王朝上千年几乎无进步,与工业时代后的飞速发展形成鲜明对比。我相信,在这个基础上的科技革命——即拥有像ChatGPT这样的超级工具——将会带来新的突破,并且这种趋势不会停止。

所以,当我看到市场炒作时,我并不害怕,而是期待那些能够利用这些工具提升效率的人们,同时也意识到投资机会不断涌现。如果我们学会使用AI提高生活品质,同时赚钱,那岂不美哉?

不过,在投资前,我们必须冷静分析,看清哪些因素驱动市场热潮,也要认识到太阳底下的新事物总有一天会结束。我希望我们的国家能够早日拥有自己的chatgpt,让更多人受益匪浅,让我们的生活更加精彩丰富。

标签: 科技行业资讯