2025-02-05 行业资讯 0
ChatGPT的开发关键在于算法模型、训练数据和算力资金。尽管市场对于AI的炒作已到极致,但实际上,这三个方面并没有明显存在卡脖子的环节。ChatGPT主要使用开源的算法模型,例如Transformer和强化学习,这些都已经广泛应用了较长时间。然而,训练数据是目前最大的困难之一,因为模型的训练需要海量且优质的语料,而中文语料被美国卡脖子是个大问题。此外,数据的整理需要时间和耐心。
举例来说,一份几千条数据的标注可能需要一周(单个标注人员可能负责多份数据标注),而由于标注标准理解不同,还需反复沟通、扯皮,最终可能导致无法使用这些标注数据。算法模型决定了效果下限,而高质量数据决定了效果上限。
至于资金支持,ChatGPT需要大量GPU用于加速训练。而针对GPU限制也是最近才有的问题。在过去,我们曾看到新闻报道某些公司宣传拥有几千块GPU等。这不仅涉及前期的大量采购,还包括多次训练时所需的大量花费。不过,无论是国内互联网巨头还是政府研究机构,只要真心想支持,就总有足够资金。
我们经常看到有关贪污或坐拥成百上千套房产的问题,但这并不意味着ChatGPT中国落后的真正原因就是指挥官不完全相信技术能改变世界,并形成信仰。这听起来有些玄乎,但要知道,在ChatGPT出现之前,没有人能确定这一路是否可行,而且每个版本都耗费了大量时间和资金。在互联网发展历史中,大多数时候中国是追随者,所以Copy to China模式更容易得到信任。
具体到某个项目,如果已经被证明有效,那么就更能得到信任、给予时间、人员和资金支持。但习惯短平快缺乏耐心,对于一个项目搞3年但仍未见效会面临什么后果?试想一下如果一个项目花费几亿却仍未见效,将会遭遇何种后果?
讨论AI发展不是无厘头的事务,因为未来AI必定影响我们的生活。本文将探讨原理、普通人的影响以及相关投资展开讨论。从现在开始重视AI发展很重要,不仅因为它是一个重要节点,也因为它是一个从量变到质变转变的人工智能领域的一次重大事件,如英伟达CEO黄仁勋所说,它如同人工智能领域中的iPhone时刻。
让我们简单解释一下ChatGPT原理:它是一种语言模型,其本质在于逐字生成输出,每个字基于前文内容根据一定概率选择,从而产生结果,与其拷贝粘贴相比,它确实逐字生成了结果。
这个过程类似一个人学习过程,有三个阶段:首先是通识学习,即看书报刊,看电视节目,以获取知识;然后进行专项学习,如按照格式写信通知或编写代码;最后进入创造性训练阶段,即提高模型泛化能力,这正通过强化学习实现之事。
同样地,从模拟一个人学业进程,我们可以看到ChatGPT出现的一个巨大意义。如果一个人阅读记忆并理解了世界上的所有资料,他将达到怎样的高度?而现在我们大部分人忙碌于无意义工作与娱乐,与此相比,完整阅读一本有意义书籍甚至占用数天乃至几个月时间,与之相比几乎不可同日而语。
因此,可以预言即使是在技术爆炸背后的知识更新速度提升背景下,我们也会迎来一种新的工具——超级工具——能够以高过个人几倍甚至数量级以上速度不断进步。而《三体》中提到的“技术爆炸”便描述了一种非线性的技术进步情况,其中封建王朝虽然持续千年,却没有显著进步;古代四大发明虽然伟大但与工业时代人类取得进步相比小巫见大巫;近现代科技飞速增长则受益于信息交流组织效率提升尤其是在互联网兴起之后,现在又有超级工具聊天机器人这样的辅助手段加入游戏板局。
综上所述,上述三点因素:算法模型、训练数据以及算力资金,都不存在明显卡脖子的障碍,因此只剩下做出已有的东西难度小很多的问题。
作为追随者,国内互联网能力不足为奇,但既然证明了一条路可走,便只能踩油门猛追。
那么哪些公司首先完成开发呢?考虑可能性,大公司>小公司,小企业>其他企业似乎自然逻辑,但是市场先生总有一两次不靠谱的时候。大潮来临普通人们如何自处呢?
首先,要明白AI不是敌人至少目前还不是,不去对抗,而是学会利用提高效率,比如查询资料生成PPT写代码等等。
未来使用AI能力成为判断个人水平高低重要因素之一。
除此之外新技术带来的投资机会也是值得关注的地方,如果既能早点下班,又能赚钱岂不美哉?
关于投资近期市场对于AIF热情极高相当疯狂,有许多股票成交量占据两市近半,这种炒作谁看了不迷糊?
稍微冷静下来思考太阳底下的新鲜事物其实很少变化,只不过这是新科技的一部分罢了。
每年Gartner都会发布新技术成熟度曲线显示任何一项新出现的科技都会经历萌芽期期待膨胀期再到成功稳定期最终衰退期这整个过程。这说明2022年的AIG刚好处在萌芽期,而现在进入期待膨胀期位置就在蓝色箭头附近位置图中展示出来。
最后,让我们回顾一下购买股票背后的公司价值评估核心标准——现金流创造能力,以及当前热炒标的是如何短暂忽略这一基本要求,同时过分关注AIG增值潜力。一旦淘金客越来越多卖铲队伍就会跟着减少。