2024-12-13 数码 0
各大企业不论真实性与规模,纷纷趁势掀起chatGPT热潮的浪潮。尽管我相信仍有一部分公司是认真致力于研发攻坚,以打造中文版的chatGPT为目标。而且,chatGPT在英文领域能够高效运作的一个关键原因,就是英文被广泛认为是全球通用语言,其训练数据量巨大。相较之下,中文虽然重要,但其流行度和可获得的网络数据并不如英文那样丰富。OpenAI对中文技术发展可能并未给予特别重视。
因此,即便chatGPT面临的一些技术挑战看似难以逾越,其实解决起来也不是完全不可行。在人工智能领域,中国与美国在研究水平上几乎处于同一水平,而高质量的人工智能论文也层出不穷。但是,要建立一个能有效运行的中文版本chatGPT,最关键的问题就是如何构建一个庞大的、质量优良的中文训练集。
若要验证这一点,只需观察那些基于低劣中文训练集生成出来的对话,它们往往带有浓厚的贴吧风格,让人忍俊不禁。这表明了,在创建出真正具有深度和准确性的中文聊天机器人的路上,我们还有很长很长的一段旅程等着去走。