2025-01-28 手机 0
北京日报客户端 记者 李明
6月10日,在2023年智源大会上,AI安全与对齐论坛引起了广泛关注。张宏江,智源研究院理事长、美国国家工程院外籍院士,与OpenAI首席执行官山姆·阿尔特曼进行了深入交流。
在讨论通用人工智能的快速发展和全球合作机制时,张宏江提出了一个问题:面对如此巨大的挑战,我们应该如何确保人工智能的安全性?阿尔特曼回应说:“我们必须将安全技术作为核心研究领域,并考虑整个系统的完整性。通过构建能够监控模型行为并不断迭代的分类器和检测器,我们可以提高模型的可靠性。”
然而,阿尔特曼也强调了这一问题不仅仅是技术层面的挑战。他指出,要让人工智能既安全又有益,还需要理解不同文化背景下的用户偏好。“中国拥有一批世界级的人工智能人才,他们对于解决‘对齐’难题至关重要。我期待中国AI研究人员能做出重大贡献。”
“对齐”问题是当前人工智能领域最受关注的问题之一。建立强大的人类友好的AGI系统,如果它不能按照人类意愿行动,将会带来严重后果。在开发这样的系统时,就需要确保它们能够被训练成符合人类意图的方式——即通过人的指导、反复调整和输出,不断解锁新能力,同时避免误用。
为了加强国际合作,推动更高标准的人工智能开发,以及创建反映全球价值观的一系列数据库,阿尔特曼表示正在采取多种措施。“这些数据库将使人们能够根据自己的价值观调整AI系统,也为共享AI安全方面的研究提供平台。”