2025-01-14 智能 0
编辑:桃子 拉燕
【新智元导读】ChatGPT又有什么错呢?美国律师向法院提交的文件中,竟引用了6个根本不存在的案例,反倒惹祸上身被制裁。
ChatGPT,真的不可信!
在美国近来的一起诉讼案件中,一位律师帮原告打官司,引用了ChatGPT捏造的6个不存在的案例。
法官当庭指出,律师的辩护状是一个彻头彻尾的谎言,简直离了大谱。
还有人戏称,要怪就怪你的prompt不行。
当他询问ChatGPT这些案件的来源时,ChatGPT先是为之前的表述不清道歉,但还是坚称这些案件都是真实的,可以在Westlaw和LexisNexis上找到。
而对方律师也同样坚持,来自Levidow Oberman律师事务所的原告律师是多么荒唐可笑,由此才引发了法庭对这个细节的重视。
在其中一个案例中,有个叫Varghese的人起诉中国南方航空有限公司。然而这件事压根不存在。
ChatGPT好像引用了另一个案件——Zicherman起诉大韩航空有限公司。而ChatGPT把日期、案件细节什么的都搞错了。
Schwartz此时才悔恨地表示,他没有意识到ChatGPT可能提供假案件,现在他非常后悔用生成式AI来进行法律研究。
法官表示,这种情况前所未见,并将于6月8日举行听证会,讨论可能的制裁措施。
网友称,更准确来说,GPT-4应该只有63分或者68分。
聊天机器人胡说八道
归根结底,是因为它固有的「幻觉」问题导致这种错误发生。简单来说,就是张口胡说八道本性所致。
即使马斯克想解决这个问题,他推出了名为TruthGPT的人工智能平台。但别忘了,无论何种形式的人工智能,其幻觉难题依旧存在。
最近一次事件是在OpenAI联合创始人兼研究员John Schulman演讲「RL and Truthfulness – Towards TruthGPT」时讨论到的幻觉产生原因和解决方案。根据Schulman,我们可以将幻觉分为两类:
模式完成行为,即语言模型无法表达自己的不确定性,不能质疑提示中的前提,或继续之前犯错误的情况下做出反应;
模型猜测错误
语言模型代表知识图谱,将训练数据中的事实存储网络中。而微调可以理解为“学习函数”,能够操作并输出token预测。在微调数据集中,如果有包含“星球大战是什么片?”的问题,以及“科幻”答案,那么Zero提出了一个建设性的建议:未来使用源链接作为验证事实是否准确。
Tricorn认为,这位原告律师应不是责备于 Chat G P T,而是应对其输入方式负责,因为他们将事情当作提示的一部分输入进去,然后让 Chat G P T 填补缺失部分,以支持其论证。此外,还有网友评论,用 Chat G P T 需要小心谨慎,以免下次成为超级碗上的主角。这正如现实生活中的活生生的证据显示出来,即使用人工智能工具执行人类工作,最终可能导致灾难性的后果。这就是你怎么看待 Chat G P T 这样的表现?
参考资料:
https://www.theverge.com/2023/5/27/23739913/chatgpt-ai-lawsuit-avianca-airlines-chatbot-research
https://www.nytimes.com/2023/05/27/nyregion/avianca-airline-lawsuit-chatgpt.htm