2025-01-14 智能 0
编辑:桃子 拉燕
【新智元导读】ChatGPT又有什么错呢?美国律师向法院提交的文件中,竟引用了6个根本不存在的案例,反倒惹祸上身被制裁。
ChatGPT,真的不可信!
在美国近来的一起诉讼案件中,一位律师帮原告打官司,引用了ChatGPT捏造的6个不存在的案例。
法官当庭指出,律师的辩护状是一个彻头彻尾的谎言,简直离了大谱。
还有人戏称,要怪就怪你的prompt不行。
当他询问ChatGPT这些案件的来源时,ChatGPT先是为之前的表述不清道歉,但还是坚称这些案件都是真实的,可以在Westlaw和LexisNexis上找到。
而对方律师也同样坚持,来自Levidow Oberman律师事务所的原告律师是多么荒唐可笑,由此才引发了法庭对这个细节的重视。
在其中一个案例中,有个叫Varghese的人起诉中国南方航空有限公司。然而这件事压根不存在。
ChatGPT好像引用了另一个案件——Zicherman起诉大韩航空有限公司。而ChatGPT把日期、案件细节什么的都搞错了。
Schwartz此时才悔恨地表示,他没有意识到ChatGPT可能提供假案件,现在他非常后悔用生成式AI来进行法律研究。
法官表示,这种情况前所未见,并将于6月8日举行听证会,讨论可能的制裁措施。
网友称,更准确来说,GPT-4应该只有63分或者68分。
聊天机器人胡说八道
归根结底,是因为它固有的「幻觉」问题导致这种错误发生。简单来说,就是张口胡说八道本性所致。
即使马斯克想拯救这个致命的问题,也推出了名为TruthGPT的人工智能平台。不过,不管是哪种类型的人工智能解决幻觉很难搞定。
最近,有一位名叫John Schulman的人,在一次演讲“RL and Truthfulness – Towards TruthGPT”中探讨了幻觉产生原因以及解决方案。他解释说,这些幻觉可以分为两类:
1 模式完成行为,即语言模型无法表达自己的不确定性,或继续之前犯错误;
2 模型猜测错误
由于知识图谱存储训练数据中的事实,而微调可以理解为学习操作并输出token预测,所以这种能力存在局限性。例如,如果微调数据集包含问题“星球大战是什么片?”和答案“科幻”,那么Zero提议,将来源链接附加到每次使用的情况下,以避免未来出现类似误解。
Tricorn认为,这位原告律师自己使用方式有误,用 Chat Gpt 的回答作为整个论据部分填充缺失环节,而不是作为输入提示的一部分。这就是活灵活现地展示AI工具做人类工作可能造成灾难性的后果,对于这样的表现,你怎么看?
参考资料:
https://www.theverge.com/2023/5/27/23739913/chatgpt-ai-lawsuit-avianca-airlines-chatbot-research
https://www.nytimes.com/2023/05/27/nyregion/avianca-airline-lawsuit-chatgpt.htm