科技杂志科普时报揭秘GPT-4虚假案件全数败诉30年律师运用ChatGPT六起官司成为笑谈

2025-01-14 智能 0

编辑：桃子拉燕

【新智元导读】ChatGPT又有什么错呢？美国律师向法院提交的文件中，竟引用了6个根本不存在的案例，反倒惹祸上身被制裁。

ChatGPT，真的不可信！

在美国近来的一起诉讼案件中，一位律师帮原告打官司，引用了ChatGPT捏造的6个不存在的案例。

法官当庭指出，律师的辩护状是一个彻头彻尾的谎言，简直离了大谱。

还有人戏称，要怪就怪你的prompt不行。

当他询问ChatGPT这些案件的来源时，ChatGPT先是为之前的表述不清道歉，但还是坚称这些案件都是真实的，可以在Westlaw和LexisNexis上找到。

而对方律师也同样坚持，来自Levidow Oberman律师事务所的原告律师是多么荒唐可笑，由此才引发了法庭对这个细节的重视。

在其中一个案例中，有个叫Varghese的人起诉中国南方航空有限公司。然而这件事压根不存在。

ChatGPT好像引用了另一个案件——Zicherman起诉大韩航空有限公司。而ChatGPT把日期、案件细节什么的都搞错了。

Schwartz此时才悔恨地表示，他没有意识到ChatGPT可能提供假案件，现在他非常后悔用生成式AI来进行法律研究。

法官表示，这种情况前所未见，并将于6月8日举行听证会，讨论可能的制裁措施。

网友称，更准确来说，GPT-4应该只有63分或者68分。

聊天机器人胡说八道

归根结底，是因为它固有的「幻觉」问题导致这种错误发生。简单来说，就是张口胡说八道本性所致。

即使马斯克想拯救这个致命的问题，也推出了名为TruthGPT的人工智能平台。不过，不管是哪种类型的人工智能解决幻觉很难搞定。

最近，有一位名叫John Schulman的人，在一次演讲“RL and Truthfulness – Towards TruthGPT”中探讨了幻觉产生原因以及解决方案。他解释说，这些幻觉可以分为两类：

1 模式完成行为，即语言模型无法表达自己的不确定性，或继续之前犯错误；

2 模型猜测错误

由于知识图谱存储训练数据中的事实，而微调可以理解为学习操作并输出token预测，所以这种能力存在局限性。例如，如果微调数据集包含问题“星球大战是什么片？”和答案“科幻”，那么Zero提议，将来源链接附加到每次使用的情况下，以避免未来出现类似误解。

Tricorn认为，这位原告律师自己使用方式有误，用 Chat Gpt 的回答作为整个论据部分填充缺失环节，而不是作为输入提示的一部分。这就是活灵活现地展示AI工具做人类工作可能造成灾难性的后果，对于这样的表现，你怎么看？

参考资料：

https://www.theverge.com/2023/5/27/23739913/chatgpt-ai-lawsuit-avianca-airlines-chatbot-research

https://www.nytimes.com/2023/05/27/nyregion/avianca-airline-lawsuit-chatgpt.htm

标签：华为智能家居装修需要多少钱、人工智能有哪些岗位、智能制造的五个层次、全屋智能家居系统后悔、人工智能的定义