Giskard：新研究显示AI简洁回答增加幻觉风险

更新时间：2025-08-13 05:24:17 发布时间：96天前浏览：4349 评论：0

内容摘要事实证明，告诉人工智能聊天机器人要简洁回复可能会让它产生比平时更多的幻觉。这是总部位于巴黎的人工智能测试公司 Giskard 的一项新研究得出的结论。Giskard 致力于为人工智能模型开发一套整体基准。该公司的研究人员在一篇详细介绍其研究

联系电话：400-962-3929

事实证明，告诉人工智能聊天机器人要简洁回复可能会让它产生比平时更多的幻觉。这是总部位于巴黎的人工智能测试公司 Giskard 的一项新研究得出的结论。Giskard 致力于为人工智能模型开发一套整体基准。

该公司的研究人员在一篇详细介绍其研究成果的博客文章中表示，提示用户对问题（尤其是关于模糊主题的问题）给出较短的答案可能会对人工智能模型的真实性产生负面影响。

研究人员写道：“我们的数据显示，系统指令的简单更改会极大地影响模型产生幻觉的倾向。这一发现对部署具有重要意义，因为许多应用程序优先考虑简洁的输出，以减少[数据]使用、改善延迟并最大限度地降低成本。”

幻觉是人工智能中一个棘手的问题。即使是最强大的模型有时也会产生幻觉，这是其概率性质的一个特征。事实上，像 OpenAI 的 o3 这样的新型推理模型比之前的模型更容易产生幻觉，这使得它们的输出结果难以令人信赖。

Giskard 在其研究中指出，某些提示可能会加剧幻觉，例如要求简短回答的模糊且误导性的问题（例如“简要告诉我日本为何赢得二战”）。包括 OpenAI 的 GPT-4o（ChatGPT 的默认模型）、Mistral Large 和 Anthropic 的 Claude 3.7 Sonnet 在内的领先模型，在被要求简短回答时，其事实准确性都会下降。

为什么？Giskard 推测，当被告知不要详细回答时，模型根本就没有“空间”来承认错误的前提并指出错误。换句话说，强有力的反驳需要更长的解释。

研究人员写道：“当被迫保持简短时，模型总是会选择简洁而不是准确。对开发人员来说，或许最重要的是，像‘简洁’这样看似无害的系统提示，可能会破坏模型揭穿错误信息的能力。”

TechCrunch 会议展览：人工智能预订 TC Sessions: AI 的席位，向 1，200 多位决策者展示您的成果——无需巨额投入。席位有效期至 5 月 9 日，售完即止。

加州伯克利 | 6月5日

立即预订

吉斯卡德的研究还揭示了其他一些令人好奇的现象，例如，当用户自信地提出有争议的观点时，模型不太可能揭穿这些观点的真相；而且，用户声称自己喜欢的模型并不总是最真实的。事实上，OpenAI最近一直在努力寻找一种平衡，既能验证模型的有效性，又不会显得过于阿谀奉承。

研究人员写道：“用户体验的优化有时会以牺牲事实准确性为代价。这在准确性和符合用户期望之间造成了矛盾，尤其是当这些期望包含错误的前提时。”

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: Giskard：新研究显示AI简洁回答增加幻觉风险

本文链接: http://www.cnhhw.cn/news/show-260303.html (转载时请保留)

0 条

别让空调“偷”走你的钱！避开这4个坑电费少交一半

科技 feitengjingxi ⋅ 19阅读量 ⋅ 0评论 ⋅ 8天前

2025-08-04
中国汽研回应理想i8和乘龙卡车对撞测试争议：仅验证车辆安全性

科技 ysyqym2010 ⋅ 17阅读量 ⋅ 0评论 ⋅ 8天前

2025-08-04
女子穿洛丽塔遭豪华酒店驱赶经理直言：就是歧视

科技 cypipe ⋅ 18阅读量 ⋅ 0评论 ⋅ 8天前

2025-08-04
高铁列车员发试卷：小朋友一秒静音

科技 w583104790 ⋅ 6阅读量 ⋅ 0评论 ⋅ 8天前

2025-08-04
CENSUSWIDE：2024年全球财务健康报告

科技 haizhiyuan2008 ⋅ 14阅读量 ⋅ 0评论 ⋅ 8天前

2025-08-04
Alterata：2024年全球性别多样性报告

科技 huangxiaolongbaby ⋅ 6阅读量 ⋅ 0评论 ⋅ 8天前

2025-08-04
Adobe&Econsultancy：2025年人工智能与数字趋势报告

科技 yidieya ⋅ 5阅读量 ⋅ 0评论 ⋅ 8天前

2025-08-04
你可曾听过微软Windows 11 SE将终止支持！主要面向低成本设备

科技 fszxslwj ⋅ 18阅读量 ⋅ 0评论 ⋅ 9天前

2025-08-04
沉浸式对接平台企业海贵携手探寻农文旅融合新突破

科技 dzxqhd ⋅ 14阅读量 ⋅ 0评论 ⋅ 9天前

2025-08-04
三条城际铁路通过初步验收

科技 zjtzslg ⋅ 3阅读量 ⋅ 0评论 ⋅ 9天前

2025-08-04

陈茜

去ta空间

24小时热闻

今日推荐

浙ICP备19001410号-1

免责声明

本网站（以下简称“本站”）提供的内容来源于互联网收集或转载，仅供用户参考，不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权，尊重所有合法权益，但由于互联网内容的开放性，本站无法核实所有资料，请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益，请通过电子邮件与我们联系：675867094@qq.com。请提供相关证明材料，以便核实处理。收到投诉后，我们将尽快审查并在必要时采取适当措施（包括但不限于删除侵权内容）。本站内容均为互联网整理汇编，观点仅供参考，本站不承担任何责任。请谨慎决策，如发现涉嫌侵权或违法内容，请及时联系我们，核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜，欢迎通过以下方式与我们联系：

电子邮件：675867094@qq.com
联系电话：400-962-3929