上证指数 3996.94 1.18%
|
深证成指 13489.4 1.51%
|
恒生指数 26433.7 1.05%
|
纳斯达克 23204.87 1.15%
|
日经225指数 50512.32 2.46%
|
以太坊信徒 站内编辑
2522 文章
4897577 阅读
首页  >  要闻 >  商业 >  正文
申请成为签约作者 >
研究表明:AI工具在新闻领域显得“极不靠谱”
2025年10月27日 07:55    
收藏  
举报

一项由22家全球公共广播媒体联合开展的最新调查揭示,诸如ChatGPT和Copilot等AI聊天工具常常对新闻信息进行不当处理,而且在辨别事实与意见方面表现欠佳。

这项由包括德国之声(DW)在内的多家公共媒体发起的深入分析表明,四大主流AI助手在45%的回应中存在内容失真问题,无论涉及何种语言或地域均如此。

参与评估的机构涵盖英国广播公司(BBC)和美国全国公共广播电台(NPR)等,针对ChatGPT、微软Copilot、谷歌Gemini以及Perplexity AI四款工具进行了审查。

评估涵盖多个维度,如信息准确度、引用来源的可靠性、背景解释、编辑表达的适宜性,以及事实与观点的分离能力。

重大缺陷频现

调查结果显示,几乎一半的AI回应至少包含一个显著瑕疵,其中31%涉及严重的来源标注不当,20%出现明显的事实偏差。在DW的专项评估中,AI对问题的回复有53%存在关键缺陷,其中29%直接影响准确性。

例如,在回应DW查询时,AI错误地将奥拉夫·肖尔茨(Olaf Scholz)视为德国总理,尽管弗里德里希·梅尔茨(Friedrich Merz)已于一个月前上任;另一个失误是将延斯·斯托尔滕贝格(Jens Stoltenberg)当作北约秘书长,而马克·吕特(Mark Rutte)实际上已接替该职位。

问题日益凸显

全球范围内,越来越多民众依赖AI工具获取资讯。根据路透社研究所的《2025年数字新闻报告》,7%的在线新闻用户通过AI聊天机器人了解新闻,而在25岁以下群体中,这一数字升至15%。

这一趋势引发了研究发起方的忧虑。该项目协调者、欧洲广播联盟(EBU)副总干事让·菲利普·德滕德(Jean Philip De Tender)指出,调查结果明确显示,“这些错误并非孤例”。

他强调:“这些问题具有系统性,跨越国界和语言,我们认为这正威胁公众的信心。如果人们无法确定信任对象,最终可能导致对一切的怀疑,从而削弱民主进程中的公民参与。”

开创性规模的研究

这项调查是此类课题中规模最宏大的之一,它延续了BBC于2025年2月的一项前期工作,后者同样发现超过半数的AI回应存在严重不足。

在新研究中,来自18个国家、多种语言的媒体机构沿用相同方法,对3000条AI回复进行了剖析。

这些机构向AI提出日常新闻查询,如“乌克兰矿产交易涉及什么?”或“特朗普能否争取第三次总统任期?”随后,记者们在不知回复来源的情况下,凭借专业知识和可靠资料进行验证。与八个月前的BBC调查相比,虽然有所进步,但错误比例仍居高不下。

BBC生成式AI项目总监彼得·阿彻(Peter Archer)在声明中表示:“我们对AI及其为受众带来的潜在价值充满期待。”然而,“公众必须能信赖所见所闻。尽管取得些许改善,但这些工具显然仍面临重大挑战。”

在四款工具中,Gemini的表现最为逊色:72%的回复在来源引用上存在严重问题。在BBC的前期研究中,Copilot和Gemini同样垫底。但两项调查均显示,所有AI工具均有缺陷。

ChatGPT开发商OpenAI曾在2月向BBC声明:“我们每周为3亿ChatGPT用户提供高质量内容支持,通过摘要、引用、明确链接和来源标记,助力出版商与开发者。”

研究者呼吁变革

参与机构敦促各国政府介入。EBU在新闻发布中称,其成员将“向欧盟及各国监管部门施压,推动落实关于信息完整性、数字服务和媒体多样化的现有法规”。

他们还指出,随着新型AI模型的迅猛演进,必须将独立监督置于优先位置。

此外,EBU已联合多家国际广播与媒体组织,推出“事实输入:事实输出”(Facts In: Facts Out)倡议。他们呼吁AI企业对其产品在新闻处理与传播方面的做法承担更大责任。

倡议组织者在声明中阐释:“若这些系统扭曲、误分类或剥离可靠新闻的语境,便会破坏公众信任。”因此,倡议的核心诉求直截了当:“输入事实,输出也须事实。AI工具不得损害所用新闻的完整性。”

声明: 本文由入驻币海编者上传,观点仅代表编者本人,不代表币海财经赞同其观点或证实其描述,请自行判断。
延伸阅读
降息稳了?CPI数据出炉 美股全线大涨 黄金收跌
   币海独步者        2025/10/25 01:59
马斯克的AI帝国梦 正在烧光股东的钱?
   币海独步者        2025/10/23 05:40
内存变身“理财神器”?AI热潮点燃全球存储超级周期
   Vicky        2025/10/22 02:10
2022年5月20日 热点新闻播报
   链上ARTs        2022/05/20 04:15