关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家439人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

保时捷出事故保险公司让报废 但只赔100万保额的一半

大象新闻 浏览 454

时隔25年,上一个时代的“英伟达”终于涨回来了

华尔街见闻官方 浏览 404

离婚4年,42岁佟丽娅高调官宣喜讯

刘森森 浏览 452

"富豪"承诺月嫂月薪1万5却1年只发5500 还向她借85万

极目新闻 浏览 552

岛内学者:若赖清德无法降低两岸紧张 特朗普会不开心

海峡导报社 浏览 588

早春买衣服在精不在多,40岁女人备好“二衣一裙”,时髦又显气质

Yuki时尚酱 浏览 3512

她连上5次春晚,私下却和恩师同居怀孕被骗流产

律便利 浏览 463

这一次,窦骁和何超莲都救不了对方

娱乐圈笔娱君 浏览 453

S家族,最出名的不是八卦?

江湖人称艾掌门 浏览 423

商竣程击败阿古特排名重返TOP300,袁悦输球后笑容被指输也是赢

网球之家 浏览 303

圣桐特医再度递表 财务紧绷难解

北京商报 浏览 378

中山大学突破:AI实现精准图像语义搜索

科技行者 浏览 467

车长超5米 比亚迪海狮08/海豹08配高阶智驾

网易汽车 浏览 304

8亿买入5%股份!四川国资战略入股湖南百亿锂电龙头,标的前三季度净利大增118.85%

红星资本局 浏览 463

海南封关首日:30克金饰省近万元 居民排长队买榴莲

极目新闻 浏览 466

2025年中国10大电摩厂商销量:雅迪92万辆,春风极核第5,隆鑫第9

小鹏财经 浏览 319

NBA战报:凯尔特人111-107魔术,班凯罗28分

懂球帝 浏览 448

日本宣布:推迟发射新型无人货运飞船HTV-X

上观新闻 浏览 437

来酷AI MINI PRO迷你主机上架:"Lunar Lake"平台,3799元起

IT之家 浏览 103

为内卷止损,为长钱布局!2026两会为金融发展划重点

独角金融 浏览 218

宝藏BOSS冯擎峰:是CTO,也是CEO

网易汽车 浏览 483
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8