关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家113人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

没买的再等等!特斯拉称Model Y今年不改款,为保销量只能降价?

小李车评李建红 浏览 2763

法蒂:感觉前年在巴萨所做的一切没被重视,我不得不决定换个球队

直播吧 浏览 2539

Cariad不再是“灵魂”担当,大众请外援能否赌赢未来?

禾颜阅车 浏览 161

唉!又一地产巨头,宣布退市

说财猫 浏览 143

持续对抗缠斗 南昌舰直面外军真实经历

环球网 浏览 2996

复制日股牛市 韩国股市成全球外资净流入第二大市场

第一财经资讯 浏览 2622

高市早苗被喊话:向中国道歉并且辞职

环球时报新闻 浏览 98

账面资金高达43亿,却要募集13亿,这家老牌企业差不差钱?

IPO日报 浏览 131

“WPS”上热搜!雷军为金山办公实控人,员工平均年薪约38万,金山此前发文:雷军任名誉董事长,不领薪酬

大象新闻 浏览 144

乌军丢失"钢铁要塞" 俄军争夺战被形容为"非常血腥"

枢密院十号 浏览 3114

U17世界杯吉祥物灵感来自前国足主帅米卢,米卢:感谢这个创意

懂球帝 浏览 135

军事专家:日本敢染指台湾 就是对中国本土造成侵略

环球网资讯 浏览 47

陈妍希拉赵丽颖下水,报复陈晓!?

八卦疯叔 浏览 22

林心如曝霍建华消费观

科学发掘 浏览 109

年薪300万请来LV高管!泡泡玛特“奢侈品化”的生死赌局

杠杆游戏 浏览 23

女网红名下公司涉嫌逃税逾千万被查处 仍在高频次直播

红星新闻 浏览 25

令人唏嘘!KD再战旧主,太阳三巨头合体17场超昔日篮网三巨头

懂球帝 浏览 2733

春晚开播第二天,全网都在搜他的神图

她刊 浏览 2930

纳百川股份收现比一度仅过半,依赖宁德时代,毛利率持续下滑

权衡财经 浏览 2591

牛弹琴:2025年最后1个月大戏上演 印度迎最重要客人

北京日报客户端 浏览 31

27分钟28+8早早打卡!亚历山大场下观赛脸都笑烂了 雷霆24胜1负

颜小白的篮球梦 浏览 24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8