关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家442人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

南亚空战启示录:枭龙碾压S400背后工业革命

浏览 937

可逐字复现畅销书,多家巨头AI模型被指存储版权作品

IT之家 浏览 253

每秒可传 1250 万部高清电影,亚马逊启动跨大西洋海底光缆项目

IT之家 浏览 469

一张图理清:美国抓捕委内瑞拉总统马杜罗始末

看看新闻Knews 浏览 305

农妇收玉米时遇山体坍塌失联4天 周边马路出现大坑

红星新闻 浏览 564

东方港湾董事长但斌:致敬白酒投资者,这两年其他的人都吃香的喝辣的

红星资本局 浏览 376

TA:世界杯美国队首战门票销量堪忧,甚至远不如同一场地伊朗的比赛

懂球帝 浏览 107

曝娜扎被抢休息室,刘亦菲聊天监听,后台大瓜!

萌神木木 浏览 469

一篇搞懂:飞书多维表格、n8n、Dify 等自动化工作流里的 Webhook 到底是个啥

钛媒体APP 浏览 494

霍尔木兹海峡已再次关闭

央视新闻客户端 浏览 148

派系纷争不断 加沙秩序恢复仍需时间

极目新闻 浏览 455

E句话 | 网红遭杀害后抛尸?!

仙女事件簿 浏览 2878

美妆胶卷 | 五种玫瑰之语,在肌肤上绽放出至臻爱意。

伊周潮流 浏览 3207

又来?富保罗节目搭档:湖人应交易东契奇,他能换3倍里夫斯的筹码

懂球帝 浏览 317

定位中型轿车 比亚迪海豹07 EV官图发布

车质网 浏览 238

大衣哥女儿又胖了,穿睡衣上街买烤串,头发油腻没有打理

素素娱乐 浏览 3209

欧阳明高警示:中国车企转型需防范“欲速不达”

观察者网 浏览 209

张建勇、张国富等22人增持北汽蓝谷 刘观桥增持花了4年工资

道哥说车 浏览 341

微软 Z1000 固态硬盘现身网络,搭载神秘 CNEXLabs 主控

IT之家 浏览 16576

洛国富曾展示中国元素文身:长城、兵马俑、邮戳、中文名

直播吧 浏览 2987

外媒称“美国指控古巴军队在乌克兰作战” 古巴驳斥

环球网资讯 浏览 464
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8