向AI证明“我不是AI”困扰用户:学生手写论文被判“人工智能生成内容”
毕业季到来,很多人都在忙着写论文,在社交媒体网站上经常看到有人吐槽,辛辛苦苦写的文章,竟然被判定为 AIGC(人工智能生成内容)。
事实上,AI 的这种误判不仅针对文章。有人想以自己为原型,用 AI 制作数字人,竟然无法通过 " 真人审核 "。AI 系统到底如何判定,找不到明确说明。如果论文的 AIGC 率检测过高,会影响论文的通过,很多人不得不用 AI 或者手动改写,把文章写得支离破碎,才能通过检测。
真人如果被系统判定为 AIGC,只有想办法让自己更 " 粗糙 ",才能让 AI 满意。本质上不是在寻找 " 人的特征 ",而是在寻找 " 非机器特征 ",人类必须显示 " 平庸 ",用 " 瑕疵 " 才能证明人类的身份。一些人正在因为表现得 " 太优秀 " 或 " 太标准 ",而在 AI 的算法面前失去了作为人的 " 入场券 "。
记者所写旧文被判定 18.12% 为 AIGC
辛苦手搓的文章被判定为AIGC
临近毕业,在社交媒体网站上,吐槽论文进行 AIGC 率检测时数据离谱的帖子频频可见。
小达(化名)近日曾在网上发帖,询问论文 AIGC 率检测 20% 左右够不够。因为现在检测平台众多,他不知道自己的论文在不同的平台会有什么结果。
他告诉扬子晚报记者,他所在的学校规定论文的 AIGC 率不能超过 30%。起初,他检测的 AIGC 率是达到 60% 多,后来用了检测平台提供的降低 AIGC 率的服务,花了数百元钱,降到 16% 左右。
小熊(化名)把市面上免费的 AIGC 检测网站基本上都试用过一遍,发现结果都比较偏高,绞尽脑汁降低 AIGC 率以后,还有 20% 左右。后来她用学校提供的 AIGC 检测系统,数值低很多。她的不少同学也遇到这些问题,在免费网站测出 30% — 40% 多,学校提供的系统中测出来 1% 多。
记者也试用了 AIGC 率检测,把 AI 大模型流行前写过的一篇报道提交到一个检测平台,检测出 AIGC 总体疑似度达 18.12%,数段内容被标上橙色,判定 AIGC 生成疑似度在 60%~70%。
免费检测提供 " 智能降 AIGC" 增值服务
长相标准的女孩不能通过真人审核
受到 AIGC 检测困扰的不只有论文作者们。
年轻女孩小林(化名)为尝试制作专属 AI 数字人,将自己真人拍摄的原片视频上传至某专业剪辑平台,却接连收到平台 " 未通过真人审核 " 的提示。她多次更换账号重新上传,结果均以审核失败告终,这一乌龙事件让女孩倍感疑惑与无奈。
据小林向记者讲述,她出于对 AI 数字人技术的好奇,打算用自己真实拍摄的视频素材,借助平台功能生成个性化虚拟形象。视频全程由本人出镜拍摄,画面、动作均为真实记录,无任何 AI 合成、换脸等后期处理。
可提交审核后,平台系统却始终判定其视频并非真人拍摄,无法进入后续的数字人制作流程。反复尝试无果后,小林不禁提出疑问:" 明明是活生生的真人,难道被系统认成数字人了?"
此事一经分享,迅速引发讨论。不少网友表示感同身受,称如今 AI 生成技术愈发逼真,虚拟形象与真人差距不断缩小,导致平台审核算法出现 " 识别混乱 "。业内人士分析,当前一些内容平台为防范 AI 虚假视频、侵权换脸等问题,设置了严格的真人审核机制,但算法在判定时易过度敏感,将面部特征精致的真人素材,误判为 AI 合成的虚拟内容,进而出现此类反向乌龙。
小林上传真人素材被判定无法通过真人审核
文章改到句子不通顺才能过检
论文查重有非常明确的结果,是否抄袭一目了然。AIGC 率检测如同黑箱,系统到底如何判定,没有人知道。各个检测平台都没有具体说明如何检测 AIGC 率。小熊说:" 我就是这种感觉,查重的话,起码能标注和哪个文献有相同的地方,相同处有多少字。我感觉 AIGC 率挺虚无缥缈的,不知道平台基于什么算法。
为了通过 AIGC 率检测,已经有人总结了一些经验。一位从 85% 降到 10% 的用户介绍方法说,文章要多用 " 的、了、到、过、会 " 等废话字,并把 " 首先,其次,最后 " 这类 AI 常用的词语删了,可以改用 " 一是,二是,三是;一方面、另一方面 " 等代替。要把短句合成长句,经常出现的词换成同义词,改变句子的前后结构,如 " 效率提升了 30%" 改成 " 提升了 30% 的效率 " 等。读起来句型要乱一点,不要全是一个节奏,语气不要太书面。
另外,每个 AIGC 率免费检测网站都会提供增值服务,如果检测出来的数值比较高,就向用户推出降低 AIGC 率的服务。记者在检测报告页面中也看到,系统提供智能降 AIGC 服务,但需要购买旗舰版才能获得。
毕业生论文如果被判定 AIGC 率过高,可能有不利影响。小熊迫于无奈,只能花钱使用检测平台的服务降低 AIGC 率。小熊说,降低 AIGC 率之后,她的论文在学校提供的系统中检测出来是 3.7%," 标红的内容都在致谢部分,有时候手写的也会标注为 AIGC,所以感觉检测不准。"
小熊有类似的感觉,她发现所谓降低 AIGC 率," 其实一般是把语句改得不通顺一点,句子结构更换一下。而且检测平台降低 AIGC 并不是人工修改,也是在使用 AI 进行处理。"
经历了降低 AIGC 率的小达也表示,降低 AIGC 率对文章的表述有影响," 有些句子都不通顺了,真的无语。"
AI 对人类进行 " 反向图灵测试 "
无论是论文被误判为 AIGC,还是真人被判定为 " 数字人 ",背后都有着相同的技术逻辑和深层悖论。
技术专家表示,目前的 AI 检测工具并非真的能 " 读懂 "AIGC 内容,它们本质上是基于统计学的特征分析。AI 是通过学习人类最优秀、最标准的数据训练出来的,AI 写作非常稳定,而且逻辑严密,没有语法错误。如果一篇文章文笔极佳、逻辑无懈可击,AI 算法就会因其缺乏人类常见的 " 困惑度 " 而判定为 AIGC。数字人也是这样,如果真人长相标准,表情举止到位,AI 算法会认为这种高度的对称性和稳定性超出了自然人类的随机误差,从而判定为 AIGC。
有些人正因为表现得 " 太优秀 " 或 " 太标准 ",而在算法面前丧失了作为人的 " 入场券 "。而且 AI 判定不像人类的民事法庭,并非 " 谁主张谁举证 ",被判定为 " 疑似 AI 生成 " 后,人类必须自证清白。
人类评判 AI 是否具有人类智能时,有一个著名的图灵测试,核心是探讨机器是否能够模拟人类智能,使人类无法区分机器与真人的回答。 AI 是否真正通过图灵测试尚有争议,而 AIGC 率检测已经成了 AI 对人类的 " 反向图灵测试 "。
现在的论文检测和数字人判定是 AI 在测试人类是否 " 够乱、够笨、够不标准 ",只有通过了这种 " 反向图灵测试 ",人类在 AI 眼中才有人的身份。
人类面对 AI 的检测,如果为了 " 证明自己是人 " 而不得不故意把文章写得 " 烂一点 ",把相貌做得更 " 糙一点 ",故意展示瑕疵来证明自己,这标志着我们进入了一个 " 以不完美定义人类 " 的荒诞时代。
