关于AIGC-X

传播内容认知全国重点实验室、中国科学技术大学、合肥综合性国家科学中心人工智能研究院联合推出的AI生成内容检测工具,可以快速分辨出内容是机器生成还是人工生成的。

AIGC技术的突破,将会大大推动人工智能在内容领域的全面变革。然而,AIGC在虚假信息、学术造假、网络钓鱼等任务中的滥用,严重阻碍新技术在媒体和教育等领域的应用。AIGC-X是实验室研究AI自我治理机制的重要成果,是探索如何从技术角度解决AIGC安全问题的初步尝试。结合内容识别、内容溯源等技术,AIGC-X能够有效的推动AI风险管理、安全审查和评估技术的发展,为建立安全可信AIGC生态的基础提供技术方案与支撑。

技术原理

AI文本生成模型是在海量文本语料基础上,经过自回归式语言建模的大规模训练得到,模型通过计算下一个单词的概率分布逐步完成整个文本内容的生成。

AIGC-X尝试采用算法融合与知识驱动的人工智能框架,使用深度建模来捕捉困惑度、突现频次等隐式特征,学习得到机器生成文本与人工生成文本的分布差异。

测试案例
想踢足球的时候:没有场地,草地可以,砖地可以,土地可以,水泥地也可以;没有球门,捡两块砖可以,摆俩书包可以。篮球就不一样了,篮球场必须要有篮筐,必须地面要平,以及必须要有一个篮球。足球为啥是第一运动?因为足球在推广过程中的门槛实在太低了,低到他对你的经济要求几乎为0,对环境要求也低的可怜,所以足球有着其他运动比不了的广阔群众基础。
AIGC-X:该内容是人工生成的😊
置信度:89.45%
点击试用
足球被称为世界第一运动是因为它在全球的普及度非常高,拥有大量的支持者和粉丝。根据统计数据,足球是世界上最受欢迎的运动,有超过4亿人口在世界各地玩足球。足球的简单规则和基本设备需求使它成为了一项易于参与的运动,并且它在世界范围内的盛行也使得它成为了一项全球性的文化现象。此外,足球还是世界上最受关注的体育赛事之一,其中包括世界杯和欧洲冠军联赛等。
AIGC-X:该内容是机器生成的😜
置信度:93.80%
点击试用
作为一种人工智能技术,对话生成模型,如 ChatGPT,仍然面临着很多挑战。 1. 理解多样性:生成的对话可能存在偏见和不准确的信息,因为模型是基于大量的文本数据进行训练的。  2. 语言复杂性:自然语言具有复杂的语法和语义,模型必须能够理解这些复杂的关系才能生成准确的回答。 3. 数据隐私:用于训练生成模型的数据可能包含敏感信息,因此必须开发机制来保护隐私。
AIGC-X:该内容是机器生成的😜
置信度:77.60%
点击试用
功能体验区
本工具只测试鉴别内容是否为AI生成,内容正误请使用其他工具进行判别。

未来工作

AIGC-X目前只支持中文内容的检测。
由于短文本蕴含的创作源头信息相对较少,AIGC-X对较短文本,尤其是一个短语的检测精度有待提高。
AIGC-X聚焦于通用文体的检测,其领域泛化性能有待提升。受限于样本数量,AIGC-X对于ChatGPT生成的文书、诗词、 对联、代码等文体检测能力相对有限。
AIGC-X对抗攻击的鲁棒性较弱。对于AI生成内容,加入人为的修改后,AIGC-X就会更倾向于将内容判定为人工生成的。
内容生成与内容判别具有一定的对抗性,生成技术以生成更具有欺骗性的内容为目标,AIGC-X需要在博弈过程中不断升级。
主管单位: 依托单位: 建设单位: 传播内容认知全国重点实验室
联系方式:sklccc@people.cn 地址:北京市朝阳区金台西路2号
京ICP备12004265号-27 京公网安备11000002000008号