怎样破解AI文章一眼假的问题?

怎样破解AI文章一眼假的问题?

傻木
2024-04-16 / 0 评论 / 64 阅读 / 正在检测是否收录...

AI.jpg

如今感觉越来越离不开AI了
不管是代码类
还是工作总结类
都可以问AI
只要你问问题的足够精确
AI几乎没有废话
比他妈的某度简洁多了
你要什么给你什么
不像某度
要命

普通人用AI主要是做一些文案类的应用
例如工作总结之类的
还有写新闻通稿之类的
都离不开AI
但是有没有发现一个问题
不管你用的是老美顶尖的GPT
还是国内号称比GPT更牛逼的AI
输出的文章一眼即可辨别这不是人写的
这是为什么?

究其原因
我认为这是目前AI最大的痛点
没有人类的情感
所谓的情感
当然由最基本的喜怒哀乐组成的
例如本文开头的那几句
他妈的
除非你给AI特定的身份标签
否则AI绝对不会输出这几个字
这就是典型的情感

还有一点
AI输出的几乎不会有错别字
《康熙字典》共收录汉字47035个
1915年中华书局出版的《中华大字典》共收字48000余个
1986年到1990年的《汉语大字典》收字54678个
1994年出版的《中华辞海》,共收汉字87019个,其中重复字320个
字数最多的要数日本《今昔文字镜》,收录汉字超15万
GB 2312标准共收录6763个汉字,已经覆盖我们99.75%的使用频率
据统计,1000个常用字能覆盖约92%的书面资料
2000字可覆盖98%以上
3000字就已到99%了
综上所述,就算一共有15万字,加上这些字组的词,组的句子
算100万字
典型的AI包含了多少信息呢?
最简单的模型3B
即30亿
这是能加载到手机上的模型
电脑上使用的离线模型一般使用7B或以上
一般来说,小于7B的不建议使用
智商有限,本文不做展开讨论
一个简单的30亿参数的模型几乎包括了人类最常用的所有信息
更别说简单的文字了
AI写文章几乎不会出现任何错别字
为什么不是100%呢?
毕竟模型是人类训练的
只要有人类参与
不可能达到100%
想必这就是硅基生命为何要取代碳基生命的理由之一吧
又扯远了
回头再来说
AI生成的文章是生成式的
具有随机性
专业名词叫做随机种子
但是万变不离其宗
人类训练AI模型时
是按照人类最常见的
最简单的
大众所熟知的
教科书式的
例如代码规范
100%按照官方规范投喂的
例如生成式文章
都是拿名人名作去投喂的
所以你跟AI说
请模仿鲁迅的文笔给你写一篇文章
那真是毫不费力分分钟就好
正因为AI的守规矩
所以就有了方圆
这里的方圆就是一个圈圈
只要是AI写的文章
都出不了圈
一眼就可以识别这是AI写的

例如人类会经常说些倒装句
这是AI写的吧,这篇作文
这是AI写的吧,这篇论文
这是AI写的吧,这首歌词
你吃了吧,中饭
你交了没有?学费
看了小视屏里面教程,一边看一边做,我真是学废了
我左手一只鸡,右手一只鸭,嘴里喝着8瓶娃娃
是不是就没有AI色彩了
而是感受到了人类的色彩
所以
AI写的文章
你得再改改
改个倒装句
故意写错几个字
同音不同义的
等等等等
可以比较快速的抹除部分AI痕迹
到底能抹除几分,那要看你用心几分了

0

评论 (0)

取消
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net