部署了AI内容检测器,是由俩种模型和1种规则组成的文本检测器,不仅考虑了困惑度和爆发度。
这里面有很多问题,就是应对魔改,用AI生成式降低AI撰写率,一般被称为,降AI。
在应对魔改方面,有几个思路:
圈子里讨论:之前一篇论文说,AI生成的一般没有语法错误,人写的往往会有语法错误来着。
另外就是,魔改后的文章往往会出现通顺度和流畅度存在问题,或者用词不当。
另外还想到一个方法:
把AI的联词,全部提取出来,然后训练个模型,就是说,我已知他百分百是AI的词提出来,单独加权,把人类观察特征合并了,然后从AI魔改的文本过滤出去。然后把过滤后的原始文本,直接扔给模型训练。这样就可以滤出底稿了。
当然,他只是其中的一个条件,具体过程还需要去数据验证。
据说头条的AI检测器非常强大。