首页 / 知识
关于列表:“坏词”过滤器
2023-04-13 00:37:00

“bad words” filter技术性不是很高,但是...我必须在我们正在开发的新站点中实施一个单词过滤器。 因此,我需要一个"好"坏词列表来为我的数据库提供...任何提示/方向? 环顾谷歌,我发现了这个,这是一个开始,但仅此而已。 是的,我知道这种过滤器很容易逃脱……但是客户就是客户! :-) 该站点将必须过滤掉英语和意大利语单词,但是对于意大利语,我可以请同事们帮我提供社区构建的" parolacce"列表:-)-可以使用电子邮件。 谢谢你的帮助。 当心集体错误。
我没有看到指定的任何语言,但是您可以将其用于PHP,它将为每个已插入的作品生成一个RegEx,这样即使是故意的拼写错误(即@ ss,i3itch)也将被捕获。
Shutterstock有一个Github存储库,其中包含用于过滤的不良单词列表。 您可以在这里查看:https://github.com/shutterstock/List-of-Dirty-Naughty-Obscene-and-Otherwise-Bad-Words 如果有人需要API,则Google当前会提供错误词指示符。
更新:Google现在已删除此服务。 +1是关于Clbuttic错误的,我认为"坏词"过滤器扫描开头和结尾的空格(例如" ass")而不是仅扫描确切的字符串非常重要,这样我们就不会出现像clbuttic这样的词,紧身裤,黄油,奶油等。 我想说的是,在您知道帖子后就删除它们,并阻止对其帖子过分露骨的用户。您可以不说脏话就说很令人反感的话。如果您阻止"屁股"(又名驴)一词,那么人们将只键入a $$或/ 55,或者他们需要键入以通过过滤器的其他任何内容。 Wikipedia ClueBot的单词过滤器不正确,请阅读其源代码。 http://en.wikipedia.org/wiki/User:ClueBot/Source#Score_list 您总是可以说服客户进行一次用户会话,而这些用户只是不断发布专家信息,并提出一种简单的解决方案将其添加到系统中。这是很多工作,但可能会更代表社区。
在研究此主题时,我确定需要的不仅仅是一个可以任意替换的列表。我建立了一个Web服务,可让您确定所需的"清洁"程度。它还会努力识别误报-也就是说,在一个上下文中某个单词可能是不好的,而在其他上下文中则不是。 |
最新内容
相关内容
python如何读取列表中元素的位置?
python如何读取列表中元素的位置?,位置,数据,异常,培训,字符串,元素,索引,方法,示例,结果,python读取列表中元素位置的方法:1、使用index()方python如何导入txt数据库?
python如何导入txt数据库?,数据,时间,代码,培训,数据库,函数,读数,数据表,以上,方法,python将TXT数据导入数据库的方法代码如下:#!/usr/bin/pyPython怎么取出列表中的相邻元素?
Python怎么取出列表中的相邻元素?,代码,异常,培训,元素,指针,序列,对象,表示,语句,函数,1、python的迭代器。iter()能把一个序列生成为一个和python如何获取列表里的数据类型?
python如何获取列表里的数据类型?,代码,信息,培训,类型,数据类型,表里,元素,语句,函数,对象,1、Python可以通过tpye()方法来判断list里的元知python怎么返回列表元素索引?
python怎么返回列表元素索引?,检测,异常,培训,索引,元素,列表,方法,字符串,结果,范围内,python中可以使用index()方法返回列表中指定元素的索python怎么筛选列表中大于0的数据?
python怎么筛选列表中大于0的数据?,数据,培训,函数,结果,以上,方法,更多,内容,列表,python筛选列表中大于0的数据的方法:1、使用匿名函数lambpython列表有哪些常用方法?
python列表有哪些常用方法?,位置,方法,培训,列表,语法,元素,示例,对象,以上,参数,列表是最常用的Python数据类型,它可以作为一个方括号内的逗python列表是否允许重复
python列表是否允许重复,培训,表里,元素,字典,列表,方法,长度,种类,也就是,下面,python列表允许重复,下面我们就来介绍几种判断列表是否重复的python中怎么将元组、字典转化为列
python中怎么将元组、字典转化为列表,培训,列表,字典,方法,元素,示例,中将,语法,以上,参数,python中将元组、字典转化为列表的方法:python中可python怎么查看列表长度?
python怎么查看列表长度?,代码,技术,培训,列表,长度,方法,示例,元素,鲜为人知,初始化,python中可以使用len()或length_hint()方法查看列表长python中如何清空数组(列表)元素
python中如何清空数组(列表)元素,代码,培训,数组,列表,元素,示例,范围,类型,方法,初始化,python本身并没有数组类型,但是他的Numpy库中有数组Python元组怎么转换成列表
Python元组怎么转换成列表,培训,列表,对象,示例,中将,以上,方法,更多,内容,python中将元组转换成列表的方法是使用list()进行转换。使用示例