導航:首頁 > 源碼編譯 > 敏感詞彙過濾演算法

敏感詞彙過濾演算法

發布時間:2022-08-18 06:38:59

❶ QQ空間敏感詞過濾標準是什麼

只要涉及敏感政治歷史事件,網頁黃頁鏈接,涉及長篇大論的非主流政軍地緣政治私人心得,這些東西,發布在QQ空間里,都會被過濾。

擔心的話可以先用微信的敏感詞檢測工具檢測一下,或許能打開新世界。「敏感詞過濾」功能支持內置敏感詞詞庫和自定義敏感詞兩種過濾方式。

介紹

「敏感詞過濾」是指對互聯網發布的言論和文章中含有的敏感詞進行過濾。敏感詞經過在互聯網的傳播和擴散會影響社會的穩定和用戶的使用。

雲鎖的「敏感詞過濾」功能可以對用戶post請求的內容阻止並提示,而get請求的內容則使用「*」號替代敏感詞。如果網站開啟GZIP時,敏感詞過濾則不生效。

❷ JAVA中如何利用StringBuffer方法來對一些用戶所提交的聊天內容中的敏感性詞語進行過濾

代碼發表不了,截圖給你

❸ 微博圖片違禁詞有哪些

這個沒有固定的。
一般設置政治性的都會是敏感詞。智能過濾敏感詞彙是構建敏感詞庫後,通過演算法來遍歷文本,並與敏感詞樹匹配,進而達到識別並過濾敏感詞彙的作用。
於海量樣本數據和第三代內容安全技術,智能策略定製,高效過濾色情、廣告、涉政、暴恐等多類敏感詞和違禁變種。

❹ 微博敏感詞彙有哪些

智能過濾敏感詞彙是構建敏感詞庫後,通過演算法來遍歷文本,並與敏感詞樹匹配,進而達到識別並過濾敏感詞彙的作用。目前網易易盾基於海量樣本數據和第三代內容安全技術,智能策略定製,高效過濾色情、廣告、涉政、暴恐等多類敏感詞和違禁變種。

也有一些網站根據自身實際情況,設定一些只適用於本網站的特殊敏感詞,例如很多電子商務網站會將一些涉及侵犯知識產權,不宜銷售的商品。


古代諱詞:

在中國古代,人們往往會碰到「諱詞」,多是因為不能直呼皇帝、長輩的名字,要用另一個詞替代。後來也有「雅稱」,比如上廁所叫去一號,或者上衛生間、洗手,不能直接說小便大便。說到這里,也有個笑話。

去過越南的人都知道,越南人說「再見」的發音就是TamBiet,跟中國人說「大便」是一樣的,所以在越南旅遊時中國人到處能聽到「大便大便」,這個發音在越南一點也沒有不雅的感覺。

以上內容參考:網路-敏感詞

❺ 數字敏感詞彙怎麼繞過

換一種思路來想

❻ 網站都會把敏感詞彙屏蔽掉,舉例說明一下

你這個問題問的就有點問題。
你說的是你自己的這個網站還是別人的網站里發布信息會把你的敏感詞給屏蔽掉。
如果你是在別的網站發布信息,敏感詞自動被屏蔽了,這個很正常,因為現在網站內容方面管控的非常嚴格,只要涉及到敏感的,基本上就自動過濾的,也沒有什麼好的解決方法。
只能你自己寫好稿子之後,再去看一下內容,文字有沒有敏感的信息,有的就直接替換成其他文字即可。

❼ 實現一個過濾無用詞彙程序。規則如下: 1. 能接受的字元是:字母 數字 標點符號 , . " 還有無用的符號 @#

跟他相似

#include<iostream>
#include<cstring>
using namespace std;

int check(char *str,char *nosign);
void trans(char *str);

#define MAXLENGTH 30
#define STANDARD 20

int main()
{
char str[MAXLENGTH];
char newstr[STANDARD];
char store[STANDARD];
char *address[STANDARD];
char *pt;
char *mark;

char nosense[20] = {'@','#','$',',','.','"',' ','\0'};
char word[5][10] = { "L4","FD","D26"};
int i = 0;
int k = 0;
int l = 0;
int count = 3;
int num = 5;
bool flag = true;
int m = 0;
char *p;
char yorn;
p = word;

do
{
cout << "\n請輸入和諧詞,輸入「|」停止\n";
cin >> p[count];
count++;
if( count == num && p[count-1] != '|')
{
num = 2*num;
p = new char[num][10];
for(m=0;m < num/2;m++)
p[m] = word[m];
}
}
while(p[i-1] != '|');
//上面一部分

cout << "
cin >> yorn;
if( yorn == 'y' )
cin.getline(nosense,20);

do
{
cout << "輸入字元串(不多於20個字元):\n";
cin.getline(str,30);

if( strlen(str) > STANDARD || check(str,nosense) == 1 )
{
cout << "輸入錯誤\n";
}
}
while( strlen(str) > STANDARD || check(str,nosense) == 1 );

cout << "\n字元串是:"<< str <<endl;
strcpy(newstr,str);
strupr(newstr);
pt = newstr;

for(i = 0;i < strlen(pt);i++)
{
if( pt[i] != '*')
{
address[k] = &str[i];
store[k] = pt[i];
k++;
}
}

for(i = 0;i < count;i++)
{
if( strstr(store,word[i]) )
{
mark = strstr( store,word[i] );
for( l = 0 ; l < strlen(word[i]); ++l)
*(mark + l) ='*';
}
}

for( i = 0 ; i < strlen(newstr); ++i )
{
if ( store[i] == '*')
{
*address[i] = '*';
}
}

cout <<"\n和諧後的句子是" << str << endl;

return 0;
}

int check(char *str,char *nosign)
{
int i = 0;
int k = 0;
bool flag = false;

for(i = 0;i < strlen(str);i++)
{
if(!( ( str[i] >= 'a' && str[i] <= 'z' )||(str[i] >= 'A' && str[i] <= 'Z')||(str[i] >= '0'&&str[i] <= '9')))
{
flag = false;
for( k=0 ;k < strlen(nosign);k++)
{
if ( str[i] == nosign[k])
{
str[i] = '*';
flag = true;
break;
}
}
if (!flag)
{
return 1;
}
}
}
return 0;
}

❽ 百度知道是怎麼封問題的

第一:過濾關鍵字,通過關鍵字和一些演算法來過濾問題,比方說網路敏感詞彙有乳房,警察……當你提問的問題中含有乳房的時候網路會屏蔽這個問題,但是提問乳房癌的人也會被屏蔽,但敏感詞之間有關聯,當網路過濾到到乳房和警察在一起的時候問題就會被屏蔽。
第二:就是舉報,當舉報人數達到一定數值,問題會被網路封閉或刪除。
但是第二點會出現惡意舉報,所以誕生了網路巡查員,當被舉報人數達到一定數值而網路又沒過濾到任何敏感詞彙,問題就會反饋到網路巡查員那裡,進行人工審核。

閱讀全文

與敏感詞彙過濾演算法相關的資料

熱點內容
壓縮包製作後照片順序怎麼改 瀏覽:680
fibonacci數列演算法 瀏覽:775
產品經理要和程序員吵架嗎 瀏覽:252
grub2命令行 瀏覽:618
無法獲取加密卡信息 瀏覽:774
雲伺服器網卡充值 瀏覽:509
編程就是軟體 瀏覽:49
伺服器如何添加許可權 瀏覽:437
引用指針編程 瀏覽:851
手機加密日記本蘋果版下載 瀏覽:63
命令行括弧 瀏覽:176
java程序升級 瀏覽:490
排序演算法之插入類 瀏覽:227
gcccreate命令 瀏覽:73
海爾監控用什麼app 瀏覽:64
系統盤被壓縮開不了機 瀏覽:984
linuxredis30 瀏覽:541
狸窩pdf轉換器 瀏覽:697
ajax調用java後台 瀏覽:906
活塞式壓縮機常見故障 瀏覽:615