導航:首頁 > 編程語言 > php論文查重

php論文查重

發布時間:2023-07-08 00:23:56

Ⅰ PHP做一個簡單的類似論文查重的功能

思路是可以的:

//步驟一,分句,把原文$text按標點符號分為句子存入數組$arr,只保存長度15個字元以上的句子
//本步驟應該沒有難度

//步驟二,判斷數組$arr中的每個句子在現有資料庫中是否匹配
foreach ($arr as $str){
if CheckS($str) 標記句子$str;
}

//函數,在資料庫裡面匹配指定的句子,返回最大匹配的子串
function CheckS($s){
$n=strlen($s);//考慮漢字編碼,可能需要使用多位元組的函數,這里只是含義描述
for ($i=0;$i<=$n-15;$i++){
$ss=left($s,$n-$i);//前$n-$i(全長、少1個、少2個、15個)個字元
$sql="select count(*) from 資料庫 where 論壇內容 like '%$ss%'";
if 資料庫中的論文正文存在字元串$ss then return $ss;
$ss=right($s,$n-$i);//後$n-$i(全長、少1個、少2個、15個)個字元
$sql="select count(*) from 資料庫 where 論壇內容 like '%$ss%'";
if 資料庫中的論文正文存在字元串$ss then return $ss;
}
return "";//返回空串,表示無匹配
}

說明,資料庫中的論文要進行整理,整理為匹配模板,刪除多餘的空格、回車、換行,把所有的表達符號替換為空格,這樣資料庫裡面的論文模板就是空格分開的句子。

閱讀全文

與php論文查重相關的資料

熱點內容
東營程序員 瀏覽:712
發票上傳參數沒置伺服器地址 瀏覽:41
程序員網上接單能掙多少錢 瀏覽:175
稀有傳奇手游源碼 瀏覽:547
u盤里的cd驅動加密是什麼 瀏覽:414
遺傳演算法編碼長度 瀏覽:974
pe裝伺服器需要注意什麼 瀏覽:320
foreach計數php 瀏覽:525
php自連接 瀏覽:297
程序員被噴了怎麼辦 瀏覽:711
android消息數 瀏覽:263
為什麼在伺服器里輸不了指令 瀏覽:31
程序員那麼可愛前女友劇情介紹 瀏覽:104
centosjava環境變數配置 瀏覽:555
伺服器主板被鎖如何恢復 瀏覽:132
xpc語言編程軟體 瀏覽:823
光遇安卓怎麼解限制 瀏覽:302
元氣騎士老版源碼 瀏覽:106
助眠解壓音頻小姐姐口腔音 瀏覽:236
sql加密身份證號解碼 瀏覽:164