導航:首頁 > 編程語言 > php論文查重

php論文查重

發布時間:2023-07-08 00:23:56

Ⅰ PHP做一個簡單的類似論文查重的功能

思路是可以的:

//步驟一,分句,把原文$text按標點符號分為句子存入數組$arr,只保存長度15個字元以上的句子
//本步驟應該沒有難度

//步驟二,判斷數組$arr中的每個句子在現有資料庫中是否匹配
foreach ($arr as $str){
if CheckS($str) 標記句子$str;
}

//函數,在資料庫裡面匹配指定的句子,返回最大匹配的子串
function CheckS($s){
$n=strlen($s);//考慮漢字編碼,可能需要使用多位元組的函數,這里只是含義描述
for ($i=0;$i<=$n-15;$i++){
$ss=left($s,$n-$i);//前$n-$i(全長、少1個、少2個、15個)個字元
$sql="select count(*) from 資料庫 where 論壇內容 like '%$ss%'";
if 資料庫中的論文正文存在字元串$ss then return $ss;
$ss=right($s,$n-$i);//後$n-$i(全長、少1個、少2個、15個)個字元
$sql="select count(*) from 資料庫 where 論壇內容 like '%$ss%'";
if 資料庫中的論文正文存在字元串$ss then return $ss;
}
return "";//返回空串,表示無匹配
}

說明,資料庫中的論文要進行整理,整理為匹配模板,刪除多餘的空格、回車、換行,把所有的表達符號替換為空格,這樣資料庫裡面的論文模板就是空格分開的句子。

閱讀全文

與php論文查重相關的資料

熱點內容
嵌入式基礎命令 瀏覽:526
當程序員必學的編程語言 瀏覽:906
pro文件夾有什麼用 瀏覽:357
我的世界伺服器有人開掛如何踢出 瀏覽:482
程序員有天賦 瀏覽:640
編程計算並輸出半徑 瀏覽:709
日期排序java 瀏覽:953
程序員的中介模式 瀏覽:880
python中求兩個字元串重復部分 瀏覽:495
如何查看收件發件伺服器 瀏覽:110
linux配置android環境變數 瀏覽:132
android文字測量 瀏覽:883
壓力大金錢怎麼解壓 瀏覽:641
生男演算法 瀏覽:770
php讀取當前目錄 瀏覽:439
說一個可以連接的伺服器地址 瀏覽:508
操盤手1pdf 瀏覽:536
什麼app新人注冊可以免費買東西 瀏覽:601
flexjava教程 瀏覽:119
vnc訪問雲伺服器 瀏覽:484