导航:首页 > 编程语言 > php论文查重

php论文查重

发布时间:2023-07-08 00:23:56

Ⅰ PHP做一个简单的类似论文查重的功能

思路是可以的:

//步骤一,分句,把原文$text按标点符号分为句子存入数组$arr,只保存长度15个字符以上的句子
//本步骤应该没有难度

//步骤二,判断数组$arr中的每个句子在现有数据库中是否匹配
foreach ($arr as $str){
if CheckS($str) 标记句子$str;
}

//函数,在数据库里面匹配指定的句子,返回最大匹配的子串
function CheckS($s){
$n=strlen($s);//考虑汉字编码,可能需要使用多字节的函数,这里只是含义描述
for ($i=0;$i<=$n-15;$i++){
$ss=left($s,$n-$i);//前$n-$i(全长、少1个、少2个、15个)个字符
$sql="select count(*) from 数据库 where 论坛内容 like '%$ss%'";
if 数据库中的论文正文存在字符串$ss then return $ss;
$ss=right($s,$n-$i);//后$n-$i(全长、少1个、少2个、15个)个字符
$sql="select count(*) from 数据库 where 论坛内容 like '%$ss%'";
if 数据库中的论文正文存在字符串$ss then return $ss;
}
return "";//返回空串,表示无匹配
}

说明,数据库中的论文要进行整理,整理为匹配模板,删除多余的空格、回车、换行,把所有的表达符号替换为空格,这样数据库里面的论文模板就是空格分开的句子。

阅读全文

与php论文查重相关的资料

热点内容
程序员图鉴 浏览:534
东营程序员 浏览:712
发票上传参数没置服务器地址 浏览:41
程序员网上接单能挣多少钱 浏览:175
稀有传奇手游源码 浏览:547
u盘里的cd驱动加密是什么 浏览:414
遗传算法编码长度 浏览:974
pe装服务器需要注意什么 浏览:320
foreach计数php 浏览:525
php自连接 浏览:298
程序员被喷了怎么办 浏览:711
android消息数 浏览:263
为什么在服务器里输不了指令 浏览:31
程序员那么可爱前女友剧情介绍 浏览:104
centosjava环境变量配置 浏览:555
服务器主板被锁如何恢复 浏览:132
xpc语言编程软件 浏览:823
光遇安卓怎么解限制 浏览:302
元气骑士老版源码 浏览:106
助眠解压音频小姐姐口腔音 浏览:236