导航:首页 > 编程语言 > php论文查重

php论文查重

发布时间:2023-07-08 00:23:56

Ⅰ PHP做一个简单的类似论文查重的功能

思路是可以的:

//步骤一,分句,把原文$text按标点符号分为句子存入数组$arr,只保存长度15个字符以上的句子
//本步骤应该没有难度

//步骤二,判断数组$arr中的每个句子在现有数据库中是否匹配
foreach ($arr as $str){
if CheckS($str) 标记句子$str;
}

//函数,在数据库里面匹配指定的句子,返回最大匹配的子串
function CheckS($s){
$n=strlen($s);//考虑汉字编码,可能需要使用多字节的函数,这里只是含义描述
for ($i=0;$i<=$n-15;$i++){
$ss=left($s,$n-$i);//前$n-$i(全长、少1个、少2个、15个)个字符
$sql="select count(*) from 数据库 where 论坛内容 like '%$ss%'";
if 数据库中的论文正文存在字符串$ss then return $ss;
$ss=right($s,$n-$i);//后$n-$i(全长、少1个、少2个、15个)个字符
$sql="select count(*) from 数据库 where 论坛内容 like '%$ss%'";
if 数据库中的论文正文存在字符串$ss then return $ss;
}
return "";//返回空串,表示无匹配
}

说明,数据库中的论文要进行整理,整理为匹配模板,删除多余的空格、回车、换行,把所有的表达符号替换为空格,这样数据库里面的论文模板就是空格分开的句子。

阅读全文

与php论文查重相关的资料

热点内容
精品源码怎么算 浏览:490
加密技术在现实中应用体会 浏览:180
单片机如何换晶振 浏览:206
合并两个数组java 浏览:13
命令标注圆半径怎么用 浏览:659
出差人员电脑加密 浏览:248
文件夹0项什么意思 浏览:602
空调冷媒压缩机启动 浏览:911
流氓文件夹怎么强制删除 浏览:783
嵌入式基础命令 浏览:526
当程序员必学的编程语言 浏览:907
pro文件夹有什么用 浏览:357
我的世界服务器有人开挂如何踢出 浏览:482
程序员有天赋 浏览:640
编程计算并输出半径 浏览:709
日期排序java 浏览:953
程序员的中介模式 浏览:881
python中求两个字符串重复部分 浏览:495
如何查看收件发件服务器 浏览:110
linux配置android环境变量 浏览:132