本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
本书以文本的抄袭检测为研究对象,探索了抄袭检测的语料库构建、Web环境下的抄袭源检索和高模糊抄袭检测的文本对齐的问题、数据、架构和模型。全书共9章, ~3章介绍了抄袭检测的概念、类型和框架,综述了抄袭检测的方法;第4章介绍了现有抄袭语料构建方法,提出了基于自然标注的抄袭语料构建方法;第5和第6章对抄袭源检索开展研究,描述了基于排序学习的源检索查询生成模型和关注检索结果聚合性的源检索过滤模型;第7~9章,对抄袭检测的文本对齐开展研究,提出了基于排序学习的抄袭文本匹配模型、句法和语义交互的释义文本深度匹配模型以及基于序列标注的文本对齐模型。
前言
第1章 绪论
1.1 研究背景及意义
1.2 抄袭检测的研究现状及发展趋势
1.2.1 抄袭检测任务简介
1.2.2 抄袭语料构建
1.2.3 源检索的查询生成
1.2.4 源检索的检索结果过滤
1.2.5 释义抄袭文本匹配
1.2.6 抄袭片段对齐
1.3 研究的主要目标、内容和结构
参考文献
第2章 抄袭检测的概念、类型和框架
2.1 引言
2.2 文本复用的概念和方式
2.2.1 文本复用的概念
2.2.2 文本复用的方式
2.3 抄袭的概念和历史
2.3.1 抄袭的概念
2.3.2 抄袭的历史
2.4 抄袭的类型
2.5 抄袭检测的框架
2.5.1 外部抄袭检测的一般检索过程
2.5.2 抄袭源检索的过程框架
2.5.3 文本对齐的过程框架
2.5.4 内部抄袭检测的过程框架
2.5.5 跨语言抄袭检测的过程框架
2.6 本章小结
参考文献
第3章 抄袭检测的方法综述
3.1 引言
3.2 基于指纹的抄袭检测方法
3.2.1 指纹的生成
3.2.2 指纹的匹配
3.3 基于词袋模型的抄袭检测方法
3.4 基于TFIDF模型的抄袭检测方法
3.5 基于n-gram模型的抄袭检测方法
3.6 基于句法的抄袭检测方法
3.7 基于语言连续表示的抄袭检测方法
3.7.1 基于跨语言明确语义分析的跨语言抄袭检测方法
3.7.2 基于跨语言潜在语义分析的跨语言抄袭检测方法
3.8 本章小结
参考文献
第4章 基于自然标注的抄袭语料构建方法
4.1 引言
4.2 现有抄袭语料构建方法和问题分析
4.2.1 Webis系列抄袭检测语料库
4.2.2 CPSA语料库
4.2.3 METER语料库
4.2.4 其他语料