CopyDetectの使い方

コピペチェックツール「CopyDetect」をご利用頂き、ありがとうございます。

この度、CopyDetectをバージョンアップし、よりセキュアに多くの文字(最大5000文字)までコピーチェックして頂けるようになりました。

そこで、今回のブログでは、CopyDetectの使い方を説明したいと思います。

CopyDetectの使い方

今回、文章の検査対象として、Wikipediaのアップルコンピューターの記事の一部の文章をコピーチェックしてみます。

1)コピーチェックしたい文章を貼り付ける

f:id:copydetect:20150913220334p:plain

盗用チェックする文章をCopyDetectのテキストエリアに貼り付けます。対象となる文章の文字数は200文字以上、5000文字以下以内にする必要があります。

文章を入力したら、規約にチェックを入れ、「コピペチェックする」をクリックします。

2)約30秒~80秒待つ

f:id:copydetect:20150913220606p:plain

そのまま30秒から80秒程処理が完了するまで待ちます。検査する文字数にも寄りますが、概ね40秒以内で検索結果が表示されます。

検索結果画面が表示されましたら、実際にコピーチェクをしてみましょう。

【チェック方法1】「全文比較」で重複している箇所を確認

f:id:copydetect:20150913220907p:plain

検索結果には、コピーチェックした文章と同じ・類似したコンテンツを掲載しているWebページ(ファイル)のURLが一覧で表示されます。デフォルトのURL並び順は、コピーチェックした文章と類似する比率が高い順で並びます。

では、実際に重複している箇所を確認すべく、[全文比較]をクリックしてみましょう。

f:id:copydetect:20150913221602p:plain

[全文比較]をクリックすると、類似するコンテンツを掲載しているURL(Webページ・ファイル)と一致する箇所がオレンジ色でマークアップされた上で表示されます。左上の一致率(0~100%)と合わせて、一致する箇所を視覚的に確認出来ます。

実際に、このWebページのどの箇所に掲載されているかを確認するには、[一致文のみ]をクリックします。

f:id:copydetect:20150913222231p:plain

[一致文のみ]をクリックすると、分割された文章が一覧で表示されます。各文章の右側に表示される[キャッシュ]をクリックし、当該WebページのGoogleキャッシュページにアクセスします。

f:id:copydetect:20150913222648p:plain

Googleキャッシュページにて、品詞ごとに色付けされた単語が連続してならぶ箇所が、コピー検査した文章と一致する箇所となります。

f:id:copydetect:20150913222859p:plain

Googleのキャッシュページが閲覧できない場合は、[G検索]をクリックし、Googleの検索結果ページにアクセスします。

f:id:copydetect:20150913223010p:plain

上の図の様に、太文字で表示される箇所が連続して続く場合は、コピーチェック対象の文章と、このWebサイトに掲載しているコンテンツが完全に一致している可能性が高いと思われます。

f:id:copydetect:20150913223311p:plain

上の図の様に、太文字で表示される文が単語単位で断続的に出現している場合は、文章の抜粋・盗用の可能性は低く、いくつかの単語が重複していた程度の可能性が考えられます。

【チェック方法2】[連続で続く文章]の順毎に確認

部分的なコピペも検出するコピペチェック方法でも記載した様に、文章全体の類似率で盗用チェックをした場合、ライターが一部分のみ抜粋した箇所(コピペ)を見逃す可能性があります。

この部分的なコピペも見逃さずに検知検出する為には、[連続して続く文章]で類似コンテンツを掲載しているURLを並び替え、確認する必要があります。

f:id:copydetect:20150913224250p:plain

コピペチェック結果画面の上部にある[連続で続く文章]をクリックし、降順で並び替えます。

f:id:copydetect:20150913224446p:plain

連続で続く文章順に並び替え、[全文比較]をクリックします。すると、連続で続く箇所がアンカーリンク化されているので、クリックします。

f:id:copydetect:20150913224941p:plain

Googleの検索結果で、連続して太文字の文章が続く場合、部分的に一致している可能性があります。実際にWebページのコンテンツを目視で確認し、コピーチェックの度合いを確認すると良いでしょう。

【チェック方法3】文章単位で類似サイトをチェック

チェック方法1~2は、検索対象となる文章の全文と類似Webページを1対1で比較、検出する方法でしたが、チェック方法3は、検索対象となる文章を分割し、分割した文章毎に類似Webページを検出する方法です。

国内の有料コピーチェックツールの多くは、この方法でコピー検査&類似Webページを検出している様に見受けられます。

f:id:copydetect:20150913230041p:plain

デフォルトで表示されるコピー検出画面の上部にある「文章単位の類似結果」をクリックします。

f:id:copydetect:20150913230214p:plain

すると、文章単位で類似するコンテンツを掲載しているWebページが表示されます。部分的な抜粋などより精度高くコピー検知したい場合は、文章単位で類似サイトをチェック&検出すると良いでしょう。

この文章単位結果では、「ドメイン単位」、「テキスト単位」、「1テキスト」の3つで並び替えが可能です。

ドメイン単位での並び替え

f:id:copydetect:20150913230545p:plain

[ドメイン並び替え]をクリックすると、類似コンテンツを掲載しているWebサイト(ドメイン)単位でグルーピングし、並び替え表示できます。

この並び替えは、[全文比較]→[一致文]と同じ機能です。

テキスト並び替え

f:id:copydetect:20150913231216p:plain

検査対象の文章が、分割順に並び替えられます。複数のWebページから部分的に抜粋するタイプのコピペを検出する際に利用します。

1テキストのみ

f:id:copydetect:20150913231905p:plain

コピー類似度が最も高いURLと文章を、分割順に並び替えます。[テキスト並び替え]と併用して確認する事で、複数のWebページから抜粋しているコピーを目視で確認する際に利用します。