PDFdiff 操作方法
PDFの差分比較をクリックしてください。
以下のブラウザ画面で、比較したい文書(PDFファイル)を「ファイル1」と「ファイル2」にドラッグ&ドロップ後、「比較する」ボタンをクリックしてください。
3.「比較する」をクリック後、しばらくすると、以下の比較結果画面(相違点が着色された画面)が表示されます。比較結果の見方は後述「差分比較結果の見方」を参照ください。
差分比較結果の印刷、保存
比較結果(着色表示箇所)を画面上で確認するだけでなく、比較結果(元のPDFに着色されたPDF)を印刷、ダウンロードできます。
印刷、ダウンロードする場合は、比較結果画面上部にあるツールバーの印刷アイコン、ダウンロードアイコンをクリックしてください。
差分比較結果の見方
変更、追加、削除された文字の背景が着色されます。
変更文字の背景色:緑 (ファイルAとBの比較の場合、ファイルA、B共に着色されます)
追加文字の背景色:青 (ファイルAとBの比較の場合、ファイルBのみに着色されます)
削除文字の背景色:赤 (ファイルAとBの比較の場合、ファイルAのみに着色されます)
文字認識精度について
本サービスでは、PDFファイルの文字認識のために、OCR(光学文字認識)を利用しています。
OCRの認識率は 100 % でないため、稀に、着色不要箇所に着色される等があります。
特記事項
処理時間
「比較する」ボタンをクリックしてから比較結果が表示されるまでの処理時間は比較する文書により異なります。15秒から10分程度です。
処理可能頁数
複数頁からなるPDFファイルの場合、最初の100頁のみ比較可能です。お試し版は、最初の1頁のみ比較可能です。
全角と半角の違い
「-」と「-」、「,」と「,」等の全角と半角の違いは同一のものとして比較します。
以下の文書を差分比較すると、差分箇所でない文字が着色される場合があります。改良バージョンを提供予定です。
段組みが含まれる文章
表形式のテキストを含む文書(表形式によります)
横書きと縦書きが混在する文書(本サービスは横書き文書のみ対応しています)
極端に大きな文字、小さな文字を含む文書(画質、解像度等も影響します)
画質(ノイズ、歪みなど)が悪い文書、解像度が低い文書
ヘッダ、フッタを無視して比較する機能
各頁のヘッダにある文字列(タイトル、日付など)、フッタにある文字列(頁番号など)を無視して比較できます。
頁をまたがった文章が存在し、かつ、その頁のフッタやヘッダにタイトル、頁番号等の文字列が含まれていると、変更の無い文字が着色されることがあります。
そのため、「比較」ボタンをクリックする前に、ヘッダ、フッタエリアを無視して比較する指定(以下)を行ってください。文書(用紙)の上端からヘッダ下端までの距離を画面に入力する。
文書(用紙)の下端からフッタ上端までの距離を画面に入力する。
ヘッダ、フッタに文字列が存在しない文書同士を比較する場合は、ヘッダ、フッタの値は0(デフォルト値)のままで構いません。
PDFを画像に変換してから差分比較する機能
稀に、内部構造が異常なPDFの場合、文字を誤認識してしまうため、、変更の無い文字に着色される場合があります。
事前にPDFの内部構造が異常であることを検知できないため、誤認識(誤着色)が多発した場合は、「□ PDFを画像に変換して差分比較する」にチェックを入れてから比較(「比較する」ボタンをクリック)してみてください。